Clase 3 - Jupyter
Clase 3 - Jupyter
Steve Cortes R.
JUPYTER
Código Abierto.
IPython en 2014.
Es un sistema de gestión de
paquetes utilizado para
instalar y administrar
paquetes de software escritos
en Python. Muchos paquetes
pueden ser encontrados en el
Python Package Index.
COMO USAR PIP?
Instalar
pip freeze
pip list
PANDAS
Es una herramienta
de análisis y
manipulación de
datos de código
abierto rápida,
potente, flexible y
fácil de usar,
construida sobre el
lenguaje de
programación Python.
QUE PUEDO HACER EN
PANDAS?
Un objeto DataFrame rápido y eficiente para la manipulación
de datos con indexación integrada.
Herramientas para leer y escribir datos entre estructuras de
datos en memoria y diferentes formatos: CSV y archivos de
texto, Microsoft Excel, bases de datos SQL y el rápido formato
HDF5.
Agregar o transformar datos con un poderoso motor que
permite operaciones de división-aplicación-combinación en
conjuntos de datos.
Alto rendimiento de fusión y unión de conjuntos de datos.
INSTALAR PANDAS
pd.read_csv('data.csv')
EXCEL
pd.read_excel('tmp.xlsx',
index_col=0)
ESCRIBIR
CSV JSON
df.to_csv(‘out.csv', index=False)
EXCEL
df1.to_excel("output.xlsx",
sheet_name='Sheet_name_1')
SUBCONJUTOS subconjunto =
dataframe[”columna"]
DE LOS DATOS
dataframe.plot()
GRAFICAR Dataframe[”columna”].plot()
CREAR NUEVOS df[”new"] = df[”old"] *
DATOS
1.882
DESCRIBIR dataframe[”columna"].mean()
dataframe[”columna"].median()
DATOS dataframe[”columna"].describe(
)
PRACTICA
Descargue y lea en un dataframe
de jupyter los datos del enlace
https://drive.google.com/open?id=1
nfwBFgom35JdohXmZs__RPsNBb6Fn
4AT
La descripción de los datos se
encuentra en:
https://www.kaggle.com/jessemosti
pak/hotel-booking-demand
Con el Dataset obtenido
anteriormente describa y grafique
datos relevantes.