Guion
Guion
Dialogo1:
Python es un lenguaje de programación ampliamente utilizado en las aplicaciones web, el
desarrollo de software, la ciencia de datos y el machine learning (ML). Los desarrolladores
utilizan Python porque es eficiente y fácil de aprender, además de que se puede ejecutar en
muchas plataformas diferentes.
Dialogo2:
Para usar este lenguaje instalaremos la herramienta Anaconda, es una distribución libre y
abierta de los lenguajes Python y R, utilizada en ciencia de datos, y aprendizaje automático.
Esto incluye procesamiento de grandes volúmenes de información, análisis predictivo y
cómputos científicos.
Para instalarla, el computador en que se instale debe tener los siguientes requerimientos
técnicos:
4GB De RAM y de disco duro un procesador de 32 o 64 Bits, y que el sistema operativo
sea de Linux, Windows o Mac.
Luego de comprobar que su computador esta en condiciones podemos empezar con la
instalación.
Ubique, primeramente, el link de la página oficial www.anaconda.com.
Ingrese.
(Proceso de instalación).
Una vez realizada la instalación correctamente, se recomienda reiniciar el computador, para
que todas las herramientas terminen su proceso de configuración y se pueda empezar a
trabajar en la aplicación que provee esta distribución.
Dialogo4
La lectura de datos se debe empezar con:
Crear un notebook
Preparar el archivo con los datos
La lectura comienza con el comando df = pd.read_csv('DatosSeguros.csv')
Se debe aplicar el siguiente comando para obtener información de los datos: df.info()
Para eliminar los datos nulos se usan los siguientes codigos: para encontralos
df.isnull().sum() y df=df.dropna para elimimarlos.
Luego se revisan los resultados despyes de eliminar los resultados nulos con: df.info()
Para eliminar los datos duplicados se usa el comando: df=df.drop_duplicates()
Para ordenar los datos por edad de menor a mayor se usa:
edad=df.sort_values(‘edad’)edad.head(10) y de mayor a menor:
edad=df.sort_values(‘edad’,ascending=false)edad.head(10)