Ciencia de Datos en Python Vs SPSS

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 28

Ciencia de datos con Python vs

plataformas
t licenciadas
Presentado por:
Krystian Marentes – Especialista de Producto
Propiedad Intelectual
Esta presentación está formulada bajo estricta
confidencialidad por INFÓRMESE. Se encuentra
disponible para usted, aclarando que la información
aquí descrita no podrá ser transmitida o compartida,
tampoco podrá ser usada con propósitos
comerciales u otros distintos a los originalmente
mencionados.

Copyright INFÓRMESE 2019

V. 1
Agenda
1. ¿Por qué Python en Data
Science?
2. ¿Y otras plataformas open
source?
3. Python y SPSS.
4. Lo mejor de los dos
mundos.
5. Más allá de la analítica.
¿Por qué
Python?
Componentes de Data Science

Data Science

Bases de Machine
Estadística
datos Learning

Big Data Matemáticas

Deep Learning
Minería de
datos
¿Por qué python
para tareas de
ciencia de datos?

V. 1
¿Por qué Python?

Facilidad en el uso: lenguaje claro y simple Programación interactiva

Lenguaje de propósito general Popularidad. Comunidad muy grande Calidad


Algunas herramientas…
Python vs
otros open
source
El otro gran competidor – R

Lenguaje para computación Herramientas para el


estadística y gráficos análisis de datos

Fuerte en la generación de Manejo de datos efectivos y


gráficos facilidades en el almacenamiento
Algunas diferencias…

Análisis de datos amigable, modelos Productividad y


Propósito
estadísticos y gráficos legibilidad del código

Curva de aprendizaje Curva de aprendizaje


Aprendizaje
difícil al inicio gradual y corta

Investigadores, Ingenieros,
Usado por
estadísticos. empresas.
Algunas diferencias…

Procesamiento en un Integración con otros sistemas,


Uso
único equipo. incorporación a bases de datos.

Trabajo exploratorio, Implementación de algoritmos en


Tareas
fácil para principiantes. ambientes de producción.

Análisis de datos Uso de paquetes


básico sin paquetes Manejo de datos para análisis de
adicionales. datos.
¿Cuál se usa más?

Popularidad entre 2013 Popularidad relativa en


y febrero de 2015. stackoverflow y github.
Índice Tiobe Ranking Redmonk

Fuente: https://www.datacamp.com/community/tutorials/r-or-python-for-data-analysis?tap_a=5644-dce66f&tap_s=10907-287229
Algunas limitaciones…

Colaboración Seguridad Curva de aprendizaje


¿Por qué
Python y
SPSS?
• Open Source. • Potenciar la
• Flexibilidad. flexibilidad.
• Bajo costo de • Ampliación del
implementación horizonte de
acción.

Fortalezas Oportunidades

Amenzas Debilidades

• Pérdida de conocimiento. • Dificultades en el


• .No transferir el manejo para
conocimiento a otras áreas ciertos perfiles.
clave. • Despliegue.
Entonces, ¿con cuál
debería quedarme?
Integración
de Python
con SPSS
Ventajas de la integración

 SPSS es una plataforma ideal desde la que los


usuarios de python pueden manejar grandes
conjuntos de datos, obtener gráficos de alta
calidad y otras formas de producción.
 SPSS es de fácil uso, tiene la capacidad de
permitir usar python a una amplia gama de
usuarios que no estén familiarizados con python.
 Cuando se utiliza python dentro de SPSS, puede
aplicar funciones a los datos de SPSS, mientras
que se mantiene la integridad de la base de datos
original.
Formas de integración

1. Nodos de extensión
Formas de integración

2. Nodos de extensión

Nodos creados por la comunidad


disponibles como licencia open
source por los usuarios de SPSS
Modeler.
Formas de integración
3. Creación de nodos de extensión
Hacia la IA
La escalera de la IA

Artificial
Intelligence

Machine Learning

Analítica

Datos

V. 1
Ambientes de integración
Herramientas

Data Model Watson


Refinery Builder APIs

Runtimes ML Runtimes DL

IaaS cloud

Gestión del ciclo de vida


Demos un
vistazo…
Gracias!
Emprendamos juntos
el camino analítico.

Krystian Marentes
[email protected]

También podría gustarte