Data Science

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 54

PRÁCTICA PROFESIONAL I CICLO 01 | 2024

DATA SCIENCE
DATA SCIENCE

Data Science o ciencia de


Definición datos es una disciplina
científica centrada en el
análisis de grandes fuentes de
datos para extraer
información, comprender la
realidad y descubrir patrones
con los que tomar decisiones.
Para conseguir convertir esa
información no estructurada
o estructurada en contenido
de valor, el Data Science
combina herramientas de la
matemática, estadística y/o
informática, para que, con
todo ello, pueda llegar a
cumplir su objetivo, la
optimización de la toma de
decisiones.
CONCEPTOS CLAVE
MACHINE LEARNING

¿Qué es?

El aprendizaje automático es una


de las aplicaciones más
interesantes de la inteligencia
artificial. Crea sistemas capaces
de identificar patrones complejos
entre millones de datos, lo que
consigue gracias a un algoritmo.
MACHINE LEARNING
¿Para qué sirve?
Los algoritmos de Machine Learning clasifican la información y son
capaces de anticipar comportamientos aportando a la ciencia de datos
esa capacidad predictiva tan importante: las organizaciones pueden
actuar antes de que algo ocurra.

Ejemplo:
¿Alguna vez te ha llamado tu compañía telefónica para hacerte una
oferta después de haber planteado una queja? Ocurre cuando sus
sistemas de datos concluyen que se han producido una serie de
hechos que a otros usuarios los ha llevado a darse de baja. Y para
impedirlo, actúan, incluso antes de que pase.
DEEP LEARNING

¿Qué es?

El Deep Learning es uno de los diferentes sistemas


para activar procesos de Machine Learning. Crea
una red neuronal artificial estructurada por niveles
jerárquicos. De este modo, el nivel más bajo
aprende algo simple que envía a un segundo nivel
jerárquico. Este segundo combina ese aprendizaje
con otra información, convirtiéndola en algo más
complejo, y así sucesivamente.
DEEP LEARNING

Para qué sirve:

Además de para retar a los campeones del mundo de


ajedrez como hace el programa Alpha Go de Google, es
utilizado para descubrir un tipo de información entre
millones de datos.
Se utiliza diagnóstico médico, análisis de reacción de
clientes frente a un producto, reconocimiento facial o
identificación de emociones faciales, reconocimiento de
voz, clasificación de vídeos, etc.
Las empresas más poderosas invierten cantidades ingentes en sistemas de Deep Learning
que mejore la monitorización de mensajes en redes sociales e internet. Analizando esos
mensajes, identifican nuevos grupos sociales de clientes, mejoran sus productos o
combaten el fraude.
TEXT MINING

¿Qué es?

Así se conoce al conocimiento y herramientas


para analizar información textual. Este
proceso que forma parte del Data Mining,
descubre una información que anteriormente
no existía de modo explícito a través de la
recuperación de datos, extracción de
información y la Data Mining.
TEXT MINING

¿Para qué sirve?

Para realizar búsquedas, descubrir relaciones


o tendencias, clasificar de forma automática
millones de documentos o elaborar
resúmenes. Todo ello es valiosa materia prima
para la ciencia de datos.

En los últimos años el Text Mining ha sido caballo de batalla en los procesos electorales de
los países más avanzados del mundo. Se utiliza para identificar el sentimiento en las
publicaciones en medios y redes sociales o medir el nivel de popularidad del candidato.
DATA MINING

¿Qué es?

Conocida en español como minería de


datos, su conocimiento y procedimiento
permiten analizar grandes bases de datos
de forma automatizada, identificando los
patrones que explican el comportamiento
de los datos. Estos patrones surgen
utilizando herramientas de estadística y/o
algoritmos con base en redes neuronales
e inteligencia artificial.
DATA MINING

¿Para qué sirve?

Sus aportaciones a la ciencia de datos


son muchas, pero quizá se puedan
resumir en su capacidad para responder
a preguntas con datos, o a preguntas
que incluso las organizaciones no habían
llegado a plantearse.

Por ejemplo, puede descubrir que un determinado alimento es comprado en el


supermercado por los diabéticos por su escaso aporte de hidratos de carbono a su dieta. El
descubrimiento le permitiría dirigir acciones comerciales específicas.
X

¿Qué es?

Crea programas y mecanismos capaces de


responder con autonomía a información o
estímulos en un comportamiento
aparentemente inteligente o humano.
INTELIGENCIA ARTIFICIAL

¿Para qué sirve?

A la AI (Artificial Intelligence) se le
atribuye una revolución infinita, entre
otras cosas por su facilidad para
integrarse en otras tecnologías. Su
mayor aportación es no necesitar de la
orden humana para actuar, capacidad
que no todos ven con buenos ojos.

Desde la mejora del software fotográfico de tu smartphone a los sistemas de seguridad de


los vehículos automáticos, como decimos, la AI añade una capa de eficiencia a casi
cualquier actividad.
ACTIVIDAD
Realizar en grupos de trabajo un glosario de los
siguientes conceptos:

Datos Data Warehousing


Base de datos Data Like
Big Data Data Silos
Redes Neuronales Feature Engineering
Limpieza de Datos Data driven
Preparación de Datos Data Literacy
Curación de Datos Single Source of Truth
Visualización de Datos Data Warehousing
Modelo Predictivo
PRÁCTICA PROFESIONAL I CICLO 01 | 2024

¿QUE ES COBIT?
Antes que nada ... Repasemos
Conceptos Generales
Gobierno de Ge
Ad sti
TI mi ón
nis /
tra
ció
n

ó n
a ci
r m
f o
In
Seguridad
De la ISO 38500.: Gobierno Corporativo de
TI
1.6.2 Gobierno Corporativo: Sistema mediante el
cual se dirigen y controlan las Organizaciones.
1.63 Gobierno Corporativo de TI: Sistema mediante
el cual se dirige y controla el uso actual o futuro
de la Tecnología de la información.
El Gobierno Corporativo de TI implica la
evaluación y dirección del uso de dicha tecnología
para dar soporte a la organización y el monitoreo
de este uso para alcanzar los planes. Este incluye
la estrategia y las políticas para utilizar la
tecnología de la información dentro de una
organización.
Conclusión importante

Gobierno de TI es la capacidad
de lograr el alineamiento,
seguridad, eficiencia y eficacia
en los procesos de tecnología
de información (TI) mediante la
integración de métricas y
controles (Marcos de trabajo)
dentro de la plataforma
tecnológica para establecer la
mejora continua y
proporcionar valor a la
organización.
Ges tión /
Adm inis tra ción

Ges tión : es la asu nció n y eje rcic io de res pon sab ilid ade s
sob re un pro ces o (es dec ir, sob re un con jun to de
act ivid ade s) lo que incl uye :
La pre ocu pac ión por la disp osic ión de los rec urs os y
est ruc tur as nec esa rias par a que ten ga lug ar.
La coo rdin aci ón de sus act ivid ade s
La ren dic ión de cue nta s ant e el aba nico de age nte s
inte res ado s por los efe cto s que se esp era que el
pro ces o des enc ade ne.
In f o r m a c ió n

La info rma ción con stit uye un imp orta nte act ivo, ese ncia l par a
las nec esid ade s emp resa rial es de una org aniz ació n. La
info rma ción pue de exis tir de muc has man era s.
Pue de ser imp resa o esc rita en pap el, pue de esta r alm ace nad a
elec trón icam ent e, ser tran smi tida por cor reo o por med ios
elec trón icos , se pue de mos trar por vide os o exp one r ora lme nte
en con ver sac ione s.
Datos
Proceso
Información
Seguridad

La prot ecci ón conf erid a a un siste ma de info rma ción auto mat izad o con
el fin de alca nzar los obje tivo s apli cab les de la pres erva ción de la
inte grid ad, disp onib ilida d y conf iden ciali dad de los recu rsos del
siste ma de info rma ción (inc luye hard war e, soft war e, info rma ción /
dato s y tele com unic acio nes)
3.3. Conf iden cialid ad. La prop ieda d que esa infor mac ión esté
disp onib le y no sea divu lgad a a pers onas , entid ades o proc esos
no-a utor izad os.
3.8 Integ ridad . La prop ieda d de salva guar dar la exac titud e ISO 2700 1
integ ridad de los activ os.
3.2 Disp onib ilida d. La prop ieda d de esta r disp onib le y utiliz able
cuan do lo requ iera una entid ad auto rizad a.
COBIT: Control Objectivies for Information
and Related Technology. (Objetivos de
control para la información y tecnologías
relacionadas)

Esta desarrollado por ISACA (Information


Systems Audit and Control Association) y
el IT Governance Institute (ITGI)
El Marco de COBIT
Ayuda a las Organizaciones a crear un valor óptimo a partir
de TI, al mantener un equilibrio entre la realización de
Beneficios y la Optimización de los niveles de riesgo y
Utilización de los recursos.

Permite que las tecnologías de la información y


relacionadas se gobiernen y administren de una manera
holística (con un enfoque Holístico) a nivel de toda la
Organización, incluyendo el alcance completo de todas las
áreas de responsabilidad funcionales y de negocios,
considerando los intereses relacionados con TI de las partes
interesadas internass y externas
COBIT / EVOLUCIÓN

Un Marco Empresarial de ISACA, en www.isaca.org/cobit


Los Principios
de COBIT 5

Fuente: COBIT®5, Figura 2. ISACA® Todos los derechos reservados


1. Satisfacer las Necesidades de las Partes
Interesadas
Las Organizaciones tienen muchas partes interesadas y
"Crear valor" significa cosas diferentes - a veces
conflictivas - para cada una de ellas.

Para cada decisión se puede, y se debe, hacer las


siguientes preguntas:
¿Quién recibe los beneficios?
¿Quién asume el riesgo?
¿Qué recursos se necesitan?
Satisfacer las Necesidades de
las Partes Interesadas (cont.)

Las metas en cascada de COBIT 5


traducen las necesidades de las
Partes Interesadas en metas
específicas, accionables y
personalizadas dentro del
contexto de la Organización, de
las metas relacionadas con la TI y
de las metas habilitadoras.
¿Cúal es entonces el Valor para las partes interesadas?

Para lograr valor para las partes interesadas de la Organización, se


requiere un buen gobierno y una buena administración de los activos
de TI y de la información.
Los Directivos, Gerentes y Ejecutivos de las Organizaciones deben
acoger la TI como cualquier otra parte importante del negocio.
Cada día aumentan y se complican más los requisitos externos, tanto
legales como de cumplimiento regulatorio y contractual, relacionados
con el uso de la información y la tecnología en la Organización,
amenazando el patrimonio si no se cumplen.
COBIT 5 proporciona un marco integral que ayuda a las Organizaciones
a lograr su metas y entregar valor mediante un gobierno y una
administración efectivos de la TI de la Organización
2. Cubrir la organización de forma integral
COBIT 5 integra el gobierno y la administración de la tecnología de
la información relacionadas desde una perspectiva integral a nivel
de toda la Organización.
Cubre todas las funciones y procesos necesarios para gobernar y
gestionar la información corporativa y las tecnologías
relacionadas, contempla todos los servicios TI internos y externos
relevantes, así como los procesos de negocio internos y externos.
Los catalizadores permite a cada grupo de interés definir requisitos
exhaustivos y completos para la información y el ciclo de vida de
procesamiento de la información, conectando de este modo el
negocio y su necesidad de una información adecuada y la función TI,
y soportando el negocio y el enfoque de contexto.
3. Aplicar un solo marco integrado

COBIT 5 está alineado con los últimos marcos y normas relevantes


usadas por las organizaciones:

Corporativo: COSO, COSO ERM, ISO/IEC 9000, ISO/IEC 31000.


Relacionado con TI: ISO/IEC 38500, ITIL, la serie ISO/IEC 27000,
TOGAF, PMBOK/PRINCE2, CMMI
4. Aplicar un enfoque holístico

Los catalizadores son factores que, individual y colectivamente,


influyen sobre si algo funcionará – en este caso, el gobierno y la
gestión de la empresa TI, impulsados por las metas en cascada, es
decir las metas de alto nivel relacionadas con la TI definen qué
deberían lograr los diferentes habilitadores.

Las cuatro dimensiones comunes de los catalizadores son:


1. Grupos de interés
2. Metas
3. Ciclo de vida
4. Buenas prácticas
5. Separar el gobierno de la administración

La posición de COBIT 5 sobre esta fundamental distinción entre


gobierno y gestión/administración es:

Gobierno.
El Gobierno asegura que se evalúan las necesidades, condiciones y
opciones de las partes interesadas para determinar que se alcanzan
las metas corporativas equilibradas y acordadas; estableciendo la
dirección a través de la priorización y la toma de decisiones; y
midiendo el rendimiento y el cumplimiento respecto a la dirección y
metas acordadas.
5. Separar el gobierno de la administración

Es necesario identificar los tipos de gobiernos que existen:

Gobierno Corporativo
Gobierno de Proyectos
Gobierno de Tecnologías de Información
Gobierno Ambiental
Gobierno Económico y Financiero
5. Separar el gobierno de la administración

Gestión.
La gestión planifica, construye, ejecuta y controla actividades
alineadas con la dirección establecida por el cuerpo de gobierno
para alcanzar las metas empresariales, la descripción de este
proceso es continuamente identificar, evaluar y reducir los riesgos
relacionados con TI dentro de los niveles de tolerancia
establecidos por la dirección ejecutiva de la empresa CEO.
5. Separar el gobierno de la administración
PRÁCTICA PROFESIONAL I CICLO 01 | 2024

DATA
ANALYTICS
DATA ANALYTICS

Es el proceso mediante el cual se


Definición analizan datos crudos a fin de
responder preguntas y llegar a
conclusiones prácticas, muchas de
estas técnicas han llegado a
automatizarse hasta llegar a ser
procesos mecánicos.
Mediante las técnicas de data
analytics es posible encontrar
tendencias y mediciones que de lo
contrario habrían sido pasadas por
alto dentro de la enorme cantidad
de información con la que se suele
trabajar. Estos datos pueden usarse
para optimizar procesos y aumentar
la eficiencia de la empresa.
Es importante porque permite
que las empresas optimicen su
desempeño. Así, implementarla
dentro del modelo de negocios
significa que las empresas
pueden reducir costos al
identificar formas más
eficientes de funcionar, así
como una cantidad enorme de
información.
¿CÓMO FUNCIONA?
Data analytics es un término amplio que comprende muchos tipos
diferentes de análisis de datos. Casi cualquier clase de información
puede someterse a las técnicas de data analytics a fin de mejorar el
funcionamiento interno de una empresa o sistema.

Por ejemplo, las empresas de manufactura a menudo registran el


tiempo de ejecución y de inactividad de varias máquinas. Esto a fin de
analizar la información y crear un plan que administre mejor las
cargas de trabajo y alcanzar un pico de eficiencia en el trabajo.

Sin embargo, data analytics puede hacer mucho más que simplemente
señalar las falencias en la producción. Las empresas de contenido
usan muchas de estas mismas técnicas para mantener a sus
visitantes haciendo clic y viendo su contenido.
¿CUAL ES EL PROCESO?
CUAL ES EL PROCESO?
Requisitos de información
Determinar los requisitos
de información o cómo los
datos se encuentran
agrupados. Estos podrían
dividirse en base a edad,
ingresos, género, etc.
Todos aquellos valores
pueden ser numéricos o
separarse por categorías.
CUAL ES EL PROCESO?
Recolección de datos

Esto podría hacerse por


diferentes medios como
computadoras, fuentes online,
cámaras, fuentes ambientales,
personal, etc.
CUAL ES EL PROCESO?
Analisis
Una vez que se obtiene la
información, esta debe ser
analizada. Ese proceso puede
llevarse a cabo en una hoja de
cálculos o, de preferencia, en algún
Software especializado en
procesamiento de datos, en el que
sea posible gestionar datos
estadísticos de manera
automatizada.
CUAL ES EL PROCESO?
Limpieza

Luego, antes de empezar el análisis de la


información, se procede a limpiarla.
Aquéllo significa que la data es revisada
con cuidado para asegurarse de que no
haya errores, duplicados o que no se
encuentre incompleta. Este paso ayuda a
corregir cualquier falla antes de que sean
enviadas al analista de datos.
TIPOS DE DATA ANALYTICS
DIAGNOSTIC ANALYTICS
Esta se enfoca en explicar por qué suceden las
cosas y el diagnóstico. Esto requiere el uso de
diferentes tipos de información y plantear
diferentes hipótesis. ¿Fue un factor externo como el
clima lo que afectó la venta regular de los
productos? ¿La última campaña de marketing tuvo
algún impacto en las ventas? ¿Algún mensaje fue
especialmente relevante o atractivo para algún
grupo de datos?
DESCRIPTIVE ANALYTICS

Consiste en describir lo que ha sucedido en un


periodo determinado de tiempo. ¿El número de
impresiones o visualizaciones ha subido? ¿Las
cifras de ventas en este mes son más altas que las
del mes anterior?
PREDICTIVE ANALYTICS

Aquí nos enfocamos en la predicción y los


eventos que sucederán en el futuro cercano.
¿Qué sucedió con las ventas la última vez
que hubo un cambio súbito en el clima?
¿Cuántos modelos de predicción de clima
muestran cambios importantes en el verano
que se acerca?
PRESCRIPTIVE ANALYTICS

Este sugiere un curso de acción. Por ejemplo, si la mayoría de


los modelos de predicción de clima señalan que la posibilidad
de un cambio importante en el clima es mayor del 58%, lo
más recomendable será tomar las medidas apropiadas para
asegurar que tengamos suficiente producto que vender, así
como, tal vez combinar con alguna promoción y/o estrategia
de venta cruzada para sacar el mejor provecho de los
factores externos, con base en el análisis de datos históricos.
¿DIFERENCIA ENTRE
DATA ANALYTICS Y BI?
Business Intelligence se enfoca en
proporcionar informes y visualizaciones
para ayudar en la toma de decisiones,
Data Analytics se enfoca en descubrir
patrones y tendencias

También podría gustarte