Brochure Web Scraping Python
Brochure Web Scraping Python
Curso:
tación
Presen
os
objetiv
ios
benefic
s
Syllabu
o d o d e pago
M
ado
Certific
to
Contac
Web Scraping con Python
Recolección de datos estructurados y no estructurados
2
Presentación
Existe muchos datos en Internet que están esperando ser analizados para convertirse en información
ción
resenta
y posteriormente en conocimiento. Pero, ¿cómo obtener esos datos de una manera escalable y
P estructurada? Lo que necesitamos hacer se llama web scraping. Web scraping es un técnica que
sirve para obtener datos de una página web seleccionada de forma automatizada y guardarlos en un
archivo o en una base de datos. Así mismo, esta técnica nos va a permitir transformar los datos no
os
objetiv estructurados de la web en datos estructurados. Este curso permitirá aprender a empezar a recolectar
datos que se encuentran en distintas páginas web para poder utilizarlos en tus proyectos de análisis
de datos, machine learning, investigación, entre otros.
ios
benefic
Syllabu
s Dirigido a:
99 Desarrolladores, analistas, jefes de proyecto, personal de instituciones involucradas en el diseño,
desarrollo de modelos predictivos que buscan enriquecer sus datasets internos.
ago
odo de p
99 Profesionales de áreas de inteligencia comercial, marketing digital, business intelligence, etc.
M 99 Administradores de riesgos y especialistas en modelos.
99 Académicos, investigadores que busquen probar sus investigaciones con data distinta.
99 Científicos de datos, entusiastas y público en general.
ado
Certific
Contac
to Requisitos:
Conocimientos básicos de programación, de preferencia experiencia usando el lenguaje de programación
Python. Conocimientos básicos de estructura de páginas web, HTML.
Objetivos
99 Entender que es web scraping, cómo y sobre qué funciona. Diferencia con web
tación
crawling.
Presen 99 Poder entender y hacer el análisis del HTML de una página web.
99 Conocer los métodos de extracción.
99 Conocer la librería Scrapy para realizar la tarea de web scraping.
os
objetiv
99 Reconocer páginas web que usan JavaScript.
99 Aprender a automatizar interacciones con Python usando Selenium.
99 Automatizar el ingreso de captchas (reconocer dígitos).
ios 99 Desarrollo de un spider para un e-commerce.
benefic 99 Aprender a automatizar un web spider.
s
Syllabu
Metodología
go
Mo do de pa Nuestra metodología es Learning by Doing. El aprendizaje que proponemos se basa
en la práctica y el desarrollo de casos reales. El analítico aprende mejor en la práctica
y solucionando casos, los cuales son tomados de las experiencias del medio local e
ado internacional.
Certific
Para eso, se dispone de lo siguientes herramientas:
99 Base de datos de prueba para aplicar lo aprendido.
to
Contac 99 Casos de aplicación, situaciones reales con aplicación en el mercado peruano e
internacional.
99 Material didáctico con el desarrollo del curso.
99 Una PC por participante.
Beneficios
tación
Presen 99 Certificado de especialización.
99 Pertenecer a la comunidad más grande de profesionales de business analytics.
os
objetiv 99 Plana docente compuesta por líderes del sector, especializados en herramientas y temas a
desarrollar.
ios 99 Descuentos en programas complementarios.
benefic 99 Laboratorios de cómputo.
99 Material didáctico con el desarrollo del curso.
s
Syllabu 99 Acceso a bibliografía especializada.
99 Acceso a la bolsa de trabajo especializada de DMC.
o d o d e pago
M
Las empresas actuales están buscando profesionales que se diferencien en la gestión.
Las ventajas competitivas que obtienes al estar en constante capacitación son muchas,
ado
Certific entre las que destacamos:
Syllabus Instructor
I. Preliminares: Michael Larico B.:
ción
resenta
• Introducción al web scraping.
Bachiller de Ingeiería de Sistemas. Actualmente se desempeña como
P • Conceptos relacionados al web scraping.
• Introducción HTML - tags.
Data Engineer en el Banco de Crédito del Perú. Con experiencia en
big data, business intelligence, lenguajes de programación como
Python y herramientas de visualización y Spark, SQL en empresas
os II. Herramientas para un análisis de una página web: del sector telecomunicaciones.
Medios de pago
1. Depósito en las cuentas BBVA o BCP:
tación
Presen
N° Cuenta de Ahorros: 0011-0177-02-00180473
N° Cuenta de Corriente: 193-2251181-0-01
os
objetiv Razón Social J&J Data Mining Consulting S.A.C
o d o d e pago
M
ado
Certific 3. Oficina DMC:
Pagos en efectivo o con cualquier tipo de tarjeta vía:
to
Contac
Dirección: Calle Río de la Plata 167, Of. 203, San Isidro. Lima - Perú.
Horario de atención: de lunes a viernes de 9:00 a.m. a 8:00 p.m. y
sábados de 9:00 a.m. a 6:00 p.m.
Certificado
Certificación otorgada a nombre de DMC Perú, empresa de capacitación líder en herramientas
tación
Presen
analíticas del Perú.
99Certificado de especialización
os
objetiv ¿Cómo obtengo mi certificado de especialización?
s
Syllabu
o d o d e pago
M
ado
Certific
to
Contac
DMC Perú
DMC es una empresa pionera dedicada a la extracción de conocimiento desde grandes bases de datos, con
más de 10 años experiencia en la capacitación de temas de Minería de Datos, Scoring de Riesgo Crediticio,
tación Business Intelligence, Técnicas de segmentación, Business Analytics y Big Data. DMC es la única empresa
Presen peruana reconocida como uno de los referentes de capacitación en temas de Big Data.
os
objetiv Algunas empresas que confiaron en nosotros:
ios
benefic
s
Syllabu
o d o d e pago
M
ado
Certific
to
Contac
Contacto
Email: [email protected]
tación
Presen Web: www.dmc.pe
Teléfono: (511) 253-5066
os Móvil: 924209481 / 975491764
objetiv Dirección: Calle Río de la Plata 167, Of. 203. San Isidro. Lima - Perú.
Horario de atención: de lunes a viernes de 9:00 a.m. a 8:00 p.m. y sábados de 9:00 a.m. a 6:00 p.m.
ios
benefic BCP
Embajada Embajada
Cuba Francia
s
Syllabu
FEDERICO VILLARREAL
AV. AREQUIPA
AV. AREQUIPA
ado
CLLE. HEMILIO HERNÁNDEZ CLLE. RÍO DE LA PLATA 167 CALLE RÍO DE LA PLATA
Certific Trilce
FEDERICO VILLARREAL
AV. PETIT THOUARS
to
Contac
AV. AREQUIPA
AV. AREQUIPA
Global Tv TA
OS
S AC
O
RL
ATV CA
CHACARILLA
PALLARDELLI
AV. A