0% encontró este documento útil (0 votos)
102 vistas

Brochure Web Scraping Python

Este documento presenta un curso sobre web scraping con Python. El curso enseña a recolectar datos estructurados y no estructurados de páginas web de forma automatizada usando herramientas como Scrapy y Selenium. Los estudiantes aprenderán a analizar el código HTML, extraer datos, construir spiders y automatizar tareas como el reconocimiento de captchas.

Cargado por

CarlosN.Sánchez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
102 vistas

Brochure Web Scraping Python

Este documento presenta un curso sobre web scraping con Python. El curso enseña a recolectar datos estructurados y no estructurados de páginas web de forma automatizada usando herramientas como Scrapy y Selenium. Los estudiantes aprenderán a analizar el código HTML, extraer datos, construir spiders y automatizar tareas como el reconocimiento de captchas.

Cargado por

CarlosN.Sánchez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 9

1

Curso:

tación
Presen

os
objetiv

ios
benefic
s
Syllabu

o d o d e pago
M
ado
Certific

to
Contac
Web Scraping con Python
Recolección de datos estructurados y no estructurados
2

Presentación
Existe muchos datos en Internet que están esperando ser analizados para convertirse en información
ción
resenta
y posteriormente en conocimiento. Pero, ¿cómo obtener esos datos de una manera escalable y
P estructurada? Lo que necesitamos hacer se llama web scraping. Web scraping es un técnica que
sirve para obtener datos de una página web seleccionada de forma automatizada y guardarlos en un
archivo o en una base de datos. Así mismo, esta técnica nos va a permitir transformar los datos no
os
objetiv estructurados de la web en datos estructurados. Este curso permitirá aprender a empezar a recolectar
datos que se encuentran en distintas páginas web para poder utilizarlos en tus proyectos de análisis
de datos, machine learning, investigación, entre otros.
ios
benefic

Syllabu
s Dirigido a:
99 Desarrolladores, analistas, jefes de proyecto, personal de instituciones involucradas en el diseño,
desarrollo de modelos predictivos que buscan enriquecer sus datasets internos.
ago
odo de p
99 Profesionales de áreas de inteligencia comercial, marketing digital, business intelligence, etc.
M 99 Administradores de riesgos y especialistas en modelos.
99 Académicos, investigadores que busquen probar sus investigaciones con data distinta.
99 Científicos de datos, entusiastas y público en general.
ado
Certific

Contac
to Requisitos:
Conocimientos básicos de programación, de preferencia experiencia usando el lenguaje de programación
Python. Conocimientos básicos de estructura de páginas web, HTML.

Web: dmc.pe Teléfono. 253-5066 Móvil: 924209481/ 975491764 Email: [email protected]


Atrás Siguiente
3

Objetivos
99 Entender que es web scraping, cómo y sobre qué funciona. Diferencia con web

tación
crawling.
Presen 99 Poder entender y hacer el análisis del HTML de una página web.
99 Conocer los métodos de extracción.
99 Conocer la librería Scrapy para realizar la tarea de web scraping.
os
objetiv
99 Reconocer páginas web que usan JavaScript.
99 Aprender a automatizar interacciones con Python usando Selenium.
99 Automatizar el ingreso de captchas (reconocer dígitos).
ios 99 Desarrollo de un spider para un e-commerce.
benefic 99 Aprender a automatizar un web spider.

s
Syllabu
Metodología
go
Mo do de pa Nuestra metodología es Learning by Doing. El aprendizaje que proponemos se basa
en la práctica y el desarrollo de casos reales. El analítico aprende mejor en la práctica
y solucionando casos, los cuales son tomados de las experiencias del medio local e
ado internacional.
Certific
Para eso, se dispone de lo siguientes herramientas:
99 Base de datos de prueba para aplicar lo aprendido.
to
Contac 99 Casos de aplicación, situaciones reales con aplicación en el mercado peruano e
internacional.
99 Material didáctico con el desarrollo del curso.
99 Una PC por participante.

Web: dmc.pe Teléfono. 253-5066 Móvil: 924209481/ 975491764 Email: [email protected]


Atrás Siguiente
4

Beneficios
tación
Presen 99 Certificado de especialización.
99 Pertenecer a la comunidad más grande de profesionales de business analytics.
os
objetiv 99 Plana docente compuesta por líderes del sector, especializados en herramientas y temas a
desarrollar.
ios 99 Descuentos en programas complementarios.
benefic 99 Laboratorios de cómputo.
99 Material didáctico con el desarrollo del curso.
s
Syllabu 99 Acceso a bibliografía especializada.
99 Acceso a la bolsa de trabajo especializada de DMC.

o d o d e pago
M
Las empresas actuales están buscando profesionales que se diferencien en la gestión.
Las ventajas competitivas que obtienes al estar en constante capacitación son muchas,
ado
Certific entre las que destacamos:

• Rentabilidad única en el mercado laboral.


to
Contac • Desarrollo de pensamiento crítico y analítico.
• Serás un profesional muy valorado en la actualidad.

Web: dmc.pe Teléfono. 253-5066 Móvil: 924209481/ 975491764 Email: [email protected]


Atrás Siguiente
5

Syllabus Instructor
I. Preliminares: Michael Larico B.:
ción
resenta
• Introducción al web scraping.
Bachiller de Ingeiería de Sistemas. Actualmente se desempeña como
P • Conceptos relacionados al web scraping.
• Introducción HTML - tags.
Data Engineer en el Banco de Crédito del Perú. Con experiencia en
big data, business intelligence, lenguajes de programación como
Python y herramientas de visualización y Spark, SQL en empresas

os II. Herramientas para un análisis de una página web: del sector telecomunicaciones.

objetiv • Análisis de una página web.


• Métodos de extracción: expresiones regulares,
BeautifulSoup, selectores. Paulo César Tuya R.:
ios • Construcción de un web scraper simple.
benefic III. Web Scraping con Scrapy:
Predocente de la Pontificia Universidad Católica del Perú en la
especialidad de Ingeniería Informática. Desarrollador de proyectos
de extracción de información y análisis de datos estructurados y
• Selectores: XPATH, CSS. no estructurados, experiencia en la construcción de modelos de
s
Syllabu
• Mi primer spider. prospección de riesgo crediticio en el sector bancario.
• Conociendo la arquitectura de un proyecto con Scrapy.
• Items, Items Loaders.
• Callbacks.

o d o d e pago • Pipelines: limpiando la data obtenida.


M
IV. Scraping en páginas web con JavaScript / automatizar
ingreso captchas I:
ado
Certific
• Reconocer código JavaScript. Nota: Todos los profesores mencionados están relacionados al
• Usar Selenium para poder automatizar las curso especializado. No necesariamente podrían desarrollar una
interacciones en una página web. clase.
• Ingresar los dígitos de un captcha automáticamente.
to
Contac V. Spider final:
• Análisis de la página web.
• Implementación del spider.
• Pruebas unitarias.
• Puesta en producción, automatización del spider.

Web: dmc.pe Teléfono. 253-5066 Móvil: 924209481/ 975491764 Email: [email protected]


Atrás Siguiente
6

Medios de pago
1. Depósito en las cuentas BBVA o BCP:

tación
Presen
N° Cuenta de Ahorros: 0011-0177-02-00180473
N° Cuenta de Corriente: 193-2251181-0-01

os
objetiv Razón Social J&J Data Mining Consulting S.A.C

ios R.U.C 20520972740


benefic
s 2. Pago online:
Syllabu

o d o d e pago
M
ado
Certific 3. Oficina DMC:
Pagos en efectivo o con cualquier tipo de tarjeta vía:
to
Contac
Dirección: Calle Río de la Plata 167, Of. 203, San Isidro. Lima - Perú.
Horario de atención: de lunes a viernes de 9:00 a.m. a 8:00 p.m. y
sábados de 9:00 a.m. a 6:00 p.m.

Web: dmc.pe Teléfono. 253-5066 Móvil: 924209481/ 975491764 Email: [email protected]


Atrás Siguiente
7

Certificado
Certificación otorgada a nombre de DMC Perú, empresa de capacitación líder en herramientas
tación
Presen
analíticas del Perú.
99Certificado de especialización

os
objetiv ¿Cómo obtengo mi certificado de especialización?

Al finalizar el curso el capacitador evaluará a los participantes con un caso aplicativo:


ios
benefic
99La nota mínima requerida es (14) catorce.
99Asistencia mínima del 80% en todo el curvso.

s
Syllabu

o d o d e pago
M
ado
Certific

to
Contac

Web: dmc.pe Teléfono. 253-5066 Móvil: 924209481/ 975491764 Email: [email protected]


Atrás Siguiente
8

DMC Perú
DMC es una empresa pionera dedicada a la extracción de conocimiento desde grandes bases de datos, con
más de 10 años experiencia en la capacitación de temas de Minería de Datos, Scoring de Riesgo Crediticio,
tación Business Intelligence, Técnicas de segmentación, Business Analytics y Big Data. DMC es la única empresa
Presen peruana reconocida como uno de los referentes de capacitación en temas de Big Data.

os
objetiv Algunas empresas que confiaron en nosotros:
ios
benefic
s
Syllabu

o d o d e pago
M
ado
Certific

to
Contac

Web: dmc.pe Teléfono. 253-5066 Móvil: 924209481/ 975491764 Email: [email protected]


Atrás Siguiente
9

Contacto
Email: [email protected]
tación
Presen Web: www.dmc.pe
Teléfono: (511) 253-5066
os Móvil: 924209481 / 975491764​
objetiv Dirección: Calle Río de la Plata 167, Of. 203. San Isidro. Lima - Perú.
Horario de atención: de lunes a viernes de 9:00 a.m. a 8:00 p.m. y sábados de 9:00 a.m. a 6:00 p.m.
ios
benefic BCP
Embajada Embajada
Cuba Francia

s
Syllabu

FEDERICO VILLARREAL
AV. AREQUIPA

AV. AREQUIPA

AV. PETIT THOUARS


o d o d e pago
M Británico Scotiabank

ado
CLLE. HEMILIO HERNÁNDEZ CLLE. RÍO DE LA PLATA 167 CALLE RÍO DE LA PLATA

Certific Trilce

FEDERICO VILLARREAL
AV. PETIT THOUARS
to
Contac
AV. AREQUIPA

AV. AREQUIPA

Global Tv TA
OS
S AC
O
RL
ATV CA
CHACARILLA

PALLARDELLI

AV. PETIT THOU


Web: dmc.pe Teléfono. 253-5066 Móvil: 924209481/ 975491764 Email: [email protected]
Atrás Siguiente
AV. A

AV. A

También podría gustarte