Consulta Scraping Python

Este documento describe el proceso de web scraping y cómo Python es un lenguaje de programación adecuado para esta tarea. Explica que el web scraping implica extraer información específica de páginas web mediante el análisis de su código fuente HTML. Además, destaca que Python es popular para web scraping debido a sus capacidades de procesamiento de texto, apertura de recursos web y análisis de datos, así como las bibliotecas disponibles como Scrapy, Selenium y BeautifulSoup.

Cargado por

Alejandro Galindo

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

229 vistas1 página

Consulta Scraping Python

Cargado por

Alejandro Galindo

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 1

Consulta Scraping Python

Web scraping con Python

La World Wide Web está compuesta por muchos millones de documentos enlazados entre sí,
conocidos también como páginas web. El texto fuente de las páginas web está escrito en el
lenguaje Hypertext Markup Language (HTML). Los códigos fuente en HTML son una mezcla
de informaciones legibles para los humanos y códigos legibles para las máquinas,
llamados tags o etiquetas. El navegador, como puede ser Chrome, Firefox, Safari o Edge,
procesa el texto fuente, interpreta las etiquetas y presenta al usuario la información que
contienen.

Para extraer del texto fuente únicamente la información que le interesa al usuario, se utiliza un
tipo software especial. Se trata de los programas llamados web scrapers, crawlers, spiders o,
simplemente, bots, que examinan el texto fuente de las páginas en busca de patrones concretos y
extraen la información que contienen. Los datos conseguidos mediante web
scraping posteriormente se resumen, combinan, evalúan o almacenan para ser usados más
adelante.
Python, el popular lenguaje de programación se presta especialmente bien para la creación de
programas de web scraping. Puesto que las páginas web han de ser constantemente modificadas
y actualizadas, sus contenidos cambian con el tiempo. Puede que cambie su diseño, por
ejemplo, o que se les añadan nuevos elementos. Los web scrapers se desarrollan teniendo en
cuenta la estructura específica de una página web, de forma que, si dicha estructura
cambia, el scraper también debe modificarse. Este proceso resulta especialmente sencillo con
Python.

Asimismo, Python tiene como puntos fuertes el procesamiento de texto y la apertura de recursos
web, dos de las bases técnicas del web scraping. Python es, además, un estándar consolidado en
materia de análisis y procesamiento de datos. Por si esto fuera poco, Python ofrece un
amplísimo ecosistema de programación, que cuenta con bibliotecas, proyectos de código
abierto, documentación y referencias explicativas del lenguaje, así como entradas de foros,
informes de error y artículos de blog.

Más concretamente, existen varias herramientas consolidadas diseñadas para hacer web

scraping con Python. Te presentamos tres de las más
conocidas: Scrapy, Selenium y BeautifulSoup. Si quieres empezar a practicar, puedes echarle un
vistazo a nuestro tutorial de web scraping con Python, en el que utilizamos BeautifulSoup, que
te ayudará a entender el proceso de scraping.

También podría gustarte

Problemas 6
Aún no hay calificaciones
Problemas 6
13 páginas
Manual de Instalación Visual Studio y SQL Server1
Aún no hay calificaciones
Manual de Instalación Visual Studio y SQL Server1
8 páginas
Seminario Python+Django
Aún no hay calificaciones
Seminario Python+Django
38 páginas
Aprendiendo Python: Desde los Fundamentos hasta la Programación Avanzada: La colección de TI
De Everand
Aprendiendo Python: Desde los Fundamentos hasta la Programación Avanzada: La colección de TI
Christopher Ford
Aún no hay calificaciones
Pymongo
Aún no hay calificaciones
Pymongo
27 páginas
12 Python Interprete de Comandos
Aún no hay calificaciones
12 Python Interprete de Comandos
51 páginas
Herencia en Python
Aún no hay calificaciones
Herencia en Python
8 páginas
Clase - Librería Numpy
Aún no hay calificaciones
Clase - Librería Numpy
41 páginas
Python 3 Numpy
Aún no hay calificaciones
Python 3 Numpy
17 páginas
Introducción A Pandas para Análisis de Series Temporales
Aún no hay calificaciones
Introducción A Pandas para Análisis de Series Temporales
46 páginas
Python Sintax
Aún no hay calificaciones
Python Sintax
11 páginas
Fundamentos de Python 1
Aún no hay calificaciones
Fundamentos de Python 1
30 páginas
Análisis de Sentimientos Con Python (Parte 1)
Aún no hay calificaciones
Análisis de Sentimientos Con Python (Parte 1)
5 páginas
TkInter - de Marciano A Humano - Sección 1 - Generador de Interfaz Gráfica de Usuario Multiplataforma para Python
Aún no hay calificaciones
TkInter - de Marciano A Humano - Sección 1 - Generador de Interfaz Gráfica de Usuario Multiplataforma para Python
10 páginas
PYTHON
Aún no hay calificaciones
PYTHON
9 páginas
Python
Aún no hay calificaciones
Python
10 páginas
Practica 08
Aún no hay calificaciones
Practica 08
26 páginas
Guía Rápida NumPy
Aún no hay calificaciones
Guía Rápida NumPy
107 páginas
Como Instalar Python y Django
Aún no hay calificaciones
Como Instalar Python y Django
4 páginas
Python
Aún no hay calificaciones
Python
366 páginas
Clase 4 - Introducción A La Programación Con Python II
Aún no hay calificaciones
Clase 4 - Introducción A La Programación Con Python II
75 páginas
Django Web Framework
100% (2)
Django Web Framework
19 páginas
Monografía de Lenguaje de Programacion
Aún no hay calificaciones
Monografía de Lenguaje de Programacion
21 páginas
Aprendizaje Automático 8
Aún no hay calificaciones
Aprendizaje Automático 8
30 páginas
Clase #2, Semana 2. Introduccion A Python
Aún no hay calificaciones
Clase #2, Semana 2. Introduccion A Python
9 páginas
Laboratorio 7
Aún no hay calificaciones
Laboratorio 7
17 páginas
If o Condicional en Python - Año 2023
100% (1)
If o Condicional en Python - Año 2023
57 páginas
Web Scraping Con Python Ejemplo
100% (2)
Web Scraping Con Python Ejemplo
4 páginas
PAUL ANDRES - Laboratorio 1 - 1 - Python
Aún no hay calificaciones
PAUL ANDRES - Laboratorio 1 - 1 - Python
32 páginas
Kivy Latest
100% (1)
Kivy Latest
392 páginas
Practica 3 UDP
Aún no hay calificaciones
Practica 3 UDP
2 páginas
Programa Curso Python
Aún no hay calificaciones
Programa Curso Python
3 páginas
Aprendizaje Supervisado
Aún no hay calificaciones
Aprendizaje Supervisado
61 páginas
02 - Django Dia 2
Aún no hay calificaciones
02 - Django Dia 2
32 páginas
Kivy
100% (1)
Kivy
26 páginas
Curso de Programacion en Python PDF
Aún no hay calificaciones
Curso de Programacion en Python PDF
8 páginas
Clase 18 - Django - Porfolio (Parte 2)
Aún no hay calificaciones
Clase 18 - Django - Porfolio (Parte 2)
52 páginas
Apuntes Python V2
Aún no hay calificaciones
Apuntes Python V2
86 páginas
Python
Aún no hay calificaciones
Python
159 páginas
Taller SQLAlchemy
Aún no hay calificaciones
Taller SQLAlchemy
17 páginas
01 - Funciones y Módulos
Aún no hay calificaciones
01 - Funciones y Módulos
23 páginas
Guia Basica Numpy
Aún no hay calificaciones
Guia Basica Numpy
29 páginas
Métodos de Strings
100% (1)
Métodos de Strings
6 páginas
Apuntes Django
Aún no hay calificaciones
Apuntes Django
1 página
Python y WxPython
Aún no hay calificaciones
Python y WxPython
64 páginas
Python
Aún no hay calificaciones
Python
29 páginas
Prog Python Sesion01
Aún no hay calificaciones
Prog Python Sesion01
35 páginas
Servidor Web Con Flask en Python
Aún no hay calificaciones
Servidor Web Con Flask en Python
15 páginas
Tipos de Datos Básicos de Python - Cuáles Son y Características
Aún no hay calificaciones
Tipos de Datos Básicos de Python - Cuáles Son y Características
11 páginas
Python para Informa Ticos: Explorando La Informacio N
Aún no hay calificaciones
Python para Informa Ticos: Explorando La Informacio N
258 páginas
Python 3
Aún no hay calificaciones
Python 3
29 páginas
Programa de Desarrollo Web Con Python
Aún no hay calificaciones
Programa de Desarrollo Web Con Python
5 páginas
Aplicaciones de 3 Capas
Aún no hay calificaciones
Aplicaciones de 3 Capas
23 páginas
Clase 27. Python 3
Aún no hay calificaciones
Clase 27. Python 3
46 páginas
Proyecto Python y SQL
Aún no hay calificaciones
Proyecto Python y SQL
14 páginas
Bucle For Anidado en Python
Aún no hay calificaciones
Bucle For Anidado en Python
4 páginas
HTML 5 Y CSS
De Everand
HTML 5 Y CSS
antonio1961
Aún no hay calificaciones
Programación en Objetive-C con Xcode y GCC
De Everand
Programación en Objetive-C con Xcode y GCC
Miguel Ángel G. Arias
Aún no hay calificaciones
Programar en C | Paso a Paso: La guía sencilla para principiantes
De Everand
Programar en C | Paso a Paso: La guía sencilla para principiantes
M.Eng. Johannes Wild
Aún no hay calificaciones
Matplotlib, Introducción a la Visualización 2D, Parte II
De Everand
Matplotlib, Introducción a la Visualización 2D, Parte II
Luis Brito
Aún no hay calificaciones
Numpy Libro 1, Introducción
De Everand
Numpy Libro 1, Introducción
Luis Brito
Aún no hay calificaciones
Problemas 9
100% (1)
Problemas 9
5 páginas
Problemas 1
Aún no hay calificaciones
Problemas 1
17 páginas
Problemas 1
Aún no hay calificaciones
Problemas 1
16 páginas
Fundamento Conceptual4
Aún no hay calificaciones
Fundamento Conceptual4
4 páginas