Tarea #2

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 5

TAREA

N° 2 3-4

MINERÍA DE DATOS
Asignatura: MINERÍA DE DATOS

Sistemas de clasificación y recomendación.


UNIDAD 3-4:
Aplicaciones alternativas de Data Mining.

Objetivo de la Tarea

Aplicar técnicas de minería de texto para analizar y procesar datos recopilados de


Twitter, y así desarrollar un clasificador de sentimientos que pueda identificar y
predecir la actitud emocional expresada en los tweets de los usuarios. Esto
permitirá comprender mejor las emociones de los usuarios y proporcionar
información valiosa para la toma de decisiones en áreas como el marketing, la
atención al cliente, entre otros.

INSTRUCCIONES
• Lea la información proporcionada en el compendio de la unidad 3 y 4
• Lea detenidamente lo solicitado:

El análisis de sentimiento se refiere a la aplicación del procesamiento del


lenguaje natural, la lingüística computacional y el análisis de texto para
identificar y extraer información subjetiva de los materiales de origen. El
análisis de sentimiento tiene como objetivo determinar la actitud de un
hablante o un escritor hacia cualquier tema o incidente. Es el estudio
computacional de las opiniones, valoraciones, actitudes y emociones de las
personas hacia entidades, individuos, problemas, eventos, temas y sus
atributos. Para esto, se necesitan técnicas de minería de datos y de minería
de texto.
Los sitios de redes sociales en estos días son una gran fuente de
comunicación para los usuarios de Internet. Por lo tanto, estos son una
fuente importante para comprender las emociones de las personas. En este
documento, utilizamos técnicas de minería de datos con el fin de clasificar
© Universidad Estatal de Milagro – UNEMI

para realizar un análisis de sentimientos sobre las opiniones que las


personas han compartido en Twitter. Recopilamos conjuntos de datos, es
decir, los tweets de Twitter que están en lenguaje natural y aplicamos
técnicas de minería de texto (tokenización, derivación, etc.) para
convertirlos en una forma útil y luego usarlos para crear un clasificador de
sentimientos que pueda predecir sentimientos felices, tristes y neutrales.
para un tuit en particular. Se utilizará la herramienta RapidMiner, que ayuda
a construir el clasificador y puede aplicarlo al conjunto de datos de prueba.

Para el desarrollo del trabajo deben tomar en consideración las siguientes


pautas y estructura del documento:

2
1. Scraping a Twitter
▪ Cree una conexión de Twitter para especificar la cuenta de
Twitter para el acceso a la API de Twitter.
▪ Realizar scraping a Twitter utilizando la herramienta
RapidMiner
▪ Especificar una consulta y obtener estados de Twitter que
contengan esta consulta.
▪ La extracción de tweets puede ser en idioma español o inglés
▪ Extraer 10000 tweets.
2. Seleccionar el atributo
▪ Del conjunto de datos que fue extraído, se deberá trabajar con
el que contenga el texto del Tweet.
3. Construyendo el Proceso de la información
▪ Realizar la depuración de datos fuentes no válidas cómo
etiquetas de retweets o HTML
▪ Construir un nuevo atributo a partir de los atributos del
conjunto de datos
▪ Aplicar el análisis de sentimientos (positivo, negativo, neutral)
de la fuente de datos
4. Evaluación y Visualización
▪ Crear una base de la información generada
▪ Crear un gráfico Pie Donut basado en el nuevo atributo
5. Palabras claves por grupo:
▪ Grupo 1 --> Artificial Intelligence
▪ Grupo 2 --> Machine Learning
▪ Grupo 3 --> Blockchain
▪ Grupo 4 --> Cybersecurity
▪ Grupo 5 --> Cryptocurrency
▪ Grupo 6 --> Deep Learning
▪ Grupo 7 --> Chatbot
▪ Grupo 8 --> Internet of Things
▪ Grupo 9 --> CloudComputing
© Universidad Estatal de Milagro – UNEMI

▪ Grupo 10 --> BigData


▪ Grupo 11 --> Augmented Reality
▪ Grupo 12 --> Virtual Reality
▪ Grupo 13 --> Quantum Computing
▪ Grupo 14 --> 5G
▪ Grupo 15 --> Smart Home
▪ Grupo 16 --> Autonomous Vehicles
▪ Grupo 17 --> DigitalTransformation
▪ Grupo 18 --> Robotics
6. Video explicativo
▪ El grupo deberá subir un video en Google drive con el permiso
de lectura, donde se explique el proceso realizado y los

3
resultados obtenidos, cabe indicar que la actividad se
revisará sobre ese video; el mismo que debe mostrar con
cámara a los integrantes del grupo en la realización de la
actividad.
7. Requisitos de presentación
▪ Hoja A4
▪ Letra Arial 11
▪ Interlineado: 1,5
▪ Extensión: realizar las capturas de pantallas correspondientes
que sean visibles y que contengan una explicación de los
pasos realizados (importante que aquí se ponga el enlace
para revisar el vídeo).
▪ En un archivo .zip comprimir el documento PDF, archivo de
proceso RapidMiner y archivo de la información generada por
el algoritmo.
▪ El archivo a subir en la plataforma, será el archivo .zip que
contendrá todo lo anterior descrito.
© Universidad Estatal de Milagro – UNEMI

4
© Universidad Estatal de Milagro – UNEMI

FORMATO CONTROLADO: FR0020/ v1.0 / 18-11-2019


6

También podría gustarte