4.cinvestav Ipn

Análisis de sentimiento sobre textos en Español basado en
aproximaciones semánticas con reglas lingüı́sticas

Sentiment analysis of texts in spanish based on semantic approaches with
linguistic rules
Roberto Hernández Petlachi y Xiaoou Li

Department of Computer Science
CINVESTAV-IPN
Av. IPN 2508, col. Zacatenco
C.P. 07360, México DF
[email protected], [email protected]
Resumen: La aparición de blogs, foros y redes sociales en internet, donde hay

una multitud de usuarios expresando opiniones sobre una gran variedad de temas;
ha despertado el interés del ámbito empresarial. Se ve en este tipo de recursos una
oportunidad de conocer como sus productos son percibidos por los consumidores,
es por ello que se han requerido de soluciones para analizar y monitorizar estas
opiniones. Nuestra propuesta está basada en aproximaciones semánticas con reglas
lingüı́sticas para la clasificación de polaridad de textos en español. La clasificación
de la polaridad en las palabras se hace de acuerdo a un diccionario de orientación
semántica donde cada término se encuentra marcado con un valor de uso y va-
lor emocional, junto con reglas lingüı́sticas para resolver varias contrucciones que
podrı́an afectar la polaridad del texto.
Palabras clave: análisis de sentimiento, freeling, minerı́a de opinión, clasificación
de la polaridad.
Abstract: The emergence of blogs, forums and social networks sites where there is
a multitude of users expressing opinions on a wide variety of topics; has aroused the
interest of the business world. We see in this type of resources a chance to meet their
products are perceived by consumers, is why solutions are required to analyze and
monitor these reviews. Our proposal is based on semantic approaches with linguistic
rules for classifying polarity texts in Spanish. Polarity classification in the words is
done according to a dictionary of semantic orientation where each term is labeled
with a use value and emotional value, along with linguistic rules to solve various
constructions that could affect the polarity of text.
Keywords: sentiment analysis, freeling, Opinion Mining, polarity classification.
1 Introducción tienen a su disposición una gran variedad

de herramientas al alcance sin precedentes
“Lo que otros piensan” ha sido una pieza
para poder compartir sus experiencias de
importante de información para la ma-
marca y opiniones (positivas o negativas), en
yorı́a de nosotros durante el proceso de
relación con cualquier producto o servicio.
toma de decisiones. Mucho antes de que
Como las grandes empresas están creciendo
la conciencia de la World Wide Web se
cada vez más empiezan a darse cuenta, que
generalizara, muchos de nosotros pedimos
las voces de los consumidores pueden ejercer
a nuestros amigos que nos recomienden un
una enorme influencia en la formación de
buen electricista, pedir cartas de referencia
las opiniones de otros consumidores y, en
con respecto a los solicitantes de empleo a
última instancia, su fidelidad de marca, sus
los colegas, o consultar los comentarios de
decisiones de compra, y su defensa de la
los consumidores para decidir qué producto
marca. Las empresas pueden responder a
o servicio comprar. Con la explosión de
las opiniones de los consumidores que se
las plataformas Web 2.0, tales como blogs,
generan a través del monitoreo y análisis de
foros de discusión y otros tipos de medios
medios sociales mediante la modificación de
de comunicación social, los consumidores
sus mensajes de marketing, posicionamiento dor semántico base no supervisado. (Bakliwal
de marca, desarrollo de productos, y otras et al., 2012) presenta un método de puntua-
actividades en consecuencia. ción del sentimiento no supervisado y com-
paran su propuesta con un método supervi-
En este artı́culo presentamos una clasifi- sado. Por otro lado, Martı́n-Wanton y Carri-
cación de la polaridad con aproximaciones llo de Albornoz (2012) proponen un méto-
que combinan el conocimiento semántico con do basado en diccionarios afectivos y Word-
reglas lingüı́sticas para textos en español. Net. Trabajos recientes sobre el análisis de
Finalmente debemos destacar el desafı́o que español son los trabajos de (Vilares, Alonso,
significa trabajar con textos espontáneos en y Gómez-Rodrı́guez, 2013) donde hacen una
español, plagados de errores ortográficos y clasificación de la polaridad mediante análi-
cierto desapego a las normas gramaticales sis sintáctico de dependencias que les brinda
especialmente en la puntuación. mejores resultados con respecto a los sistemas
puramente léxicos. La mayorı́a de los trabajos
El artı́culo se organiza de la siguiente ma- recientes acerca de la clasificación de la pola-
nera. En la sección 2 se revisan brevemen- ridad se enfocan en el idioma inglés, dándole
te los antecedentes referentes a la clasifica- poca importancia al español. En este último
ción de polaridad, en la sección 3 detallamos lenguaje el sistema más relevante es SODic-
nuestra solución. En sección 4 se ilustran los tionariesV1.11Spa realizado por (Brooke, To-
resultados experimentales. Finalmente en la filoski, y Taboada, 2009) . Donde este resuel-
sección 5 se muestran las conclusiones y trave la orientación semántica a nivel individual
bajos a futuro. en sustantivos, verbos, adjetivos y adverbios;
trata modificadores de la polaridad como son
2 Antecedentes los intensificadores y la negación. La manera
El análisis de sentimiento en el procesamien- de tratar todas estas construcciones lingüı́sti-
to del lenguaje natural se refiere, a la disci- cas a nivel léxico, con lo cual el SODictiona-
plina que comprende la tarea de identificar- riesV1.11Spa nos ayuda a resolver estas cons-
clasificar fragmentos de texto que contengan trucciones.
emotiva opinión o subjetiva. Las tareas que se La negación en el análisis de sentimiento
pueden englobar en la disciplina, cabe desta- ha sido estudiada en los últimos años, los tra-
car la detección de polaridad donde los textos bajos tradicionales utilizan métodos supervi-
dados son clasificados y analizados según la sados que modelan el texto como un conjunto
carga emotiva que presenten ya sea positiva o de frecuencia de palabras asignándole un va-
negativa; la detección de la subjetividad cuyo lor binario. (Choi y Cardie, 2008) su hipótesis
objetivo es la identificación de fragmentos de es asumir que las palabras dentro de una ex-
textos que poseen un significado o una carga presión interactúan unos con otros para de-
subjetiva expresada por parte del autor. terminar la polaridad total de la expresión.
Nuestra propuesta se enfoca principal- (Yang et al., 2010) considera la negación co-
mente a la clasificación de la polaridad en mo los términos situados a la derecha. Otro
textos en español. El uso del término senti- trabajo relacionado (Taboada et al., 2011),
miento en relación al análisis de textos apa- utiliza información morfológica para identifi-
reció por primera vez en los trabajos de (Das car la negación.
y Chen, 2001) y (Tong, 2001) sobre la pre-
dicción de juicios para analizar el comporta- El uso del lenguaje en plataformas de re-
miento de los mercados. Solamente un año des sociales en internet presenta un desafı́o
después, el termino análisis de sentimiento interesante. Al tratarse de escritura es-
fue acuñado por (Turney, 2002) en referen- pontánea y creativa con marcados rasgos de
cia a sus aproximaciones para la clasificación oralidad, la ortografı́a resulta ser sumamen-
de textos en función de su polaridad, donde te variable, debemos abarcar no solo una co-
se presenta una fórmula matemática para el rrección ortográfica si no también de caracte-
cálculo de lo que Turney denomino Orienta- res repetidos, palabras abreviadas y de signos
ción Semántica. (Zhang et al., 2011) propo- de puntuación, haremos uso el algoritmo de
nen un método supervisado para el análisis Levenshtein, con sus operaciones de edición
de textos cortos (Twitter) que es entrenado (inserción, borrado y sustitución) para la co-
con los datos proporcionados por un analiza- rrección ortográfica.
3 Solución término al candidato generado por el al-
Nuestra solución se basa en aproximaciones goritmo. Para corregir las palabras se ha-
semánticas, etiquetación morfológica y orien- ce uso de un diccionario de palabras, el
tación semántica con métodos supervisados, cual se compone de la lista completa de
para ası́ determinar la polaridad del texto. formas del Corpus de Referencia del Es-
Como primer paso pre procesamos, seguido pañol Actual (CREA) de la Real Aca-
de la lematización entrenando las frases en la demia Española, con frecuencias de uso
herramienta Freeling, tokenización y segmen- y con las formas conjugadas más usadas,
tación, posteriormente la etiquetación, una aproximadamente son 128 000 formas. Si
vez teniendo estos pasos, aplicamos las reglas una palabra no es encontrada en nuestro
lingüı́sticas para obtener la clasificación de diccionario, el algoritmo tomara la pa-
polaridad. El sistema ha sido preparado para labra más cercana con distancia 1, y la
trabajar con el idioma Espa nol. reemplazara.
3.1 Preprocesamiento Corrección de caracteres repetidos: espe-

cialmente en el caso de vocales, reempla-
Corrección de signos de puntuación: es zamos la repetición de la misma concu-
importante hacer resaltar que los signos rrencia por una sola, con excepción de
de puntuación en el análisis de senti- cc,rr,ll . Una vez que se obtiene el texto
miento son muy importantes debido a limpio procedemos a realizar la lemati-
que si se colocan de manera incorrec- zación de las palabras para obtener su
ta, pueden afectar negativamente al res- lema sin conjugación, junto con la toke-
to del procesado (por ejemplo:“Hasta la nización y la segmentación de las oracio-
prox . VERACRUZ ... Gracias ... ”) nes para ası́ poder clasificar la polaridad
Normalización de URL: las direcciones (por ejemplo: largoooooo → largo”).
web presentes en un tuit son sustituidas
por la cadena “enlace”. 3.2 Identificación de conceptos
Reemplazo de emoticonos: muchas de con carga emocional
las herramientas existentes en internet Una vez el sistema ha determinado todos los
cuentan con un catálogo de emoticonos conceptos de cada oración, el siguiente paso
que ayudan a los usuarios a expresar me- consiste en traducir cada concepto identifi-
jor lo que están sintiendo al momento de cado a su correspondiente carga emocional
escribir sus opiniones. Para poder usar con un léxico afectivo, en el caso de que el
esta información creamos una bolsa de concepto tenga una categorı́a emocional aso-
emoticones más usuales en los textos y ciada. Para realizar este paso se precisa, por
su respectivo significado, y reemplaza- tanto, de un léxico afectivo llamado SODic-
mos esta cadena de caracteres por una tionariesV1.11Spa de orientación semántica,
cadena que pueda ser buscada en el dic- este diccionario almacena valores que reflejan
cionario de orientación semántica y nos el sentimiento de una colección de palabras de
ayude a definir la polaridad de cada uno distintas categorı́as gramaticales.
de los textos que contenga dicha carac- Para obtener la polaridad de los textos se
terı́stica. genera una sumatoria de todas las palabras
Corrección de abreviaturas: se sustitu- de la opinión que se encuentren en los diccio-
yen algunas de las palabras abreviadas narios como se muetra en la ecuación 1.
más habituales por su forma gramatical
N
reconocida (por ejemplo: “q”→ “que”, X
OStexto = P alabras (1)
“xq” → “porque”).
i=1
Corrección de palabras: para la correc-
3.3 Intensificadores en el análisis
ción ortográfica utilizamos el algoritmo
de Levenshtein con su noción de distan- de sentimientos
cia. El cual calcula la distancia entre Identificar la intensificación permite conocer
dos términos como la mı́nima cantidad cuáles son los puntos que intención de desta-
de operaciones de edición (borrado, in- car una idea. Los intensificadores son un gru-
serción y sustitución) para corregir un po de modificadores emocionales a tener en
cuenta cuando se plantea desarrollar un siste- “no.es prácticamente idéntica en todas las si-
ma de análisis de sentimientos. Los intensifi- tuaciones posibles. La única diferencia es el
cadores se definen como términos capaces de tipo de dependencia con el que se anota cuan-
ampliar o disminuir la intensidad emocional do el negador depende de un verbo en vez de
del texto al que afectan. cualquier otro tipo de construcción.
Para realizar esta tarea seguimos el en- Para resolver la negación en vez de inver-
foque de (Taboada et al., 2011), donde ca- tir la polaridad de la palabra afectada por
da cuantificador lleva asociado un porcentaje negación, modificamos su valor en una can-
que var ı́a seg ún la intensidad con la que tidad fija de signo contrario al sentimiento
aumente o disminuya el texto al que afecta. de la palabra afectada por la negación, con
La intensificación basada en porcentajes pro- lo que se consigue un enfoque más real de
pone que cada intensificador tenga un por- la negación. Tomando en cuenta que las pa-
centaje asociado, positivo si es amplificador labras fuertemente negativas tienen un valor
y negativo si es decrementador. Esto permite de −5, tomamos el mismo valor para poder
que las oraciones sem ánticas se modifiquen generar la polaridad con palabras que con-
de forma que se tenga en cuenta las polarida- tengan esta caracterı́stica. Esto es para cada
des de los elementos involucrados. palabra positiva afectada por la negación se
El mecanismo seguido en el sistema para tomara a dicha palabra y se le restara el va-
la detección de intensificadores en los textos lor de 5, la palabra con valoración negativa
consiste en la comparación de los términos de tendrá una suma de 5 (por ejemplo: horri-
cada oración con todas las entradas de la lista ble −4, No está horrible = 1, genial 4, No
de intensificadores proporcionada por el dic- está genial = -1, querer = 2, No quiero = -3).
cionario SODictionariesV1.11Spa. Cuando el Pare esto construimos un diccionario pro-
sistema detecta una coincidencia, comprue- pio que contienen las formas posibles en el
ba a su vez que el rol gramatical del término idioma español de negar un hecho como son
identificado es el adecuado, y si es ası́, éste es :
marcado como intensificador. Posteriormente
se le suma el porcentaje ya sea para incre- La negación se produce usualmente an-
mentar o decrementar la palabra, y esto va- teponiendo al verbo el adverbio nega-
lor es Intintensif icador es la palabra encontra- tivo “no”: [No] tengo hambre. Incluso
da en nuestro diccionario de intensificadores, hay que tomar encuenta el alcance de la
que servirá como incrementador o decremen- negación para verificar que palabra esta
tador, multiplicado por la palabra que afecta, afectando, por ejemplo: No está mal.
el resultado final obtenido se suma junto con
los demás términos encontrados para obtener También mediante otros adverbios, por
la polaridad final del texto. ejemplo:
Nunca: Nunca lo dije.
3.4 Negación en el análisis de Nada: Nada trajo.
sentimientos Tampoco: Tampoco está mal.
La detección de la negación es un proceso Con la utilización de conjunciones
complejo que no solo abarca la identificación negativas “ni”:
de las palabras o términos que expresan la [Ni] compraré hoy [ni] com-
negación, sino también su ámbito de acción; praré mañana.
es decir, las palabras afectadas por dicha ne-
gación. 4 Resultados experimentales
La negación es una de las construcciones
lingüı́sticas que más influye en el análisis de 4.1 Datos de entrenamiento
polaridad de los textos. La negación es una El conjunto de datos de entrenamiento Ctrain
construcción habitual a la hora de expresar proporcionado por la organización TASS
una opinión. Una forma de negar una idea en 2014 consiste en 7,219 mensajes de Twitter.
el español es mediante el término “no”, aun- Cada tweet esta etiquetado con una polari-
que existen otros negadores como “tampoco”, dad global, indicando si en el texto se expre-
“sin.o “nunca”que son también utilizados con sa un sentimiento positivo, neutral, negativo
frecuencia. o ningun sentimiento. 6 niveles han sido de-
La estructura sintáctica para la negación finidos: fuertemente positivo (P+), positivo
(P), neutral (NEU), negativo (N), fuertemen- Presición Recall Medida F
te negativo (N+) and sin sentimiento (NO- 3 Niveles 0.6192 1 0.7648
NE) como se muestra en la tabla 1. El núme- 5 Niveles 0.4558 1 0.6261
ro de tweets correspondiente a P+ y NONE
son los que continene mas alto porcentaje en Tabla 3: Resultados obtenidos sobre la eva-
el corpus. luación del conjunto de test.
Sentimiento % # Tweets # de Tweets

P+ 22.44 % 1619 Los valores más altos en el diccionario de
P 4.12 % 297 orientación semántica son: fuertemente po-
NEU 8.45 % 610 sitivo +5 y fuertemente negativo -5, dentro
N 16.91 % 1220 de los cuales tomamos los rangos para gene-
N+ 12.51 % 903 rar los resultados de las categorı́as correspon-
NONE 23.58 % 1846 dientes, donde podemos notar que en la cla-
sificación de los tweets neutros se alcanza un
Tabla 1: Distribución por clases de polaridad bajo rendimiento, se puede deber a muchas
en corpus train Ctrain razones una de ellas es la mezcla de ideas a
. favor y en contra que dificultan la clasifica-
ción de estos textos.
Este corpus fue utilizado para realizar el Para poder obtener los resultados utiliza-
entrenamiento necesario para probar nuestra mos el rango antes mencionado y mostrado
solución. en la ecuación 2, donde para cada categorı́a
los valores fueron tomados de la siguiente
4.2 Evaluación manera:
Nuestra solución fue evaluada utilizando el
corpus test Ctest de TASS 2014 que con-
siste en 60,798 mensajes de Twitter. Cada X = −5 . . . 5 (2)
tweet esta etiquetado con una polaridad glo-
bal, indicando si en el texto se expresa un Para valores positivos (P) el rango toma
sentimiento positivo, neutral, negativo o nin- fue X >= 1
gun sentimiento. Se ha realizado experimen- Para valores negativos (N) el rango toma
tos para las dos tareas de clasificación de fue X <= −1
polaridad: cuatros categorı́as (Positivo → P,
Neutral → NEU, Negativo → N, NONE) y Para valores neutrales (NEU) el rango
seis categorı́as (Fuertemente Positivo → P+, toma fue
Positivo → P, Neutral → NEU, Negativo → −1 < X < 1
N, Fuertemente Negativo → N+, NONE) co- Para valores que no contienen sentimien-
mo se muestra en la tabla 2. Los resultados tos, fue necesario declara una variable
se evalúan siguiendo las métricas de preci- que indicara la carencia de esta caracte-
sión, recall y la medida F. En el cuadro 3 se ristica para poder clasificarlos con (NO-
incluyen los resultados para las dos categori- NE).
zaciones (3 y 5 niveles).
Analizando a detalle los resultados llega-
Sentimiento % # Tweets # de Tweets
mos a la conclusión que tenemos errores en
P+ 34.12 % 20,745
la subjetividad de los tweets y además en
P 2.45 % 1,488
las reglas lingüı́sticas tomadas para realizar
NEU 2.15 % 1,305 la negación de los mismos. Además de que
N 18.56 % 11,287 los valores de precisión son más bajos en los
N+ 7.5 % 4557 casos de valores neutrales.
NONE 35.22 % 21,416
5 Conclusiones y trabajo futuro
Tabla 2: Distribución por clases de polaridad
en corpus Ctest Es bien sabido que la importancia del análi-
. sis de sentimientos se ha visto incrementada
debido a la inmensa cantidad de información
subjetiva disponible. Es por ello que en este
artı́culo presentamos una propuesta que em- analysis: From english to spanish. Inter-
plea conocimiento semántico y lingüı́stico pa- national Conference RANLP, páginas 50–
ra detectar el sentimiento de los tweets escri- 54.
tos en español. Los resultados experimenta- Choi, Yejin y Claire Cardie. 2008. Learning
les muestran un buen rendimiento y sugieren with compositional semantics as structu-
que la estructura morfosintáctica de los tex- ral inference for subsentential sentiment
tos junto con reglas lingüı́sticas es muy útil analysis. En Proceedings of the Conferen-
para detectar la polaridad de dichos textos. ce on Empirical Methods in Natural Lan-
En definitiva, estamos convencidos de que el guage Processing, páginas 793–801. Asso-
análisis de sentimiento es un muy reciente ciation for Computational Linguistics.
campo de aplicaciones práctica de la investi-
gación académica con una clara relación con Das, Sanjiv y Mike Chen. 2001. Yahoo! for
la industria. En los trabajos a futuro serı́a in- amazon: Extracting market sentiment
teresante integrar en el análisis los signos de from stock message boards. In Procee-
interrogación y las risas para tener un acer- dings of the Asia Pacific Finance Asso-
camiento más real al sentimiento que expre- ciation Annual Conference.
sa el usuario, además de rediseñar las reglas Dı́az, Ismael, Grigori Sidorov, y Sergio
lingüı́sticas para la negación, donde una de Suárez-Guerra. 2014. Creación y evalua-
las cuestiones mejor estudiadas de la nega- ción de un diccionario marcado con emo-
ción es la negación lógica mediante medios ciones y ponderado para el español. En
sintácticos, atendido al orden. Entre las len- TASS 2012 Working Notes, Mexico.
guas del mundo cuatro posibilidades para el
Kamps, J. y M. Marx. 2002. Words with
orden relativo del sujeto, del objeto y del ver-
attitude. 1st International WordNet Con-
bo mezclado con la negación, siendo los más
ference, páginas 332–341, Septiembre.
frecuentes por orden: SOV-Neg, S-Neg-VO,
Neg-VSO, Neg-VOS. También se deben con- Kim, Soo-Min y Eduard Hovy. 2004. Deter-
siderar las herramientas disponibles de la pla- mining the sentiment of opinions. En Pro-
taforma como el uso de hashtags que en nues- ceedings of the 20th International Confe-
tra solución no son tomados en cuenta y que rence on Computational Linguistics, CO-
en ocasiones son el único indicador de senti- LING ’04, Stroudsburg, PA, USA. Asso-
miento indicado en el tweet: #FelicesFiestas, ciation for Computational Linguistics.
#muchassonrisaslindas, #horror, entre otros. Maas, Andrew L., Raymond E. Daly, Pe-
ter T. Pham, Dan Huang, Andrew Y. Ng,
Bibliografı́a y Christopher Potts. 2011. Learning word
Abbasi, Ahmed, Hsinchun Chen, y Arab Sa- vectors for sentiment analysis. En Pro-
lem. 2008. Sentiment analysis in multi- ceedings of the 49th Annual Meeting of
ple languages: Feature selection for opi- the Association for Computational Lin-
nion classification in web forums. ACM guistics: Human Language Technologies -
Trans. Inf. Syst., 26(3):12:1–12:34. Volume 1, Stroudsburg, PA, USA. Asso-
Abdul-Mageed, Muhammad, Sandra Kübler, ciation for Computational Linguistics.
y Mona Diab. 2012. Samar: a system for Martı́n-Watson, T y J Carrillo de Albor-
subjectivity and sentiment analysis of ara- noz. 2012. Sistema para la clasificación
bic social media. En Proceedings of the 3rd de la polaridad y seguimiento de temas.
Workshop in Computational Approaches En TASS 2012 Working Notes, Castelón,
to Subjectivity and Sentiment Analysis, Spain.
WASSA ’12, Stroudsburg, PA, USA. As-
Nasukawa, Tetsuya y Jeonghee Yi. 2003.
sociation for Computational Linguistics.
Sentiment analysis: capturing favorability
Bakliwal, Akshat, Piyush Arora, Senthil using natural language processing. En
Madhappan, Nikhil Kapre, Mukesh Singh, Proceedings of the 2nd international con-
y Vasudeva Varma. 2012. Mining senti- ference on Knowledge capture, K-CAP
ments from tweets. WASSA 2012, pági- ’03, páginas 70–77, New York, NY, USA.
na 11.
Pang, Bo. 2012. Opinion Mining and Sen-
Brooke, Julian, Milan Tofiloski, y Maite Ta- timent Analysis, volumen 1. Morgan and
boada. 2009. Cross-linguistic sentiment Claypool, Hanover, MA, USA, Mayo.
Pang, Bo, Lillian Lee, y Shivakumar Vaith- Zhang, Lei, Riddhiman Ghosh, Mohamed
yanathan. 2002. Thumbs up?: senti- Dekhil, Meichun Hsu, y Bing Liu. 2011.
ment classification using machine learning Combining lexicon-based and learning-
techniques. En Proceedings of the ACL- based methods for twitter sentiment
02 conference on Empirical methods in analysis. HP Laboratories HPL-2011-89.
natural language processing - Volume 10,
EMNLP ’02, páginas 79–86, Stroudsburg,
PA, USA. Association for Computational
Linguistics.
Saralegi Urizar, X y I San Vicente Roncal.
2012. Detecting sentiments in spanish
tweets. IEEE, Working Notes.
Su, Qi, Xinying Xu, Honglei Guo, Zhili Guo,
Xian Wu, Xiaoxun Zhang, Bin Swen, y
Zhong Su. 2008. Hidden sentiment as-
sociation in chinese web opinion mining.
En Proceedings of the 17th international
conference on World Wide Web, WWW
’08, New York, NY, USA. ACM.
Taboada, Maite, Julian Brooke, Milan To-
filoski, Kimberly Voll, y Manfred Stede.
2011. Lexicon-based methods for senti-
ment analysis. Comput. Linguist., 37(2),
Junio.
Tong, Richard M. 2001. An operational sys-
tem for detecting and tracking opinions in
on-line discussion. 1(6).
Turney, Peter D. 2002. Thumbs up or
thumbs down?: semantic orientation ap-
plied to unsupervised classification of re-
views. En Proceedings of the 40th Annual
Meeting on Association for Computational
Linguistics, Stroudsburg, PA, USA. Asso-
ciation for Computational Linguistics.
Vilares, David, Miguel Ángel Alonso, y Car-
los Gómez-Rodrı́guez. 2013. Supervised
polarity classification of spanish tweets
based on linguistic knowledge. En Pro-
ceedings of the 2013 ACM symposium on
Document engineering, páginas 169–172.
ACM.
Yamg, Kiduk. 2008. Widit in trec 2008 blog
track: Leveraging multiple sources of opi-
nion evidence. Indiana, USA.
Yang, Qiang, Sinno Jialin Pan, Xiaochuan
Ni, Jian-Tao Sun, y Zheng Chen. 2010.
Cross-domain sentiment classification via
spectral feature alignment. En Procee-
dings of the 19th International Conference
on World Wide Web, WWW ’10, páginas
751–760, New York, NY, USA. ACM.

4.cinvestav Ipn

Cargado por

Copyright:

Formatos disponibles

4.cinvestav Ipn

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

4.cinvestav Ipn

Cargado por

Copyright:

Formatos disponibles

Análisis de sentimiento sobre textos en Español basado en

aproximaciones semánticas con reglas lingüı́sticas

Roberto Hernández Petlachi y Xiaoou Li

Resumen: La aparición de blogs, foros y redes sociales en internet, donde hay

1 Introducción tienen a su disposición una gran variedad

3.1 Preprocesamiento Corrección de caracteres repetidos: espe-

Sentimiento % # Tweets # de Tweets

También podría gustarte