Este documento presenta un método para clasificar la polaridad de textos en español basado en aproximaciones semánticas con reglas lingüísticas. Combina un diccionario de orientación semántica que etiqueta términos con valores de uso y emoción con reglas lingüísticas para resolver construcciones que podrían afectar la polaridad del texto, como intensificadores y negación. El método clasifica la polaridad a nivel de palabras y texto para analizar opiniones expresadas en blogs, foros y redes sociales.
0 calificaciones0% encontró este documento útil (0 votos)
33 vistas7 páginas
Este documento presenta un método para clasificar la polaridad de textos en español basado en aproximaciones semánticas con reglas lingüísticas. Combina un diccionario de orientación semántica que etiqueta términos con valores de uso y emoción con reglas lingüísticas para resolver construcciones que podrían afectar la polaridad del texto, como intensificadores y negación. El método clasifica la polaridad a nivel de palabras y texto para analizar opiniones expresadas en blogs, foros y redes sociales.
Este documento presenta un método para clasificar la polaridad de textos en español basado en aproximaciones semánticas con reglas lingüísticas. Combina un diccionario de orientación semántica que etiqueta términos con valores de uso y emoción con reglas lingüísticas para resolver construcciones que podrían afectar la polaridad del texto, como intensificadores y negación. El método clasifica la polaridad a nivel de palabras y texto para analizar opiniones expresadas en blogs, foros y redes sociales.
Este documento presenta un método para clasificar la polaridad de textos en español basado en aproximaciones semánticas con reglas lingüísticas. Combina un diccionario de orientación semántica que etiqueta términos con valores de uso y emoción con reglas lingüísticas para resolver construcciones que podrían afectar la polaridad del texto, como intensificadores y negación. El método clasifica la polaridad a nivel de palabras y texto para analizar opiniones expresadas en blogs, foros y redes sociales.
Resumen: La aparición de blogs, foros y redes sociales en internet, donde hay
una multitud de usuarios expresando opiniones sobre una gran variedad de temas; ha despertado el interés del ámbito empresarial. Se ve en este tipo de recursos una oportunidad de conocer como sus productos son percibidos por los consumidores, es por ello que se han requerido de soluciones para analizar y monitorizar estas opiniones. Nuestra propuesta está basada en aproximaciones semánticas con reglas lingüı́sticas para la clasificación de polaridad de textos en español. La clasificación de la polaridad en las palabras se hace de acuerdo a un diccionario de orientación semántica donde cada término se encuentra marcado con un valor de uso y va- lor emocional, junto con reglas lingüı́sticas para resolver varias contrucciones que podrı́an afectar la polaridad del texto. Palabras clave: análisis de sentimiento, freeling, minerı́a de opinión, clasificación de la polaridad. Abstract: The emergence of blogs, forums and social networks sites where there is a multitude of users expressing opinions on a wide variety of topics; has aroused the interest of the business world. We see in this type of resources a chance to meet their products are perceived by consumers, is why solutions are required to analyze and monitor these reviews. Our proposal is based on semantic approaches with linguistic rules for classifying polarity texts in Spanish. Polarity classification in the words is done according to a dictionary of semantic orientation where each term is labeled with a use value and emotional value, along with linguistic rules to solve various constructions that could affect the polarity of text. Keywords: sentiment analysis, freeling, Opinion Mining, polarity classification.
1 Introducción tienen a su disposición una gran variedad
de herramientas al alcance sin precedentes “Lo que otros piensan” ha sido una pieza para poder compartir sus experiencias de importante de información para la ma- marca y opiniones (positivas o negativas), en yorı́a de nosotros durante el proceso de relación con cualquier producto o servicio. toma de decisiones. Mucho antes de que Como las grandes empresas están creciendo la conciencia de la World Wide Web se cada vez más empiezan a darse cuenta, que generalizara, muchos de nosotros pedimos las voces de los consumidores pueden ejercer a nuestros amigos que nos recomienden un una enorme influencia en la formación de buen electricista, pedir cartas de referencia las opiniones de otros consumidores y, en con respecto a los solicitantes de empleo a última instancia, su fidelidad de marca, sus los colegas, o consultar los comentarios de decisiones de compra, y su defensa de la los consumidores para decidir qué producto marca. Las empresas pueden responder a o servicio comprar. Con la explosión de las opiniones de los consumidores que se las plataformas Web 2.0, tales como blogs, generan a través del monitoreo y análisis de foros de discusión y otros tipos de medios medios sociales mediante la modificación de de comunicación social, los consumidores sus mensajes de marketing, posicionamiento dor semántico base no supervisado. (Bakliwal de marca, desarrollo de productos, y otras et al., 2012) presenta un método de puntua- actividades en consecuencia. ción del sentimiento no supervisado y com- paran su propuesta con un método supervi- En este artı́culo presentamos una clasifi- sado. Por otro lado, Martı́n-Wanton y Carri- cación de la polaridad con aproximaciones llo de Albornoz (2012) proponen un méto- que combinan el conocimiento semántico con do basado en diccionarios afectivos y Word- reglas lingüı́sticas para textos en español. Net. Trabajos recientes sobre el análisis de Finalmente debemos destacar el desafı́o que español son los trabajos de (Vilares, Alonso, significa trabajar con textos espontáneos en y Gómez-Rodrı́guez, 2013) donde hacen una español, plagados de errores ortográficos y clasificación de la polaridad mediante análi- cierto desapego a las normas gramaticales sis sintáctico de dependencias que les brinda especialmente en la puntuación. mejores resultados con respecto a los sistemas puramente léxicos. La mayorı́a de los trabajos El artı́culo se organiza de la siguiente ma- recientes acerca de la clasificación de la pola- nera. En la sección 2 se revisan brevemen- ridad se enfocan en el idioma inglés, dándole te los antecedentes referentes a la clasifica- poca importancia al español. En este último ción de polaridad, en la sección 3 detallamos lenguaje el sistema más relevante es SODic- nuestra solución. En sección 4 se ilustran los tionariesV1.11Spa realizado por (Brooke, To- resultados experimentales. Finalmente en la filoski, y Taboada, 2009) . Donde este resuel- sección 5 se muestran las conclusiones y tra- ve la orientación semántica a nivel individual bajos a futuro. en sustantivos, verbos, adjetivos y adverbios; trata modificadores de la polaridad como son 2 Antecedentes los intensificadores y la negación. La manera El análisis de sentimiento en el procesamien- de tratar todas estas construcciones lingüı́sti- to del lenguaje natural se refiere, a la disci- cas a nivel léxico, con lo cual el SODictiona- plina que comprende la tarea de identificar- riesV1.11Spa nos ayuda a resolver estas cons- clasificar fragmentos de texto que contengan trucciones. emotiva opinión o subjetiva. Las tareas que se La negación en el análisis de sentimiento pueden englobar en la disciplina, cabe desta- ha sido estudiada en los últimos años, los tra- car la detección de polaridad donde los textos bajos tradicionales utilizan métodos supervi- dados son clasificados y analizados según la sados que modelan el texto como un conjunto carga emotiva que presenten ya sea positiva o de frecuencia de palabras asignándole un va- negativa; la detección de la subjetividad cuyo lor binario. (Choi y Cardie, 2008) su hipótesis objetivo es la identificación de fragmentos de es asumir que las palabras dentro de una ex- textos que poseen un significado o una carga presión interactúan unos con otros para de- subjetiva expresada por parte del autor. terminar la polaridad total de la expresión. Nuestra propuesta se enfoca principal- (Yang et al., 2010) considera la negación co- mente a la clasificación de la polaridad en mo los términos situados a la derecha. Otro textos en español. El uso del término senti- trabajo relacionado (Taboada et al., 2011), miento en relación al análisis de textos apa- utiliza información morfológica para identifi- reció por primera vez en los trabajos de (Das car la negación. y Chen, 2001) y (Tong, 2001) sobre la pre- dicción de juicios para analizar el comporta- El uso del lenguaje en plataformas de re- miento de los mercados. Solamente un año des sociales en internet presenta un desafı́o después, el termino análisis de sentimiento interesante. Al tratarse de escritura es- fue acuñado por (Turney, 2002) en referen- pontánea y creativa con marcados rasgos de cia a sus aproximaciones para la clasificación oralidad, la ortografı́a resulta ser sumamen- de textos en función de su polaridad, donde te variable, debemos abarcar no solo una co- se presenta una fórmula matemática para el rrección ortográfica si no también de caracte- cálculo de lo que Turney denomino Orienta- res repetidos, palabras abreviadas y de signos ción Semántica. (Zhang et al., 2011) propo- de puntuación, haremos uso el algoritmo de nen un método supervisado para el análisis Levenshtein, con sus operaciones de edición de textos cortos (Twitter) que es entrenado (inserción, borrado y sustitución) para la co- con los datos proporcionados por un analiza- rrección ortográfica. 3 Solución término al candidato generado por el al- Nuestra solución se basa en aproximaciones goritmo. Para corregir las palabras se ha- semánticas, etiquetación morfológica y orien- ce uso de un diccionario de palabras, el tación semántica con métodos supervisados, cual se compone de la lista completa de para ası́ determinar la polaridad del texto. formas del Corpus de Referencia del Es- Como primer paso pre procesamos, seguido pañol Actual (CREA) de la Real Aca- de la lematización entrenando las frases en la demia Española, con frecuencias de uso herramienta Freeling, tokenización y segmen- y con las formas conjugadas más usadas, tación, posteriormente la etiquetación, una aproximadamente son 128 000 formas. Si vez teniendo estos pasos, aplicamos las reglas una palabra no es encontrada en nuestro lingüı́sticas para obtener la clasificación de diccionario, el algoritmo tomara la pa- polaridad. El sistema ha sido preparado para labra más cercana con distancia 1, y la trabajar con el idioma Espa nol. reemplazara.
3.1 Preprocesamiento Corrección de caracteres repetidos: espe-
cialmente en el caso de vocales, reempla- Corrección de signos de puntuación: es zamos la repetición de la misma concu- importante hacer resaltar que los signos rrencia por una sola, con excepción de de puntuación en el análisis de senti- cc,rr,ll . Una vez que se obtiene el texto miento son muy importantes debido a limpio procedemos a realizar la lemati- que si se colocan de manera incorrec- zación de las palabras para obtener su ta, pueden afectar negativamente al res- lema sin conjugación, junto con la toke- to del procesado (por ejemplo:“Hasta la nización y la segmentación de las oracio- prox . VERACRUZ ... Gracias ... ”) nes para ası́ poder clasificar la polaridad Normalización de URL: las direcciones (por ejemplo: largoooooo → largo”). web presentes en un tuit son sustituidas por la cadena “enlace”. 3.2 Identificación de conceptos Reemplazo de emoticonos: muchas de con carga emocional las herramientas existentes en internet Una vez el sistema ha determinado todos los cuentan con un catálogo de emoticonos conceptos de cada oración, el siguiente paso que ayudan a los usuarios a expresar me- consiste en traducir cada concepto identifi- jor lo que están sintiendo al momento de cado a su correspondiente carga emocional escribir sus opiniones. Para poder usar con un léxico afectivo, en el caso de que el esta información creamos una bolsa de concepto tenga una categorı́a emocional aso- emoticones más usuales en los textos y ciada. Para realizar este paso se precisa, por su respectivo significado, y reemplaza- tanto, de un léxico afectivo llamado SODic- mos esta cadena de caracteres por una tionariesV1.11Spa de orientación semántica, cadena que pueda ser buscada en el dic- este diccionario almacena valores que reflejan cionario de orientación semántica y nos el sentimiento de una colección de palabras de ayude a definir la polaridad de cada uno distintas categorı́as gramaticales. de los textos que contenga dicha carac- Para obtener la polaridad de los textos se terı́stica. genera una sumatoria de todas las palabras Corrección de abreviaturas: se sustitu- de la opinión que se encuentren en los diccio- yen algunas de las palabras abreviadas narios como se muetra en la ecuación 1. más habituales por su forma gramatical N reconocida (por ejemplo: “q”→ “que”, X OStexto = P alabras (1) “xq” → “porque”). i=1 Corrección de palabras: para la correc- 3.3 Intensificadores en el análisis ción ortográfica utilizamos el algoritmo de Levenshtein con su noción de distan- de sentimientos cia. El cual calcula la distancia entre Identificar la intensificación permite conocer dos términos como la mı́nima cantidad cuáles son los puntos que intención de desta- de operaciones de edición (borrado, in- car una idea. Los intensificadores son un gru- serción y sustitución) para corregir un po de modificadores emocionales a tener en cuenta cuando se plantea desarrollar un siste- “no.es prácticamente idéntica en todas las si- ma de análisis de sentimientos. Los intensifi- tuaciones posibles. La única diferencia es el cadores se definen como términos capaces de tipo de dependencia con el que se anota cuan- ampliar o disminuir la intensidad emocional do el negador depende de un verbo en vez de del texto al que afectan. cualquier otro tipo de construcción. Para realizar esta tarea seguimos el en- Para resolver la negación en vez de inver- foque de (Taboada et al., 2011), donde ca- tir la polaridad de la palabra afectada por da cuantificador lleva asociado un porcentaje negación, modificamos su valor en una can- que var ı́a seg ún la intensidad con la que tidad fija de signo contrario al sentimiento aumente o disminuya el texto al que afecta. de la palabra afectada por la negación, con La intensificación basada en porcentajes pro- lo que se consigue un enfoque más real de pone que cada intensificador tenga un por- la negación. Tomando en cuenta que las pa- centaje asociado, positivo si es amplificador labras fuertemente negativas tienen un valor y negativo si es decrementador. Esto permite de −5, tomamos el mismo valor para poder que las oraciones sem ánticas se modifiquen generar la polaridad con palabras que con- de forma que se tenga en cuenta las polarida- tengan esta caracterı́stica. Esto es para cada des de los elementos involucrados. palabra positiva afectada por la negación se El mecanismo seguido en el sistema para tomara a dicha palabra y se le restara el va- la detección de intensificadores en los textos lor de 5, la palabra con valoración negativa consiste en la comparación de los términos de tendrá una suma de 5 (por ejemplo: horri- cada oración con todas las entradas de la lista ble −4, No está horrible = 1, genial 4, No de intensificadores proporcionada por el dic- está genial = -1, querer = 2, No quiero = -3). cionario SODictionariesV1.11Spa. Cuando el Pare esto construimos un diccionario pro- sistema detecta una coincidencia, comprue- pio que contienen las formas posibles en el ba a su vez que el rol gramatical del término idioma español de negar un hecho como son identificado es el adecuado, y si es ası́, éste es : marcado como intensificador. Posteriormente se le suma el porcentaje ya sea para incre- La negación se produce usualmente an- mentar o decrementar la palabra, y esto va- teponiendo al verbo el adverbio nega- lor es Intintensif icador es la palabra encontra- tivo “no”: [No] tengo hambre. Incluso da en nuestro diccionario de intensificadores, hay que tomar encuenta el alcance de la que servirá como incrementador o decremen- negación para verificar que palabra esta tador, multiplicado por la palabra que afecta, afectando, por ejemplo: No está mal. el resultado final obtenido se suma junto con los demás términos encontrados para obtener También mediante otros adverbios, por la polaridad final del texto. ejemplo: Nunca: Nunca lo dije. 3.4 Negación en el análisis de Nada: Nada trajo. sentimientos Tampoco: Tampoco está mal. La detección de la negación es un proceso Con la utilización de conjunciones complejo que no solo abarca la identificación negativas “ni”: de las palabras o términos que expresan la [Ni] compraré hoy [ni] com- negación, sino también su ámbito de acción; praré mañana. es decir, las palabras afectadas por dicha ne- gación. 4 Resultados experimentales La negación es una de las construcciones lingüı́sticas que más influye en el análisis de 4.1 Datos de entrenamiento polaridad de los textos. La negación es una El conjunto de datos de entrenamiento Ctrain construcción habitual a la hora de expresar proporcionado por la organización TASS una opinión. Una forma de negar una idea en 2014 consiste en 7,219 mensajes de Twitter. el español es mediante el término “no”, aun- Cada tweet esta etiquetado con una polari- que existen otros negadores como “tampoco”, dad global, indicando si en el texto se expre- “sin.o “nunca”que son también utilizados con sa un sentimiento positivo, neutral, negativo frecuencia. o ningun sentimiento. 6 niveles han sido de- La estructura sintáctica para la negación finidos: fuertemente positivo (P+), positivo (P), neutral (NEU), negativo (N), fuertemen- Presición Recall Medida F te negativo (N+) and sin sentimiento (NO- 3 Niveles 0.6192 1 0.7648 NE) como se muestra en la tabla 1. El núme- 5 Niveles 0.4558 1 0.6261 ro de tweets correspondiente a P+ y NONE son los que continene mas alto porcentaje en Tabla 3: Resultados obtenidos sobre la eva- el corpus. luación del conjunto de test.
Sentimiento % # Tweets # de Tweets
P+ 22.44 % 1619 Los valores más altos en el diccionario de P 4.12 % 297 orientación semántica son: fuertemente po- NEU 8.45 % 610 sitivo +5 y fuertemente negativo -5, dentro N 16.91 % 1220 de los cuales tomamos los rangos para gene- N+ 12.51 % 903 rar los resultados de las categorı́as correspon- NONE 23.58 % 1846 dientes, donde podemos notar que en la cla- sificación de los tweets neutros se alcanza un Tabla 1: Distribución por clases de polaridad bajo rendimiento, se puede deber a muchas en corpus train Ctrain razones una de ellas es la mezcla de ideas a . favor y en contra que dificultan la clasifica- ción de estos textos. Este corpus fue utilizado para realizar el Para poder obtener los resultados utiliza- entrenamiento necesario para probar nuestra mos el rango antes mencionado y mostrado solución. en la ecuación 2, donde para cada categorı́a los valores fueron tomados de la siguiente 4.2 Evaluación manera: Nuestra solución fue evaluada utilizando el corpus test Ctest de TASS 2014 que con- siste en 60,798 mensajes de Twitter. Cada X = −5 . . . 5 (2) tweet esta etiquetado con una polaridad glo- bal, indicando si en el texto se expresa un Para valores positivos (P) el rango toma sentimiento positivo, neutral, negativo o nin- fue X >= 1 gun sentimiento. Se ha realizado experimen- Para valores negativos (N) el rango toma tos para las dos tareas de clasificación de fue X <= −1 polaridad: cuatros categorı́as (Positivo → P, Neutral → NEU, Negativo → N, NONE) y Para valores neutrales (NEU) el rango seis categorı́as (Fuertemente Positivo → P+, toma fue Positivo → P, Neutral → NEU, Negativo → −1 < X < 1 N, Fuertemente Negativo → N+, NONE) co- Para valores que no contienen sentimien- mo se muestra en la tabla 2. Los resultados tos, fue necesario declara una variable se evalúan siguiendo las métricas de preci- que indicara la carencia de esta caracte- sión, recall y la medida F. En el cuadro 3 se ristica para poder clasificarlos con (NO- incluyen los resultados para las dos categori- NE). zaciones (3 y 5 niveles). Analizando a detalle los resultados llega- Sentimiento % # Tweets # de Tweets mos a la conclusión que tenemos errores en P+ 34.12 % 20,745 la subjetividad de los tweets y además en P 2.45 % 1,488 las reglas lingüı́sticas tomadas para realizar NEU 2.15 % 1,305 la negación de los mismos. Además de que N 18.56 % 11,287 los valores de precisión son más bajos en los N+ 7.5 % 4557 casos de valores neutrales. NONE 35.22 % 21,416 5 Conclusiones y trabajo futuro Tabla 2: Distribución por clases de polaridad en corpus Ctest Es bien sabido que la importancia del análi- . sis de sentimientos se ha visto incrementada debido a la inmensa cantidad de información subjetiva disponible. Es por ello que en este artı́culo presentamos una propuesta que em- analysis: From english to spanish. Inter- plea conocimiento semántico y lingüı́stico pa- national Conference RANLP, páginas 50– ra detectar el sentimiento de los tweets escri- 54. tos en español. Los resultados experimenta- Choi, Yejin y Claire Cardie. 2008. Learning les muestran un buen rendimiento y sugieren with compositional semantics as structu- que la estructura morfosintáctica de los tex- ral inference for subsentential sentiment tos junto con reglas lingüı́sticas es muy útil analysis. En Proceedings of the Conferen- para detectar la polaridad de dichos textos. ce on Empirical Methods in Natural Lan- En definitiva, estamos convencidos de que el guage Processing, páginas 793–801. Asso- análisis de sentimiento es un muy reciente ciation for Computational Linguistics. campo de aplicaciones práctica de la investi- gación académica con una clara relación con Das, Sanjiv y Mike Chen. 2001. Yahoo! for la industria. En los trabajos a futuro serı́a in- amazon: Extracting market sen- timent teresante integrar en el análisis los signos de from stock message boards. In Procee- interrogación y las risas para tener un acer- dings of the Asia Pacific Finance Asso- camiento más real al sentimiento que expre- ciation Annual Conference. sa el usuario, además de rediseñar las reglas Dı́az, Ismael, Grigori Sidorov, y Sergio lingüı́sticas para la negación, donde una de Suárez-Guerra. 2014. Creación y evalua- las cuestiones mejor estudiadas de la nega- ción de un diccionario marcado con emo- ción es la negación lógica mediante medios ciones y ponderado para el español. En sintácticos, atendido al orden. Entre las len- TASS 2012 Working Notes, Mexico. guas del mundo cuatro posibilidades para el Kamps, J. y M. Marx. 2002. Words with orden relativo del sujeto, del objeto y del ver- attitude. 1st International WordNet Con- bo mezclado con la negación, siendo los más ference, páginas 332–341, Septiembre. frecuentes por orden: SOV-Neg, S-Neg-VO, Neg-VSO, Neg-VOS. También se deben con- Kim, Soo-Min y Eduard Hovy. 2004. Deter- siderar las herramientas disponibles de la pla- mining the sentiment of opinions. En Pro- taforma como el uso de hashtags que en nues- ceedings of the 20th International Confe- tra solución no son tomados en cuenta y que rence on Computational Linguistics, CO- en ocasiones son el único indicador de senti- LING ’04, Stroudsburg, PA, USA. Asso- miento indicado en el tweet: #FelicesFiestas, ciation for Computational Linguistics. #muchassonrisaslindas, #horror, entre otros. Maas, Andrew L., Raymond E. Daly, Pe- ter T. Pham, Dan Huang, Andrew Y. Ng, Bibliografı́a y Christopher Potts. 2011. Learning word Abbasi, Ahmed, Hsinchun Chen, y Arab Sa- vectors for sentiment analysis. En Pro- lem. 2008. Sentiment analysis in multi- ceedings of the 49th Annual Meeting of ple languages: Feature selection for opi- the Association for Computational Lin- nion classification in web forums. ACM guistics: Human Language Technologies - Trans. Inf. Syst., 26(3):12:1–12:34. Volume 1, Stroudsburg, PA, USA. Asso- Abdul-Mageed, Muhammad, Sandra Kübler, ciation for Computational Linguistics. y Mona Diab. 2012. Samar: a system for Martı́n-Watson, T y J Carrillo de Albor- subjectivity and sentiment analysis of ara- noz. 2012. Sistema para la clasificación bic social media. En Proceedings of the 3rd de la polaridad y seguimiento de temas. Workshop in Computational Approaches En TASS 2012 Working Notes, Castelón, to Subjectivity and Sentiment Analysis, Spain. WASSA ’12, Stroudsburg, PA, USA. As- Nasukawa, Tetsuya y Jeonghee Yi. 2003. sociation for Computational Linguistics. Sentiment analysis: capturing favorability Bakliwal, Akshat, Piyush Arora, Senthil using natural language processing. En Madhappan, Nikhil Kapre, Mukesh Singh, Proceedings of the 2nd international con- y Vasudeva Varma. 2012. Mining senti- ference on Knowledge capture, K-CAP ments from tweets. WASSA 2012, pági- ’03, páginas 70–77, New York, NY, USA. na 11. Pang, Bo. 2012. Opinion Mining and Sen- Brooke, Julian, Milan Tofiloski, y Maite Ta- timent Analysis, volumen 1. Morgan and boada. 2009. Cross-linguistic sentiment Claypool, Hanover, MA, USA, Mayo. Pang, Bo, Lillian Lee, y Shivakumar Vaith- Zhang, Lei, Riddhiman Ghosh, Mohamed yanathan. 2002. Thumbs up?: senti- Dekhil, Meichun Hsu, y Bing Liu. 2011. ment classification using machine learning Combining lexicon-based and learning- techniques. En Proceedings of the ACL- based methods for twitter sentiment 02 conference on Empirical methods in analysis. HP Laboratories HPL-2011-89. natural language processing - Volume 10, EMNLP ’02, páginas 79–86, Stroudsburg, PA, USA. Association for Computational Linguistics. Saralegi Urizar, X y I San Vicente Roncal. 2012. Detecting sentiments in spanish tweets. IEEE, Working Notes. Su, Qi, Xinying Xu, Honglei Guo, Zhili Guo, Xian Wu, Xiaoxun Zhang, Bin Swen, y Zhong Su. 2008. Hidden sentiment as- sociation in chinese web opinion mining. En Proceedings of the 17th international conference on World Wide Web, WWW ’08, New York, NY, USA. ACM. Taboada, Maite, Julian Brooke, Milan To- filoski, Kimberly Voll, y Manfred Stede. 2011. Lexicon-based methods for senti- ment analysis. Comput. Linguist., 37(2), Junio. Tong, Richard M. 2001. An operational sys- tem for detecting and tracking opinions in on-line discussion. 1(6). Turney, Peter D. 2002. Thumbs up or thumbs down?: semantic orientation ap- plied to unsupervised classification of re- views. En Proceedings of the 40th Annual Meeting on Association for Computational Linguistics, Stroudsburg, PA, USA. Asso- ciation for Computational Linguistics. Vilares, David, Miguel Ángel Alonso, y Car- los Gómez-Rodrı́guez. 2013. Supervised polarity classification of spanish tweets based on linguistic knowledge. En Pro- ceedings of the 2013 ACM symposium on Document engineering, páginas 169–172. ACM. Yamg, Kiduk. 2008. Widit in trec 2008 blog track: Leveraging multiple sources of opi- nion evidence. Indiana, USA. Yang, Qiang, Sinno Jialin Pan, Xiaochuan Ni, Jian-Tao Sun, y Zheng Chen. 2010. Cross-domain sentiment classification via spectral feature alignment. En Procee- dings of the 19th International Conference on World Wide Web, WWW ’10, páginas 751–760, New York, NY, USA. ACM.