4.cinvestav Ipn

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 7

Análisis de sentimiento sobre textos en Español basado en

aproximaciones semánticas con reglas lingüı́sticas


Sentiment analysis of texts in spanish based on semantic approaches with
linguistic rules

Roberto Hernández Petlachi y Xiaoou Li


Department of Computer Science
CINVESTAV-IPN
Av. IPN 2508, col. Zacatenco
C.P. 07360, México DF
[email protected], [email protected]

Resumen: La aparición de blogs, foros y redes sociales en internet, donde hay


una multitud de usuarios expresando opiniones sobre una gran variedad de temas;
ha despertado el interés del ámbito empresarial. Se ve en este tipo de recursos una
oportunidad de conocer como sus productos son percibidos por los consumidores,
es por ello que se han requerido de soluciones para analizar y monitorizar estas
opiniones. Nuestra propuesta está basada en aproximaciones semánticas con reglas
lingüı́sticas para la clasificación de polaridad de textos en español. La clasificación
de la polaridad en las palabras se hace de acuerdo a un diccionario de orientación
semántica donde cada término se encuentra marcado con un valor de uso y va-
lor emocional, junto con reglas lingüı́sticas para resolver varias contrucciones que
podrı́an afectar la polaridad del texto.
Palabras clave: análisis de sentimiento, freeling, minerı́a de opinión, clasificación
de la polaridad.
Abstract: The emergence of blogs, forums and social networks sites where there is
a multitude of users expressing opinions on a wide variety of topics; has aroused the
interest of the business world. We see in this type of resources a chance to meet their
products are perceived by consumers, is why solutions are required to analyze and
monitor these reviews. Our proposal is based on semantic approaches with linguistic
rules for classifying polarity texts in Spanish. Polarity classification in the words is
done according to a dictionary of semantic orientation where each term is labeled
with a use value and emotional value, along with linguistic rules to solve various
constructions that could affect the polarity of text.
Keywords: sentiment analysis, freeling, Opinion Mining, polarity classification.

1 Introducción tienen a su disposición una gran variedad


de herramientas al alcance sin precedentes
“Lo que otros piensan” ha sido una pieza
para poder compartir sus experiencias de
importante de información para la ma-
marca y opiniones (positivas o negativas), en
yorı́a de nosotros durante el proceso de
relación con cualquier producto o servicio.
toma de decisiones. Mucho antes de que
Como las grandes empresas están creciendo
la conciencia de la World Wide Web se
cada vez más empiezan a darse cuenta, que
generalizara, muchos de nosotros pedimos
las voces de los consumidores pueden ejercer
a nuestros amigos que nos recomienden un
una enorme influencia en la formación de
buen electricista, pedir cartas de referencia
las opiniones de otros consumidores y, en
con respecto a los solicitantes de empleo a
última instancia, su fidelidad de marca, sus
los colegas, o consultar los comentarios de
decisiones de compra, y su defensa de la
los consumidores para decidir qué producto
marca. Las empresas pueden responder a
o servicio comprar. Con la explosión de
las opiniones de los consumidores que se
las plataformas Web 2.0, tales como blogs,
generan a través del monitoreo y análisis de
foros de discusión y otros tipos de medios
medios sociales mediante la modificación de
de comunicación social, los consumidores
sus mensajes de marketing, posicionamiento dor semántico base no supervisado. (Bakliwal
de marca, desarrollo de productos, y otras et al., 2012) presenta un método de puntua-
actividades en consecuencia. ción del sentimiento no supervisado y com-
paran su propuesta con un método supervi-
En este artı́culo presentamos una clasifi- sado. Por otro lado, Martı́n-Wanton y Carri-
cación de la polaridad con aproximaciones llo de Albornoz (2012) proponen un méto-
que combinan el conocimiento semántico con do basado en diccionarios afectivos y Word-
reglas lingüı́sticas para textos en español. Net. Trabajos recientes sobre el análisis de
Finalmente debemos destacar el desafı́o que español son los trabajos de (Vilares, Alonso,
significa trabajar con textos espontáneos en y Gómez-Rodrı́guez, 2013) donde hacen una
español, plagados de errores ortográficos y clasificación de la polaridad mediante análi-
cierto desapego a las normas gramaticales sis sintáctico de dependencias que les brinda
especialmente en la puntuación. mejores resultados con respecto a los sistemas
puramente léxicos. La mayorı́a de los trabajos
El artı́culo se organiza de la siguiente ma- recientes acerca de la clasificación de la pola-
nera. En la sección 2 se revisan brevemen- ridad se enfocan en el idioma inglés, dándole
te los antecedentes referentes a la clasifica- poca importancia al español. En este último
ción de polaridad, en la sección 3 detallamos lenguaje el sistema más relevante es SODic-
nuestra solución. En sección 4 se ilustran los tionariesV1.11Spa realizado por (Brooke, To-
resultados experimentales. Finalmente en la filoski, y Taboada, 2009) . Donde este resuel-
sección 5 se muestran las conclusiones y tra- ve la orientación semántica a nivel individual
bajos a futuro. en sustantivos, verbos, adjetivos y adverbios;
trata modificadores de la polaridad como son
2 Antecedentes los intensificadores y la negación. La manera
El análisis de sentimiento en el procesamien- de tratar todas estas construcciones lingüı́sti-
to del lenguaje natural se refiere, a la disci- cas a nivel léxico, con lo cual el SODictiona-
plina que comprende la tarea de identificar- riesV1.11Spa nos ayuda a resolver estas cons-
clasificar fragmentos de texto que contengan trucciones.
emotiva opinión o subjetiva. Las tareas que se La negación en el análisis de sentimiento
pueden englobar en la disciplina, cabe desta- ha sido estudiada en los últimos años, los tra-
car la detección de polaridad donde los textos bajos tradicionales utilizan métodos supervi-
dados son clasificados y analizados según la sados que modelan el texto como un conjunto
carga emotiva que presenten ya sea positiva o de frecuencia de palabras asignándole un va-
negativa; la detección de la subjetividad cuyo lor binario. (Choi y Cardie, 2008) su hipótesis
objetivo es la identificación de fragmentos de es asumir que las palabras dentro de una ex-
textos que poseen un significado o una carga presión interactúan unos con otros para de-
subjetiva expresada por parte del autor. terminar la polaridad total de la expresión.
Nuestra propuesta se enfoca principal- (Yang et al., 2010) considera la negación co-
mente a la clasificación de la polaridad en mo los términos situados a la derecha. Otro
textos en español. El uso del término senti- trabajo relacionado (Taboada et al., 2011),
miento en relación al análisis de textos apa- utiliza información morfológica para identifi-
reció por primera vez en los trabajos de (Das car la negación.
y Chen, 2001) y (Tong, 2001) sobre la pre-
dicción de juicios para analizar el comporta- El uso del lenguaje en plataformas de re-
miento de los mercados. Solamente un año des sociales en internet presenta un desafı́o
después, el termino análisis de sentimiento interesante. Al tratarse de escritura es-
fue acuñado por (Turney, 2002) en referen- pontánea y creativa con marcados rasgos de
cia a sus aproximaciones para la clasificación oralidad, la ortografı́a resulta ser sumamen-
de textos en función de su polaridad, donde te variable, debemos abarcar no solo una co-
se presenta una fórmula matemática para el rrección ortográfica si no también de caracte-
cálculo de lo que Turney denomino Orienta- res repetidos, palabras abreviadas y de signos
ción Semántica. (Zhang et al., 2011) propo- de puntuación, haremos uso el algoritmo de
nen un método supervisado para el análisis Levenshtein, con sus operaciones de edición
de textos cortos (Twitter) que es entrenado (inserción, borrado y sustitución) para la co-
con los datos proporcionados por un analiza- rrección ortográfica.
3 Solución término al candidato generado por el al-
Nuestra solución se basa en aproximaciones goritmo. Para corregir las palabras se ha-
semánticas, etiquetación morfológica y orien- ce uso de un diccionario de palabras, el
tación semántica con métodos supervisados, cual se compone de la lista completa de
para ası́ determinar la polaridad del texto. formas del Corpus de Referencia del Es-
Como primer paso pre procesamos, seguido pañol Actual (CREA) de la Real Aca-
de la lematización entrenando las frases en la demia Española, con frecuencias de uso
herramienta Freeling, tokenización y segmen- y con las formas conjugadas más usadas,
tación, posteriormente la etiquetación, una aproximadamente son 128 000 formas. Si
vez teniendo estos pasos, aplicamos las reglas una palabra no es encontrada en nuestro
lingüı́sticas para obtener la clasificación de diccionario, el algoritmo tomara la pa-
polaridad. El sistema ha sido preparado para labra más cercana con distancia 1, y la
trabajar con el idioma Espa nol. reemplazara.

3.1 Preprocesamiento Corrección de caracteres repetidos: espe-


cialmente en el caso de vocales, reempla-
Corrección de signos de puntuación: es zamos la repetición de la misma concu-
importante hacer resaltar que los signos rrencia por una sola, con excepción de
de puntuación en el análisis de senti- cc,rr,ll . Una vez que se obtiene el texto
miento son muy importantes debido a limpio procedemos a realizar la lemati-
que si se colocan de manera incorrec- zación de las palabras para obtener su
ta, pueden afectar negativamente al res- lema sin conjugación, junto con la toke-
to del procesado (por ejemplo:“Hasta la nización y la segmentación de las oracio-
prox . VERACRUZ ... Gracias ... ”) nes para ası́ poder clasificar la polaridad
Normalización de URL: las direcciones (por ejemplo: largoooooo → largo”).
web presentes en un tuit son sustituidas
por la cadena “enlace”. 3.2 Identificación de conceptos
Reemplazo de emoticonos: muchas de con carga emocional
las herramientas existentes en internet Una vez el sistema ha determinado todos los
cuentan con un catálogo de emoticonos conceptos de cada oración, el siguiente paso
que ayudan a los usuarios a expresar me- consiste en traducir cada concepto identifi-
jor lo que están sintiendo al momento de cado a su correspondiente carga emocional
escribir sus opiniones. Para poder usar con un léxico afectivo, en el caso de que el
esta información creamos una bolsa de concepto tenga una categorı́a emocional aso-
emoticones más usuales en los textos y ciada. Para realizar este paso se precisa, por
su respectivo significado, y reemplaza- tanto, de un léxico afectivo llamado SODic-
mos esta cadena de caracteres por una tionariesV1.11Spa de orientación semántica,
cadena que pueda ser buscada en el dic- este diccionario almacena valores que reflejan
cionario de orientación semántica y nos el sentimiento de una colección de palabras de
ayude a definir la polaridad de cada uno distintas categorı́as gramaticales.
de los textos que contenga dicha carac- Para obtener la polaridad de los textos se
terı́stica. genera una sumatoria de todas las palabras
Corrección de abreviaturas: se sustitu- de la opinión que se encuentren en los diccio-
yen algunas de las palabras abreviadas narios como se muetra en la ecuación 1.
más habituales por su forma gramatical
N
reconocida (por ejemplo: “q”→ “que”, X
OStexto = P alabras (1)
“xq” → “porque”).
i=1
Corrección de palabras: para la correc-
3.3 Intensificadores en el análisis
ción ortográfica utilizamos el algoritmo
de Levenshtein con su noción de distan- de sentimientos
cia. El cual calcula la distancia entre Identificar la intensificación permite conocer
dos términos como la mı́nima cantidad cuáles son los puntos que intención de desta-
de operaciones de edición (borrado, in- car una idea. Los intensificadores son un gru-
serción y sustitución) para corregir un po de modificadores emocionales a tener en
cuenta cuando se plantea desarrollar un siste- “no.es prácticamente idéntica en todas las si-
ma de análisis de sentimientos. Los intensifi- tuaciones posibles. La única diferencia es el
cadores se definen como términos capaces de tipo de dependencia con el que se anota cuan-
ampliar o disminuir la intensidad emocional do el negador depende de un verbo en vez de
del texto al que afectan. cualquier otro tipo de construcción.
Para realizar esta tarea seguimos el en- Para resolver la negación en vez de inver-
foque de (Taboada et al., 2011), donde ca- tir la polaridad de la palabra afectada por
da cuantificador lleva asociado un porcentaje negación, modificamos su valor en una can-
que var ı́a seg ún la intensidad con la que tidad fija de signo contrario al sentimiento
aumente o disminuya el texto al que afecta. de la palabra afectada por la negación, con
La intensificación basada en porcentajes pro- lo que se consigue un enfoque más real de
pone que cada intensificador tenga un por- la negación. Tomando en cuenta que las pa-
centaje asociado, positivo si es amplificador labras fuertemente negativas tienen un valor
y negativo si es decrementador. Esto permite de −5, tomamos el mismo valor para poder
que las oraciones sem ánticas se modifiquen generar la polaridad con palabras que con-
de forma que se tenga en cuenta las polarida- tengan esta caracterı́stica. Esto es para cada
des de los elementos involucrados. palabra positiva afectada por la negación se
El mecanismo seguido en el sistema para tomara a dicha palabra y se le restara el va-
la detección de intensificadores en los textos lor de 5, la palabra con valoración negativa
consiste en la comparación de los términos de tendrá una suma de 5 (por ejemplo: horri-
cada oración con todas las entradas de la lista ble −4, No está horrible = 1, genial 4, No
de intensificadores proporcionada por el dic- está genial = -1, querer = 2, No quiero = -3).
cionario SODictionariesV1.11Spa. Cuando el Pare esto construimos un diccionario pro-
sistema detecta una coincidencia, comprue- pio que contienen las formas posibles en el
ba a su vez que el rol gramatical del término idioma español de negar un hecho como son
identificado es el adecuado, y si es ası́, éste es :
marcado como intensificador. Posteriormente
se le suma el porcentaje ya sea para incre- La negación se produce usualmente an-
mentar o decrementar la palabra, y esto va- teponiendo al verbo el adverbio nega-
lor es Intintensif icador es la palabra encontra- tivo “no”: [No] tengo hambre. Incluso
da en nuestro diccionario de intensificadores, hay que tomar encuenta el alcance de la
que servirá como incrementador o decremen- negación para verificar que palabra esta
tador, multiplicado por la palabra que afecta, afectando, por ejemplo: No está mal.
el resultado final obtenido se suma junto con
los demás términos encontrados para obtener También mediante otros adverbios, por
la polaridad final del texto. ejemplo:
Nunca: Nunca lo dije.
3.4 Negación en el análisis de Nada: Nada trajo.
sentimientos Tampoco: Tampoco está mal.
La detección de la negación es un proceso Con la utilización de conjunciones
complejo que no solo abarca la identificación negativas “ni”:
de las palabras o términos que expresan la [Ni] compraré hoy [ni] com-
negación, sino también su ámbito de acción; praré mañana.
es decir, las palabras afectadas por dicha ne-
gación. 4 Resultados experimentales
La negación es una de las construcciones
lingüı́sticas que más influye en el análisis de 4.1 Datos de entrenamiento
polaridad de los textos. La negación es una El conjunto de datos de entrenamiento Ctrain
construcción habitual a la hora de expresar proporcionado por la organización TASS
una opinión. Una forma de negar una idea en 2014 consiste en 7,219 mensajes de Twitter.
el español es mediante el término “no”, aun- Cada tweet esta etiquetado con una polari-
que existen otros negadores como “tampoco”, dad global, indicando si en el texto se expre-
“sin.o “nunca”que son también utilizados con sa un sentimiento positivo, neutral, negativo
frecuencia. o ningun sentimiento. 6 niveles han sido de-
La estructura sintáctica para la negación finidos: fuertemente positivo (P+), positivo
(P), neutral (NEU), negativo (N), fuertemen- Presición Recall Medida F
te negativo (N+) and sin sentimiento (NO- 3 Niveles 0.6192 1 0.7648
NE) como se muestra en la tabla 1. El núme- 5 Niveles 0.4558 1 0.6261
ro de tweets correspondiente a P+ y NONE
son los que continene mas alto porcentaje en Tabla 3: Resultados obtenidos sobre la eva-
el corpus. luación del conjunto de test.

Sentimiento % # Tweets # de Tweets


P+ 22.44 % 1619 Los valores más altos en el diccionario de
P 4.12 % 297 orientación semántica son: fuertemente po-
NEU 8.45 % 610 sitivo +5 y fuertemente negativo -5, dentro
N 16.91 % 1220 de los cuales tomamos los rangos para gene-
N+ 12.51 % 903 rar los resultados de las categorı́as correspon-
NONE 23.58 % 1846 dientes, donde podemos notar que en la cla-
sificación de los tweets neutros se alcanza un
Tabla 1: Distribución por clases de polaridad bajo rendimiento, se puede deber a muchas
en corpus train Ctrain razones una de ellas es la mezcla de ideas a
. favor y en contra que dificultan la clasifica-
ción de estos textos.
Este corpus fue utilizado para realizar el Para poder obtener los resultados utiliza-
entrenamiento necesario para probar nuestra mos el rango antes mencionado y mostrado
solución. en la ecuación 2, donde para cada categorı́a
los valores fueron tomados de la siguiente
4.2 Evaluación manera:
Nuestra solución fue evaluada utilizando el
corpus test Ctest de TASS 2014 que con-
siste en 60,798 mensajes de Twitter. Cada X = −5 . . . 5 (2)
tweet esta etiquetado con una polaridad glo-
bal, indicando si en el texto se expresa un Para valores positivos (P) el rango toma
sentimiento positivo, neutral, negativo o nin- fue X >= 1
gun sentimiento. Se ha realizado experimen- Para valores negativos (N) el rango toma
tos para las dos tareas de clasificación de fue X <= −1
polaridad: cuatros categorı́as (Positivo → P,
Neutral → NEU, Negativo → N, NONE) y Para valores neutrales (NEU) el rango
seis categorı́as (Fuertemente Positivo → P+, toma fue
Positivo → P, Neutral → NEU, Negativo → −1 < X < 1
N, Fuertemente Negativo → N+, NONE) co- Para valores que no contienen sentimien-
mo se muestra en la tabla 2. Los resultados tos, fue necesario declara una variable
se evalúan siguiendo las métricas de preci- que indicara la carencia de esta caracte-
sión, recall y la medida F. En el cuadro 3 se ristica para poder clasificarlos con (NO-
incluyen los resultados para las dos categori- NE).
zaciones (3 y 5 niveles).
Analizando a detalle los resultados llega-
Sentimiento % # Tweets # de Tweets
mos a la conclusión que tenemos errores en
P+ 34.12 % 20,745
la subjetividad de los tweets y además en
P 2.45 % 1,488
las reglas lingüı́sticas tomadas para realizar
NEU 2.15 % 1,305 la negación de los mismos. Además de que
N 18.56 % 11,287 los valores de precisión son más bajos en los
N+ 7.5 % 4557 casos de valores neutrales.
NONE 35.22 % 21,416
5 Conclusiones y trabajo futuro
Tabla 2: Distribución por clases de polaridad
en corpus Ctest Es bien sabido que la importancia del análi-
. sis de sentimientos se ha visto incrementada
debido a la inmensa cantidad de información
subjetiva disponible. Es por ello que en este
artı́culo presentamos una propuesta que em- analysis: From english to spanish. Inter-
plea conocimiento semántico y lingüı́stico pa- national Conference RANLP, páginas 50–
ra detectar el sentimiento de los tweets escri- 54.
tos en español. Los resultados experimenta- Choi, Yejin y Claire Cardie. 2008. Learning
les muestran un buen rendimiento y sugieren with compositional semantics as structu-
que la estructura morfosintáctica de los tex- ral inference for subsentential sentiment
tos junto con reglas lingüı́sticas es muy útil analysis. En Proceedings of the Conferen-
para detectar la polaridad de dichos textos. ce on Empirical Methods in Natural Lan-
En definitiva, estamos convencidos de que el guage Processing, páginas 793–801. Asso-
análisis de sentimiento es un muy reciente ciation for Computational Linguistics.
campo de aplicaciones práctica de la investi-
gación académica con una clara relación con Das, Sanjiv y Mike Chen. 2001. Yahoo! for
la industria. En los trabajos a futuro serı́a in- amazon: Extracting market sen- timent
teresante integrar en el análisis los signos de from stock message boards. In Procee-
interrogación y las risas para tener un acer- dings of the Asia Pacific Finance Asso-
camiento más real al sentimiento que expre- ciation Annual Conference.
sa el usuario, además de rediseñar las reglas Dı́az, Ismael, Grigori Sidorov, y Sergio
lingüı́sticas para la negación, donde una de Suárez-Guerra. 2014. Creación y evalua-
las cuestiones mejor estudiadas de la nega- ción de un diccionario marcado con emo-
ción es la negación lógica mediante medios ciones y ponderado para el español. En
sintácticos, atendido al orden. Entre las len- TASS 2012 Working Notes, Mexico.
guas del mundo cuatro posibilidades para el
Kamps, J. y M. Marx. 2002. Words with
orden relativo del sujeto, del objeto y del ver-
attitude. 1st International WordNet Con-
bo mezclado con la negación, siendo los más
ference, páginas 332–341, Septiembre.
frecuentes por orden: SOV-Neg, S-Neg-VO,
Neg-VSO, Neg-VOS. También se deben con- Kim, Soo-Min y Eduard Hovy. 2004. Deter-
siderar las herramientas disponibles de la pla- mining the sentiment of opinions. En Pro-
taforma como el uso de hashtags que en nues- ceedings of the 20th International Confe-
tra solución no son tomados en cuenta y que rence on Computational Linguistics, CO-
en ocasiones son el único indicador de senti- LING ’04, Stroudsburg, PA, USA. Asso-
miento indicado en el tweet: #FelicesFiestas, ciation for Computational Linguistics.
#muchassonrisaslindas, #horror, entre otros. Maas, Andrew L., Raymond E. Daly, Pe-
ter T. Pham, Dan Huang, Andrew Y. Ng,
Bibliografı́a y Christopher Potts. 2011. Learning word
Abbasi, Ahmed, Hsinchun Chen, y Arab Sa- vectors for sentiment analysis. En Pro-
lem. 2008. Sentiment analysis in multi- ceedings of the 49th Annual Meeting of
ple languages: Feature selection for opi- the Association for Computational Lin-
nion classification in web forums. ACM guistics: Human Language Technologies -
Trans. Inf. Syst., 26(3):12:1–12:34. Volume 1, Stroudsburg, PA, USA. Asso-
Abdul-Mageed, Muhammad, Sandra Kübler, ciation for Computational Linguistics.
y Mona Diab. 2012. Samar: a system for Martı́n-Watson, T y J Carrillo de Albor-
subjectivity and sentiment analysis of ara- noz. 2012. Sistema para la clasificación
bic social media. En Proceedings of the 3rd de la polaridad y seguimiento de temas.
Workshop in Computational Approaches En TASS 2012 Working Notes, Castelón,
to Subjectivity and Sentiment Analysis, Spain.
WASSA ’12, Stroudsburg, PA, USA. As-
Nasukawa, Tetsuya y Jeonghee Yi. 2003.
sociation for Computational Linguistics.
Sentiment analysis: capturing favorability
Bakliwal, Akshat, Piyush Arora, Senthil using natural language processing. En
Madhappan, Nikhil Kapre, Mukesh Singh, Proceedings of the 2nd international con-
y Vasudeva Varma. 2012. Mining senti- ference on Knowledge capture, K-CAP
ments from tweets. WASSA 2012, pági- ’03, páginas 70–77, New York, NY, USA.
na 11.
Pang, Bo. 2012. Opinion Mining and Sen-
Brooke, Julian, Milan Tofiloski, y Maite Ta- timent Analysis, volumen 1. Morgan and
boada. 2009. Cross-linguistic sentiment Claypool, Hanover, MA, USA, Mayo.
Pang, Bo, Lillian Lee, y Shivakumar Vaith- Zhang, Lei, Riddhiman Ghosh, Mohamed
yanathan. 2002. Thumbs up?: senti- Dekhil, Meichun Hsu, y Bing Liu. 2011.
ment classification using machine learning Combining lexicon-based and learning-
techniques. En Proceedings of the ACL- based methods for twitter sentiment
02 conference on Empirical methods in analysis. HP Laboratories HPL-2011-89.
natural language processing - Volume 10,
EMNLP ’02, páginas 79–86, Stroudsburg,
PA, USA. Association for Computational
Linguistics.
Saralegi Urizar, X y I San Vicente Roncal.
2012. Detecting sentiments in spanish
tweets. IEEE, Working Notes.
Su, Qi, Xinying Xu, Honglei Guo, Zhili Guo,
Xian Wu, Xiaoxun Zhang, Bin Swen, y
Zhong Su. 2008. Hidden sentiment as-
sociation in chinese web opinion mining.
En Proceedings of the 17th international
conference on World Wide Web, WWW
’08, New York, NY, USA. ACM.
Taboada, Maite, Julian Brooke, Milan To-
filoski, Kimberly Voll, y Manfred Stede.
2011. Lexicon-based methods for senti-
ment analysis. Comput. Linguist., 37(2),
Junio.
Tong, Richard M. 2001. An operational sys-
tem for detecting and tracking opinions in
on-line discussion. 1(6).
Turney, Peter D. 2002. Thumbs up or
thumbs down?: semantic orientation ap-
plied to unsupervised classification of re-
views. En Proceedings of the 40th Annual
Meeting on Association for Computational
Linguistics, Stroudsburg, PA, USA. Asso-
ciation for Computational Linguistics.
Vilares, David, Miguel Ángel Alonso, y Car-
los Gómez-Rodrı́guez. 2013. Supervised
polarity classification of spanish tweets
based on linguistic knowledge. En Pro-
ceedings of the 2013 ACM symposium on
Document engineering, páginas 169–172.
ACM.
Yamg, Kiduk. 2008. Widit in trec 2008 blog
track: Leveraging multiple sources of opi-
nion evidence. Indiana, USA.
Yang, Qiang, Sinno Jialin Pan, Xiaochuan
Ni, Jian-Tao Sun, y Zheng Chen. 2010.
Cross-domain sentiment classification via
spectral feature alignment. En Procee-
dings of the 19th International Conference
on World Wide Web, WWW ’10, páginas
751–760, New York, NY, USA. ACM.

También podría gustarte