Tecnologias e Ciencias Da Linguagem
Tecnologias e Ciencias Da Linguagem
Tecnologias e Ciencias Da Linguagem
o r g a n i z a d o r e s
TECNOLOGIAS e
CIÊNCIAS DA LINGUAGEM:
vertentes e novas aplicações
TECNOLOGIAS e
CIÊNCIAS DA LINGUAGEM:
vertentes e novas aplicações
CONSELHO EDITORIAL:
Alexandre Cadilhe [UFJF]
Ana Cristina Ostermann [Unisinos/CNPq]
Ana Elisa Ribeiro [CEFET-MG]
Carlos Alberto Faraco [UFPR]
Cleber Ataíde [UFRPE]
Clécio Bunzen [UFPE]
Francisco Eduardo Vieira [UFPB]
Irandé Antunes [UFPE]
José Ribamar Lopes Batista Júnior [LPT-CTF/UFPI]
Luiz Gonzaga Godoi Trigo [EACH-USP]
Márcia Mendonça [IEL-UNICAMP]
Marcos Marcionilo [editor]
Vera Menezes [UFMG]
Luciana Cidrim | Waslon Lopes | Francisco Madeiro
o r g a n i z a d o r e s
TECNOLOGIAS e
CIÊNCIAS DA LINGUAGEM:
vertentes e novas aplicações
Diagramação: Telma Custódio
T253
Tecnologias e ciências da linguagem [recurso eletrônico] : vertentes
e novas aplicações / Luciana Cidrim, Waslon Terllizzie A. Lopes, Francisco
Madeiro. - 1. ed. - São Paulo : Pá de Palavra, 2019.
recurso digital
Formato: epub
Requisitos do sistema: adobe digital editions
Modo de acesso: world wide web
Inclui bibliografia e índice
ISBN 978-85-68326-39-8 (recurso eletrônico)
Direitos reservados à
PÁ DE PALAVRA
[O selo de autopublicação da Parábola Editorial]
Rua Dr. Mário Vicente, 394 - Ipiranga
04270-000 São Paulo, SP
pabx: [11] 5061-9262
home page: www.padepalavra.com.br
e-mail: [email protected]
Todos os direitos reservados. Nenhuma parte desta obra pode ser repro-
duzida ou transmitida por qualquer forma e/ou quaisquer meios (eletrônico
ou mecânico, incluindo fotocópia e gravação) ou arquivada em qualquer
sistema ou banco de dados sem permissão por escrito da editora.
ISBN: 978-85-68326-39-8
© da edição: Pá de Palavra, São Paulo, dezembro de 2019.
SUMÁRIO
Apresentação............................................................................................................................. 7
5
APRESENTAÇÃO
7
Tecnologias e ciências da linguagem
8
1
BRINCANDO DE ESCREVER
um aplicativo para auxiliar a escrita de escolares
com dislexia
Avelino Gomez
Universidade Católica de Pernambuco - UNICAP
Luciana Cidrim
Universidade Católica de Pernambuco - UNICAP
Francisco Madeiro
Universidade Católica de Pernambuco - UNICAP
1. INTRODUÇÃO
O uso das tecnologias da informação e da comunicação (TIC) moder-
niza a educação, abrindo possibilidades de ensino cada vez mais eficientes
(CIDRIM et al. 2015; CIDRIM; MADEIRO, 2017; KUSTER et al., 2018). Uma
das principais vantagens do uso das TIC no processo de ensino-aprendiza-
gem de crianças com transtornos de aprendizagem, em relação a propostas
tradicionais de jogos e materiais impressos, é promover uma interação mais
adequada (BORHAN et al., 2015, 2018; HOLZ et al., 2018). Os jogos educati-
vos, quando bem sucedidos, despertam o interesse da criança, aumentando
o envolvimento e a motivação para aprender (GARCIA; KLOOS; GIL, 2013;
RAJAGOPAL; JAYA, 2018).
Para crianças com transtornos de aprendizagem, em especial, a dislexia,
apenas as formas tradicionais de modelos de ensino podem não ser suficien-
tes para alcançarem condições de aprendizagem mais adequadas. Os disléxi-
cos necessitam de outros mecanismos de ensino baseados em estratégias mul-
tissensoriais, ou seja, por meio das relações entre imagens e sons (BORHAN
et al., 2015; CIDRIM; BRAGA; MADEIRO, 2018).
De um modo geral, as dificuldades de aprendizagem podem ser de-
sencadeadas por fatores relacionados à metodologia da alfabetização, como
também por fatores emocionais ou socioeconômicos, já a dislexia é decorrente
9
Tecnologias e ciências da linguagem
2. MÉTODO
O jogo foi desenvolvido para o sistema operacionail Android. Utilizou-se
a plataforma nas nuvens Firebase (FIREBASE, 2018) para o armazenamento de
informações online. Para o desenvolvimento da interface do jogo, procurou-se
seguir diretrizes para a criação de softwares para crianças disléxicas, como,
por exemplo, tipo de fonte utilizada e contrastes entre as cores (CIDRIM et
al., 2015), além de oferecer uma interface dinâmica, permitindo que a criança
personalize a aplicação. O jogo utiliza um sistema de login, onde o usuário
pode se cadastrar e/ou entrar em sua conta. Existem duas modalidades de
contas: usuários (jogadores) e administradores (profissionais que acompa-
nham as crianças).
3. RESULTADOS
Ao entrar no jogo, o usuário tem acesso ao menu principal da aplicação
(Figura 1), onde são apresentados os botões: “jogar”, “loja” e “configurações”,
além de: pontuação do usuário (canto superior esquerdo), nome do jogador
(topo da tela do aplicativo, à direita) e um botão de logout, caso o usuário
queira sair de sua conta. Ao clicar em “Jogar”, o usuário segue para a tela do
jogo (Figura 2), onde palavras passarão da esquerda para direita e a criança
deverá escrevê-las, tendo como opção escrever da forma cursiva (letra ma-
nuscrita) ou em letra de forma (letra de imprensa maiúscula). Ao terminar
de escrever a palavra, a criança deverá pressionar o botão “Ok”, que validará
a resposta. Se correto, a criança ganhará de um a três pontos, dependen-
do da dificuldade da palavra. Se o jogador errar ou a palavra sair da sua
visibilidade, perderá uma vida. A cada jogo o usuário tem 3 vidas. O jogo
termina quando as vidas se esgotam. É importante ressaltar que em caso de
erros durante a atividade, o usuário é notificado com uma pequena vibração
do aparelho com o intuito de não causar desmotivação durante a atividade.
10
Capítulo 1 – Brincando de escrever
11
Tecnologias e ciências da linguagem
12
Capítulo 1 – Brincando de escrever
13
Tecnologias e ciências da linguagem
14
Capítulo 1 – Brincando de escrever
4. CONCLUSÕES
Este jogo se propõe como uma ferramenta tecnológica auxiliar na in-
tervenção dos problemas de escrita por crianças disléxicas. A possibilidade
de adição de novas palavras ao aplicativo, a escrita da palavra através do
touchscreen com a própria letra e a personalização da interface são funciona-
lidades que proporcionam ao fonoaudiólogo ou pedagogo a possibilidade de
trabalhar de acordo com as dificuldades específicas de cada criança. Como
sugestão de trabalhos futuros estão: (1) inserção de animações e novas ima-
gens de background para o jogo; (2) realizar um estudo para avaliar o uso do
jogo na intervenção fonoaudiológica e (3) desenvolver o jogo para o sistema
operacional iOS.
Este capítulo é uma versão expandida do trabalho “Brincando de escre-
ver: um aplicativo para auxiliar a escrita de crianças disléxicas”, apresentado
em forma de poster no Brain Connection, realizado de 8 a 11 de novembro de
2018 na cidade de Belo Horizonte/MG.
15
Tecnologias e ciências da linguagem
REFERÊNCIAS
BORHAN, N.; SHARBINI, H.; AHMADI, M.; CHIU, P. Developing reading skills using sight
word reading strategy through interactive mobile game-based learning for dyslexic children.
International Journal for Innovation Education and Research, Vol. 3, n. 10, p. 1-10, 2015.
BORHAN, N.; SHIANAG, C.; CHIU, P.; SHARBINI, H.; PING PING, T.; OTHMAN, R.; PETER,
M. An enhancement of dyslexic mobile application using sight word reading strategy: results
and findings. Journal of Computer Science, Vol. 14, n.7, p. 919-929, 2018.
CHIARAMONTE, T.; SENO, M.; CAPELLINI, S. Relação do desempenho ortográfico de escolares
com dislexia do desenvolvimento. In: ALFERES (Org.). Qualidade e Políticas Públicas na
Educação 8. São Paulo: Atena Editora, p. 256-262, 2018.
CIDRIM, L.; CAJUEIRO, L.; BRAGA, P.; BEZERRA, R.; GAMA, C.; MADEIRO, F. DIS-
ORTOGRAFANDO: um aplicativo desenvolvido para auxiliar a intervenção com crianças
disléxicas. In: CIDRIM; COSTA (Orgs.) Tecnologias da Informação e da Comunicação (TIC)
Aplicadas às Ciências da Linguagem. Curitiba: CRV, 2015, p. 9-22.
CIDRIM, L.; MADEIRO, F. Studies about spelling on dyslexia: a literature review. Revista
CEFAC, Vol. 19, n. 6, p. 842-854, 2017.
CIDRIM L.; BRAGA, P.; MADEIRO, F. Desembaralhando: um aplicativo para intervenção no
problema do espelhamento de letras por crianças disléxicas. Revista CEFAC, Vol. 20, n. 1,
p. 13-20, 2018.
FIREBASE. [Acesso em: 08 Dez 2018]. Disponível em: https://firebase.google.com/summit/.
GARCIA, C.; KLOOS, D.; GIL, C. Game based spelling learning. IEEE Frontiers in Education
Conference (FIE). Saratoga Springs, New York, p. 11-15, 2013.
HOLZ, H.; BRANDELIK, K.; BEUTTLER, B.; BRANDELIK, J.; NINAUS, M. How to train your
syllable stress awareness – a digital game-based intervention for Gernan dyslexic children.
International Journal os Serious Games, Vol. 5, n. 3, p. 37-59, 2018.
KUSTER, S.; VAN WEERDENBURG, M.; GOMPEL, M.; BOSMAN, A. Dyslexie font does not
benefit reading in children with or without dyslexia. Annals of Dyslexia, Vol. 68, n. 1, p.
25-42, 2018.
RAJAGOPAL, K.; JAYA, S. “Spell it up!”: mobile application (app) for improving spelling skills
among the dyslexic students. Proceedings of International Conference on the future of
Education, IConFEd 2018. Institute os Teacher Education Tuanku Bainun Campus, Penang,
Malásia.
SHAYWITZ, S. Entendendo a dislexia. Um novo e completo programa para todos os níveis de
problemas de leitura. Porto Alegre: Artmed, 2006.
16
2
ATIVIDADES EDUCACIONAIS EM
REALIDADE AUMENTADA PARA O PROTAGONISMO
DOS ALUNOS NA APRENDIZAGEM DOS
CONTEÚDOS EDUCACIONAIS
Annie Lezan Bittencourt de Moura
CNA Inglês Definitivo
1. INTRODUÇÃO
Vamos iniciar este capítulo fazendo duas reflexões importantes. Primei-
ra reflexão: Você está preparado para ensinar aliando a Realidade Aumenta-
da, através da tecnologia móvel, com o uso de um aplicativo digital adaptado
ao conteúdo da disciplina que você leciona?
O processo de aprendizagem no século XXI não pode mais acontecer cen-
trado no professor. O aluno se motiva quando fica curioso e vai buscar/pesquisar
as suas próprias descobertas. O uso das metodologias ativas (VICKERY, 2016)
para o ensino é capaz de motivar o desenvolvimento do aprendiz deste milênio.
Visando tornar a sua aula menos centrada no professor e desenvolver a
autonomia do aprendiz, apresentamo-lhes aqui um formato de ensinar seus
conteúdos através do envolvimento de seus aprendizes com o auxílio do apli-
cativo digital HP Reveal (originalmente conhecido por Aurasma, mas recente-
mente adquirido pela HP, que alterou o nome do App) usando os smartphones
e dinâmicas, com os quais o seu aluno ficará ativamente envolvido no pro-
cesso de aprendizagem.
Segunda Reflexão: Você já ouviu falar no conceito BYOD para as aulas?
BYOD é a sigla para Bring Your Own Device, que em Português significa “Tra-
ga o seu próprio aparelho” (livre tradução feita pela autora) ou “traga seu
próprio dispositivo” (Revista Exame, 2013).
17
Tecnologias e ciências da linguagem
Este conceito traz novos desafios ao planejamento das aulas pelos pro-
fessores. Escolhas e desafios sobre autorizar ou não os alunos a usarem os
aparelhos celulares (smartphones) ou tablets nas aulas passam a rondar os pro-
fessores no início do século XXI. As dúvidas perpassam desde decidir se os
estudantes devem usar seus próprios dispositivos móveis ou os equipamen-
tos da escola, até sobre formas de garantir que os alunos irão permanecer na
tarefa se estiverem com os seus próprios dispositivos.
Os aparelhos móveis como os smartphones e os tablets invadiram a vida
das pessoas, mas há muitos educadores que ainda têm receio de trazê-los
para as suas salas de aula, pois, de certa forma, se a atividade não for mui-
to bem elaborada, o educador sente-se inseguro em não conseguir garantir
que os alunos permaneçam na tarefa, já que estarão com os seus próprios
dispositivos.
Percebendo que muitos professores ainda sentem-se inseguros em como
lidar com esses equipamentos nas aulas, será apresentada aqui uma lista de
atividades possíveis e já testadas para encorajar seus alunos a usarem os apa-
relhos móveis na sala de aula, de forma inovadora e criativa.
Segundo Strasser (2012, p.8-10), o uso de ferramentas tais como aplica-
tivos para celulares smartphones e/ou tablets pode transformar o processo de
aprendizagem em algo criativo, interativo, colaborativo, rápido, que expan-
de o conhecimento, oferece oportunidades autênticas de uso do conteúdo da
disciplina, estimula a alfabetização digital, é motivacional, é democrático, faz
bem ao meio-ambiente, além de ser uma fonte aberta e, em alguns casos, até
gratuita de recursos para a aprendizagem.
Assim, a autora deste texto, baseada na sua prática pedagógica, apre-
sentará a seguir técnicas de como usar a Realidade Aumentada para ajudar
os docentes a ensinarem na forma como as gerações de Millenials (aqueles
nascidos entre 1979 e 1995) e a geração Z (aqueles que nasceram entre 1992
e 2010), de acordo com escoladainteligencia.com.br (acessado em 20/04/19),
querem aprender: sendo ativos e protagonistas e com a tecnologia ao dispor
da palma de suas mãos.
2. NOSSOS OBJETIVOS
Ensinar e motivar os professores das mais diversas disciplinas a pensa-
rem seus planejamentos de aulas incluindo a utilização do HP Reveal, usando
a tecnologia móvel de forma a envolverem seus aprendizes de forma ativa na
aquisição do conhecimento e na consolidação dos conteúdos escolares.
18
Capítulo 2 – Atividades educacionais em realidade aumentada para o protagonismo dos alunos na aprendizagem dos conteúdos educacionais
19
Tecnologias e ciências da linguagem
4. O APLICATIVO HP REVEAL
20
Capítulo 2 – Atividades educacionais em realidade aumentada para o protagonismo dos alunos na aprendizagem dos conteúdos educacionais
Ø É gratuito
Ø Plataforma
Android ou IOS
Ø Benefícios
Motivação e surpreender os alunos com oportunidades interativas de
praticar o conteúdo brincando com a realidade aumentada, que tanto encanta
e prende a atenção do aprendiz.
Ø Inconvenientes
Às vezes o aplicativo trava e fica lento. Os vídeos mais curtos, de até 30
segundos, funcionam melhor.
Ø Tutoriais
• Como usar e visualizar realidade aumentada no aplicativo HP
Reveal. Autoria: Power in your hands. Publicado em 20 de junho de
2018. Acessado em 30/03/19. https://youtu.be/NM9iV6pQnNs.
• Make your Own Augmented Reality - with PowerPoint and Auras-
ma (Now Called HP REVEAL). Autoria: PowerPoint Spice. https://
www.youtube.com/channel/UCIWglTtslnzN3rSEUbldzag. Publica-
do em 24 de abril de 2017. Acessado em 30/03/19. https://youtu.be/
pEVKtPEcgQg.
• Aurasma Demo (LARRY MAGID) - https://youtu.be/GBKy-hSedg8.
Publicado em 8 de abril de 2011. Acessado em 30/03/19.
• Aurasma Lite Tutorial 1 (Create your own Aura). Autor: Mii, Paraozle.
Publicado em 27 de outubro de 2012. Acessado em 30/03/19. https://
youtu.be/q5uyFJR1-N8.
21
Tecnologias e ciências da linguagem
B. Entendendo:
• Aura = Onde você aponta o celular (a foto ou desenho ou imagem
na camisa).
• Overlay = O vídeo que se sobrepõe à foto.
22
Capítulo 2 – Atividades educacionais em realidade aumentada para o protagonismo dos alunos na aprendizagem dos conteúdos educacionais
23
Tecnologias e ciências da linguagem
5.2. Projetos
Peça aos alunos que façam vídeos de atividades de sala de aula que eles
fazem normalmente e criem sobreposições de AR em suas tarefas e projetos,
explicando os conteúdos. É recomendável o professor criar um projeto onde
os alunos filmam-se explicando determinado conteúdo ou assunto. Estes ví-
deos serão as AURAS para outros estudantes aprenderem novos assuntos, ao
apontarem seus celulares para uma foto ou imagem desenhada pela criança
(Figura 2). Este é um modo interessante de fazer um aluno ensinar ao outro.
Na imagem 2, observe que, a partir de um desenho produzido pelos alunos, o
HP Reveal traz em Realidade Aumentada um vídeo com um dos aprendizes
explicando o conteúdo do desenho.
24
Capítulo 2 – Atividades educacionais em realidade aumentada para o protagonismo dos alunos na aprendizagem dos conteúdos educacionais
25
Tecnologias e ciências da linguagem
26
Capítulo 2 – Atividades educacionais em realidade aumentada para o protagonismo dos alunos na aprendizagem dos conteúdos educacionais
Figura 5A. Explicando personagens Figura 5B. Passeio no museu Figura 5C. Outras imagens
de passeio no museu
Fonte: Fotos pertencentes ao acervo da autora.
27
Tecnologias e ciências da linguagem
28
Capítulo 2 – Atividades educacionais em realidade aumentada para o protagonismo dos alunos na aprendizagem dos conteúdos educacionais
6. CONSIDERAÇÕES FINAIS
Por que usar Realidade Aumentada (Augmented Reality ou AR) nas suas
aulas?
Na opinião da autora, a AR está primeiramente alinhada com a teoria da
aprendizagem sócio-construtivista, pois pode ajudar o professor a posicionar
o aprendiz dentro de um contexto físico e social do mundo atual em que o
Millennial vive, o mundo da tecnologia digital. Para essa geração que nasceu
com um smartphone nas mãos, envolver os processos de aprendizagem parti-
cipativamente através do uso de um aplicativo de realidade aumentada pode
transformar o aluno num “mágico transformador da realidade” (citação pró-
pria) e nele despertar a vontade de partir para a investigação autêntica, ativa
observação, coaching entre pares, ensino recíproco e participação periférica
legítima com múltiplos modos de representação.
Observa-se que este único App (HP Reveal) pode ser adaptado para di-
versos conteúdos escolares, fornecendo aos professores mais de sete possi-
bilidades ou sugestões de tarefas aqui descritas. O objetivo principal deste
capítulo foi colocar nas mãos dos docentes uma ferramenta (HP Reveal App)
capaz de estimular professores e alunos a transformarem suas aulas e envol-
ver os aprendizes através de uma metodologia ativa de ensino.
29
Tecnologias e ciências da linguagem
REFERÊNCIAS BIBLIOGRÁFICAS
Aurasma for Beginners- How to create an Aura. 2017. Disponível em: https://www.youtube.
com/watch?v=tzz3yjwymBE. Acesso em 30/03/19.
Características da geração Z e as suas influências em sala de aula. Disponível em: https://
escoladainteligencia.com.br/caracteristicas-da-geracao-z-e-as-suas-influencias-em-sala-de-
aula/. Acesso em 20/04/19.
Editorial QueConceito. Conceito de Realidade Aumentada. Disponível em: https://queconceito.
com.br/realidade-aumentada. Acesso em 30/03/19.
Estúdio ABC. Você sabe o que é BYOD? As siglas invadem nossas vidas por todos os lados e, às
vezes, ficamos confusos com tanta informação, mas guarde estas letras na sua mente: BYOD
– do inglês, bring your own device (traga seu próprio dispositivo). 2013. Disponível em:
https://exame.abril.com.br/tecnologia/voce-sabe-o-que-e-byod/. Acesso em: 01/04/2019.
Geração Y (millennials). Conceito, o que é, Significado. Disponível em: https://conceitos.com/
geracao-y/. Acessado em 20/04/19.
KENSKI, V. Aprendizagem mediada pela tecnologia. Revista diálogo educacional Vol. 4, n. 10,
2003. Acesso em 30/03/19.
LOCKWOOD, R. Flip it! Strategies for the ESL Classroom. Estados Unidos da América:
University of Michigan Press, 2014.
MAGID, L. Aurasma Demo. 2011. Disponível em: https://www.youtube.com/watch?v=GBKy-
hSedg8. Acesso em 30/03/19.
MENA, I. Verbete Draft: o que é Realidade Aumentada. 2017. Disponível em: https://
projetodraft.com/verbete-draft-o-que-e-realidade-aumentada/. Acesso em: 22/04/2019.
30
Capítulo 2 – Atividades educacionais em realidade aumentada para o protagonismo dos alunos na aprendizagem dos conteúdos educacionais
MII, P. Aurasma Lite Tutorial 1 (Create your own Aura). 2012. Disponível em: https://www.
youtube.com/watch?v=q5uyFJR1-N8. Acesso em 30/03/19.
MILCHELL, K.; SCHOLZ, M. iPads in ESL Classrooms. iBook by OREGON STATE UNIVERSITY,
2012.
MORAN, J. Os Novos Espaços de Atuação do Professor com as Tecnologias. Revista Diálogo
Educacional, Vol. 4, n. 12. 2004. Disponível em: http://www.pucrs.br/ciencias/viali/tic_
literatura/artigos/tic_professores/189117821002.pdf. Acesso em 22/04/2019.
MOTTERAM, G. (org) Innovations in learning for English language teaching. British Council,
2013.
NOGUEIRA, N. O professor atuando no Ciberespaço: reflexões sobre a utilização da internet
com fins pedagógicos. São Paulo: Érica, 2002.
OLIVEIRA NETTO, A. Novas Tecnologias e Universidade: da didática tradicionalista à
inteligência artificial: desafios e armadilhas. Petrópolis: Vozes, 2005.
PÉREZ GÓMEZ, Á. Educação na era digital: a escola educativa. Porto Alegre: Penso, 2015.
Power in your hands. Como usar e Visualizar realidade aumentada no aplicativo HP Reveal.
2018. Disponível em: https://www.youtube.com/watch?v=NM9iV6pQnNs. Acesso em
30/03/19.
PowerPoint Spice. Make your Own Augmented Reality - with PowerPoint and Aurasma (Now
Called HP Reveal)https://www.youtube.com/channel/UCIWglTtslnzN3rSEUbldzag.
2017. Disponível em: https://www.youtube.com/watch?v=pEVKtPEcgQg. Acesso em
30/03/19.
PUCHTA, H.; WILLIAMS, M. Teaching Young Learners to Think. Helbling Languages, 2011.
STRASSER, T. Mind the app! Helbling Languages, 2012.
VICKERY, A. Aprendizagem Ativa nos anos iniciais do Ensino Fundamental. Porto Alegre:
Penso. 2016.
WIKIPÉDIA, a enciclopédia livre. Geração Y. Disponível em: https://pt.wikipedia.org/wiki/
Geração_Y. Acesso em 12/04/2019.
31
3
CATEGORIZAÇÃO DE DOCUMENTOS
Roberto H. W. Pinheiro
Universidade Federal do Cariri - UFCA
George D. C. Cavalcanti
Universidade Federal de Pernambuco - UFPE
1. INTRODUÇÃO
Os computadores não são tão inteligentes quanto a maioria das pessoas
pensa. Existe até um certo misticismo no quão avançados são os computado-
res nos dias de hoje. É compreensível, pois os avanços são vários e ocorrem
com uma velocidade surpreendente. Mal conseguimos assimilar uma nova
tecnologia e já surge outra. São muitas mentes pensantes em torno desse
mundo tecnológico e, por isso, terminamos nos perdendo no que é realidade
e no que é mito. Afinal, as máquinas realmente conseguem pensar? Conse-
guem ler textos? Interpretá-los? Quais são os tipos de problemas resolvidos
pelos computadores? Eu vou perder meu emprego?
Todos esses questionamentos são explorados há alguns anos e seguem
sendo estudados. A área da computação é vasta e com certeza demandaria
inúmeros especialistas para explorar tamanho escopo. Portanto, precisamos
afunilar nossa abrangência para que o estudo seja proveitoso. Que tal fo-
car em textos? Algo aparentemente simplório, tendo em vista que as pessoas
veem robôs conversando na televisão. Porém o texto é um elemento funda-
mental para desenvolver sistemas mais complexos. Especialmente nos dias de
hoje. Quem nunca usou uma rede social? Quem nunca leu textos na Internet?
Quem não tem um WhatsApp? Grande parte da informação presente nes-
ses locais é textual. Imagine o potencial de exploração desses dados brutos?
Quem nunca teve a impressão que está sendo espionado pelo seu próprio
computador ou celular? Talvez você esteja sendo.
33
Tecnologias e ciências da linguagem
34
Capítulo 3 – Categorização de Documentos
a. Pré-processamento
Geralmente, o pré-processamento é a primeira etapa em um Sistema de
Categorização de Documentos, pois trata-se de operações realizadas sobre os
documentos originais. O principal objetivo do módulo de Pré-processamento
é melhorar o texto presente em cada documento para facilitar a etapa seguin-
te de Extração de Características. Esse módulo transforma o texto corrido em
vários termos facilmente identificáveis e separados. Existem diversas rotinas
de pré-processamento de texto. A utilização, ou não, dessas rotinas depende
do domínio de aplicação. Por exemplo, não faz sentido aplicar uma rotina de
Corretor Ortográfico em documentos que contêm apenas números.
35
Tecnologias e ciências da linguagem
36
Capítulo 3 – Categorização de Documentos
37
Tecnologias e ciências da linguagem
b. Extração de Características
Os documentos em sua estrutura original são formados por diversos
caracteres compondo palavras e frases. Os dados apresentados dessa maneira
não são fáceis de serem processados em um sistema automático, pois não é
trivial lidar com a complexidade de uma linguagem natural. Assim, os do-
cumentos precisam ser convertidos para uma forma de representação mais
compacta e mais adequada ao processamento computacional. Uma das for-
mas mais comuns e mais utilizadas é transformar o texto em um vetor de
características.
Um vetor de característica é uma sequência de valores que representa
um dado documento em um espaço vetorial. De maneira geral, essa nova
representação inviabiliza que os documentos sejam lidos ou interpretados.
Por outro lado, essa forma de representar documentos em um espaço vetorial
facilita o uso de abordagens computacionais.
Cada documento é transformado em um vetor e cada posição desse vetor
representa uma característica. A palavra “característica” possui dois signifi-
cados em Categorização de Documentos (XUE; ZHOU, 2009). Um significado
refere-se à unidade que será utilizada para representar o documento (chama-
do de unidade da característica). O outro é referente a qual valor traz melhor
representatividade às características (chamado de valor da característica).
Com relação às unidades das características, podemos utilizar palavras
isoladas, sentenças ou até recortes de sequências de caracteres. Palavras isola-
das são sequências de caracteres que iniciam em um caractere alfanumérico e
38
Capítulo 3 – Categorização de Documentos
são finalizadas por algum símbolo delimitador (espaço, ponto, vírgula) espe-
cificado pelo desenvolvedor. As sentenças são cadeias de palavras, como: “o
cachorro atravessou a rua” ou “enviou uma carta”. A definição do que é uma
sentença depende do limite imposto pelas especificações do algoritmo utili-
zado. Existem algoritmos que fazem uso da gramática da língua (DUMAIS
et al., 1998) (SCOTT; MATWIN, 1999) e outros que usam algum formalismo
estatístico para definir as sentenças (TZERAS; HARTMANN, 1993). Por fim,
o recorte de sequências de caracteres, mais conhecido como n-grams (LODHI
et al., 2002) é a composição de características com recordes a cada n caracteres.
Por exemplo, a palavra “teste” usando 3-grams seria representada pelas ca-
deias “tes”, “est”, “ste”. A abordagem n-grams pode ser bastante interessante
em línguas como chinês ou japonês, que não fazem uso do espaço, não sendo
possível segmentar este tipo de documento por palavras.
Com relação aos valores das características (Salton; Buckley, 1988), as
três formas de representação mais conhecidas são: presença ou ausência do
termo, frequência do termo e Term Frequency – Inverse Document Frequency
(TF-IDF). A primeira forma é a mais simples e atribui uma representação
binária (true ou false) para cada termo ou característica. Esse valor é usado
para indicar a presença ou a ausência desta característica em um determina-
do documento. É pouco custoso em termos de memória e de processamento,
mas essa simplicidade remete a uma baixa representatividade. Afinal, uma
palavra estar presente em um documento não indica que ela é de fato rele-
vante para definir sua categoria. Nada impede que um texto sobre Religião
tenha a palavra “jogada” e essa palavra pode confundir o sistema em di-
reção à categoria de Esportes. Na sequência, temos a Frequência do Termo,
sendo esta forma mais completa que a primeira, pois não indica apenas a
presença ou ausência da característica. O valor da frequência do termo cor-
responde à quantas vezes a característica aparece em um dado documento.
Sua implementação é mais custosa e mais complexa que a representação por
valor binário. A Figura 2 exemplifica essa representação. Por fim, temos a
abordagem mais popular, conhecida como TF-IDF. Apesar de ter sido pro-
posta em 1988 (SALTON; BUCKLEY, 1988), TF-IDF é uma forma bastante
utilizada mesmo em pesquisas atuais, especialmente como base comparativa
para propostas mais recentes (CHEN et al., 2016; YAVAH et al., 2019). Seu fun-
cionamento segue a lógica de que apenas a Frequência do Termo não é su-
ficiente, pois se um termo aparecer em muitos documentos, ele perde parte
de sua relevância por ser generalista demais. Então, para uma característica
ter um valor elevado, é necessário que ela apareça muito em determinado
documento, mas pouco nos demais documentos.
39
Tecnologias e ciências da linguagem
Figura 2. Exemplo de Vetor de Característica composto por palavras com valor da Frequência do Termo.
Como o vetor de características é o mesmo para todos os documentos de uma base, existem termos
de valor zero em todos os documentos. Isto é um indicativo que aquele termo existe em
algum documento da base, mas não no atual.
c. Classificação
Computadores resolvem problemas usando algoritmos que são uma se-
quência de instruções para obter uma saída a partir de uma entrada. Por
exemplo, algoritmos de ordenação são capazes de, dada uma lista de núme-
ros como entrada, gerar como saída essa lista com os números ordenados.
Existem inúmeros algoritmos para essa mesma tarefa, tais como: Bubble sort,
Insertion sort, Shell sort, Quick sort, para citar apenas alguns.
Entretanto, não existe um algoritmo para todas as tarefas. Ou talvez
exista, mas nós não conseguimos criar um para cada tarefa. Por exemplo,
como elaborar um algoritmo capaz de classificar um documento como sendo
de Política ou Clima? Podemos pensar em algumas regras, mas essas regras
podem não contemplar todo o universo de possibilidades textual que pode
ocorrer nesses documentos. Nós, seres humanos, poderíamos realizar essa ta-
refa com certa facilidade, mas não somos capazes de explicar todo o processo
que usamos. Não é como ordenar uma lista. Nem de longe.
A dificuldade em criar algoritmos para um sistema de tamanha com-
plexidade é por não conseguirmos definir claramente as etapas necessárias
para sua resolução. Nos falta conhecimento ou, simplesmente, autoconheci-
mento. Entretanto, sabemos que cada notícia tem uma lógica, não são textos
aleatórias. Existem padrões que podem ser detectados. Deste modo, podemos
observar os dados em busca de respostas. É aqui que entra a Classificação.
A Classificação tem o objetivo de fazer o computador aprender a partir
de exemplos rotulados. Temos então uma tarefa que possui entrada e saída
conhecidas e desejamos gerar um modelo ou uma função capaz de aprender
esse mapeamento entre a entrada e a saída. Supondo a nossa representação
em Vetor de Características, um classificador nada mais é do que um sis-
tema que consegue dividir as categorias no espaço das características, con-
forme mostrado na Figura 3. No exemplo da Figura 3, temos três categorias
40
Capítulo 3 – Categorização de Documentos
Figura 3. Exemplos sendo divididos em classes por um Classificador (curvas pontilhadas) em um cenário
hipotético. Valores dos termos variam entre 0 e 1 devido à normalização. Termos 1 e 2 são termos
genéricos meramente ilustrativos (Pinheiro, 2017).
41
Tecnologias e ciências da linguagem
3. APLICAÇÕES
Existem diversas aplicações envolvendo Categorização de Documentos.
Como vimos na seção anterior, a Categorização de Documentos é um pro-
cesso de aprendizagem com base em um conhecimento prévio adquirido por
meio de documentos rotulados. Existem inúmeras aplicações práticas dentro
deste universo. Vamos conhecer algumas delas?
a. Detecção de Spam
Um dos exemplos clássicos de aplicação em Categorização de Documen-
tos é detecção de Spam. Nessa aplicação, deseja-se encontrar e posteriormente
remover mensagens de conteúdo suspeito e propagandas. Não se restringe
aos e-mails, podendo ser aplicado em comentários do Twitter, Youtube ou até
mesmo do seu blog no Wordpress. É uma ferramenta útil, mas para render
bons frutos é necessário que esteja em constante processo de atualização.
Um sistema de Detecção de Spam é um problema de, geralmente, duas
classes: spam ou não spam. Pode contar com um sistema de Aprendizado
por Reforço (LAI et al., 2009) com opções para que o próprio usuário ajude a
melhorar a precisão do sistema informando se algo é ou não spam. Esse tipo
de auxílio do usuário deixa o sistema mais robusto e preciso para as neces-
sidades do usuário.
b. Análise de sentimento
Apesar do nome poético, a análise de sentimento nada mais é do que
designar uma emoção como classificação para um determinado texto. Deste
modo, é possível, por exemplo, classificar um Twitter como positivo ou nega-
tivo (SEVERYN; MOSCHITTI, 2015).
Pode parecer trivial ou até mesmo pouco prático, mas é uma aplicação
útil para facilitar a compreensão de grandes quantidades de dados, espe-
cialmente em redes sociais. Na realidade, pode-se dizer que é um dos sis-
temas com maior aplicabilidade dentre os listados, tendo em vista o quanto
de informação pode gerar de retorno para uma empresa sobre sua base de
consumidores.
c. Identificação da Língua
Já falamos um pouco sobre Identificação de Língua (Seção 2a). Geral-
mente, as aplicações nessa linha não chegam ao ponto da utilização de um
42
Capítulo 3 – Categorização de Documentos
d. Identificação de paráfrases
Paráfrase é uma nova formulação de um texto usando outras palavras.
Geralmente, utilizam-se paráfrases para esclarecer algo, tendo em vista faci-
litar a compreensão do sentido da frase. Sendo assim, Identificar Paráfrases
é verificar se duas frases são semanticamente equivalentes, isto é, possuem
o mesmo sentido.
A utilidade dessa aplicação está em facilitar várias tarefas envolvendo
textos, como resumo de textos, recuperação de informação, traduções e até a
própria Categorização de Documentos como um todo. Afinal, se um texto é
escrito com palavras distintas, mas possui o mesmo significado do outro, ele
deve possuir o mesmo rótulo.
Não é uma tarefa trivial, tendo em vista que existem dois grandes pro-
blemas, pois a partir do momento que partimos para uma análise semântica,
o processo torna-se mais complexo. Os dois problemas mais notáveis são do
significado e da ordem das palavras. O problema do significado é basica-
mente encontrar o significado real, independente das palavras presentes. Isso
é extremamente complexo de ser realizado em termos computacionais, pois
geralmente as aplicações lidam com análises léxicas e sintáticas. Já o outro, é
o fato de palavras em ordens distintas possuírem sentidos diferentes (“amigo
velho” e “velho amigo”). Trabalhos mais recentes tentam inserir análises se-
mânticas para melhorar o desempenho do sistema e tratar desses problemas
da área (FERREIRA et al., 2018).
e. Fake News
Sim, é possível detectar Fake News automaticamente. Afinal, por que não
seria possível? A ideia é bastante similar à Detecção de Spam, com o dife-
rencial de que Fake News é muito recente e pode faltar informação (banco de
dados e literatura). Apesar de ser recente, é notável a utilidade dessa aplicação
em nossas vidas, pois é perceptível o impacto das Fake News no nosso mundo
43
Tecnologias e ciências da linguagem
político e social. Um estudo da área (AHMED et al., 2017), com uma base de
dados controlada, conseguiu classificar corretamente 90% das notícias como
sendo ou não Fake News. Essa aplicação no mundo real não conseguiria taxas
tão elevadas, mas acreditamos que com o tempo será possível utilizar essas
aplicações no dia-a-dia para aumentar a confiabilidade das notícias, em vez
de confiar nas mensagens recebidas em grupos de WhatsApp.
f. Avaliação de Legibilidade
A Avaliação de Legibilidade é capaz de indicar o quão fácil ou difícil
seria a leitura de um determinado texto. Talvez não fique claro a priori a uti-
lidade de uma aplicação assim, mas ela pode servir para saber se um texto
é adequado para crianças, para pessoas aprendendo o idioma, para pessoas
com baixo grau de alfabetização ou até mesmo como parte de um sistema
ainda maior, capaz de simplificar textos (ALUISIO et al., 2010). Portanto, a
Avaliação de Legibilidade é uma aplicação que visa a acessibilidade de con-
teúdo para uma abrangência maior de pessoas.
44
Capítulo 3 – Categorização de Documentos
h. Sistemas de Recomendação
Sistemas de recomendação são muito utilizados na recomendação de
produtos. Nesse contexto, o objetivo de um sistema de recomendação é indi-
car itens que sejam do interesse de um indivíduo. Para alcançar esse objetivo,
o sistema recebe um conjunto de usuários e um conjunto de itens, para apren-
der a função capaz de encontrar um valor real para cada par usuário-item.
Este valor real representa o potencial interesse do usuário em determinado
item. Quanto maior o valor, maior a chance de o item ser recomendado para
o usuário (ZAFARANI et al., 2014).
Existem dois métodos clássicos de recomendação: Recomendação Base-
ada em Conteúdo e Filtragem Colaborativa. Estudos recentes permanecem
utilizando esses métodos como base, mas adicionando cada vez mais infor-
mações, especialmente informações obtidas em redes sociais.
Os sistemas de recomendação baseados em conteúdo se apoiam no fato
de que o interesse de um usuário deve corresponder à descrição dos itens
recomendados. Assim, quanto mais similar é a descrição de um item com
relação ao perfil do usuário, maior é a chance de o usuário achar essa re-
comendação interessante. Portanto, o sistema calcula a similaridade entre a
descrição de um item e o perfil do usuário, para verificar o quão recomen-
dável é aquele item.
A Filtragem Colaborativa usa uma matriz item-usuário, na qual cada
valor da matriz possui um valor real que representa uma avaliação dada pelo
usuário, ou valor nulo caso o usuário ainda não tenha avaliado aquele item.
O objetivo da filtragem colaborativa é predizer as avaliações ausentes e, possi-
velmente, recomendar os itens com a maior avaliação prevista para o usuário.
i. Triagem de Bugs
A Triagem de Bugs é capaz de categorizar os diversos reportes1 reali-
zados por usuários e outros programadores com relação a um determinado
programa. Sua utilidade reside em facilitar o trabalho dos desenvolvedores
em identificar os bugs e corrigi-los sem precisar ler milhares de reportes e
comentários. Adicionalmente, esse tipo de aplicação pode gerar estatísticas e
outras informações relevantes para os desenvolvedores do sistema baseado
nesses reportes, possibilitando priorizar certas correções com base na ocor-
rência e no grau de insatisfação dos usuários.
1
Proveniente do inglês, bug report é um jargão da área para indicar um relatório sobre os possíveis
problemas de um software.
45
Tecnologias e ciências da linguagem
4. CONSIDERAÇÕES FINAIS
Acreditamos que as aplicações tenham exibido a importância da Catego-
rização de Documentos e áreas afins. É perceptível que a gama de aplicações
é vasta e versátil, possibilitando colaboração nas mais diversas áreas. De modo
geral, essas aplicações são facilitadoras e não finalizadoras, isto é, elas tornam a
vida das pessoas mais fáceis e, raramente, resolvem o problema por completo.
Portanto, respondendo à brincadeira inicial: não, você não vai perder
seu emprego. Obviamente, o desejo de qualquer pessoa em uma área de au-
tomação é deixar um sistema completamente livre da interferência humana,
isto é, em autonomia completa. Entretanto, sabemos que isso é um processo
demorado e, dependendo da aplicação, bastante desafiador. Deste modo, to-
das as aplicações que vimos aqui servem apenas de auxílio. São aplicações
para tornarem nossas vidas mais fáceis e mais dinâmicas. Um Sistema de
Recomendação não vai tirar seu emprego ou mudar sua vida drasticamente,
mas poderá lhe encaminhar para o melhor filme da sua vida. Uma Análise
de Sentimento não vai fazer você compreender o que se passa na cabeça das
pessoas, mas poderá lhe dar uma noção muita boa de qual público você de-
verá focar seus esforços e quais dos seus produtos estão fadados ao fracasso
ou ao sucesso.
Foi observado, na descrição de um Sistema de Categorização de Docu-
mentos, a presença forte de aspectos léxicos e sintáticos. Por muitos anos a
semântica foi deixada de lado, provavelmente pela dificuldade em integrá-la
aos sistemas automáticos. Entretanto, o rumo natural de evolução de todas
essas aplicações e da área como um todo será investir na semântica.
Representações como word2vec (GOLDBERG; LEVY, 2014) demonstram
esse interesse na semântica, criando uma espécie de espaço composto por pa-
lavras. Deste modo, é criada uma espécie de contexto linguístico das palavras
de modo que palavras que se posicionem próximas nesse espaço são tidas
como próximas em contexto. Essa descrição pode fazer o word2vec ser similar
46
Capítulo 3 – Categorização de Documentos
a um Tesauro (Seção 2a), mas não é assim tão simples. Um Tesauro é capaz de
identificar que homem e rapaz podem ser equivalentes, mas não é capaz de
dizer que homem está mais próximo de rapaz do que de criança. Nesse espa-
ço, palavras como rei e homem possuem a mesma distância de palavras como
rainha e mulher, pois o contexto é o mesmo mudando apenas o referencial do
sexo. O potencial dessa representação é enorme, mas devido à sua complexi-
dade não é tão popular, ainda, quanto os modelos citados neste capítulo.
REFERÊNCIAS
AHMED, H.; TRAORE, I.; SAAD, S. Detection of online fake news using N-gram analysis
and machine learning techniques. In: International Conference on Intelligent, Secure, and
Dependable Systems in Distributed and Cloud Environments. Springer, Cham. p. 127-138.
2017.
ALUISIO, S.; SPECIA, L.; GASPERIN, C.; SCARTON, C. Readability assessment for text
simplification. In Proceedings of the NAACL HLT 2010 Fifth Workshop on Innovative
Use of NLP for Building Educational Applications (pp. 1-9). Association for Computational
Linguistics. 2010.
CHEN, K., ZHANG, Z., LONG, J., ZHANG, H. Turning from TF-IDF to TF-IGM for term
weighting in text classification. Expert Systems with Applications, v. 66, p. 245-260, 2016.
DUMAIS, S.; PLATT, J.; HECKERMAN, D.; SAHAMI, M. Inductive learning algorithms
and representations for text categorization. In Proceedings of the seventh International
Conference on Information and Knowledge Management (pp. 148-155). ACM. 1998.
FERREIRA, R.; CAVALCANTI, G. D.; FREITAS, F.; LINS, R. D.; SIMSKE, S. J.; RISS, M. Combining
sentence similarities measures to identify paraphrases. Computer Speech & Language, 47,
p. 59-73. 2018.
GOLDBERG, Y; LEVY, O. word2vec Explained: deriving Mikolov et al.’s negative-sampling
word-embedding method. arXiv preprint arXiv:1402.3722, 2014.
HUTCHINS, J. The history of machine translation in a nutshell. Retrieved December, v. 20, p.
2009, 2005.
INDURKHYA, N.; DAMERAU, F. (Ed.). Handbook of natural language processing. CRC Press.
Cambridge, UK, 2010.
LAI, G. H.; CHEN, C. M.; LAIH, C. S.; CHEN, T. A collaborative anti-spam system. Expert
Systems with Applications, Vol. 36, n. 3, p. 6645-6653. 2009.
LANCASTER, F. Information retrieval systems: charactistics, testing and evaluation. 2. ed.
New York, NY: Wiley. 1978.
LODHI, H.; SAUNDERS, C.; SHAWE-TAYLOR, J.; CRISTIANINI, N.; WATKINS, C. Text
classification using string kernels. Journal of Machine Learning Research, Vol. 2, n. 1, p.
419-444. 2002
MAYFIELD, J.; MCNAMEE, P. Single n-gram stemming. In: ACM. Proceedings of International
Conference on Research and Development in Information Retrieval. [S.l.], p. 415–416, 2003.
MCCALLUM, A.; NIGAM, K. A comparison of event models for naive bayes text classification.
In: AAAI PRESS. Proceedings of Workshop on Learning for Text Categorization. [S.l.], 1998.
p. 41–48.
MILLER, G. A. WordNet: a lexical database for English. Communications of the ACM, Vol. 38,
n. 11, p. 39-41, 1995.
47
Tecnologias e ciências da linguagem
48
4
MINERAÇÃO DE DADOS TEXTUAIS NÃO
ESTRUTURADOS UTILIZANDO REDES COMPLEXAS
Raquel Bezerra Calado
Universidade de Pernambuco - UPE
Alexandre Magno Andrade Maciel
Universidade de Pernambuco - UPE
1. CONTEXTUALIZAÇÃO
A necessidade de extrair conhecimento relevante em documentos de tex-
to vem se tornando indispensável às organizações que buscam uma gerência
de dados eficiente. Uma enorme quantidade de dados textuais vem sendo
produzida em massa diariamente. O volume de informações desse tipo cresce
a uma taxa média de aproximadamente 62% ao ano, podendo atingir em 2022
um total de 93% dos dados digitais existentes (SCACCHI, 2017). Neste cená-
rio, acredita-se que utilizar técnicas de Mineração Textual (MT) para extração
de conhecimento em dados não estruturados tem um grande valor potencial
comercial e acadêmico.
A MT realiza um processo de extração de informações úteis e desconhe-
cidas de documentos textuais escritos em linguagem natural (PIATETSKY-
-SHAPIRO; FAYYAD; SMITH, 1996). Para realizar a extração de informação,
a mineração de texto abrange uma estrutura que integra diversas áreas de
estudo, como técnicas de mineração de dados, aprendizado de máquina, pro-
cessamento de linguagem natural, recuperação de informações (IR) e geren-
ciamento de conhecimento (CHAKRABORT; PAGOLU; GARLA, 2014).
Os dados contidos em documentos textuais são, do ponto de vista com-
putacional, classificados como não estruturados, ou seja, não organizados em
uma estrutura uniforme. Porém, analisando o texto de uma perspectiva lin-
guística, mesmo um documento bastante inócuo demonstra uma rica quan-
49
Tecnologias e ciências da linguagem
2. REDES COMPLEXAS
O termo Redes Complexas, comumente encontrado na literatura como
Ciência das Redes, refere-se a um grafo que apresenta uma estrutura topo-
gráfica não trivial, composto por um conjunto de vértices (nós) que são inter-
ligados por meio de arestas (BARABÁSI, 2003).
O início dos estudos envolvendo redes baseadas em grafos data de me-
ados de 1920, nos quais os esforços se concentravam em ilustrar as relações
entre entidades sociais, comunicação entre membros de um grupo, negocia-
ções entre nações ou transações econômicas entre corporações. Tais pesquisas
objetivaram analisar os relacionamentos sociais através das características pe-
culiares destas redes, como a centralidade, que representa o vértice central, e
a conectividade, representada pelos vértices com maior número de conexões
(BOCCALETTI et al., 2006).
Desde então, se originou um novo movimento de interesse e pesquisa no
estudo de redes complexas. As redes se tornaram uma forma paradigmática
de representar sistemas complexos nos quais o padrão de interações entre
suas partes constituintes é intrincado e está evoluindo junto com a dinâmica
do sistema estudado (TOROCZKAI, 2005).
Diversos aspectos do mundo real podem ser representados por meio das
Redes Complexas para a resolução de problemas específicos. No campo de
mineração textual, as redes podem ser montadas a partir do relacionamento
entre as palavras dentro de um texto, conforme ilustra a Figura 1.
Para uma melhor visualização da rede proposta, as preposições e arti-
gos foram retiradas da montagem da rede, mantendo somente substantivos,
adjetivos, advérbios e verbos na ilustração.
50
Capítulo 4 – Mineração de dados textuais não estruturados utilizando redes complexas
51
Tecnologias e ciências da linguagem
maior o número for, maior será o grau de conectividade do nó. Tais conexões
são bilaterais, ou seja, para um mesmo nó haverá conexões de entrada e saí-
da, definindo respectivamente o grau de entrada (Indegree) e o grau de saída
(Outdegree). O uso do grau de conectividade como medida de centralidade é
ideal para problemas em que se almeja extrair a importância dos nós a partir
de sua influência na rede.
2.1.2 Intermediação
A intermediação (betweenness) associa elevados valores de centralida-
de para os nós que são acessados um grande número de vezes pelas arestas
da rede, levando em consideração todas as possíveis conexões entre nós
dentro da rede. Os nós que possuírem alto valor de betweenness consequen-
temente possuem uma elevada influência na rede, pois são esses nós que
controlam a distribuição de informação. O valor calculado pelo betweenness
é utilizado para indicar quantitativamente os principais nós da rede. Esta
medida de centralidade pode ser aplicada a problemas em que se busca
descobrir qual nó detém a maior taxa do fluxo de informações que está
correndo pela rede.
2.1.3 Proximidade
Proximidade, ou closeness, calcula quão próximo um determinado nó
está dos demais nós da rede. A distância média de um nó para outro dentro
da rede é inversamente proporcional à sua centralidade de proximidade, sen-
do assim, quanto menor for a distância média de um nó para outro, maior
será o valor do seu closeness.
52
Capítulo 4 – Mineração de dados textuais não estruturados utilizando redes complexas
53
Tecnologias e ciências da linguagem
3. TÉCNICAS COMPLEMENTARES
O objetivo desta seção é fornecer ao leitor informações acerca de técnicas
que podem ser combinadas à utilização de Redes Complexas, com a intenção
de manter no conteúdo textual somente o que for realmente relevante.
Documentos textuais trazem uma vasta quantidade de informação, po-
rém, dentro destes mesmos documentos, existem algumas palavras e termos
que não agregam valor semântico ao texto do ponto de vista computacional.
Dada esta realidade, a etapa de filtragem ou pré-processamento textual se
faz necessária para manter somente o que realmente importa antes de passar
para a extração de conhecimento.
54
Capítulo 4 – Mineração de dados textuais não estruturados utilizando redes complexas
55
Tecnologias e ciências da linguagem
3.3. Tokenização
Também denominada de atomização, esta técnica busca dividir o fluxo
contínuo de palavras em unidades mínimas de texto previamente estabeleci-
das, conhecidas como tokens (REHMAN et al., 2013). A depender da necessida-
de, pode-se dividir o texto em unidade de palavras, ou em conjuntos (tokens)
de n palavras. A Figura 7 apresenta a tokenização de um fluxo de caracteres
levando em consideração que a divisão utilizada foi com o n = 1, ou seja, as
palavras separadas individualmente.
Figura 7. Tokenização
Fonte: Os Autores.
3.4. Normalização
Esta etapa visa simplificar conteúdo do texto através do agrupamento
de termos semelhantes. As técnicas mais utilizadas para a normalização das
palavras são o Stemming, Lematização e Thesaurus.
• Stemming: Esta técnica reduz as palavras do texto às suas respec-
tivas raízes (sem levar em conta a classe gramatical). O stemming
permite a utilização de vocábulos primitivos anteriores às variações,
como plurais e inflexões verbais (PORTER, 1980). Esse processo corta
as extremidades das palavras, incluindo a remoção de afixos deriva-
cionais. A Figura 8 apresenta um exemplo da aplicação da técnica.
Figura 8. Stemming
Fonte: Os Autores
56
Capítulo 4 – Mineração de dados textuais não estruturados utilizando redes complexas
Figura 9. Lematização
Fonte: Os Autores
4. FERRAMENTAS
Esta seção apresenta ferramentas que viabilizam a implantação das téc-
nicas discutidas em qualquer conteúdo textual. A Tabela 1 apresenta algumas
destas ferramentas.
57
Tecnologias e ciências da linguagem
58
Capítulo 4 – Mineração de dados textuais não estruturados utilizando redes complexas
5. DISCUSSÃO
Várias pesquisas sobre a utilização de Redes Complexas em problemas
envolvendo dados textuais não estruturados têm sido desenvolvidas. Nesta
seção, serão apresentados alguns destes trabalhos. Recentes contribuições em
distintas áreas de aplicações dentro da mineração textual foram levantadas,
onde, nestes estudos, as técnicas aqui descritas foram utilizadas e resultados
promissores obtidos. A Tabela 2 apresenta alguns desses trabalhos.
59
Tecnologias e ciências da linguagem
60
Capítulo 4 – Mineração de dados textuais não estruturados utilizando redes complexas
61
Tecnologias e ciências da linguagem
62
Capítulo 4 – Mineração de dados textuais não estruturados utilizando redes complexas
6. CONSIDERAÇÕES FINAIS
Apesar de ser um tópico relativamente recente à mineração textual, mui-
tos estudos já foram realizados sobre vários aspectos de Redes Complexas no
campo linguístico. Tais estudos trazem à tona o quão promissora esta técnica
63
Tecnologias e ciências da linguagem
AGRADECIMENTOS
À Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
pela concessão da bolsa de apoio financeiro a primeira autora e à empresa
Kurier Tecnologia pelo apoio financeiro e tecnológico ao longo da pesquisa.
REFERÊNCIAS
ROZZ, Y. A.; MENEZES, R. Author attribution using network motifs. Springer. International
Workshop on Complex Networks. [S.l.], 2018. p. 199–207.
AMANCIO, D. R. A complex network approach to stylometry. PloS One, Vol. 10, n. 8, p. e0136076,
2015.
BAEZA-YATES, R.; RIBEIRO, B. D. A. N. Modern information retrieval. New York: ACM Press;
Harlow, England: Addison-Wesley, 2011.
BARABÁSI, A.; ALBERT, R. Emergence of scaling in random networks. Science, Vol. 286, n. 5439,
p. 509-512, 1999.
BARABÁSI, A. L. How everything is connected to everything else and what it means for business,
science and everyday life. New York: Plume Books, 2003.
BOCCALETTI, S.; LATORA, V.; MORENO, Y.; CHAVEZ, M.; HWANG, D. U. Complex networks:
Structure and dynamics. Physics Reports, Vol. 424, n. 4-5, p. 175-308, 2006.
BUCHANAN, M.; ALDANA-GONZALES, M. Nexus: Small worlds and the ground-breaking
science of networks. Physics Today, Vol. 56, p. 71-72, 2003.
CALADO, R.; MACIEL, A.; Mineração de dados jurídicos não estruturados utilizando ensemble
dinâmico. Dissertação (Mestrado em Engenharia da Computação) - Escola Politécnica do
Recife, Universidade de Pernambuco. Recife. 2019.
CHAKRABORTY, G.; PAGOLU, M.; GARLA, S. Text mining and analysis: practical methods,
examples, and case studies using SAS. 1ª Edição. Cary, NC, USA. SAS Institute Inc., 2013.
COSTA, L. D. F.; RODRIGUES, F. A.; TRAVIESO, G.; VILLAS BOAS, P. R. Characterization of complex
networks: A survey of measurements. Advances in Physics, Vol. 56, n. 1, p. 167-242, 2007.
CORREA, E. A.; LOPES, A. A.; AMÂNCIO, D. R. Word sense disambiguation. Information
Sciences: an International Journal, Vol. 442, n. C, p. 103-113, 2018.
64
Capítulo 4 – Mineração de dados textuais não estruturados utilizando redes complexas
CHEN, H.; CHEN, X.; LIU, H. How does language change as a lexical network? An investigation
based on written Chinese word co-occurrence networks. PloS One, Vol. 13, n. 2, p. e0192545,
2018.
ERDOS, P.; RENYI, A. On random graphs. I. Publicationes Mathematicae Debrecen, Vol. 6, p.
290-297, 1959.
FELDMAN, R.; SANGER, J. The text mining handbook: advanced approaches in analyzing
unstructured data. Cambridge University Press, 2007.
GUPTA, V.; LEHAL, G. S. A survey of text mining techniques and applications. Journal of
Emerging Technologies In Web Intelligence, Vol. 1, n. 1, p. 60-76, 2009.
HANNEMAN, R. A.; RIDDLE, M. Introduction to social network methods. Riverside, CA:
University of California, 2005. Disponível em: <https://faculty.ucr.edu/~hanneman/>.
Acesso em: 08 fev. 2019.
KAO, A.; POTEET, S. R. (Ed.). Natural language processing and text mining. Springer-Verlag,
New York, Inc. Secaucus, NJ, USA, 2007.
MACHADO, C.; RODRIGUES, R.; MACIEL, A.; MENEZES, R. An approach for thematic
relevance analysis applied to textual contributions in discussion forums. International
Journal Of Distance Education Technologies, 2019.
REHMAN, Z.; ANWAR, W.; BAJWA, U. I.; XUAN, W.; CHAOYING, Z. Morpheme matching
based text tokenization for a scarce resourced language. PloS one, Vol. 8, n. 8, p. e68178, 2013.
PORTER, M. An algorithm for suffix stripping. Program, Vol. 14, n. 3, p. 130-137, 1980.
PIATETSKY-SHAPIRO, G.; FAYYAD, U.; SMITH, P. From data mining to knowledge discovery:
An overview. Advances in Knowledge Discovery And Data Mining, Vol. 1, p. 35, 1996.
SCACCHI, M.: Competitive intelligence and unstructured data: the business case for text mining.
Competitive Intelligence Magazine, Vol. 20, n. 1, p 26-40, 2017.
SINOARA, R. A.; ANTUNES, J.; REZENDE, S. O. Text mining and semantics: a systematic
mapping study. Journal of the Brazilian Computer Society, Vol. 23, n. 1, p. 9, 2017.
TOROCZKAI, Z. Complex networks: the challenge of interaction topology. Los Alamos Science,
n. 29, pp. 94–109, 2005.
WATTS, D. J.; STROGATZ, S. H. Collective dynamics of ‘small-world’ networks. Nature, Vol..
393, n. 6684, p. 440, 1998.
65
5
INTRODUÇÃO A CHATBOTS E SUAS APLICAÇÕES
EM CIÊNCIAS DA LINGUAGEM
Sílvio S. Bandeira
Universidade Católica de Pernambuco - UNICAP
Anthony J. C. C. Lins
Universidade Católica de Pernambuco - UNICAP
Fernando J. A. Wanderley
Universidade Católica de Pernambuco - UNICAP
Matheus B. L. Marinho
Universidade Católica de Pernambuco - UNICAP
Waslon T. A. Lopes
Universidade Federal de Campina Grande - UFCG
Francisco Madeiro
Universidade Católica de Pernambuco - UNICAP
1. INTRODUÇÃO
O termo chatbot é uma abreviação de duas palavras “bate-papo” (chat,
em inglês) e robô (robot ou bot, em inglês). Um chatbot é também denominado
assistente virtual, agente virtual ou, simplesmente, bot. O chatbot é basicamen-
te um programa de computador que pode interagir com pessoas fazendo e
respondendo perguntas.
No cenário de aplicações comerciais, os chatbots têm sido amplamente
utilizados na automação de sistemas de atendimento ao cliente (SAC). Um
relatório da Empresa Gartner (CRM, 2011) projeta que, em 2020, 85% das inte-
rações com clientes serão realizadas por chatbots. Dois exemplos importantes
de chatbots são o IBM Watson e o Microsoft Bot Framework.
Em se tratando de educação e aprendizagem, os chatbots têm sido con-
templados em vários estudos. Hiremath et al. (2018), por exemplo, usam bases
de dados locais e da Internet para construir um sistema escalável, amigável e
interativo. A ideia chave é usar aprendizagem de máquina, reconhecimento
67
Tecnologias e ciências da linguagem
68
Capítulo 5 – IntroduçÃo a Chatbots e suas aplicações em Ciências da Linguagem
1
Apple Siri - https://www.apple.com/br/siri/
2
Google Now - https://www.google.com/intl/pt-BR/landing/now/
3
Microsfot Cortana - https://www.microsoft.com/pt-br/windows/cortana
4
AI ChatBot Erica for Bank of America - goo.gl/V9q8n7
69
Tecnologias e ciências da linguagem
70
Capítulo 5 – IntroduçÃo a Chatbots e suas aplicações em Ciências da Linguagem
71
Tecnologias e ciências da linguagem
72
Capítulo 5 – IntroduçÃo a Chatbots e suas aplicações em Ciências da Linguagem
73
Tecnologias e ciências da linguagem
74
Capítulo 5 – IntroduçÃo a Chatbots e suas aplicações em Ciências da Linguagem
ESTUDOS DE CASOS
WTC
O primeiro caso, descrito em (AYEDOUN; HAYASHI; SETA, 2015), con-
siste em um ECA projetado ao redor de um princípio: aumentar a disposição
do aluno de conversar na língua estrangeira, a que se referem com a sigla
WTC (do inglês willing to communicate).
Os responsáveis por esse sistema identificaram que o WTC é a chave
para que o estudante melhore seu aprendizado quando evidenciaram que,
mesmo após vários anos de estudo, os alunos, em sua maioria, não se sentem
espontaneamente dispostos a conversar na língua estrangeira, ou seja, a ini-
ciativa em procurar oportunidades de comunicação é pequena. Como causas
desse fato, acharam dois tipos de fatores:
• Fatores estáveis: como personalidade, autoconfiança, situação social
e auto-motivação.
• Fatores influenciáveis: como ansiedade, percepção da própria com-
petência na língua estrangeira no contexto da conversação, desejo de
se comunicar com uma determinada pessoa e oportunidades de uso
da língua.
Os fatores influenciáveis são os que se apresentam com melhores chan-
ces de melhoria através de um ECA. Então, o sistema precisa ajudar o aluno
a reduzir a ansiedade e melhorar sua autoconfiança na comunicação, apre-
sentando contextos de conversação variados, interessantes e adequados ao
seu nível.
O ECA foi projetado com duas partes principais, cada uma delas com-
posta por módulos desenvolvidos e mantidos pelo próprio grupo e outros
disponíveis na Internet. O papel de cada uma das duas partes é bem simples:
a primeira parte, chamada de gerenciador de diálogos, que recebe a entrada
vocal do aluno, é responsável por decidir qual a resposta que o sistema dará
ao aluno e quando será emitida. A segunda parte, chamada de gerador mul-
timodal de respostas, é responsável pela apresentação da saída do sistema, ou
seja, ele decide como a resposta será emitida.
O gerenciador de diálogos precisa, em primeiro lugar, entender o que
o aluno falou e, para isto, utiliza o serviço de um módulo especializado de
75
Tecnologias e ciências da linguagem
76
Capítulo 5 – IntroduçÃo a Chatbots e suas aplicações em Ciências da Linguagem
CSIEC
O segundo ECA que analisamos, descrito em (JIA, 2009), é, sem dúvida,
o mais complexo dos três. Composto por mais de vinte módulos, o CSIEC
(do inglês computer simulation in educational communication) foi projetado para
rodar em um servidor web e tem como características mais marcantes a com-
pleta análise sintática e semântica da entrada do usuário e o uso ostensivo da
memória das conversas, inclusive, enriquecendo as novas com conhecimentos
específicos e gerais das antigas. Disponível na Internet, o sistema evolui à
medida em que é usado.
O ECA alimenta vários módulos com a mesma entrada do usuário, seja
em texto ou voz. Desta forma, o sistema consegue diminuir o tempo médio
de resposta ao usuário pois os módulos que rodam em paralelo conseguem
gerar respostas de complexidades diferentes, decidindo se uma resposta mais
rápida ao usuário é mais adequada ou a saída de um módulo mais complexo
é exigida pelo contexto.
Ao invés de ter cenários pré-programados de interação, o sistema rea-
liza a análise ontológica das sentenças de entrada juntamente com a análise
semântica, e os chamados fatos do usuário coletados são alimentados em uma
base local e formam o contexto da conversa, que pode ser enriquecido com
esses mesmos dados locais e bases de conhecimentos gerais remotas. O sis-
tema armazena fatos novos extraídos da conversa e tanto esses fatos como
características da personalidade do próprio avatar são utilizados para geração
das respostas. Por exemplo, se o usuário fala que é um estudante pela segun-
da vez, o sistema identifica que aquele “fato” já se encontra na memória do
sistema e pode responder “Sim eu sei. O que você está estudando?” ao invés
de repetir a mesma resposta anterior. Desta forma, ao invés de ter cenários
pré-programados de interação, o contexto é montado e adaptado à medida em
que o diálogo progride, o que dá flexibilidade à conversação.
As respostas geradas pelo ECA podem vir de três fontes diferentes:
• Módulo de respostas diretas, que forma saídas mais rápidas basea-
das em regras no modelo do sistema ELIZA, onde se tenta casar a
sentença do usuário em um dos padrões existentes, com a grande
diferença na flexibilidade de criação de sentenças que uma análise
semântica completa pode fornecer. Os pares de padrão e resposta
são escritos em uma tabela de respostas diretas e pode haver várias
77
Tecnologias e ciências da linguagem
78
Capítulo 5 – IntroduçÃo a Chatbots e suas aplicações em Ciências da Linguagem
Ville/DEAL
O terceiro caso que analisamos, descrito em (WIK; HJALMARSSON,
2009), é na verdade composto de dois ECAs: Ville e DEAL, ambos desenvol-
vidos para a língua sueca. O primeiro é um auxiliar no treino de vocabulário
e pronúncia, personificando um professor virtual. O segundo foi projetado
como um jogo para a prática de conversação.
Esses dois ECAs são aplicações a serem baixadas em um computador
local, ao invés de serem usadas a partir da web. Utilizam avançados recursos
visuais próprios com especial cuidado no sincronismo entre a fala e as ex-
pressões visuais, incluindo movimentos de cabeça e partes da face para dar
uma impressão mais realista ao avatar. Os agentes são flexíveis e responsivos,
e podem fazer uso de feedback neutro para manter a palavra (e.g., “ok”, “yes”,
“hum…”) enquanto a próxima resposta é gerada.
Ambos os sistemas privilegiam o retorno qualitativo ao aluno sobre o
quantitativo, ou seja, ao invés de retornar um número indicando a “nota” do
aluno, retornam frases de estímulo (e.g., “excelente”, “muito bem”). Os ECAs
são projetados de forma que suas bases de dados possam ser incrementadas
e expandidas pelos participantes do projeto a partir de conhecimento espe-
cializado, como professores treinados, e dos usuários habituais do sistema.
De fato, os responsáveis pelo sistema são bem ativos no sentido de ampliar o
sistema, construindo de forma contínua as bases de perfis de usuários, as ba-
ses de conhecimento, cenários de conversação e exercícios. Fizeram também
um excelente trabalho de análise estatística do uso do ambiente.
O ECA Ville é um professor virtual de língua com o objetivo de guiar o
estudante e, frequentemente, escolhe as palavras que o aluno deve dizer nos
exercícios e simulações, o que facilita bastante a análise (especialmente da
pronúncia). Como Ville precisa ser um modelo de pronúncia correta para o
estudante, sua voz é criada de trechos pré-gravados.
Uma característica singular do Ville é a habilidade de detectar e dar
retorno ao estudante nos erros de pronúncia mais comuns. Ainda mais inte-
ressante é que foi desenvolvido um conjunto de regras baseadas em conheci-
mento (knowledge-based rules) que explicita os erros de pronúncia mais prová-
veis na língua estrangeira dependendo da língua nativa do aluno. Algumas
das análises mais especializadas de pronúncia do Ville são: ênfase das sílabas
79
Tecnologias e ciências da linguagem
tônicas, remoção de consoante após uma vogal tônica, inserção de vogal in-
devida e duração das vogais, sempre apoiadas por exercícios de percepção.
Outra ideia muito bem sucedida do Ville é evitar dar retorno repeti-
tivo ao aluno sempre que ele comete o mesmo erro. Ao invés disto, o ECA
dispõe de várias “luzes de semáforo” na parte inferior da tela para algumas
categorias de erro e, quando o aluno comete um deles, a luz correspondente
acende em vermelho. Este sinal pode ser simplesmente ignorado mas, caso
o usuário queira saber qual erro cometeu, basta clicar na luz correspondente
que receberá o retorno.
Na questão de vocabulário, o Ville emprega os conhecidos flashcards,
que são cartões com uma palavra de um lado e seu significado/tradução no
outro. A inovação neste item fica por conta da inclusão não apenas da tradu-
ção da palavra, mas também de uma figura, o áudio e a possibilidade de o
aluno poder gravar sua própria pronúncia e receber o retorno da análise de
erros. Mais ainda, o histórico dos áudios de uma mesma palavra pronuncia-
da pelo aluno é armazenado para acompanhar o aprendizado ao longo do
tempo. Essa gama de informações gravadas pode ser utilizada para estudos
do desempenho no aprendizado da língua em diferentes classes de pessoas,
agrupadas por gênero, idade, sexo e país de origem. Outra utilidade promis-
sora da coleção é servir de base de treinamento para outros sistemas, espe-
cialmente os que façam uso de inteligência artificial.
O ECA DEAL toma o lugar de um interlocutor de diálogo casual, com o
objetivo de criar e manter uma conversa interessante. Por sua natureza mais
flexível, as vozes dos agentes no DEAL são criadas sob demanda utilizando
um sistema de sintetização vocal (do inglês text-to-speech ou TTS).
Foi projetado para fazer uso de cenários diversos onde o estudante é
estimulado a usar seu aprendizado para realizar alguma tarefa como, por
exemplo, comprar um item de uma loja. Esta abordagem é bem mais aproxi-
mada de um jogo que nos outros ECAs analisados.
Uma possibilidade muito criativa do sistema é combinar o Ville com o
DEAL em um jogo em que o aluno precisa adquirir o conhecimento de uma
“fase” no Ville, e ser testado em um cenário correspondente no DEAL para
poder “passar” para a próxima fase. Os cenários do DEAL são feitos para
construir um contexto de prática onde o estudante precisa exercitar estraté-
gias e pensamento lógico combinados com o uso da linguagem. Por exemplo,
em um determinado cenário o usuário precisa entrar em uma loja e comprar
todos os itens de uma lista levando consigo dinheiro insuficiente para tal.
Desta forma, ele precisa negociar os preços dos produtos com o vendedor
para conseguir comprar todos e completar a tarefa.
80
Capítulo 5 – IntroduçÃo a Chatbots e suas aplicações em Ciências da Linguagem
REFERÊNCIAS
ANDROUTSOPOULOU, A.; KARACAPILIDIS, N.; LOUKIS, E.; CHARALABIDIS, Y.
Transforming the communication between citizens and government through AI-guided
chatbots. Government Information Quarterly, 2018.
AYEDOUN, E.; HAYASHI, Y.; SETA, K. A conversational agent to encourage willingness to
communicate in the context of english as a foreign language. Procedia Computer Science,
[S. l.], n. 60, p. 1433-1442, 2015.
CIECHANOWSKI, L.; PRZEGALINSKA, A.; MAGNUSKI, M.; GLOOR, P. In the shades of the
uncanny valley: An experimental study of human–chatbot interaction, Future Generation
Computer Systems, Vol. 92, n.1, p. 539-548, 2019.
CRM. CRM Strategies and Technologies to Understand, Grow and Manage Custumer Experiences,
Gartner 360 Summit 2011, March 30-April 1, Los Angeles, 2011.
FØLSTAD, A.; BRANDTZAEG, P. B. Chatbots and the new world of HCI, Interactions, Vol. 24,
n. 4, p. 38-42, 2017.
FØLSTAD, A.; BRANDTZAEG, P. B.; FELTWELL, T.; LAW, E. L-C.; TSCHELIGI, M.; LUGER,
E. A. SIG: Chatbots for Social Good, Extended Abstracts of the 2018 CHI Conference on
Human Factors in Computing Systems, ACM, n. 6, p. 1-4, 2018.
GARDINER, P.; MCCUE, K.; NEGASH, L.; CHENG, T.; WHITE, L.; YINUSA-NYAHKOON,
L.; BICKMORE, T. W. Engaging women with an embodied conversational agent to deliver
mindfulness and lifestyle recommendations: A feasibility randomized control trial. Patient
Education and Counseling, Vol.100, n.9, p. 1720-1729, 2017.
HILL, J.; FORD, W.; FARRERAS, I. Real conversations with artificial intelligence: A comparison
between human–human online conversations and human–chatbot conversations, Computers
in Human Behavior, Vol. 49, n. 1, p. 245-250, 2015.
HIREMATH, G.; HAJARE, A.; BHOSALE, P.; NANAWARE, R. Chatbot for education system.
International Journal of Advance Research, Ideas and Innovations in Technology, Vol. 4,
n. 3, 2018.
JACK, B.; BICKMORE, T.; HEMPSTEAD, M.; YINUSA-NYAHKOON, L.; SADIKOVA, E.;
MITCHELL, S.; DAMUS, K. Reducing preconception risks among African American women
with conversational agent technology. The Journal of the American Board of Family Medicine,
Vol. 28, n.4, p. 441-451, 2015.
JIA, J. CSIEC: A computer assisted English learning chatbot based on textual knowledge and
reasoning. Knowledge-Based Systems, [S. l.], n. 22, p. 249-255, 2009.
KAR, R.; HALDAR, R. Applying chatbots to the internet of things: Opportunities and architectural
elements, International Journal of Advanced Computer Science and Applications
(IJACSA), Vol. 7, n. 11, p. 147-154, 2016.
KUYVEN, N.; ANTUNES, C.; DE BARROS VANZIN, V.; DA SILVA, J.; KRASSMANN, A.;
TAROUCO, L. Chatbots na educação: uma Revisão Sistemática da Literatura. RENOTE,
Vol.16, n.1, 2018.
LANGLET, C.; CLAVEL, C. Grounding the detection of the user’s likes and dislikes on the topic
structure of human-agent interactions. Knowledge-Based Systems, Vol. 106, n.1, p. 116-124,
2016.
81
Tecnologias e ciências da linguagem
MEHR, H.; ASH, H.; FELLOW, D. Artificial intelligence for citizen services and government.
Ash Center for Democratic Governance and Innovation, Harvard Kennedy School, v.2 p.1-2.
2017.
NIVAMAT, K.; CHAMPANERIA, T. Chatbots: An overview types, architecture, tools and future
possibilities. International Journal for Scientific Research & Development. Vol.5, n.7, 2017.
PICKARD, M.; ROSTER, C.; CHEN, Y. Revealing sensitive information in personal interviews:
Is self-disclosure easier with humans or avatars and under what conditions? Computers in
Human Behavior, Vol. 65, n. 1, p. 23-30, 2016.
WIK, P.; HJALMARSSON, A. Embodied conversational agents in computer assisted language
learning. Speech Communication, [S. l.], n. 51, p. 1024-1037, 2009.
82
6
RECONHECIMENTO DE COMANDOS DE VOZ
COMO INSTRUMENTO DE INTERFACE PARA
EQUIPAMENTOS ELETROELETRÔNICOS
PARA PESSOAS PORTADORAS DE
DEFICIÊNCIA FÍSICO-MOTORA
Fábio Cisne Ribeiro
Universidade Federal do Ceará – UFC
1. INTRODUÇÃO
A comunicação é um dos principais instrumentos de resolução de pro-
blemas da humanidade, sendo um meio de diálogo e de expressão, inclusive
emocional, do ser humano. A comunicação têm dado provas de sua impor-
tância para a sobrevivência e para o desenvolvimento da sociedade. Assim,
desde o surgimento dos dispositivos eletrônicos, como calculadoras, compu-
tadores, telefones, eletrodomésticos, eletrônicos, os meios de interação e/ou
comunicação dos seres humanos com os dispositivos eletrônicos, também
chamados de interface homem-máquina, tornaram-se alvo de estudos e apli-
cações nas mais diversas áreas, desde o início do século XX. Devido a isso,
essa área de pesquisa tem sido de bastante interesse da comunidade acadê-
mica (RIBEIRO, 2019).
A linguagem pode ser expressada pelos mais diversos meios, sendo
a voz a via de comunicação mais natural e mais utilizada, haja vista não
83
Tecnologias e ciências da linguagem
84
Capítulo 6 – Reconhecimento de comandos de voz como instrumento de interface para equipamentos eletroeletrônicos
“considera-se pessoa com deficiência aquela que tem impedimento de longo prazo
de natureza física, mental, intelectual ou sensorial, o qual, em interação com uma
ou mais barreiras, pode obstruir sua participação plena e efetiva na sociedade em
igualdade de condições com as demais pessoas”.
85
Tecnologias e ciências da linguagem
4. AQUISIÇÃO
A etapa de aquisição de voz é responsável por capturar continuamente a
voz do locutor do sistema, através de um microfone, convertendo a elocução
do comando de voz pronunciado para o formato digital, de forma que possi-
bilite que os algoritmos, presentes no sistema de reconhecimento de coman-
dos de voz, processarem as informações digitais no sinal da voz do locutor
(HERACLEOUS et al., 2018; AYADI et al., 2017).
Um passo dessa etapa consiste em identificar quando o locutor iniciou a
elocução de um comando de voz no sistema, e quando este locutor finalizou
a elocução do comando, de forma a isolar este trecho da fala do locutor para
que as etapas posteriores possam processar apenas a voz do locutor.
5. PRÉ-PROCESSAMENTO
O pré-processamento é a etapa responsável por “condicionar” o sinal de
voz capturada da elocução, removendo eventuais ruídos indesejáveis, remo-
vendo também as seções de silêncio presentes na fala, isolando apenas a parte
importante do sinal da fala, resultando um sinal de voz apropriado para o
processamento (BERDIBAEVA et al., 2017).
6. PROCESSAMENTO
Após a elocução da voz ser devidamente preparada, mas antes de ser clas-
sificada, esta precisa ser processada de forma a identificar os diferentes parâ-
metros da voz. Este processamento, para as aplicações que necessitam extrair
informações para classificação dos dados de entrada, é chamado de extração de
características, e consiste em converter a elocução da voz em um conjunto de ca-
racterísticas mantendo a maior parte da informação dos dados originais presen-
tes da elocução da voz. Este processo converte a voz em um conjunto de dados
ou características que são relevantes presentes na fala, removendo informações
redundantes ou insignificante dos dados originais (MANSOUR; CHENCHAH;
LACHIRI, 2018; FEROZE; MAUD, 2018; AGRAWAL; MISHRA, 2017).
86
Capítulo 6 – Reconhecimento de comandos de voz como instrumento de interface para equipamentos eletroeletrônicos
7. CLASSIFICAÇÃO
Os classificadores fazem parte dos sistemas de reconhecimento de pa-
drões e das ferramentas de aprendizagem de máquina podem ser utilizadas
para tal objetivo. Isto é realizado pela identificação de padrões presentes nas
características do conjunto de dados, usando o conhecimento a priori e/ou
informações estatísticas extraídas desses padrões. As técnicas de classificação
são tipicamente usadas para classificar dados em grupos ou classes, fazendo
com que sistemas aprendam como distinguir tais classes, permitindo, assim,
a classificação de novos dados dentro deste conjunto de classes (KUMARI;
SRIVASTAVA, 2017; LORENA; CARVALHO; GAMA, 2008).
A aplicação dos classificadores em sistemas de reconhecimento de co-
mando de voz consiste em identificar nos dados de entrada informações pre-
sentes na voz ou fala, dentre os comandos pré-definidos pelo sistema, e assim
utilizar cada comando isoladamente ou em uma determinada sequência para
a execução de uma ação (DOU et al., 2018).
87
Tecnologias e ciências da linguagem
88
Capítulo 6 – Reconhecimento de comandos de voz como instrumento de interface para equipamentos eletroeletrônicos
Para que a rede neural possa “apreender” os padrões dos dados de en-
trada, é necessário o uso de um algoritmo de treinamento. Um dos algoritmos
existentes simula o processo de aprendizagem do cérebro humano. Este algo-
ritmo consiste em estimular a rede neural com os dados a serem classificados
em conjunto com o que se espera que seja identificado, e assim o algoritmo é
capaz de definir os coeficientes das funções matemáticas presentes em cada
um dos neurônios artificiais e do conjunto de interligações destes ajustar os
parâmetros dos neurônios. Desta forma é possível que a rede neural identi-
fique características presentes na voz, durante a elocução de um comando de
voz, como: entonação, timbre e frequência (HAYKIN, 2001).
Ao final, com a rede neural artificial treinada, cada nova elocução de um
comando de voz é submetida a rede neural, seguindo os mesmos padrões de
processamento do sinal de voz, e através do algoritmo de classificação, a saída
dos últimos neurônios deve identificar o comando de voz que o usuário proferiu.
89
Tecnologias e ciências da linguagem
90
Capítulo 6 – Reconhecimento de comandos de voz como instrumento de interface para equipamentos eletroeletrônicos
AGRADECIMENTOS
À Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CA-
PES) pela concessão da bolsa de apoio financeiro ao primeiro e segundo autor.
REFERÊNCIAS
AGRAWAL, S.; MISHRA, D. K. Speaker verification using mel-frequency cepstrum coefficient
and linear prediction coding. In: 2017 International Conference on Recent Innovations in
Signal processing and Embedded Systems (RISE). [S.l.: s.n.], 2017. p. 543–548.
AYADI, M. E.; HASSAN, A.-K. S.; ABDEL-NABY, A.; ELGENDY, O. A. Text-independent speaker
identification using robust statistics estimation. Speech Communication, v. 92, p. 52–63, 2017.
BERDIBAEVA, G. K.; BODIN, O. N.; KOZLOV, V. V.; NEFED’EV, D. I.; OZHIKENOV, K. A.;
PIZHONKOV, Y. A. Pre-processing voice signals for voice recognition systems. International
Conference of Young Specialists on Micro/Nanotechnologies and Electron Devices, EDM,
p. 242–245, 2017.
BRASIL. Decreto nº 9.296, de 1º de março de 2018. Estatuto da Pessoa com Deficiência - Regulamenta
o art. 45 da Lei nº 13.146, de 6 de julho de 2015, que institui a Lei Brasileira de Inclusão da Pessoa
com Deficiência. Diário Oficial da União, Brasília, DF, 2 mar. 2018, Seção 1, p. 4.
BRASIL. Lei nº 13.146, de 6 de julho de 2015. Institui a lei brasileira de inclusão da pessoa com
deficiência (estatuto da pessoa com deficiência). Brasília, 2015.
CASSIDY, S. A.; STENGER, B.; VAN DONGEN, L.; YANAGISAWA, K.; ANDERSON, R.; WAN,
V.; BARON-COHEN, S.; CIPOLLA, R. Expressive visual text-to-speech as an assistive
technology for individuals with autism spectrum conditions. Computer Vision and Image
Understanding, v. 148, p. 193–200, 2016.
CHANDLER, D. Finding its own way: Robot wheelchair responds to user. MIT Tech Talk,
Cambridge, MA, v. 53, n. 3, p. 8-8, 24 set. 2008.
DOU, J.; YAMAGISHI, H.; ZHU, Z.; YUNUS, A. P.; CHEN, C. W. A comparative study of the
binary logistic regression (blr) and artificial neural network (ann) models for gis-based spatial
predicting landslides at a regional scale. In: Landslide Dynamics: ISDR-ICL Landslide
Interactive Teaching Tools : Volume 1: Fundamentals, Mapping and Monitoring. Cham:
Springer International Publishing, 2018. p. 139–151.
91
Tecnologias e ciências da linguagem
FEROZE, K.; MAUD, A. R. Sound event detection in real life audio using perceptual linear
predictive feature with neural network. In: IEEE Applied Sciences and Technology (IBCAST),
2018 15th International Bhurban Conference on. [S.l.], 2018. p. 377–382.
HAMPSHIRE COUNTY COUNCIL. Hampshire County Council: pushing the boundaries
by using Amazon Echo. Hampshire, United Kingdom, 19 jan. 2018. Acesso em: 21 fev.
2019. Disponível em: <https://www.local.gov.uk/hampshire-county-council-pushing-
boundaries-using-amazon-echo>.
HAYKIN, S. S. Redes Neurais: Princípios e Prática. 2. ed. Porto Alegre: Bookman Companhia
ED, 2001.
HERACLEOUS, P.; EVEN, J.; SUGAYA, F.; HASHIMOTO, M.; YONEYAMA, A. Exploiting
alternative acoustic sensors for improved noise robustness in speech communication. Pattern
Recognition Letters, v. 112, p. 191–197, 2018.
KAUNDINYA, A. S.; ATREYAS, N. S. P.; SRINIVAS, S.; KEHAV, V.; KUMAR, N. M. R. Voice
Enabled Home Automation Using Amazon Echo. International Research Journal of
Engineering and Technology, v. 4, i. 8, p. 682–684, aug. 2017.
KOSTOULAS, T.; WINKLER, T.; GANCHEV, T.; FAKOTAKIS, N.; KÖHLER, J. The MoveON
database: motorcycle environment speech and noise database for command and control
applications. Language Resources and Evaluation, v. 47, n. 2, p. 539–563, Jun 2013.
KUMARI, R.; SRIVASTAVA, S. K. Machine learning: A review on binary classification.
International Journal of Computer Applications, Foundation of Computer Science, v. 160,
n. 7, 2017.
LORENA, A. C.; CARVALHO, A. C.; GAMA, J. A. M. A review on the combination of binary
classifiers in multiclass problems. Artificial Intelligence Review, Kluwer Academic
Publishers, Norwell, MA, USA, v. 30, n. 1-4, p. 19–37, dez. 2008.
MANSOUR, A.; CHENCHAH, F.; LACHIRI, Z. Emotional speaker recognition in real life
conditions using multiple descriptors and i-vector speaker modeling technique. Multimedia
Tools and Applications, Jul 2018.
NETO, J. A. O.; CASTRO, M. A. A.; FELIX, L. B. Reconhecimento de comandos de voz para
o acionamento de cadeira de rodas. XVIII Congresso Brasileiro de Automática, 12 a
16-setembro-2010, Bonito-MS, 2010.
ORGANIZAÇÃO MUNDIAL DA SAÚDE (OMS). Classificação Estatística Internacional de
Doenças e Problemas Relacionados à Saúde: CID-11 Décima primeira revisão. Tradução de
Centro Colaborador da OMS para a Classificação de Doenças em Português. 1 ed. São Paulo:
EDUSP, 2019.
PESKETT, J. Virgin launches new Alexa initiative to assist disabled passengers. [S. l.], 27 fev.
2019. Acesso em: 28 fev. 2019. Disponível em: <https://www.accessandmobility professional.
com/virgin-launches-new-alexa-initiative-to-assist-disabled-passengers/>.
PORTAL BRASIL. Brasil financia tecnologia para pessoas com deficiência. Brasília/DF, 24 set.
2015. Acesso em: 12 fev. 2019. Disponível em: <http://www.brasil.gov.br/noticias/educacao-
e-ciencia/2015/09/brasil-financia-tecnologia-para-pessoas-com-deficiencia>.
PURINGTON, A.; TAFT, J. G.; SANNON, S.; BAZAROVA, N. N.; TAYLOR, S. H. Alexa is my new
BFF: Social roles, user satisfaction, and personification of the Amazon Echo. In: Proceedings
of the 2017 CHI Conference Extended Abstracts on Human Factors in Computing Systems, Denver,
CO, USA, 6–11 May 2017, p. 2853–2859.
RIBEIRO, F. C. Reconhecimento de comandos de voz em português brasileiro em
ambientes ruidosos usando laringofone. 2019. 132 p. Tese (Doutorado em Engenharia de
Teleinformática) - Centro de Tecnologia, Programa de Pós-Graduação em Engenharia de
Teleinformática, Universidade Federal do Ceará, Fortaleza, Brasil, 2019.
92
Capítulo 6 – Reconhecimento de comandos de voz como instrumento de interface para equipamentos eletroeletrônicos
STEINHAUSER, P. L.; MELLO, E. R. Ziglar - utilização de redes sem fio Zigbee para acessibilidade
aos portadores de deficiência física. Centro Universitário para o Desenvolvimento do Alto
Vale do Itajaí, 2012. Acesso em: 08 fev. 2019. Disponível em: <http://www.uniedu.sed.
sc.gov.br/wp-content/uploads/2013/10/Paulo-Luis-Steinhauser.pdf>.
TURAN, M. A. T.; ERZIN, E. Source and filter estimation for throat-microphone speech
enhancement. IEEE/ACM Transactions on Audio, Speech, and Language Processing, v. 24,
n. 2, p. 265–275, Feb 2016.
WORLD HEALTH ORGANIZATION (WHO). Disability and health. [S. l.], 16 jan. 2018. Acesso
em: 12 fev. 2019. Disponível em: <https://www.who.int/news-room/fact-sheets/ detail/
disability-and-health>.
WORLD HEALTH ORGANIZATION (WHO). WHO QualityRights tool kit to assess and
improve quality and human rights in mental health and social care facilities. Geneva:
WHO, 2012.
ZHANG, Z.-L.; LUO, X.-G.; GARCÍA, S.; HERRERA, F. Cost-sensitive back-propagation
neural networks with binarization techniques in addressing multi-class problems and non-
competent classifiers. Applied Soft Computing, v. 56, p. 357–367, 2017.
93
7
RECONHECIMENTO DE EMOÇÕES HUMANAS EM
DADOS MULTIMÍDIA
Eanes Torres Pereira
Universidade Federal de Campina Grande - UFCG
Luciana Ribeiro Veloso
Universidade Federal de Campina Grande - UFCG
Sinara de Oliveira Branco
Universidade Federal de Campina Grande - UFCG
1. INTRODUÇÃO
Muito se fala sobre emoções humanas nas últimas décadas. Um dos
principais responsáveis pela divulgação do tema “emoções” foi Daniel Gole-
man por meio da publicação de seu livro Inteligência Emocional. No entanto, o
tema não é novo na Psicologia e muito menos na Filosofia. Na Filosofia oci-
dental, as discussões sobre emoções remontam a Aristóteles (384 - 322 A.C.),
que define emoção como algo que é seguido de prazer e dor e que leva a
condição do indivíduo a se tornar tão transformada que seu julgamento é
afetado (ARISTÓTELES, 1998). Aristóteles cita como exemplos de emoções:
raiva, medo, piedade e seus opostos.
Provavelmente, o primeiro estudioso de psicologia a questionar “O que é
uma emoção?” foi William James em um ensaio de título Mente publicado em
1884. James enfatizou o aspecto fisiológico da emoção, argumentando que uma
emoção é uma sensação ou conjunto de sensações causados por um distúrbio
fisiológico. Porém, essa pergunta continua sem uma resposta bem definida. Al-
guns filósofos argumentaram que as emoções são algo bestial, inferior à razão
e, por isso, mais primitivo. Seria, por esse motivo, considerado que pessoas que
se deixam levar por emoções seriam inferiores, segundo esses filósofos. O fato
de alguns filósofos considerarem que a razão poderia, na maioria das vezes, ser
95
Tecnologias e ciências da linguagem
tomada pela emoção levou David Hume (1739 - 1888) a afirmar que “a razão é,
e deveria ser, a escrava das paixões” (SOLOMON, 2008, p. 3-16).
De acordo com Solomon (2008), durante a idade média, o estudo das
emoções estava associado com a ética e era um ponto central na psicologia
cristã. Essa associação das emoções com a ética cristã pode estar relacionada
a uma necessidade de associar fatores considerados primitivos e não racionais
a atitudes e ações consideradas irracionais.
Por volta do fim da década de 1990 e início do ano 2000, a Comissão
Europeia financiou uma série de projetos sobre emoções e computação lide-
rados por John Taylor e Stefanos Kollias. Essa série de projetos culminou na
publicação do livro Emotion-oriented Systems, que pode ser considerado um
manual para o estudo das emoções da perspectiva de Ciência da Computa-
ção. O livro trata desde teorias e modelos emocionais, passando por bases
de dados até situações em que as emoções são importantes como interação,
cognição, persuasão e comunicação.
De modo geral, algumas perguntas básicas que devem ser analisadas no
estudo de emoções são:
- O que são emoções?
- Como as emoções surgem?
- O que provoca as emoções?
- As emoções são conscientes ou inconscientes?
- Como as emoções afetam o raciocínio?
- É possível provocar/estimular emoções em seres humanos?
- É possível simular emoções artificialmente?
Dentre as teorias mais aceitas para explicar o que são as emoções des-
tacam-se aquelas que explicam as emoções como sendo reações fisiológicas,
de origem mental, relacionadas a algum fator consciente ou não que ponha
em risco a sobrevivência ou o bem-estar do indivíduo. Segundo as teorias
de apreciação (appraisal), toda emoção é sobre algo, mesmo que o indivíduo
não se dê conta, a princípio, de que algo é esse (SOLOMON, 2008). As emo-
ções podem ser provocadas por elementos que tragam à mente lembranças
de situações que envolvem fatores emocionais. Tais como o perfume de uma
pessoa querida numa situação afetuosa, o sabor de uma comida que a mãe
fazia na infância, uma música ou melodia que se ouvia quando estava triste
etc. No entanto, as lembranças emocionais podem se manifestar no corpo e
não necessariamente a pessoa vai saber exatamente por que ela manifesta
tremor ou sudorese em determinadas situações, por exemplo.
Um marco histórico no estudo das emoções ocorreu com um prêmio
Nobel em 2002 na área de Ciências Econômicas sendo concedido a Daniel
96
Capítulo 7 – Reconhecimento de emoções humanas em dados multimídia
Prize motivation: “for having integrated insights from psychological research into
economic science, especially concerning human judgment and decision-making un-
der uncertainty.”
1
Disponível em: https://www.nobelprize.org/prizes/economic-sciences/2002/kahneman/facts.
Acessado em 21 de novembro de 2018.
97
Tecnologias e ciências da linguagem
2. RECONHECIMENTO DE EMOÇÕES
As emoções humanas desempenham papel importantíssimo nos relaciona-
mentos sociais e nos processos de tomada de decisão (KAHNEMAN, 2011). Além
disso, uma grande variedade de funções cognitivas, como a aprendizagem e a
percepção, é influenciada pelas emoções (PICARD, 2000). Durante muito tempo
a ciência da computação buscou desenvolver algoritmos inteligentes levando em
consideração apenas fatores racionais ou lógico-matemáticos. No entanto, Picard
(2000) afirma que alguns cientistas defendem a ideia de que um sistema com
recursos finitos que esteja operando em ambiente com situações imprevisíveis
necessitará de emoções para agir de modo flexível, inteligente e eficiente.
Em seu livro, Picard (2000) popularizou o que ficou conhecido como
Computação Afetiva, ou seja, a computação relacionada a, que surge de, ou
deliberadamente influencia as emoções. Segundo Picard (2000), os três gran-
des questionamentos com os quais a computação afetiva se preocupa são:
• Como as emoções podem ser geradas em computadores?
• Como as emoções podem ser reconhecidas por computadores?
• Como as emoções podem ser expressas por computadores?
Este capítulo está inserido no contexto do segundo questionamento. Por-
tanto, o problema abordado é o reconhecimento multimodal (usando texto,
áudio, sinais de EEG, imagens e vídeos) de emoções humanas e a classificação
de múltiplas mídias quanto ao seu potencial de evocação emocional. Neste
capítulo, o termo multimodal refere-se à utilização de diversos meios de aqui-
sição ou representação de informação, tais como: imagens, áudios, vídeos e
sinais de eletroencefalografia (EEG).
98
Capítulo 7 – Reconhecimento de emoções humanas em dados multimídia
Modelos Categóricos
Os modelos categóricos têm como objetivo estabelecer categorias finitas
e discretas de estados emocionais. Dentre os modelos categóricos, destaca-se
o que foi popularizado por Ekman (1998) e que foi utilizado para classificar
expressões faciais de acordo com as possíveis emoções vivenciadas pela pes-
soa que as expressa. Um fator importante na teoria de Ekman (1998) é que
as expressões faciais relacionadas com as emoções básicas seriam universais,
isto é, independentes de aprendizado cultural. Neste contexto, Ekman (1999)
considera como básicas aquelas emoções que poderiam ter evoluído para ex-
pressar, por meio de combinações entre elas, emoções mais complexas. Por
exemplo, presunção poderia ser considerada uma mistura de emoções bá-
sicas, como alegria e desprezo. Para comprovar sua teoria, Ekman visitou
algumas populações afastadas da influência cultural moderna, tais como ha-
bitantes de Papua Nova Guiné. Na versão original de sua teoria, as emoções
básicas seriam: raiva, aversão, medo, alegria, tristeza, surpresa.
No entanto, devemos enfatizar dois fatores: 1) expressões faciais não re-
presentam as emoções propriamente ditas, mas sim uma possível expressão
das emoções; 2) Ekman não foi o primeiro pesquisador a estudar as expres-
sões faciais e muito menos as emoções. Um dos primeiros pesquisadores a
estudar as expressões faciais foi o neurologista francês Guillaume Duchenne,
que realizou pesquisas sobre a anatomia das expressões faciais por meio de
99
Tecnologias e ciências da linguagem
Figura 1. Expressões faciais ativadas por estimulação elétrica. Fig. 4, p. 277 do livro from Mécanisme de la
Physionomie Humaine de Guillaume Duchenne, 1862. Esta imagem é de domínio público.
Modelo Circumplexo
Não demorou muito para que alguns pesquisadores afirmassem que não
é possível categorizar todo o espectro emocional humano utilizando apenas al-
100
Capítulo 7 – Reconhecimento de emoções humanas em dados multimídia
3. RECONHECIMENTO DE PADRÕES
A maioria das abordagens computacionais utilizadas para reconhecer
ou classificar emoções em dados multimídia utilizam técnicas de reconhe-
cimento de padrões. Desta forma, faz-se necessário uma breve introdução
sobre esse tema. De modo geral, os sistemas tradicionais de reconhecimento
de padrões possuem as seguintes etapas:
1. Coleta da base de dados (Corpus);
2. Limpeza ou tratamento da qualidade dos dados;
3. Extração de características;
4. Treinamento de classificadores;
5. Avaliação de classificadores.
A coleta da base de dados pode ser específica para o problema que se
deseja tratar, ou obtida de outras bases. Por exemplo, se o objetivo é classificar
textos jurídicos de um determinado país, provavelmente, será necessário cole-
tar dados para aquela área jurídica específica daquele país. Mas se o objetivo
é obter uma base sobre comentários feitos sobre filmes que estão em cartaz
no cinema, pode-se percorrer blogs ou sites sobre o assunto coletando textos
sobre os filmes.
A etapa de limpeza e tratamento da qualidade de dados é dependente
do contexto da aplicação. Por exemplo, em muitas abordagens de classificação
de sentimento não são utilizadas as preposições e conjunções. Na maioria das
vezes, se utilizam apenas substantivos e adjetivos. Além disso, como muitas
das bases de dados são obtidas da Web e muitos textos são escritos utilizando
abreviações típicas da escrita online, essas palavras abreviadas precisam ser
removidas ou substituídas pelas palavras correspondentes sem abreviação.
101
Tecnologias e ciências da linguagem
102
Capítulo 7 – Reconhecimento de emoções humanas em dados multimídia
2
Emotiv. Disponível em http://emotiv.com . Acessado em 02 de maio de 2015.
103
Tecnologias e ciências da linguagem
relações humanas. Muitas vezes o paciente não sabe exatamente o que está
sentindo ou vivenciando e, se o sabe, às vezes não é capaz de expressar ade-
quadamente sua situação. Por outro lado, alguns profissionais da área de saúde
vivenciam experiências extenuantes de trabalho, o que pode interferir negati-
vamente na precisão do diagnóstico. Desta forma, uma abordagem tecnológica
utilizando um exame como EEG poderia agregar maior precisão ao diagnóstico
de doenças mentais que envolvem, por exemplo, distúrbios emocionais.
104
Capítulo 7 – Reconhecimento de emoções humanas em dados multimídia
3
Spectrogram. Disponível em https://musiclab.chromeexperiments.com/Spectrogram/. Acessado
em 13 de dezembro de 2018.
105
Tecnologias e ciências da linguagem
106
Capítulo 7 – Reconhecimento de emoções humanas em dados multimídia
6. PROCESSAMENTO DE TEXTO
Nesta seção, são apresentados os conceitos fundamentais sobre reconhe-
cimento de padrões em texto bem como aplicações em reconhecimento de
emoções.
107
Tecnologias e ciências da linguagem
108
Capítulo 7 – Reconhecimento de emoções humanas em dados multimídia
109
Tecnologias e ciências da linguagem
110
Capítulo 7 – Reconhecimento de emoções humanas em dados multimídia
111
Tecnologias e ciências da linguagem
8. CONCLUSÃO
Como pode ser observado, nos dados e aplicações aqui apresentados, a
tendência é que haja cada vez mais interação entre o ser humano, suas emo-
ções, linguagens e máquinas. O desenvolvimento tecnológico destacado neste
capítulo inclui o uso da linguagem natural, ou seja, a aplicação da linguagem
humana em pesquisa na área de inteligência computacional. Com frequência
cada vez maior, computadores são programados para responder a comandos
do usuário, muitas vezes em sua própria língua (OTHERO; MENUZZI, 2005).
O trabalho inclui profissionais de diversas áreas, dentre elas: Ciência da Com-
putação, Linguística, Psicologia e Neurociências.
O trabalho com a linguagem humana – seja ela oral ou escrita – gera a
tendência à humanização do computador, ou à Interação Humano-Computa-
dor (Human Computer Interaction), que busca implementar sistemas computa-
cionais a partir da avaliação e desenvolvimento de projetos em tais sistemas,
agrupando pesquisadores de diferentes áreas do conhecimento, sendo um
território das interfaces por excelência (CARVALHO, 2000). Para que mais
pesquisa e desenvolvimento linguístico-tecnológico surjam, interligando a
computação a áreas diversas como aqui apresentadas (saúde, linguística, psi-
cologia etc) é necessário que a máquina “aprenda” a se comunicar com o ser
humano, seu usuário, de forma fluente. Para tanto, é fundamental o avanço
no estudo sobre o funcionamento das línguas naturais para além da sintaxe,
que é o nível estrutural das línguas.
Uzskoreit (sd, p. 02) argumenta que embora “os sistemas existentes em
tecnologias linguísticas estejam longe de alcançar a habilidade humana, eles
têm diversas aplicações possíveis”, como demonstrado neste capítulo. O que
se pretende é criar softwares capazes de desenvolver mais conhecimento da
linguagem humana, pois tais conhecimentos facilitarão a comunicação hu-
mano-máquina. O que se espera é que uma máquina seja um dia capaz de
dominar, além da sintaxe, o sistema fonológico, nuances semânticas e o uso
pragmático das línguas naturais. Isso é um grande desafio, mas os resultados
comprovam que não há limites para as conquistas em pesquisa.
112
Capítulo 7 – Reconhecimento de emoções humanas em dados multimídia
REFERÊNCIAS
ARISTÓTELES. Retórica. Trad. Manuel Júnior, Paulo Alberto e Abel Pena. Lisboa: INCM, 1998.
CARVALHO, P. S. de. Interação entre humanos e computadores – uma introdução. São Paulo:
EDUC, 2000.
CHOWDHURY, P.; KIBRIA SHAKIN, S. S.; KARIM, M. R.; RHAMAN, M. K. Cognitive efficiency
in robot control by Emotiv EPOC. International Conference on Informatics, Electronics &
Vision. Dhaka: IEEE, 2014, p. 1-6.
EBRAHIMI KAHOU, S.; MICHALSKI, V.; KONDA, K.; MEMISEVIC, R.; PAL, C. Recurrent neural
networks for emotion recognition in video. In Proceedings on International Conference on
Multimodal Interaction. Seattle: ACM, 2015, p. 467-474.
EKMAN, P. Basic Emotions. In: DALGLEISH, T; POWER, M. (orgs) Handbook of Cognition and
Emotion. Sussex: John Wiley & Sons, 1999.
EKMAN. P. What the Face Reveals. Oxford: Oxford University Press, 1998.
GUILLAUME, D. Mécanisme de la Physionomie Humaine. Paris: Librairie J.-B Baillière et Fils,
1862.
JAIN, N.; KUMAR, S.; KUMAR, A.; SHAMSOLMOALI, P.; ZAREAPOOR, M. Hybrid deep neural
networks for face emotion recognition. Pattern Recognition Letters, v.115, p. 101-106, 2018.
JAKOBSON, R. On linguistic aspects of translation. In: VENUTI, L. (org) The translation studies
reader. London: Routledge, 2000.
KAHNEMAN, D. Rápido e Devagar: Duas Formas de Pensar Trad. Cássio Arantes de Leite. Rio
de Janeiro: Objetiva, 2011.
KHUSHABA, R. N.; WISE, C.; KODAGODA, S.; LOUVIERE, J.; KAHN, B. E.; TOWNSEND,
C. Consumer neuroscience: Assessing the brain response to marketing stimuli using
electroencephagram (EEG) and eye tracking. Expert Systems with Applications. Elsevier,
2013, p. 3803-3812.
KOELSTRA, S.; MUHL, C.; SOLEYMANI, M.; DEAP: A database for emotion analysis using
physiological signals. IEEE Transactions on Affective Computing. v. 3, n. 1. 2012, p. 18-31.
MCMAHAN, T.; PARBERRY, I.; PARSONS, T. D. Modality specific assessment of videogame
player's experience using the Emotiv. Entertainment Computing. Elsevier, 2015. p. 1-6.
OLOHAN, M. Introducing corpora in translation studies. Oxford: Routledge, 2004.
OOSTERWIJK, S.; LINDQUIST, K. A.; ANDERSON, E.; DAUTOFF, R.; MORIGUCHI, Y.; LISA, F.
B. States of mind: Emotions, body feelings, and thoughts share distributed neural networks.
Editora Neuroimage, 2012. p. 2110-2128.
OTHERO, G. de A.; MENUZZI, S. de M. Linguística Computacional: teoria e prática. São Paulo:
Parábola, 2005.
PETRANTONAKIS, P. C.; HADJILEONTIADIS, L. J. Emotion recognition from EEG using higher
order crossings. IEEE Transactions on Information Technology in Biomedicine. Volume 14,
Número 2, 2010, p. 186-197.
PICARD, R. W.; Affective Computing. Massachusetts: The MIT Press, 2000.
POMER-ESCHER, A. G.; PINHEIRO DE SOUZA, M. D.; BASTOS FILHO, T.F. Methodology
for analysis of stress level based on asymmetry patterns of alpha rhytms in EEG signals.
Biosignals and Biorobotics Conference. Salvador: IEEE, 2014, p. 1-5.
RODRÍGUEZ, A.; REY, B.; CLEMENTE, M.; WRZESIEN, M.; ALCAÑIZ, M. Assessing brain
activations associated with emotional regulation during virtual reality mood induction
procedures. Expert Systems with Applications, v. 42, n. 3, 2015, p. 1699-1709.
Russell J. A. A circumplex model of affect. Journal of Personality and Social Psychology.
American Psychological Association, 1980. p. 1161–1178.
113
Tecnologias e ciências da linguagem
114
SOBRE OS AUTORES
Annie Lezan Bittencourt de Moura é diretora pedagógica das unidades CNA In-
glês Definitivo em Recife & Olinda e tem 34 anos de experiência na área de ensino
de idiomas, com ênfase em Formação de Professores. É graduada em Letras com
Licenciatura em Inglês e Português. Tem Mestrado em Ciências da Linguagem pela
Universidade Católica de Pernambuco – UNICAP (2007), MBA internacional pelo Ins-
tituto Português de Administração de Marketing – IPAM (2003) e especialização em
Coordenação Pedagógica pela Faculdade Santa Fé (2009). Foi premiada duas vezes
nacionalmente na apresentação de trabalhos pedagógicos para professores, com o
título Mário Utimati Award pela rede Yázigi Internexus. Em 2019, foi escolhida para re-
ceber o Prêmio Tacaruna mulher destaque em educação no estado de Pernambuco. É
Professional Coach, licenciada pela Academia Brasileira de Coaching e pelo Behavioral
Coaching Institute. Atualmente ministra as disciplinas de Mobile Learning e de Prática
115
Tecnologias e ciências da linguagem
116
Sobre os autores
117
Tecnologias e ciências da linguagem
118
Sobre os autores
119
Este ebook foi composta em Palatino LT Std 10,5/14
pela PÁ DE PALAVRA em dezembro de 2019.
Este livro reúne capítulos de pesquisadores de universidades brasileiras
sobre a aplicação das Tecnologias da Informação e da Comunicação
(TIC) em ciências da linguagem. De caráter interdisciplinar, os trabalhos
apresentados são de profissionais das áreas da Ciência da Computação,
Engenharia, Fonoaudiologia, Letras, Linguística e Psicologia. A variedade
das aplicações das TIC contempladas na obra inclui o desenvolvimento de
aplicativos destinados à intervenção de escolares com dislexia, o uso da
realidade aumentada no ensino do inglês, categorização de documentos,
redes complexas na mineração de dados textuais não estruturados, chatbots
e suas aplicações em ciências da linguagem, reconhecimento de voz
como instrumento de interface para equipamentos eletroeletrônicos para
portadores de deficiência físico-motora e reconhecimento de emoções em
dados multimídia. É um convite ao leitor que deseja ampliar conhecimentos
sobre aplicabilidade das TIC no âmbito da linguagem.