TESAURO Linguagem de Representação Da Memória Documentária PDF
TESAURO Linguagem de Representação Da Memória Documentária PDF
TESAURO Linguagem de Representação Da Memória Documentária PDF
TESAURO
linguagem de representação da memória documentária
RIO DE JANEIRO
2001
Ao Mestre
MANOEL ADOLPHO WANDERLEY
SUMÁRIO
2 Representação e meta-representação, p.
3 Língua e linguagem, p.
6 A propósito, p.
Referências bibliográficas, p.
1 Em defesa das linguagens documentárias
Nesse sentido, o papel do bibliotecário era, fundamentalmente, o de guardião dos bens do-
cumentais, embora já existisse a consciência da sua função de intermediação entre a neces-
sidade de informação do usuário e a efetiva disponibilização desta pela biblioteca.
A formação profissional do bibliotecário era, assim, centrada em dois eixos princi-
pais. O primeiro, indicava a forte presença dos conteúdos de cultura geral, tais como o do-
mínio de idiomas, a Filosofia e a História, na tentativa de assegurar que a intermediação se
procedesse com bom índice de sucesso. O conhecimento profundo do acervo fazia do bi-
bliotecário o próprio instrumento de interação entre documento e usuário. O segundo eixo,
das técnicas de organização do acervo, era representado por um conjunto de normas, tais
como os códigos de catalogação e as tabelas de classificação. Nesse caso, o papel do bi-
tradicional contendo cerca de cem mil volumes, dispostos fisicamente por data de registro
no acervo, e sem qualquer instrumento de busca representativo do conteúdo, como índices
ou catálogos, quanto tempo um usuário levaria para localizar as informações necessárias?
Seria necessário percorrer milhões de páginas para selecionar aquelas que satisfizessem a
sua necessidade de informação. Transportando o exemplo para uma biblioteca virtual, onde
esses mesmos textos sofreram um processo de infografia 6, a questão do acesso ainda per-
6
do “Livro Universal”, organizado por áreas particulares do conhecimento, nunca foi con-
cretizado e embora o objetivo de Otlet não tenha sido alcançado nesse sentido, as suas idéi-
as foram extremamente úteis no que se refere à análise e síntese dos conteúdos informati-
vos. O princípio da indexação da informação e da construção de resumos para facilitar a
recuperação da informação contou com as regras de análise documentária criadas para a
organização do “Biblion” ou Livro Universal, ou seja, a literatura deve ser analisada, iso-
lando-se quatro categorias gerais: fatos - interpretação dos fatos - estatísticas - fontes.
Além disso, outra contribuição importante ao acesso às fontes bibliográfi-
cas foi o desenvolvimento das normas técnicas para a descrição da forma e do conteúdo
bibliográfico. Inegavelmente, Otlet e sua equipe nos legaram as bases do que chamamos
hoje de redes de informação, que funcionam interligando as representações do conhecimen-
to em todos os campos do saber, para todos os tipos de objetos e relatos, ainda necessitando
urgentemente de normalização. Essa normalização diz respeito aos formatos de apresenta-
ção da informação, aos protocolos de acesso às bases de dados, enfim, a uma nova lingua-
gem que de documentária passa a cibernética e que, em alguns casos, se aproxima da lin-
guagem pictórica, dos hieróglifos.
Se considerarmos as possibilidades de localização da informação desejada na Web,
tal como sintetiza SAÀDANI13, vemos que as melhores chances de obtê-la são aquelas que
utilizam operadores matemáticos na combinação e a restrição de conceitos representativos
da pergunta para a qual se deseja uma resposta. Não uma resposta objetiva, mas a indicação
de fontes de informação moduladas isto é, de uma cadeia de complexidade que parte dos
sites até se chegar ao texto primário. Vale lembrar que, neste momento, temos a possibili-
dade de encontrar ou não o texto primário digitalizado.
Caso já pudéssemos utilizar os operadores lingüísticos ainda em estudo, tais como
os sintagmas nominais discutidos por Brito14, a pergunta feita em lingua natural não preci-
saria ser decomposta em conceitos organizados por operadores matemáticos. Na prática, no
tudo, afirmar que ambos os sistemas se complementam e continuarão a coexistir por longo
tempo.
Enquanto aguardamos os resultados dos estudos nos campos da Lingüística e das
Ciências Cognitivas, a utilização das linguagens documentárias nos parece, ainda, indis-
pensável para a organização e o acesso ao conhecimento público.
NOTAS E CITAÇÕES
1
O primeiro Curso de Biblioteconomia no Brasil foi criado pelo Decreto n. 8.835, de 11/07/1911. Iniciou em
abril de 1915 na Biblioteca Nacional do Rio de Janeiro, tendo como diretor Manuel Cícero Peregrino Silva.
O programa deste curso pioneiro se inspirava no modelo francês (École de Chartes), dando ênfase ao aspec-
to cultural e informativo. Em 1929, o "Mackenzie College", hoje Universidade Mackenzie, de São Paulo,
criou um Curso de Biblioteconomia, inspirado no modelo norte-americano, que enfatizava os aspectos téc-
nicos da profissão. Cf. http://www.ced.ufsc.br/bibliote/encontro/bibli7/eb7art2.html
2
Sobre a impacto desta questão na Biblioteconomia Cf. DODEBEI, V.L., MENDONÇA DE SOUZA, Alfre-
do. Ciência da Informação: formação e interdisciplinaridade. Rio de Janeiro: IBICT/CNPQ/ ECO/USP,
1992.
3
Coyaud define (tradução livre) Análise Documentária como toda operação efetuada sobre o documento
bruto, a fim de torná-lo utilizável (i.e. “recuperável”) para a pesquisa documentária. Cf. COYAUD, Mauri-
ce. Analyse et recherche documentaire. In: __________. Linguistic et documentation: les articulations lo-
giques du discours. Paris: Larousse, 1972. p130
4
O conceito de análise de conteúdo apresentado pela autora diz respeito ao conjunto de técnicas destinadas
a ressaltar do conteúdo de diversas categorias de documentos escritos, certos elementos singulares de onde
se inferem características psico-sociológicas do objeto analisado. Cf. CUNHA, Isabel M. R. Ferin. Análise
documentária : parâmetros teóricos. In: ANÁLISE documentária: a análise da síntese. São Paulo: USP,
1986. p. 42.
5
Estudos fundamentados na Inteligência Artificial, na Sintaxe e em menor escala na Semântica. Cf. COU-
LON, Daniel. Informática e linguagem natural: uma visão geral dos métodos de interpretação de textos
escritos. Brasília, IBICT; Rio de Janeiro, SENAI, 1992.
6
O conceito de infografia para o autor é o de digitalização computadorizada. VIRILIO, Paul. A máquina de
visão. Rio de Janeiro: José Olympio, 1994. p. 9
7
VICKERY, B. C. Knowledge representation: a brief review. Journal of Documentation, 42, n. 3, p. 145-
159, Sept. 1982.
8
A esse respeito consultar um novo campo de especialização denominado Arquitetura da Informação. Em
Matthew Cutler: O que é exatamente arquitetura de informação? Para os webmasters, é a organização cons-
ciente de grandes volumes de informação, de forma que os usuários possam navegar de forma fácil e efici-
ente em seus site - função semelhante ao design... A criação de uma estrutura de informação sólida deveria
fazer parte da estratégia de Internet desde o início. O fio condutor deveria ser a criação da noção de hierar-
quia, um conceito de localização de cada item em termos de importância e sua relação com o todo. O objeti-
10
vo é oferecer informação suficiente para os visitantes decidirem facilmente onde ir, mas não a ponto de fica-
rem sobrecarregados de dados e confusos, ou de serem levados para onde não querem ir. Cf.
http://www.uol.com.br/webworld/tecnologia/arquitet2.htm
9
WANDERLEY, Manoel Adolfo. Linguagem documentária: acesso à informação. Rio de Janeiro, Ci. Inf.,
v. 2, n. 2 , p. 175-217, 1973. p. 180
10
RAYWARD, W. Boyd. Visions of Xanadu: Paul Otlet (1868-1944) and hypertext. Journal of the Ameri-
can Society for Information Science, v. 45, n. 4, p. 235-250, 1994.
11 BRADFORD, S. C. The documentary chaos. In: ____. Documentation. London: Crosby Lockwood & Son,
1953. cap. IX.
12
ECO, Umberto. A estrutura ausente: introducão à pesquisa semiológica. São Paulo: Perspectiva, 1991. p.
90, 91.
13
SAÀDANI, Lalthoum; BERTRAND-GASTALDY, Suzanne. La représentation dans Internet des comnais-
sances dún domaine. Documentation et bibliothèques, jan./mars, p. 27 – 42, 2000.
14
BRITO, Marcílio de. Sistemas de informação em linguagem natural: em busca de uma indexação automáti-
ca. Ci. Inf., Brasília, v. 21, n. 3, p. 223-232, set./dez., 1992.
2 Representação e meta-representação
que não se referem diretamente aos objetos buscados, são desprezadas ou abandonadas, em
função da maior inteligibilidade ou facilidade de compreensão. De fato, não teria sentido
substituir a realidade (aparentemente complexa) por modelos ainda mais complexos.
Como observam Haggett e Chorley3, os modelos são “aproximações altamente sub-
jetivas, no sentido de não incluírem todas as observações e mensurações associadas, mas,
como tais, são valiosos por ocultarem detalhes secundários e permitir o aparecimento dos
12
relações, podendo ser definido como um conjunto de elementos em interação, que realizam
determinadas funções para determinados propósitos.
Sistemas suportam processos, e mesmo que se faça distinção entre sistemas naturais
e aqueles feitos pelo homem, na verdade, estes últimos sempre apresentam algo dos primei-
ros. Um processo, por sua vez, é uma seqüência de eventos, sob controle, para a obtenção
de resultados específicos, sendo um fenômeno dependente do tempo. Fundamentalmente,
envolve troca, transformação, transmissão de energia, matéria, informação. A distinção
fundamental entre sistema e processo é que este último é o aspecto dinâmico do primeiro.
Todo sistema inclui um processo, e, como sistemas não existem no vácuo, interagem com
seu meio ambiente, podendo ser difícil estabelecer-se os limites entre ambos. São os pro-
pósitos ou objetivos que, além de estabelecerem as razões de existência do sistema, descre-
vem-lhe os limites com o meio ambiente, sendo óbvio que este também está sujeito a mu-
danças. A adaptação de um sistema ao meio ambiente, em geral, é crucial, e depende inte-
gralmente da retro-alimentação.
Ainda de acordo com Marcondes e Sayão, o fato de a ciência moderna ser caracteri-
zada por um alto grau de especialização, um alto grau de compartimentação, de fragmenta-
15
ção dos papéis e responsabilidades dos cientistas, engendra, entre outras coisas, uma neces-
sidade vital de estruturas técnicas e de técnicas complexas para cada disciplina. Dessa for-
ma, “os físicos, os biólogos, os psicólogos e os cientistas sociais estão encapsulados em
seus universos particulares. É difícil estabelecer um diálogo entre um casulo e outro”. Essa
fragmentação se contrapõe a um outro aspecto interessante, que possivelmente foi o fato
determinante no processo de concepção da teoria geral dos sistemas por Bertalanffy. “Fa-
zendo um levantamento na evolução da ciência moderna, nos deparamos com um fenôme-
no surpreendente. De forma independente, problemas e concepções similares foram traba-
lhados e desenvolvidos em áreas completamente diferentes”. Dessa forma, existem mode-
los, princípios e leis que se aplicam a sistemas generalizados ou suas subclasses, não im-
portando sua área, a natureza de seus elementos componentes, nem a relação ouforças
entre eles. Parece então legítimo aspirar a uma teoria de princípios universais passível de
ser aplicada aos sistemas em geral. É nesse sentido que Bertalanffy postula uma nova dis-
ciplina nomeada Teoria Geral dos Sistemas, cujo objetivo e formulação derivarão de prin-
cípios válidos para sistemas em geral.
“A conseqüência de se aceitar a existência de propriedades gerais dos sistemas é o
aparecimento de similaridades estruturais, ou seja, isomorfismo entre diferentes áreas. E-
xiste uma correspondência nos princípios que governam o comportamento de entidades
intrinsecamente distintas”. Um exemplo simples é a lei do crescimento exponencial, que se
aplica ao crescimento de bactérias, animais ou humanos, ao mesmo tempo que ao cresci-
mento da pesquisa científica, medido pelo número de publicações”. A partir destas propo-
sições, Bertalanffy conclui que esta correspondência é proporcionada pelo fato de que as
entidades envolvidas podem ser consideradas como sistemas, isto é, um complexo de ele-
mentos em interação. Isto faz com que estes fenômenos, embora tendo srcens distintas,
estejam subjugados a um princípio geral comum. De fato, “são muitos os exemplos de
princípios idênticos que são descobertos várias vezes, pois os pesquisadores de um campo
dução, registro e assimilação. Esse subconjunto, que existe independentemente das etapas
inferiores, permite a análise das ações decorrentes da geração de novos conhecimentos dis-
seminados de modo informal ou formalizados em registros materias (incluídos os eletrôni-
cos), em redes eventuais ou organizadas sistematicamente. Seu campo de estudo, interdis-
ciplinar, reúne principalmente os fundamentos da psico-cognição, da comunicação, da so-
ciologia de redes de informação, da economia e mercadologia.
19
Produção de conhecimentos
Com a mudança do paradigma da ciência, que deixa de se pautar pela verticalidade (es-
pecialização), se conduzindo mais no sentido da horizontalidade das abordagens transdis-
ciplinares, as informações produzidas pela sociedade dificilmente podem ser
antecipadamente organizadas por campos de interesse, em categorias fixas e imutáveis.
Essas informações são disponibilizadas por vários segmentos da sociedade e é no momento
da procura ou busca que as interseções de significado vão ocorrer. Isto é, priori,
a não se
pode afirmar que um texto de medicina possa somente interessar aos médicos, assim como
uma foto da clonagem de ovelhas ser útil apenas aos geneticistas. Aliados ao fator de
gênero, os atributos de qualidade (valor intrínseco), quantidade e conveniência da
informação produzida na atualidade devem ser considerados nesse universo dependente
dos produtos (informação), o qual se configura no que chamamos de sociedade da
informação.
Registro
dade de sua obsolescência. Como cita Virilio13, ao lado das dimensões espaço e tempo,
existe hoje uma outra dimensão, que é a luz. Não a luz no sentido puro da claridade, da
visão, do entendimento, mas a luz em sua versão de trajeto. Para Virilio, o que nos move
hoje no sentido das representações sociais não é mais o espaço e o tempo, mas o movimen-
to, o trajeto, invertendo assim o conceito de velocidade da luz para a luz da velocidade. É o
tempo real que importa. Não é mais uma questão de localização absoluta, mas de percep-
ção relativa, a qual Virilio nomeia de energia cinemática da relatividade. Quanto mais ve-
loz a apresentação dos produtos à sociedade, mais rápido estes ficam obsoletos. O senti-
mento predominante da sociedade atual pode ser caracterizado pela ansiedade de informa-
ção. Ansiedade no sentido de saber que existe uma informação relevante e não conseguir
acessá-la em tempo hábil, ou de produzir uma informação importante e não conseguir dis-
ponibilizá-la. Qual informação e quanto dela é assimilada, é uma questão complexa, men-
surável apenas indiretamente pela quantidade e qualidade dos novos conhecimentos produ-
zidos.
O segundo subconjunto, representado pela parte inferior do círculo, ao contrário do
primeiro, não tem existência independente. As seis etapas completas são necessárias ao
ciclo de vida da informação, embora só o subconjunto representado pela seleção, represen-
tação e disseminação se configurará emmemória documentária. O campo de estudo da
memória documentária e seus fundamentos mais específicos são a teoria da classificação, a
teoria do conceito e as teorias da comunicação, que são denominadas, no seu conjunto,
teorias da organização do conhecimento e, especificamente, teoria da memória documentá-
ria.
Segundo Wanderley14, toda coleção documentária pode ser representada por um
quadro de entrada dupla chamado usualmentematriz documentária, em que se atribui cada
linha a um documento e cada coluna a uma das múltiplas características a partir das quais
serão ulteriormente procurados os documentos. Com base nessa representação simbólica,
Para uma eficaz memória seletiva é possível levar-se a segmentação da matriz até
aos elementos, linhas ou colunas tomadas isoladamente, a cada uma das quais se atribuirá
mação e, ainda, à dificuldade imposta pela própria natureza da língua natural, na qual se
apresentam tanto os documentos como os pedidos de busca de um documento na coleção.
Tanto pelo aspecto quantitativo, isto é, o número de atributos escolhidos, como pelo quali-
tativo - possibilidades de interpretações semânticas - , a memória documentária ainda se
caracteriza como memória virtual de acesso ao documento primário. Ela não oferece a
garantia do acesso, apenas a possibilidade.
Montgomery15 descreve a estrutura da memória documentária em um modelo de
concepção sistêmica, denominado Sistema de Recuperação da Informação (SRI), no qual
os dados de entrada são, ao mesmo tempo, as representações das demandas de informação
pelo público e as representações do acervo ou coleção. O sistema processa essas represen-
tações, comparando-as e devolvendo-as sob a forma de novas representações direcionadas
a cada demanda. A retroalimentação é garantida pelas novas produções de conhecimento
que serão selecionadas para o ingresso no sistema de informação. Esse processo, denomi-
nado de Recuperação da Informação, pode ser considerado como um filtro, pelo qual só
transitam as informações demandadas, embora nem sempre essas se configurem como as
mais necessárias.
O modelo abaixo toma por base as simplificações apresentadas por Montgomery,
que já demonstrava a intenção de salientar a importância das representações documentárias
no sucesso do “casamento” entre público e acervo.
24
A análise do modelo SRI nos conduz às etapas inscritas na parte inferior do círculo, já
configurada como memória documentária.
Seleção
A primeira etapa do subconjunto da memória documentária e terceira etapa do ciclo da
informação é identificada pelos processos de seleção e aquisição que não são processos ao
acaso, ao contrário, devem ser planejados em função das características da instituição que
mantém acervos documentais. Ambos valem-se do princípio da economia. Quer dizer, fun-
cionam como filtros da sociedade da informação, a fim de favorecer o equilíbrio entre as
necessidades de informação do público usuário e a oferta da sociedade. Segundo Mc Gar-
ry16, “necessidade” é um conceito básico nos estudos de informação mas difícil de definir
de representação e podem ser sintetizados por três conceitos: redução semântica, pluralida-
de de significados e produção de sentido.
Redução semântica
A mediação exercida pela Ciência da Informação entre indivíduos e representa-
ções sociais faz com que a redução semântica se imponha à pluralidade de significados
como forma de garantir a produção de sentido. Toda intermediação é em si é um fe-
nômeno redutor de significados. O menor nível de redução semântica se daria, por e-
xemplo, em uma comunicação telepática entre dois indivíduos. Qualquer meio que se
interpusesse entre emissor e receptor já representaria uma alteração na fonte, como é o
caso da linguagem. A escrita acrescenta mais um nível de redução em relação à mesma
fonte e, portanto, toda proposta de representação de linguagens de representação reduz
a informação na fonte. Se a linguagem, em si, já é redutora do pensamento, todas as
formas de síntese da linguagem com o propósito de acesso à informação são, também,
formas ainda mais acentuadas de redução de significado. Inegavelmente, a cadeia de
reduções semânticas faz parte da base teórica da memória documentária para que a or-
ganização do conhecimento em unidades mínimas seja passível de decodificação. O
princípio da economia de símbolos é o que nos permite usufruir do conhecimento con-
figurado nessas memórias. É nesse momento que faz sentido incorporar um novo con-
ceito, o da meta-representação. A representação do conhecimento com esta acepção
pode ser entendida como uma cadeia necessária de reduções que se inicia com a con-
cepção indo até a representação da representação, meta-representação ou representação
documentária.
Representação sensível
⇐ Representação conceitual
⇐ Representação verbal
⇐ Representação social
⇐ Representação documentaria (meta-representação)
Pluralidade de significados
O pensamento humano, que opera com conteúdos dependentes da palavra, implica
sempre uma influência recíproca entre o sujeito pensante e o conteúdo que a palavra encer-
28
ra. A linguagem é vista como o instrumento do pensar, sua realidade imediata, tanto para o
ouvinte quanto para o falante. Merleau Ponty23 amplia esse conceito e afirma que a palavra
não é a tradução de um sentido mudo, mas criação de sentido. A linguagem não “veste”
idéias: ela encarna significações, estabelece a mediação entre o eu e o outro e sedimenta
os significados que constituem a cultura. O pensamento, segundo Spirkin24, nasce junto
com a linguagem e constitui a atividade cognoscitiva do sujeito feita imediatamente por
meio da palavra. A linguagem cumpre, então, dois papéis: um como fator de comunicação
(objeto - relação do sujeito com o objeto - relação existente entre sujeitos), outro como
organizador do pensamento. Gorsky25 confirma o discurso de Spirkin, dizendo que a lin-
guagem está vinculada ao pensamento direta e indissoluvelmente e é essa conexão essenci-
al que determina o papel que a linguagem desempenha na esfera do conhecimento. Richau-
deau26 adiciona ênfase à tese, considerando que a riqueza do aparelho lingüístico permitiu a
transcendência da sua função inicial e a linguagem se transformou em suporte do conheci-
mento, da imaginação, do sonho, dos prazeres. A linguagem não exprime somente o pen-
samento humano pré-existente, mas se constitui no próprio pensamento.27
Sobre o segundo aspecto, observa Spirkin28 que a escrita constitui a forma visual de
fixar a linguagem, surgindo quando a sociedade já havia alcançado um nível elevado de
desenvolvimento. Portanto, um produto normal da ampliação dos meios de intercomunica-
ção das pessoas, estimuladas pelas necessidades práticas da vida social. A escrita é, assim,
resultado da atividade criadora e consciente dos seres humanos. Como linguagem articula-
da, adquire um caráter até certo ponto independente e constitui uma forma de atividade
extremamente abstrata. A escritura pictográfica evoluiu gradativamente no sentido da sig-
nificação. Da representação completa do objeto, o homem passou à representação esque-
mática. Por sua vez, a escrita ideográfica ou hieroglífica constituiu um sistema de signos e
regras acerca de seu emprego que serviu para comunicar um pensamento qualquer.
Do ponto de vista do desenvolvimento do pensamento, o aparecimento do alfabeto
significou que o homem chegou a ter a idéia de que a palavra consta de elementos particu-
lares. O sistema alfabético, portanto, surgiu no estágio em que a linguagem fonética e o
pensamento abstrato haviam alcançado seu pleno desenvolvimento. A escrita fonética, a-
través da linguagem, se converteu em realidade material do pensamento. Então, ao propor-
cionar ao pensamento um caráter de certo modo independente (da realidade física dos obje-
29
tos), a linguagem foi uma das forças que contribuíram para criar não somente uma cultura
espiritual, como para desenvolver a cultura material.
Ainda em Gorsky, a linguagem não só constitui uma condição necessária para a
formação de nossos pensamentos, como também permite consolidar os êxitos da atividade
cognoscitiva do indivíduo, fixar a experiência adquirida por uma geração e transmitida às
gerações futuras. Portanto, o papel da linguagem para o conhecimento se revela a partir da
transmissão dos conhecimentos adquiridos, na passagem do nível sensorial para o racional
e no processo de formação de conceitos, tanto do discurso da ontogênese, como da filogê-
nese. O pensamento pode então ser igualado à concepção, dentro da escala associativa sen-
sação →percepção →concepção, no sentido de criação e, portanto, com independência do
real objetivo. O pensamento não se dissocia do real, mesmo considerando os conceitos de
juízos e raciocínios. A reflexão sobre a realidade natural existe, dado que tanto o conteúdo
como a forma de cada conceito, de cada juízo e de cada raciocínio particulares são um re-
flexo do mundo material.
Gorsky trata, ainda, do problema correspondente ao sentido da palavra, da correla-
ção que existe entre o sentido e o significado e ainda entre sentido e conhecimento. Usa,
para tal, o raciocínio aristotélico de propriedades ou características e diferença na identifi-
cação de grupos ou classes de conceitos e seus possíveis relacionamentos. A aproximação
de um objeto sob o aspecto da sensação, percepção ou representação nos conduz ao objeto
único e não à sua classe. As sensações e percepções não precisam ser fixadas materialmen-
te, mas as concepções sim. A suposição de que existam estrelas e o sol é da ordem da per-
cepção. A relação, ou seja, as estrelas são sóis, é da ordem da concepção. Para tanto, há a
necessidade de atribuição do signo, no caso a palavra, para expressar ou fixar o pensamen-
to (ou concepção). Logo, o processo de pensar se caracteriza pela capacidade de formar
conceitos, de generalizar. E, nesse sentido, o processo de pensamento é, por sua vez, um
processo no qual se opera com palavras.
Ainda assim, embora possamos afirmar que o signo representa o pensamento, o fato
mesmo da representação conduz à idéia de redução semiótica, tal que as representações
variam não só pela forma de apresentação como pelo modo de interpretação. Do mesmo
modo que posso representar uma relação por meio de uma abstração pictórica, como por
exemplo: a rosa é maior que o livro - e desenhar uma rosa grande e um livro pequeno, a
30
Produção de sentido
Sem dúvida que, se nas etapas anteriores já há uma configuração de redução semió-
tica, o acesso ao conhecimento mediado por representações documentárias intensifica essa
perda, considerada por Lara29 uma questão crucial do tipo: “Como representar adequada-
mente as informações sem comprometer o seu significado?” ou “Como resolver o proble-
ma da quase ausência de articulação entre os descritores para a recuperação de informações
veiculadas pelos textos?”. As palavras são neutras. Elas assumem significados conforme
sua inserção contextual. As palavras isoladas não significam nada, ou significam, virtual-
mente, tudo. É a condição de referência a determinados contextos que lhes confere signifi-
cado.
Se considerarmos, como em Gomez30, que a busca de uma informação que seja
uma resposta pertinente e relevante às nossas perguntas requer, na modernidade, a recons-
trução de um complexo cenário onde sejam agregadas as populações de fontes e canais de
informação de modo a permitir processos seletivos, organizados e econômicos de busca e
recuperação, tal reconstrução vai forçosamente fazer uso de atalhos semânticos no sentido
clássico do processo operacional presente na idealização das representações documentárias.
Quer dizer, desconstruir o “texto” para reconstruí-lo de forma reduzida. Sem dúvida que ao
lado da redução simbólica fica configurada a redução de significado. O paradoxo da produ-
ção de sentido no campo das memórias documentárias deve ser entendido como uma ten-
são necessária: reduzir informação para obter conhecimento.
Os produtos obtidos pelos processos de representação documentária, em seus vários
graus de redução semântica, quer sejam: o texto ou objeto na íntegra, resumos, referências
bibliográficas, índices temáticos ou notações de classes sob as formas de codificações tex-
Disseminação da Informação
31
utilizadas no nosso cotidiano quando recebemos e enviamos informações por correio tradi-
cional, correio eletrônico, telefone, fax ou por transferência eletrônica de arquivos. Nesse
sentido, fazemos uso de guias e catálogos, geralmente organizados por temas de interesse
ou domínios, assim como os catálogos de produtos e serviços, editores de livros e revistas
técnicas.
32
Não poderia ser diferente nos acervos de bibliotecas, arquivos, museus, como tam-
bém no universo virtual das grandes redes de informação. Para este último, hoje nos vale-
mos de páginas de índices temáticos, organizadas em sistema hipertexto, que nada mais são
do que uma sucessão de filtros ou de atalhos pelos quais o usuário vai selecionando o ca-
minho mais propício à localização de uma dada informação. Tais atalhos visam, portanto, a
diminuir a ansiedade de informação, facilitando o acesso mais rápido aos conteúdos que
venham a satisfazer uma determinada necessidade de informação. Do ponto de vista das
instituições de memória, a disseminação é não só o estágio final do ciclo de vida do docu-
mento, como a tarefa social de garantir o direito à informação. Sem a disseminação o ciclo
total se rompe, impedindo as novas construções e a geração de novos conhecimentos.
A meta-representação ou representação documentária, explicitada pelos modelos do
ciclo de vida da informação e do sistema de recuperação da informação (SRI), deve ainda
sofrer uma análise, no sentido de ser isolado o conceito de linguagem de comunicação, em
especial o conceito de linguagem documentária, discussão que organizará o próximo capí-
tulo.
NOTAS E CITAÇÕES
1
VICKERY, B. C. Knowledge representation: a brief review. Op. cit., p. 145
2
MENDONÇA DE SOUZA, Alfredo, DODEBEI, Vera Lucia. Modelos e sistemas em Ciência da Informa-
ção. Rio de Janeiro, UFRJ/ECO, 1992. (Terceiro Seminário apresentado à diciplina “Linguagem e Ciência
da Informação III”).
3
HAGGETT, P., Chorley, R. J. Modelos, paradigmas e a nova Geografia. In: ________. Modelos sócio-
econômicos en Geografia. Rio de Janeiro: Livros Técnicos e Científicos / USP, 1975.
4
CLARKE, D. Models in archaeology. London : Methuen, 1972.
5
BURT, P. V. , KINNUCAN, M. T. Information models and modeling techniques for information systems.
Annual Review of Information Sciences and Technology. Holanda: Elsevier, v. 25
6
MARCONDES, C. H. , SAYÃO, L. F. Teoria Geral dos Sistemas: Sistemas de Informação Rio de Janeiro:
UFRJ/ECO,em
Doutorado 1992. (Seminário
Ciência apresentado à disciplina “Linguagem e Ciência da Informação V”, Curso de
da Informação)
7
MARCONDES, C.H. , SAYÃO, L.F. Op. cit., p. 15
8
HAGGET, P., Chorley, R.J. op. cit.
9
BURT, P.V., KINNUCAN, M.T op. cit.
10
LYYTINEN, K. Two views of information modelling. Information & Management, v. 12, n. 1, jan. 1987.
33
11
SHANONN, C. E., WEAVER, W. The mathematical theory of communication. Urbana: Univesity of
Illinois Press, 1949.
12
LANCASTER, F. W. Information retrieval systems: characteristics, testing and evaluation. 2. ed. New
York: Wiley, 1979.
13
VIRILIO, Paul. A máquina de visão. Rio de Janeiro: José Olympio, 1994. p. 9
14
WANDERLEY, Manoel Adolfo. Organização da memória documentária: a matriz documentária. Rio de
Janeiro: UNIRIO/CCH, 1980. (Notas de Aula)
15
MONTGOMERY, Christine A. Automated language processing. Annual Review of Information Science
and Technology. v. 4, p.145-174, 1969.
16
Mc GARRY, K. J. Da documentação à informação: um contexto em evolução. Lisboa: Editorial Reserva,
1984.
17
Cf. MARCONDES, Carlos Henrique. Representação e economia da informação. Ci. Inf., Brasilia, v. 30, n.
1, p. 61-70, jan./abr. 2001.
18
FOUCAULT, Michel. A palavra e as coisas : uma arqueologia das Ciências Humanas. São Paulo: Martins
Fontes, 1994.
19
MAGRO, Cristina. Representação, Virtus Dormitiva e linguagem. In: OLIVEIRA. P. ; BENN-IBLER, V.
e MENDES, E. (orgs) Revisitações: Edição Comemorativa dos 30 anos da Faculdade de Letras . Belo Hori-
zonte: Editora FALE/UFMG. 1999. p. 29 – 44.
20
GOMEZ, Maria Nelida Gonçalez. A representação do conhecimento e o conhecimento da representação:
algumas questões epistemológicas. Ci. Inf., Brasilia, v. 22, n. 3 p. 217-222, set./dez. 1993.
21
KOBASHI, Nayr Yumiko. Análise documentária e representação da informação . INFORMARE – Cad.
Prog.Pós-Grad. Ci.Inf., Rio de Janeiro, v.2, n.2 p. 5-27, jul./dez. 1996.
22
BECKER, Howard S. Apud. JARDIM, José Maria. Cartografia de uma ordem imaginária: uma análise do
sistema nacional de arquivos. Dissertação de Mestrado em Ciência da Informação. Escola de Comunicação,
Universidade Federal do Rio de Janeiro, 1994. p.98
23
MERLEAU PONTY, Maurice. O visível e o invisível. São Paulo: Perspectiva, 1992. p22
24
SPIRKIN, A.G. Origen del lenguaje y su papel en la formacio del pensamiento. In: Les theories de
l’action. Paris, Hachette, 1972
25
GORSKY, D. P. Lenguaje y conocimiento. In: Pensamiento y lenguaje. Mexico: Grijalbo, 1966. p. 68-105.
26
RICHAUDEAU, F. Langage et action. In: LES THÉORIES de l’action . Paris : Hachette, 1972.
27
Alguns lingüistas e psicólogos contestam essa tese, principalmente os discípulos de Piaget, que deduziram
de seus trabalhos
p. 208. experimentais
No entanto, vale a pena ainvestigar
pré-existência
se os do pensamentopiagetianos
experimentos sobre a linguagem. Cf. Richaudeau,
são da ordem op.ape-
da ontogênese cit.
nas, ou se estedem-se também à filogênese.
28
SPIRKIN, A. G. op. cit., p. 114.
29
LARA, Marilda Lopes Ginez de. Algumas contribuições da semiolologia e da semiótica para a análise das
linguagens documentárias. Ci. Inf. , Brasilia, v. 22, n. 3, p. 223-226, set./dez. 1993.
30
GOMEZ, Maria Nélida Gonzalez de. Op. cit.
34
31
Na opinião de Claude Levi-Strauss, a diferença essencial entre sociedades com escrita e sociedades sem
escrita é que as primeiras são pluralistas e contém sempre mais de um ponto de vista, mais de uma possibili-
dade de ação. As sociedades primitivas, ou sem escrita, tendem a ser monolíticas; os modos de fazer vigen-
tes não são postos em questão e a tradição fornece definitivamente o plano de como as coisas devem fazer-
se. O pluralismo cria tensão e debate e desencadeia o futuro. Cf. Mc GARRY, K. J. op. cit., p. 43, 44.
32
DODEBEI, Vera Lucia Doyle. Espaços mítico e imagético da memória social. In: Memória e espaço. Rio
de Janeiro: 7 Letras, 2000. p. 63-71.
33
LATOUR, Bruno. Redes que a razão desconhece: laboratórios, bibliotecas, coleções. In: O poder das
bibliotecas: a memória dos livros no Ocidente. Rio de Janeiro: Editora UFRJ, 2000. p. 29
3 Língua e Linguagem
grafias, índices, inventários, repertórios. Embora todos esses produtos pertençam ao gêne-
ro das representações documentárias, uma vez que são construídos para referenciar um
objeto, a fim de permitir a sua distribuição e localização na memória documentária, eles
não devem ser classificados como linguagem documentária. Os conceitos de linguagem
documentária encontrados na literatura reduzem, por vezes, todas as formas de representa-
ção documentária à linguagem documentária, igualando assim, os dois conceitos.
A primeira explicação possível para esse fato reside no emprego indiscriminado da
terminologia utilizada pelos campos teórico-conceituais da representação documentária
importados do modelo europeu, cujo foco está centrado na analyse documementaire e do
modelo americano, que utiliza a information indexing como expressão genérica para as
ria8. Com base na análise dessa literatura, arriscamo-nos a discutir o campo teórico-
conceitual e metodológico das representações documentárias, não de forma exaustiva mas,
ao contrário, pontuando as reflexões nas relações entre seus conceitos principais a fim de
destacar aqueles imprescindíveis à construção de seus produtos, em particular, das lingua-
gens documentárias.
As operações efetuadas nos documentos a fim de torná-los úteis a uma pesquisa
documentária podem ser observadas sob dois aspectos: o primeiro é relativo aos processos
que ocorrem na transformação do objeto em item documentário, passível de ser recuperado
da memória documentária; o segundo aspecto diz respeito aos produtos, quer sejam gera-
dos por esses processos, quer sejam construídos para melhorar a comunicação entre usuário
e documento.
Considera-se como processos a análise, a síntese e a tradução em códigos docu-
mentários. Destes, a análise e a síntese vão constituir o que se denomina Análise Docu-
mentária e a tradução ou processo de codificação documentária vai variar em função do
objetivo específico da criação de códigos documentários, isto é: catalogação, classificação,
indexação ou condensação informativa. Os produtos gerados por esses processos são, por-
tanto: catálogos, índices e resumos. E os produtos construídos para melhorar a comunica-
ção constituem as Linguagens Documentárias. O gráficoabaixo representa uma das inú-
meras possibilidades de leitura deste campo de estudos. Sua construção teve por objetivo
principal organizar os conceitos já consagrados na literatura, apresentando as relações exis-
tentes entre eles, quer sejam de subordinação ou paradigmáticas, quer sejam de coordena-
ção ou sintagmáticas.
39
deles, denominado de Análise Documentária (AD), é definido por Cunha 9 como o estudo
do conjunto de procedimentos efetuados com o fim de expressar o conteúdo de documentos
sob formas destinadas a facilitar a recuperação da informação. A AD, embora não seja
um campo novo de interesse da Biblioteconomia e da Ciência da Informação, experimen-
tou um desenvolvimento maior no Brasil, a partir de um grupo de pesquisa formado pela
Escola de Comunicação e Artes de Universidade de São Paulo, tendo como propósito dar
40
o documentalista como leitor. Portanto, a intermediação presente no ato de ler cria mais um
universo retórico a ser considerado – o do analista, além daquele existente para o autor, e
aquele existente para o leitor objeto da criação do texto. Esses universos retóricos ou “tá-
buas”14 de conhecimentos formam um quadro de referências necessário não só à segmenta-
ção do texto como à sua reconstrução, como diz Cunha 15, à remontagem do discurso. Ou-
tros aspectos que devem ser considerados são a capacidade preditiva do leitor que extrai do
41
texto mais do que está expresso lingüísticamente, graças às açoes mentais estruturadas e as
estratégias de leitura adotadas e, contrariamente, a tendência natural de reduzir o cenário
para reter as informações principais. A inclusão das estratégias de leitura, tanto textuais
como imagéticas16, no mundo das representações documentárias parece ser de vital impor-
tância à qualidade da memória documentária e à eficácia do sistema de recuperação das
informações.
A segmentação do texto objeto da AD pode ser considerada a síntese da leitura, fase
que antecede à da codificação. Nesta etapa, o analista pode valer-se dos fundamentos da
sintaxe ou da semântica. No que se refere à análise automática de textos, Coulon 17 indica
que as pesquisas que visam a associar a informática ao processamento de textos podem ser
classificadas em quatro fases: fase estatístico-morfológica (1945-1955); fase sintática
(1955-1070); fase lógica (1963- ); e fase cognitiva (1974- ). Vê-se nesta classificação
uma evolução de abordagens que indicam os graus de complexidade da tecnologia de seg-
mentação de textos, ou seja: análise morfológica (léxico) ⇐ análise sintática (estrutura)
⇐ interpretação lógica das estruturas sintáticas (semântica) ⇐ análise conceitual (simu-
lação). Essa última fase representa os esforços conjuntos da psicologia cognitiva e da in-
formática (inteligência artificial) na solução da representação automática do conhecimento.
Os processos de atribuição de códigos ou “rótulos” aos segmentos da leitura docu-
mental, como denominou Lancaster, podem ser discutidos sob o aspecto normativo. Quer
dizer que eles se dividem em dois universos: os processos que se abstêm de orientações
normativas e os que se valem das estruturas dos códigos para controlar as funções sintáti-
cas e semânticas da língua natural. Os primeiros são nomeados de indexação livre, indexa-
ção natural, indexação por palavras-chaves (no sentido de extrato empregado por Coyaud),
pois utilizam as palavras naturais, encontradas no texto, como pontos de acesso ao conteú-
do. Essa modalidade de indexação é a utilizada como parte integrante de compêndios e
manuais técnicos e objetiva a localização de conceitos, assuntos, nomes de pessoas ao lon-
somente refletir sobre a influência dos controles sintáticos e semânticos, não apenas no
momento da atribuição do código, como também na segmentação do texto.
Pode-se dizer que a indexação natural faz uso da escolha de palavras simples, com-
postas ou articuladas em frases que, extraídas do texto vão se transformar em uma repre-
sentação reduzida do objeto. Independentemente dastecnologias da AD empregadas nessa
segmentação, não há, nesta fase, o processo de tradução do texto srcinal em um outro re-
duzido, representado e traduzido. O processo de tradução, no nosso entender, implica a
interação de língua e linguagem, dois sistemas de comunicação que mutuamente se refe-
renciam. Portanto, só há o processo de tradução quando a língua natural e a linguagem
documentária são confrontadas. De outro lado, pode-se considerar que a indexação natural
é uma indexação “incompleta” (melhor seria utilizar outra expressão) pois, nesse processo,
apenas a análise/síntese mental é considerada na segmentação do texto, ignorando-se o
plano conceitual da representação. Neste caso, todas as vantagens tanto da língua natural
quanto das linguagens documentárias são desprezadas, uma vez que as palavras são retira-
das de um contexto significativo para constituírem uma lista ou um índice de pouco valor
para a identificação dos conceitos que representavam no texto.
Vale observar, ainda, que os processos de representação documentária sofrem uma
variação significativa na leitura e segmentação dos objetos em análise dependendo da utili-
zação ou não de uma linguagem documentária. A linguagem documentária proporciona não
só um controle das dispersões semânticas e sintáticas da língua natural como delimita o
domínio conceitual do campo de estudo em questão. Essa delimitação do domínio guia a
leitura e influencia a segmentação do texto, no sentido de que esta última deva se ajustar à
linguagem documentária para a qual será traduzida. O compromisso que a indexação assu-
me com o campo de estudo é muito mais forte quando ela é “completa”, isto é, quando ela
cumpre integralmente as etapas da leitura, da segmentação e da codificação documentária.
Dos produtos da representação documentária, componentes da segunda faceta do
esquema conceitual apresentado, vamos nos ocupar das Linguagens Documentárias (LD).
Antes de serem analisadas sob o ponto de vista de linguagens artificialmente construídas
para facilitar o acesso às coleções de uma memória documentária, devemos observar que as
LD pertencem à categoria das linguagens comunicação, aolado da língua natural oral e
escrita, das linguagens gestuais, sonoras e visuais. As LD guardam traços característicos
43
Hughes citado por Nocetti e Figueiredo20 define a língua natural como um sistema
de símbolos vocais arbitrários pelos quais o pensamento é transmitido de um ser para o
outro, podendo ser entendida dos pontos de vista:
tes, que, embora sejam constituídas pelos mesmos símbolos, podem ter signifi-
cado diferente.
O menino lê alto (lê em voz alta)
O menino alto lê (o menino alto)
• vocal ⇒ é formada pelos sons produzidos pelos órgãos da fala dos seres huma-
nos.
De acordo com Cintra21, a prática da linguagem é marcada por uma tendência natu-
ral do homem de compreender, governar e modificar o mundo. Essa necessidade de domi-
nar os fenômenos sociais implica em dois processos, o de apreensão e o de compreensão.
O primeiro pode ser representado por uma “catalogação” do mundo e o segundo pela sua
“hierarquização”. Esses dois processos indicam a arbitrariedade da língua, uma vez que
desde a fase de nomeação, característica do desenvolvimento da espécie humana, a função
classificatória se fez presente. O fato de atribuir um símbolo a um referente já o isola con-
ceitualmente de outros referentes. Como a memória documentária é formada, preponderan-
temente, por documentos textuais, as principais questões apontadas para a eficácia dos pro-
cessos de representação documentária repousam na criatividade, arbitrariedade e simbolis-
mo da língua natural, o que vai gerar alternativas de escolha no processo de tradução e de
codificação. Essas alternativas de escolha podem ser representadas pela característica de
dispersão da LN que vai dificultar a eficácia do processo comunicativo restrito à recupera-
ção da informação documentária. A dispersão na LN pode ser classificada por: dispersão
45
As LD, a par de guardar uma relação estreita com a língua natural, de vez que pos-
suem um vocabulário ou léxico documentário e uma estrutura ou sintaxe, representam o
conteúdo informativo de um documento, operando por análise e síntese. Quer dizer, a lin-
gua natural é traduzida para uma linguagem sintética - descritores - a qual, retida na memó-
ria do catálogo tradicional ou da máquina, significa economia verbal, economia de símbo-
los, economia de espaço. Mas, certamente, significa também economia de significado.
Do ponto de vista dos fundamentos teóricos da Comunicação ao nosso propósito de
estabelecer as relações entre LN e LD, identificamos no discurso de Umberto Eco em Se-
miótica e Filosofia da Linguagem22 alguns conceitos que, de certo modo, dominam as dis-
cussões semióticas, principalmente sob a perspectiva da filosofia. São eles: signo e signifi-
cado, símbolo e código.
Eco vê o mundo como fato de cultura, uma mensagem a desvendar e considera que
todos os fenômenos de cultura podem ser vistos como fatos de comunicação, para os
quais as mensagens isoladas se organizam e se tornam compreensíveis em referência a có-
digos. Partindo da suposição do mundo como um fenômeno semiótico, Eco procura identi-
ficar na história da filosofia a discussão sobre a língua e outros sistemas de signos e medi-
ante essa releitura, afirma que cada grande filósofo do passado elaborou, de alguma for-
ma, uma semiótica. Dos estóicos a Cassirer, dos medievais a Vico, de Santo Agostinho a
Wittgenstein, todos abordaram os sistemas de signos. Mas é com Aristóteles que a idéia de
ser é percebida como expressão de vários modos, ou que o ser é o que a linguagem expres-
sa de muitas maneiras. Usando a figura que viria a ser mais tarde conhecida como o triân-
46
gulo semântico de Ogden e Richard, Eco relê semioticamente alguns filósofos: onde Y é
uma expressão, Z é uma coisa ou estados de coisas e X o significado.
Para Platão o Z era uma experiência do mundo, mas efêmera e enganosa, dotada de
"realidade" apenas enquanto imitação de uma realidade situada no mundo das idéias; para
Aristóteles era uma susbtância primeira, em toda a sua concretude; para os estóicos era
um corpo. Para Platão o X era um conceito; para Aristóteles, uma disposição da mente;
para os estóicos uma criação do espírito humano. Embora a definição dessas entidades
mudasse segundo o contexto filosófico, a diferença entre significado e referência foi de
algum modo enunciada.
Para Ogden e Richard o Y é o símbolo, o Z o referente, o X a referência. No que con-
cerne à semiologia só interessa o lado esquerdo do triângulo pois, o problema do referen-
te não tem pertinência, uma vez que existem símbolos que possuem uma referência e
não têm referente (como o unicórnio, que se refere a um animal fantástico, mas inexis-
tente). Há ainda símbolos diferentes, com significado diferente, que dizem respeito ao
mesmo referente (Vênus, como estrela-da-manhã e estrela-da-tarde, ou ainda as expres-
sões "meu padrasto" e "o pai de meu meio-irmão").
Já Peirce, ao entender o signo como alguma coisa que está para alguém em lugar de
outra, sob algum aspecto ou capacidade, trata essas relações numa estrutura triádica, que
lembra o triângulo richardsiano onde, alterando as conceituações saussurianas de signifi-
cante e significado, introduz a idéia do Interpretante. Onde o Y é o símbolo ou "repre-
sentâmen", o Z o objeto que representa e o X interpretante (tese essa mais próxima de Aris-
tóteles e dos estóicos). A idéia do interpretante, como diz Eco, pode ser identificada com o
significado, mas a hipótese mais fecunda é a que vê o Interpretante como uma outra repre-
47
sentação relativa ao mesmo objeto, numa cadeia de semiose ilimitada, uma vez que para
estabelecermos o que seja o interpretante de um signo é necessário designá-lo mediante
outro signo, o qual tem por sua vez outro interpretante, designável por outro signo, e assim
por diante.
Esse círculo vicioso se dá em relação aos diversos contextos ou culturas a que o sig-
nificante se direciona, como por exemplo o significado do significante vaca para o hindu
ou os significantes beleza, unicórnio e Deus. Esta relação cultural provoca na mente do
indivíduo o interpretante, existindo, portanto, diferentes interpretantes a partir do contato
com um código ou cultura. Assim, com base num dado código, um significante denota um
significado num certo grau de extensão e, ainda, conota um significado em relação ao pró-
prio código. A relação de conotação se estabelece quando um par formado pelo signifi-
cante e pelo significado denotado, conjuntamente, se torna o significante de um significado
adjunto. O termo cão, por exemplo, denota certo tipo de animal, mas para o italiano tam-
bém conota "mau tenor". A relação entre símbolo e referência é estudada em profundida-
de, uma vez que é dessa relação que ocorrem os fenômenos de significação. A relação
entre símbolo e significado pode mudar, crescer, deformar-se; o símbolo permanece cons-
tante e o significado torna-se mais rico ou mais pobre. A esse processo dinâmico e contí-
nuo Eco denomina sentido.
A língua natural (LN) faz parte desse modelo comunicacional "aberto", onde a men-
sagem varia conforme os códigos. Estes são postos em pauta conforme as ideologias e cir-
cunstâncias, e todo sistema de signos se reestrutura continuamente com base na experiên-
cia de decodificação que o processo institui como semiosi in progress. O processo de co-
municação se dá, portanto, quando o indivíduo reduz o que pensa e quer a um sistema de
convenções comunicativas, ou seja, quando o que pensa e quer é socializado. O sistema de
saber, por sua vez, tem que se transformar em um sistema de signos, onde a ideologia soci-
48
alizada se torna código. Nasce assim uma estreita relação entre o mundo dos códigos e o
mundo do saber preexistente, onde esse saber torna-se visível, controlável, quando se faz
código, convenção comunicativa.
À LN é atribuído um sistema de signos compreendido pelo que se designa de gra-
mática. Para Eco a gramática é composta da sintática, da semântica e da pragmática. A sin-
tática diz respeito ao sentido estrutural da língua e envolve a morfologia e a sintaxe. A
semântica se ocupa do sentido lexical e a pragmática do sentido situacional. Esta última, a
pragmática, segundo Bar-Hidel citado por Eco23
é o estudo da dependência essencial da comunicação, em linguagem natural, do
falante e do ouvinte, do contexto lingüístico e do contexto extralingüístico e da disponibili-
dade dos conhecimentos fundamentais, da prontidão em obter esse conhecimento funda-
mental e da boa vontade dos participantes do ato de comunicação.
Essa classificação da gramática, impõe apenasuma diferença àquela feita por Saus-
24
sure , ao afirmar que tudo o que compõe um estado de língua pode apenas ser reduzido a
uma teoria dos sintagmas e a uma teoria das associações. Tal diferença diz respeito ao nível
de extensão das relações entre os conceitos, isto é, as relações sintagmáticas e as relações
associativas (ou paradigmáticas) implicam a sintaxe (incluindo a morfologia) , a semântica
e a pragmática. Sem dúvida que no modelo de semiose, a pragmática exerce um importan-
te papel no sucesso da comunicação pois, somada à semântica, vai possibilitar o apareci-
mento do significado contextual, em detrimento apenas do significado lexical.
Nesse sentido, Eco utiliza uma metáfora muito interessante para analisar a gramáti-
ca da LN e que corresponde a dois modelos: o dodicionário e o da enciclopédia. Do ponto
de vista da representação da LN como um dicionário, o conceito de estrutura classificatória
é utilizado, na qual os significados de cada palavra são impostos por sua posição num es-
quema arborescente composto de gêneros e espécies. Assim é que /casa/ é um tipo de mo-
radia; /macieira/ é um tipo de árvore frutífera que, por sua vez é uma espécie de árvore.
Esse tipo de representação pressupõe o uso de estruturas hierárquicas rígidas que conside-
ram as propriedades conceituais, atributivas e necessárias dos objetos. Do ponto de vista da
representação enciclopédica, a LN pode se analisada como uma rede de relações infinitas
que faz maior uso de propriedades factuais, descritivas ou acidentais dos objetos. Se para o
modelo de dicionário há um consenso e uma finitude conceitual, para a enciclopédia há um
49
tre as palavras. Para as primeiras, o conceito de hierarquia está sempre presente pois, o sig-
nificado de cada palavra traz consigo a sua inserção em uma classe de objetos, inferindo-se
daí a posição da palavra na ordem de gêneros e espécies: /árvore/ supõe /vegetais/ e tam-
bém /macieira/. Para as relações sintagmáticas, a reunião de palavras representa a busca de
um sentido, isto é, classes distintas de palavras que intencionalmente reunidas vão compor
uma mensagem: /árvore/ e /madeira/ e /casa/ e /incêndio/ e ... Essa reunião é da natureza de
redes, representada pela possibilidade infinita de combinações entre as palavras, enquanto
as inferências nas relações paradigmáticas são finitas, contidas numa escala entre o maior
gênero e a menor espécie. Esses são os sentidos deordem/hierarquia e de desordem/rede.
Vale ressaltar que a idéia de enciclopédia ligada à desordem e portanto à rede, simboliza a
forma como os temas são reunidos circunstancialmente ou pragmaticamente, a partir de um
roteiro, como uma das inúmeras possibilidades de análise do conhecimento.
Todas as LD incluem, em maior ou menor grau, as imagens de hierarquia e rede, o
que torna complexa uma classificação segundo esses critérios. No entanto, isolando-se al-
guns atributos compartilhados pelas principais LD, pode-se tentar compreendê-las sob essa
nova perspectiva, ao menos no que se refere às suas propostas de utilização no espaço-
tempo. Os três momentos que se seguem devem ser compreendidos como segmentações
arbitrárias e, portanto, circunstanciais, na análise das LD, não significando que os atributos
utilizados para a classificação sejam mutuamente exclusivos.
1º momento: domínio
A classificação tradicional das LD isolava dois atributos, até então, considerados
antagônicos: universal, correspondendo a reduções da totalidade do conhecimento eespe-
cializada, representando a totalidade de alguns domínios do conhecimento. No primeiro,
encontram-se as classificações bibliográficas universais, os macrotesauros, as listas de ca-
beçalhos de assunto construídas com base nas classificações universais; no segundo atribu-
po, a idéia de todo e também a de parte. É como se do todo escolhêssemos uma porção
nuclear e, a partir dela, estabelecêssemos as relações necessárias com esse todo. Por exem-
plo: se o meu interesse é sobre /energia nuclear/ qual a rede de relações necessárias para
efetuar uma moldura, um roteiro de análise dessa porção do todo? Certamente, vários as-
pectos presentes no todo, tais como: física, química, biologia, economia, religião, educa-
ção ... Em vez de efetuar-se simplesmente um recorte do universo, construi-se uma rede de
referências que deve estar representada na língua natural (escrita e oral) e na metalíngua-
gem documentária.
2º momento: objeto
Tem-se por certo que as LD podem estruturar-se por conceitos, isto é, por abstra-
ções de objetos representados por um símbolo da língua natural, de caráter unívoco e restri-
to, ou por assuntos, que definiríamos como a representação da soma de vários conceitos.
Tradicionalmente, as LD foram concebidas a partir da análise dos assuntos presentes na
literatura, portanto a unidade referencial das classes e subclasses era formada por pré-
coordenações conceituais. Do mesmo modo, as Listas de Cabeçalhos de Assunto adotaram
este mesmo princípio, já que seu objetivo é o de codificar, por palavras, o que a Classifica-
ção havia codificado com a notação. A noção de conceito como unidade estrutural das LD
surge com a proposta de Ranghanathan seguida por Sayers, Bliss, Mills e os trabalhos do
Classification Research Group, culminando, na atualidade, com um campo de estudos de-
nominado “Organização do Conhecimento” cuja base teórica repousa na Teoria Analítica
do Conceito” de Ingetrat Dhalberg27. As LD mais representativas das estruturas pós-
coordenadas, isto é, estruturas que se formam por relações conceituais e não por relações
28
de assuntos, são as classificações facetadas e os tesauros. Wanderley , discute a correla-
ção dessas estruturas, com base no modelo de Gardin para os léxicos documentários, dis-
tinguindo-os em classificações unidimensionais e pluridimensionais, conforme se estrutu-
ram numa só, ou em mais de uma dimensão. Por dimensão de uma organização, explica o
autor, entende-se a natureza das relações analíticas, paradigmáticas, que a constituem, ou,
em outras palavras, da relação dos termos à classe a que pertencem. As unidimensionais
podem ser representadas pelos sistemas taxonômicos no estilo das Ciências Naturais, onde,
de fato uma só relação informa todos os níveis: reino ⇐ classe ⇐ subclasse ⇐ ordem ⇐
subordem ⇐ família ⇐ gênero ⇐ espécie ⇐ nome comum, quando se diz que são unidi-
52
mensionais reais. Para aquelas em que a multiplicidade se esconde em uma unidade, como
é o caso das classificações decimais (ex: Dewey Decimal Classification – CDD), diz-se que
são unidimensionais aparentes. As pluridimensionais reúnem as organizações semânticas
(essência, definições) e as sintáticas (acidentes, funções) e são denominadas de classifica-
ções facetadas (Colon Classification). Wanderley inclui, ainda, o conceito de mistas, no
qual se inserem as classificações que alternam os pontos de vista essenciais e funcionais, e,
entre elas os esquemas ditos analítico-sintéticos (Decimal Universal Classification – CDU),
tais como o concebe Gardin. Desta proposta de análise das estruturas de classificações
bibliográficas nota-se a que a preferência da organização pluridimensional denota uma
tendência de considerar o conceito, perspectivado pelos vários domínios do conhecimento,
como a unidade principal e necessária à representação documentária.
3º momento: ordem
Se a ordem única representada pelas taxonomias, como no caso das ciências natu-
rais, ou as aparentes estabelecidas pelas LD que hierarquizam assuntos, não nos servem
para estabelecer as representações, ao mesmo tempo, essenciais e funcionais dos objetos
que nos são indicados pela pragmática, no sentido de efetuar a plenitude da semiose, de-
vemos nos valer então da multiplicidade de ordens, conforme os nós da rede de conheci-
mentos que queremos representar. Partindo do suposto de que é a Rede de Conhecimentos
que vai indicar a melhor organização de sua representação, a constituição das LD vai pres-
supor a identificação e a segmentação do domínio do conhecimento, a fim de poder efetuar
a análise de seus conceitos chaves. Se a literatura monográfica foi a única responsável pelo
desenho das classificações unidimensionais, cujo objetivo principal era o do arranjo físico
dos documentos e da recuperação do todo temático, e a literatura periódica proporcionou o
surgimento de LD especializadas, de cunho semântico, como foi o caso dos tesauros me-
ramente alfabéticos, a produção do conhecimento armazenada na memória documentária
da atualidade vai necessitar de instrumentos que não só delimitem campos conceituais, mas
que os organize em segmentos hierárquicos. As listas de cabeçalhos de assunto, como espe-
lho da estrutura classificatória utilizada na organização de acervos da memória documen-
tária, só têm sua sobrevivência assegurada pelo domínio que os grandes acervos bibliográ-
ficos impõem como paradigmas, por exemplo, a biblioteca do congresso americano (Li-
brary of Congress). Nesse caso, o domínio está dado pela ideologia de acumulação da insti-
53
do usuário. Essas duas garantias (Literária e do Usuário) refletem um contexto onde tanto o
31
universo documental quanto as necessidades de informação do usuário são consideradas.
b) servir de instrumento para a distribuição útil dos livros ou documentos. Essa
função é cumprida pelas classificações bibliográficas, sendo que as mais utilizadas até
hoje são a CDD (Dewey Decimal Classification) e a CDU (Classificação Decimal Univer-
sal), as quais foram construídas pelo método dedutivo, unidimensional e misto respectiva-
54
estrutura hierárquica do conceito, que o conceito de /manga/ é mais interessante para a mi-
nha pesquisa. Quando as linguagens desse tipo são consideradas linguagens-produtos do
processo de catalogação, temos as listas de cabeçalhos de assunto. As listas de cabeçalhos de
assunto são linguagens documentárias que organizam uma rede de relações temáticas (mode-
lo da enciclopédia), de caráter conceitual pré-coordenado, uma vez que refletem não os
conceitos principais de um domínio do conhecimento, mas os assuntos estruturados no
55
Notas e citações
1
COYAUD, M. Linguistique et documentation: les articulations logiques du discours. Paris: Larousse, 1972.
173 p.p. 130
2
Neste trabalho, usaremos a expressão /língua/ com o sentido de língua natural e /linguagem/ para linguagens
de comunicação. Sobre as diferenças semânticas entre língua e linguagem Martinet afirma que, há meio sécu-
lo, as definições de linguagem vêm apresentando uma certa coerência, pois partem todas do princípio de que
a linguagem é um sistema de signos utilizados para estabelecer a comunicação. Mas, o autor estabelece uma
oposição entre língua e linguagem. A língua é definida pelo caráter vocal, a linearidade e a dupla articulação,
e a linguagem é um conceito mais vasto identificado com o sistema de signos que permite efetivar a comuni-
cação. Saussure, por sua vez, além de distinguir língua e linguagem, observa que língua ( langue) e fala (paro-
le) são partes de um todo que é a linguagem. A primeira se situa no campo social e a segunda na esfera do
indivíduo. Cf. NOCETTI, Milton A., FIGUEIREDO, R. C. Línguas naturais e linguagens documentárias:
traços inerentes e ocorrências de interação. R. Bibliotecon. Brasília, v. 6, n. 1. p. 23-37.
3
WANDERLEY.M. A. Linguagem documentária. op. cit. p. 176.
4
LANCASTER, F. W. Indexção e resumos: teoria e prática. Brasília: Briqut de Lemos, 1993. p. 15-17.
5
de. :Étude
GROLIER, EricParis
documentaires. sur les1962.
UNESCO, catégories
p. 262.générales applicables aux classifications et codifications
6
RANGANATHAN, S. R. Philosophy of library classification. Copenhagen: Ejnar Munksgaard, 1951. p. 33
7
WANDERLEY, M. A. op. cit. p. 188.
8
As referências a esses autores se encontram ao logo do texto, em citações, ou na bibliografia.
9
CUNHA, Maria Isabel R. Ferin. Do mito à análise documentária. São Paulo: EDUSP, 1990. (Tese de
doutorado) p. 59
10
CUNHA, Maria Isabel R. Ferin. Do mito ....Op. cit. p. 19
11
WANDERLEY, Manoel Adolpho. op. cit. p. 187
12
CUNHA, Maria Isabel R. Ferin. (Coord.) Análise documentária: considerações teóricas e experimentações.
São Paulo: FEBAP, 1989. p. 28 e 29
13 CINTRA, Ana Maria Marques. Estratégias de leitura em documentação. In: SMIT, Joahanna W. (coord.)
Análise documentária: a análise da síntese. Brasília: SCT-PR/CNPq/IBICT, 1898. p. 30-38.
14
Cf, ECO, Umberto. A estrutura ausente: introducão à pesquisa semiológica. São Paulo: Perspectiva, 1991.
15
CUNHA, Maria Isabel R. Ferin. Do mito .....Op. cit.p. 111
16
SMIT, Johanna, W. A análise da imagem: um primeiro plano. In: Análise documentária: considerações
teóricas e experimentações. São Paulo: FEBAP, 1989. p. 102-113
57
17
COULON, Daniel, KAYSER, Daniel. Informática e linguagem natural: uma visão geral dos métodos de
interpretação de textos escritos. Brasília: SCT-PR/CNPq/IBICT, 1992. p.11
18
NOCETTI, Milton A., FIGUEIREDO, R. C. Línguas naturais e linguagens documentárias: traços inerentes
e ocorrências de interação. R. Bibliotecon. Brasília, v. 6, n. 1. p. 23-37.
19
Várias correntes da lingüística contemporânea reconhecem uma dupla articulação da língua. Na língua,
articulam-se entre si unidades de primeira articulação, dotadas de significado (a língüística européia
chama-as monemas e a lingüística norte-americana, morfemas) e identificáveis, embora nem sempre, com a
palavra. Tais unidades combinam-se entre si e formam unidades mais vastas chamadas sintagmas. Mas as
unidades de primeira articulação, que podem ser numerosíssimas no interior de uma língua, como o
demonstram os dicionários, constroem-se combinando entre si unidades de segunda articulação, os
fonemas, dotados de valor diferencial uns em relação aos outros, mas desprovidos de significado. Cf.
MARTINET, apud ECO, Umberto. A estrutura ausente: introducão à pesquisa semiológica. São Paulo:
Perspectiva, 1991. p. 32.
20
NOCETTI, Milton A., FIGUEIREDO, R. C. Op. cit.
21
CINTRA, Ana Maria Marques et al. Para entender as linguagens documentárias. São Paulo : Polis : APB,
1994. p. 18
22
ECO, Umberto. Semiótica e filosofia da linguagem. São Paulo: Ática , 1991.
23
ECO, Umberto. op. cit. p. 75
24
SAUSSURE, Ferdinand de. Curso de Lingüística geral. São Paulo: Cultrix, 1974. p. 136-139.
25
Cf. DELEUZE, G., GUATTARI, F. Rhizome. Paris: Minuit, 1976.
26
ECO, Umberto. Semiótica e filosofia da linguagem. op. cit. p. 245-290.
27
A discussão maior sobre organização conceitual se dará no próximo capítulo.
28
WANDERLEY, M.A . Linguagem documentária: acesso à informação. Ci. Inf., Rio de Janeiro, v. 2, n. 2. p.
175-217, 1973. p. 204
29
PINTO, Maria Cristina Mello Ferreira. Análise e representação de assuntos em sistemas de recuperação da
informação; linguagens de indexação. R.. Esc. Bibliotecon., UFMG, Belo Horizonte, v. 14, n. 2 p. 169-186,
set. 1985.
30
LARA, Marilda Lopes Ginez de. Algumas contribuições da semiolologia e da semiótica para a análise das
linguagens documentárias. Ci. Inf. , Brasilia, v. 22, n. 3, p. 223-226, set./dez. 1993
31
Voltaremos a esta questão posteriormente, quando da análise das fontes para a construção de tesauros.
32
SHERA, J. H., EGAN, M. E. op. cit., p. 37
33
Shera ressalta dois objetivos principais do catálogo de biblioteca: inventário e recuperação da informação,
sendo que o último é a sua função mais importante.
34
LESKA, B. M. Theoretical and methodological problems of therminology In: PROCEEDINGS of
international symposium, Nov. 27-30, 1979, Warsaw.
Um pouco da história
59
Segundo Vickery1, a palavra tesauro (latim = thesauru, grego = thesaurós) teve ori-
gem na Grécia significando Treasury or Storehouse (tesouro ou armazenagem / repositó-
rio), sendo que em 1936 o Oxford English Dictionary definiu a expressão inglesa como um
dicionário, enciclopédia e similares. Em 1852, Peter Mark Roget publicou o Thesaurus of
English Words and Phrases, uma coleção de termos organizada não em ordem alfabética,
como em um dicionário, mas de acordo com as idéias que expressavam. O objetivo de tal
estrutura era o de encontrar as palavras pelas quais as idéias pudessem ser mais bem ex-
pressas em textos. De acordo com Gomes2, Roget era secretário da Royal Society e
pretendia, com aquela obra, facilitar sua atividade literária. Levou nesse trabalho cerca de
50 anos. Argumentava Roget que o propósito de um dicionário comum é simplesmente
explicar o significado das palavras, mas o problema para o qual ele pretendia oferecer a
solução poderia ser apresentado assim: sendo dada uma palavra, pode-se encontrar seu
significado ou a idéia que ela pretende trazer consigo, em um dicionário. Mas, ao contrário:
tendo-se uma idéia, qual/quais palavras podem melhor expressar seu significado? Com esse
objetivo, as palavras e frases da língua foram arranjadas no Roget’s Thesaurus não de a-
cordo com seu som ou ortografia, mas estritamente de acordo com seu significado.
Peter Mark Roget organizou as palavras da língua inglesa em seis categorias concei-
tuais: relações abstratas – espaço – matéria – intelecto – volição – afeições. Essas categori-
as foram subdivididas em classes, que por sua vez foram divididas em seções, subseções e
conceitos isolados, tal como no recorte abaixo:
NOUN: EXISTENCE, being, entity, ens [L.], esse [L.], subsistence; quid, hypaxis [rare], auto-
maton.
REALITY, actuality; positiveness &c. adj.; fact, matter of fact, sober reality; truth [See
Truth]; actual existence.
PRESENCE (existence in space) [See Presence]; coexistence [See Synchronism].
STUBBORN FACT; not a dream [See Imagination]; no joke.
ESSENCE, inmost nature, center of life, inner reality, vital principle.
[SCIENCE OF EXISTENCE] ontology.
VERB: EXIST, be; have being &c. n.; subsist, live, breathe, stand, obtain, be the case; occur
(event) [See Eventuality]; have place, rank, prevail; find oneself, pass the time, vegetate.
come into existence &c. n.; arise (begin) [See Beginning]; come forth (appear) [See
Visibility].
BECOME ( be converted) [See Conversion]; bring into existence [See Production];
coexist, postexist [rare], preëxist [rare].
CONSIST IN, lie in; be comprised in, be contained in, be constituted by.
ABIDE, continue, endure, last, remain.
ADJECTIVE: EXISTING &c. v.; existent, subsistent, under the sun; in existence &c. n.; extant; afloat,
on foot, current, prevalent; undestroyed.
REAL, actual, positive, absolute; factual, veritable, true [See Truth]; substantial, subs-
tantive; self-existing, self-existent; essential, beënt.
WELL-FOUNDED, well-grounded; unideal, unimagined; not potential [See
Nonexistence]; authentic.
ADVERB: ACTUALLY &c. adj.; in fact, in point of fact, in reality; indeed; de facto [L.], ipso
facto [L.].
QUOTATIONS: 1. Ens rationi.
2. cogito ergo sum.
3. Think’st thou existence doth depend on time?—Byron
tela. O campo ou domínio desse tesauro é a língua inglesa e seu propósito continua a ser
aquele imaginado por Roget ou seja, o de auxiliar na escolha de uma expressão que melhor
reflita o conceito existente na mente do escritor. Por outro lado, como concepção, o mo-
delo do Roget’Thesaurus é utilizado no ensino da língua inglesa, em pesquisas de natureza
lingüística e filológica, jogos e lazer, propaganda e marketing de empresas comerciais.
No Brasil, além das iniciativas comentadas por Gomes, descobrimos uma obra inti-
tulada Dicionário inverso4, cujo objetivo era o de “proporcionar maior facilidade de con-
sulta aqueles que se dedicam à arte-ciência educativa e recreativa das ‘palavras cruzadas’ e
das charadas e enigmas em geral. A sua ordenação deve ser vista sob o prisma inverso dos
léxicos usuais - do significado para a palavra que o expressa”. Embora este léxico (elabo-
rado somente até a letra B) seja distinto do tesauro de Roget quanto ao uso, os dois têm em
comum o fato de organizarem os significados em detrimento dos símbolos utilizados na
linguagem natural para representá-los.
A partir de 1940, o termo tesauro começou a ser utilizado na esfera da Ciência da
Informação e, em especial, no processo de recuperação da informação, como sendo um
instrumento capaz de transportar conceitos e suas relações mútuas, tal como expressos na
linguagem dos documentos, em uma língua regular, com controle de sinônimos e estruturas
sintáticas simplificadas. Ainda segundo Gomes, o tesauro documentário surgiu da necessi-
dade de manipular grande quantidade de documentos especializados. Era preciso trabalhar
com vocabulário mais específico e com uma estrutura mais depurada do que aquela presen-
te nos cabeçalhos de assunto (remissivas e referências cruzadas tipo ver e ver também).
Assim, além da especificidade, cuidou-se de melhorar a estrutura, e as referências cruzadas
(ver também) deram lugar às relações hieráquicas (paradigmáticas) e associativas (sintag-
máticas). Pelo fato desse novo instrumento da documentação possibilitar, através do agru-
pamento dos termos, o acesso a uma idéia, mesmo sem saber nomeá-la de saída, as novas
listas estruturadas de termos passaram a ser chamadas de tesauros, por analogia com a obra
ria ser obtida por processos automáticos se as associações de palavras fossem previamente
armazenadas em uma memória. Bernier e Heumann 6 propuseram o uso do tesauro com o
sentido de coincidir os vocabulários de uma solicitação de pesquisa com o do sistema de
recuperação de informações, formando três tipos de ajuda: restrição do número de pala-
vras-chaves, lista classificada de termos e definições de palavras-chaves. Wall 7 listou alfa-
beticamente as palavras-chaves, provendo-as de referências cruzadas dos seguintes tipos:
sinônimos, termo genérico, termo específico e termo relacionado. A característica de a-
brangência no uso de relações entre os termos foi enfocada por M. Taube8, que propôs um
esquema de associações entre o termo a indexar com outras palavras-chaves que pudessem
ser relevantes e utilizadas tanto para a indexação como para a recuperação de informações.
Heald9 descreveu o tesauro como um instrumento dividido em duas partes: a primeira é
uma lista alfabética de palavras-chaves e referências cruzadas para indicar a hierarquia de
conceitos, e a segunda é a próprio estrutura hierárquica, apresentando as categorias ou face-
tas do vocabulário. Por fim, a UNESCO10 define o tesauro com sendo “vocabulário contro-
lado e dinâmico de termos relacionados semântica e genericamente, que cobre de forma
extensiva um campo específico do conhecimento” e a COSATI11 como “uma recompilação
de termos selecionados com as apropriadas relações mútuas e expostos de maneira a obter
máxima coerência na descrição de conceitos para a confecção de índices ou recuperação de
informações”.
O emprego de tesauros nas tarefas de indexação e recuperação de informações tenta
resolver o problema da alocação de documentos em classes de assuntos, não só por sua
capacidade de controlar o vocabulário, mas porque é um instrumento que relaciona os des-
critores/termos de forma mais consistente, apresentando uma estrutura sintética simplifica-
da e uma complexa rede de referências cruzadas. Isto permite ao especialista localizar com
mais facilidade a palavra-chave requerida para uma busca. Apresenta, ainda, um relacio-
namento lógico e hierárquico dos descritores, o que contribui para a indexação dos docu-
12
mentos ao nível específico e/ou genérico (modulação). Segundo Foskett , o principal obje-
tivo do tesauro é o de controle terminológico e, em concordância com Lancaster 13, lista
suas principais funções: controlar sinônimos e quase sinônimos; distinguir homógrafos;
facilitar a condução da busca por meio dos termos relacionados e das referências cruzadas
(estrutura sintética), melhorando a consistência da indexação e transportando a linguagem
63
Método consensual
A obtenção da terminologia se faz por consenso de peritos no assunto, mediante a
formação de comitês para discussão acerca dos termos que irão compor a estrutura do léxi-
co documentário e tendo como justificativa a garantia dos produtores e utilizadores do sis-
tema de informação; daí decorre um processo de dedução das espécies a serem incluídas, a
partir da definição, baseada no conhecimento, das classes gerais ou facetas principais. O
método é chamado também deGestalt, em contraposição a Analítico; Estalactite , em con-
traposição a Estalagmite; ou ainda Commitee Aproach, em contraposição a Empírico.
Os métodos Empírico e Consensual derivam, por sua vez, de dois princípios que
regem o levantamento dos termos e que são, respectivamente, a Garantia Literária e o En-
dosso do Usuário.
Garantia literária
A expressão Garantia Literária (Literary Warrant ou Bibliographic Warrant) foi
usada por Wyndhan Hulme19 em 1911, que defendia que a determinação de classes na
construção de linguagens documentárias não deveria ser baseada na classificação do co-
nhecimento e sim nas classes em que existe literatura; isto é, as características da literatura
em si é que determinam as classes definidas no sistema. Foskett20 assume o princípio da
Garantia Literária ao afirmar que os sistemas de recuperação de informação devem basear-
se no material que nele introduzimos e não em considerações puramente lógicas. Good-
man21, por sua vez, ao discutir o Thesaurus of Eric Descriptors, enfatizou o princípio da
67
Garantia Literária, ao ponto de afirmar que “ninguém pode, nunca, incluir um descritor no
tesauro, a não ser que um documento tenha sido nele classificado. Como exemplo, ainda,
de aplicação deste princípio, temos o sistema de classificação da Biblioteca do Congresso
Americano, que foi desenvolvido, pragmáticamente, a partir do estudo de seu acervo bibli-
ográfico.
Endosso do usuário
A expressão Endosso do Usuário (User Warrant ou Personal Warrant), usada por
Lancaster22, é uma confirmação direta dos produtores e utilizadores das informações de um
campo de atividades de que os termos escolhidos são, efetivamente, aqueles utilizados na
comunidade e, portanto, serão eles utilizados nas solicitações de pesquisa no acervo biblio-
gráfico. Chai Kim23, em artigo que discute os dois métodos de levantamento dos termos,
Empírico e Consensual, observou, através de experimento, que a relevância na recuperação
das informações se dá no mesmo grau quando utilizado uma linguagem construída a partir
de termos selecionados da literatura corrente (Empírico) ou um vocabulário cujos termos
foram obtidos através do consenso de um grupo de peritos no assunto (Consensual). Kim
conclui seu trabalho com a argumentação de que o conhecimento e a comunicação deste
não podem ser conceituados separadamente, não sendo verdadeiro que o conhecimento
baseado no consenso de peritos seja fundamentalmente diferente do conhecimento expres-
so na literatura, já que a literatura é a formalização do conhecimento produzido. Kim, no
entanto, deixou de considerar que o conhecimento pode ainda não estar retratado na litera-
tura, dado o hiato existente entre conhecimento e comunicação formal.
Na verdade, quando se trata de construção de linguagens documentárias, o ideal
seria que se pudesse absorver os dois princípios concomitantemente, isto é, certificar-se de
que a terminologia levantada possui as duas garantias: literária e do usuário. A esse respei-
to pode-se citar a experiência de Pickford24, que desenvolveu uma linguagem documentária
para a Biomedicina no National Institute for Medical Research, Inglaterra. O léxico do-
cumentário foi construído, tomando-se por fonte uma coleção literária abrangendo periódi-
cos especializados. Após a indicação feita pelos usuários do centro de pesquisa acerca dos
periódicos que deveriam pertencer a uma coleção de engenharia biomédica (1/3 do material
coletado), foram feitas cópias dos artigos que circularam entre os usuários em potencial. A
esses colaboradores foi solicitado que indexassem as cópias de acordo com uma série de
68
normas, sendo que cada cópia circulou por dois especialistas de modo que dois pontos de
vista fossem obtidos. As respostas coletadas foram tratadas eletronicamente, sendo a esco-
lha dos termos definida pela freqüência de uso na indexação. Esta metodologia obrigou à
formulação de instruções rigorosas acerca da indexação de documentos, utilizando, portan-
to, o conhecimento do usuário acerca da matéria, somado à técnica da indexação.
Nos Estados Unidos da América, Dym25 desenvolveu o Thesaurus for Paint Tech-
nology para a Federation of Paint Technology, coletando os termos a partir do envio de
cópias de artigos de revistas técnicas para os membros da Federação e solicitando que cada
colaborador sublinhasse os termos que considerasse representativos do conteúdo de cada
artigo. O processamento da terminologia se deu do mesmo modo que o adotado por Pick-
ford.
Tanto Pickford quanto Dym utilizaram a um só tempo os princípios da Garantia
Literária e do Endosso do Usuário, obtendo, como resultado do método, a terminologia
preferida por usuários em potencial do sistema de informação, o nível de especificidade e o
grau de exaustividade requeridos para a indexação dos documentos, além de envolverem os
usuários no processo, despertando o interesse e a participação mais efetiva nos programas
de documentação e informação.
Com base nessas duas experiências Dodebei26 desenvolveu uma pesquisa que visa-
va a estabelecer uma metodologia de levantamento de termos para a construção de tesauros
contemplada com as duas garantias: literária e do endosso do usuário. O domínio escolhido
69
para testar a metodologia foi a Formação Profissional nas suas ações desenvolvidas no Bra-
sil. A escolha de tal campo de assunto de deveu ao fato de que os estudos sobre a termino-
logia dessa especialização da Educação eram não só escassos, como disciplinares. Os ins-
trumentos terminológicos existentes ora se apresentavam no contexto geral da Educação,
ora no contexto da Economia. A inadequação dos instrumentos desenvolvidos para a área
de Formação Profissional fez com que os diversos organismos interessados duplicassem
esforços para sistematizar vocabulários técnicos, de modo a minimizar suas próprias difi-
culdades internas de comunicação em uma mesma linguagem.
As instituições ligadas à Formação Profissional procediam ao desenvolvimento de
seus próprios vocabulários, criando-se um impasse no momento de trocar informações en-
tre si, dada a característica de diversificação da linguagem quando do emprego de concei-
tos, tendo-se em vista, de uma lado, a extensão territorial do Brasil e seus regionalismos
lingüísticos, e, de outro, as diversas posições teóricas tradicionalmente adotadas. Após o
estudo da comunidade atuante no campo da Formação Profissional, e da identificação da
classe de problema existente no seu campo de interesse, decidiu-se envolver as três maiores
instituições para-governamentais que cobriam os setores primário, secundário e terciário de
atividades econômicas, ou seja, o Serviço Nacional de Aprendizagem Rural (SENAR), o
Serviço Nacional de Aprendizagem Industrial (SENAI) e o Serviço Nacional de Aprendi-
zagem Comercial (SENAC).
A decisão baseou-se no fato de que essas instituições congregavam um número re-
levante de técnicos em Formação Profissional, assim como possuíam um acervo básico de
obras e documentos sobre o assunto, sendo na sua maioria as produtoras dessa literatura.
Foram selecionados 250 artigos de periódicos nacionais e 250 técnicos em Formação Pro-
fissional. Cada técnico recebeu um artigo acompanhado de instruções. A seleção dos ter-
mos deveria ser feita após a leitura (análise de conteúdo), devendo-se sublinhar os concei-
tos (representados por palavras simples ou compostas) que fossem representativos do texto
dentes entre si, isto é, se a escolha recair pela utilização de um grupo de peritos que vai
estabelecer, dedutivamente, as hierarquias representativas de um dado campo conceitual,
isto não deve eliminar a comprovação de que tais hierarquias estão refletidas nas fontes,
tanto documentais como pessoais. O processo, nesse caso, deve partir de uma suposta hipó-
tese, ou suposição hipotética, passível de verificação particular, para então ser confirmada.
Sob o ponto de vista da indução, é improvável que não se faça suposições, ao longo do
processo, já que algum conhecimento antecipado o construtor da linguagem documentária
deve possuir. O modelo de Pierce citado por Eco 29, para o entendimento das regras de sig-
nificação, pode ilustrar esta tensão entre indução e dedução:
Peirce considera a abdução como a hipótese que, comparada com a dedução e a in-
dução, dá srcem aos três diferentes esquemas inferenciais em que as casas de linha contí-
nua expressam os estágios argumentativos pelos quais temos proposições verificadas, e as
casas de linha tracejada, os estágios argumentativos produzidos pelo raciocínio. Assim é
que a Abdução, naturalmente deve ser verificada.
O que se distingue nesta etapa de definição do universo conceitual é que os concei-
tos podem ser criados dedutivamente, ou identificados indutivamente, nas fontes primárias
e secundárias. O modelo de Peirce nos ajuda a compreender que os conceitos criados de-
vem ter uma correspondência com as fontes, na etapa da delimitação do universo conceitu-
al, e que o processo das inferências vai fundamentar toda a organização conceitual descrita
nas etapas seguintes.
Se a decisão tiver sido a do método dedutivo, o grupo de especialistas não estará
simplesmente determinando quais conceitos farão parte da linguagem documentária, mas já
72
11
COMMITTEE ON SCIENTIFIC AND TECHNICAL INFORMATION. Guidelines for the development
of information retrieval thesauri. Washington : Government Printing Office, 1967.
12
FOSKETT, D. .J. A study of the role of categories in a thesaurus for education documentation. Strasbourg
: Council of Europe, 1972.
13
LANCASTER, F. W. Vocabulary control for information retrieval. Washington : Information Resources
Press, 1972.
14
GOMES, H. E. op. cit. p. 20
15
SOERGEL, D. Indexing languages and thesauri : construction and maintenance. Los Angeles : Wiley -
Becker & Hayes, 1974.
16
GOMES, op. cit., p.30
17
DODEBEI, Vera Lucia D. L. de M. Construção de thesauri: experimento empírico para a coleta de termos
em formação profissional. Rio de Janeiro, 1979. Dissertação apresentada ao Instituto Brasileiro de
Informação em Ciência e Tecnologia / Universidade Federal do Rio de Janeiro para a obtenção do grau de
mestre em Ciência da Informação.
18
LANCASTER, F.W. Vocabulary control for information retrieval. Washington : Information Resources
Press, 1972.
19
HULME, E. W. Principals of book classification. Association of Assistant Librarians, 1950.
20
FOSKETT, A. C. A abordagem temática da informação. São Paulo : Polígono, 1973. p. 10, 20, 40.
21GOODMAN, F. The role and function of thesaurus in education. In: THESAURUS of ERIC descriptors.
New York : CCM Information Corporation, 1972. p. IX-X.
22
LANCASTER, F. W. op. cit.
23
CHAI KIM, SOON KIM. Consensus vs frequency: an empirical investigation of theories for identifying
descriptors in designing retrieval thesauri. Information Processing Management, London, v. 13, n. 4, p. 253-
258, 1977.
24
PICKFORD, A. G. A. FAIR (Fast Access Information Retieval) Project. Aslib Procedings, London. v. 19,
n. 3, p. 79-95, 1976.
25
DYM, E. D. A new approach to the development of a technical thesaurus. Proceedings of the American
Documentation Institute, Washington, D.C. n. 4, p. 126 -131, 1967.
26
DODEBEI, V. L. D. L. de M. Construção de thesauri. op. cit.
27
BEGHTOL, Claire. Domain analysis, literary warrant andconsensus: the case of fiction studies. Journal of
the American Society for Information Science. v. 46, n. 1, p. 30-44, 1995.
28
HJORLAND, Birger, ALBRECHTSEN, Hanne. Toward a new-horizon inInformation Science: Domain-
Analysis. Journal of the American Society for Information Science. v. 46, n. 6, p. 400-425, 1995.
29
ECO, Umberto. Semiótica e filosofia da linguagem. op.cit. p. 50
5 Tesauro - Parte 2:organização de conceitos
• 1ª → CONCEITO = ESSÊNCIA
Abbagnamo2 traça um quadro de relações em que, tanto para Hegel como para Aris-
tóteles, o conceito é a essência necessária da realidade, o que faz que ela não possa ser dife-
rente do que é. Aristóteles reforça a idéia de conceito de Platão quando diz que o conceito
(logos) é o que circunscreve ou define a substância ou a essência necessária de uma coisa,
classificando-o em: conceitos comuns, próprios e materiais. Kant, em sua obra Crítica da
razão pura, afirma que, se os conceitos se referem às coisas só mediante a sensação, os
Relações conceituais
Mudando o foco de nossa atenção das esferas ontológica e metodológica na identi-
ficação dos conceitos que constituirão uma linguagem documentária para o espaço lógico
das suas relações, duas abordagens teóricas devem ser consideradas: a dadivisão lógica
própria do processo dedutivo, representado pela diferença e a da predicação conceitual,
que compreende tanto a indução quanto a dedução, num processo relacional de semelhan-
A divisão lógica
A hierarquização conceitual é um processo analítico, que considera a divisão do
tema geral em suas espécies. As espécies são, portanto, obtidas pela diferença específica,
ou seja, as qualidades ou atributos que, somados aos próprios do gênero, as distinguem.
78
Diremos, então, que a cada derivação conceitual as espécies daí decorrentes adquirem pelo
menos um atributo a mais que seu gênero próximo, tornando-se mais intensas ou compre-
ensíveis na medida em que aumenta o número das diferenças.
A questão da diferença é estudada na teoria da classificação a partir das categorias
aristotélicas que, reformuladas por Porfírio, representam: gênero, espécie, diferença, pro-
priedade e acidente. Porfírio (séc. IV), na sua obra Isagoge ou Introdução às categorias,
aplicando o princípio da oposição de Platão e Aristóteles, apresentou uma classificação
dicotômica constando de cinco predicáveis ou categoremas representados na famosa classi-
ficação Árvore de Porfírio ou Arvore de Remée (divulgada no século XVI pelo filósofo
francês Pierre de la Remée):
Objeto (matéria)
Objeto material (+ essência : forma e conteúdo)
Suporte da informação (+ memória)
Documento (+ tempo de publicação)
Periódico
a) Completude
A divisão do conceito deve ser completa, adequada e ordenada por complexidade
crescente, isto é, enumerar todos as espécies de que o gênero se compõe, do simples ao
complexo ou do abstrato ao concreto. Por exemplo, aplicando-se a característica nível de
ensino, a divisão abaixo está completa, com todas as espécies enumeradas.
80
b) Irredutibilidade
A divisão deve garantir que a cada dedução conceitual os conteúdos sejam irredutí-
veis entre si, isto é, não se deve enumerar mais do que os elementos verdadeiramente dis-
tintos entre si, de maneira que nenhum esteja compreendido no outro. Se, tal como no e-
xemplo, o conceito de inteligência está contido no conceito de alma, ele não pode integrar
o primeiro nível de derivação conceitual, coordenado à alma e ao corpo. O conceito de
inteligência é um conceito subordinado à alma.
c) Mútua exclusividade
A divisão deve ser fundada no mesmo princípio, isto é, servir-se de membros ver-
dadeiramente opostos entre si. Para cada derivação conceitual deve-se usar apenas uma
característica do conceito. No exemplo abaixo, a divisão do conceito biblioteca considerou
duas características de derivação ao mesmo tempo: disciplina e tamanho. Embora a espécie
esteja de acordo com o gênero, uso de duas diferenças concomitantes configura um erro
lógico.
81
A organização conceitual deve garantir que a classificação obtida tenha por quali-
dades: ser completa; ser irredutível; e, ser mutuamente exclusiva.
Com a divisão lógica, os conceitos vão se relacionar pela hierarquia do processo de
derivação conceitual, sendo fundamental o domínio de seu conteúdo. Para tanto, devemos
considerar uma idéia ou conceito do ponto de vista de sua intensão (ou compreensão) e de
sua extensão. Se tomarmos como exemplo a divisão:
idéia superior em extensão se chama gênero em relação à idéia inferior, e esta, espécie em
relação à primeira. Assim, quanto maior é a intensão (número de caraterísticas do concei-
to), menor é a extensão (número de membros ou espécies) de uma classe, e vive-versa.
Embora as relações hierárquicas sejam as mais freqüentes na organização de con-
ceitos para a construção de linguagens documentárias, elas não devem ser as únicas a se-
rem consideradas no processo de construção de linguagens documentárias.
Wanderley8, citando Mills, considera as seguintes limitações impostas pelo uso da
divisão lógica na concepção de classificações bibliográficas:
a) a relação de gênero para espécie, de uma coisa para suas variedades, é apenas
uma das relações de fato utilizadas nas classificações bibliográficas;
b) é inadequado limitar-se a divisão às características que constituem qualidades
genéricas essenciais.
c) é comum o uso de características acidentais, quando mais apropriadas para o en-
tendimento do contexto, sem que isto fira a lógica da derivação conceitual;
d) não é sempre exeqüível, ao dividir-se um gênero por características sucessivas,
ater-se a uma regra de todo coerente;
e) a divisão lógica não pode impor uma ordem privilegiada de aplicação de caracte-
rísticas.
f) o mesmo ocorre quanto ao arranjo das classes, o qual teoricamente não obrigaria
à anteposição do geral para o particular, do abstrato ao concreto, nem privilegiaria qualquer
ordem dentro de uma série de subclasses coordenadas;
g) por fim, não existe uma correspondência biunívoca entre documentos e termos
de classes, o que se soma à natural complexidade das relações entre as próprias ciências e
ao caráter interdisciplinar da pesquisa moderna.
Tais limitações, no entanto, só fazem demonstrar o caráter subjetivo, arbitrário das
classificações, quer dizer: a decisão quanto ao ponto de vista a se adotar na divisão lógica;
deve ser lógica na formação e relacionamento conceituais, mas flexível nas aplicações ob-
jetivas.
Predicação conceitual
De acordo com Dahlberg9, a linguagem permitiu ao homem relacionar-se com os
vários objetos que o circundavam e permitiu também que ele elaborasse enunciados sobre
eles. Toda vez que o objeto é pensado como único, distinto dos demais, constituindo uma
unidade inconfundível (coisas, fenômenos, processos, acontecimentos, atributos) pode-se
falar em objetos individuais, isto é: objetos únicos, definidos, distintos de outros, com pre-
sença de tempo e espaço , por exemplo: O menino (este menino específico). Mas, além dos
objetos individuais, podemos referir-nos a objetos gerais, quando não se trata de nada úni-
co, mas de algo que ocorre em várias situações, de um tipo geral, que, de certo modo, pres-
cindem das dimensões tempo e espaço- Um menino (qualquer menino).
Com a ajuda das línguas naturais é possível formular enunciados a respeito tanto
dos objetos individuais como dos objetos gerais. Cada enunciado verdadeiro representa um
elemento, atributo ou característica do conceito. Efetuando-se a predicação de um objeto
individual, identificam-se os elementos, como abaixo:
Se tomarmos o objeto geral /Instituição/, sobre ele poderemos formular os seguintes enun-
ciados verdadeiros:
Do mesmo modo, a soma total dos enunciados verdadeiros de um objeto geral re-
sulta no conceito geral deste objeto. No entanto, ao comparar o elenco de atributos dos dois
tipos de conceitos, podemos perceber que nos conceitos individuais há sempre elementos
dos conceitos gerais, o que significa que é possível, portanto, inferir conceitos gerais a par-
tir de conceitos individuais. Isto é o que permite que no processo indutivo, por inferência,
possa-se chegar à uma classe geral, partindo-se de um objeto particular. Pode-se, assim,
considerar a formação dos conceitos como a reunião e a compilação de enunciados verda-
deiros a respeito de determinado objeto. Para fixar o resultado dessa compilação, usamos a
palavra ou qualquer signo que possa traduzir ou fixar essa compilação. É possível, então,
definir conceito como a compilação de enunciados verdadeiros sobre determinado objeto,
fixada por um símbolo lingüístico.
Se o conceito pode ser compreendido como um portador de elemen-
tos/características, obtidos pela predicação de seu referente, para fins de comunicação é
necessário sintetizar os elementos do conceito em uma expressão, ou combinação de pala-
vras, a fim de que se possa manipulá-lo ou, até mesmo, designá-lo por um código ou sinal.
Dahlberg10 apresenta, assim, um modelo conceitual para a organização do conhecimento e
estudos terminológicos, denominado Teoria Analítica do Conceito (orientada para referen-
te), visando à comunicação entre indivíduos, tendo como intermediário a informação regis-
trada. Utilizando o significado de conceito como sinal e conteúdo, Dahlberg defende que
as características do conceito são entendidas como elementos de conhecimento, e a soma
86
Segundo Dahlberg, muitas vezes não se trata de um atributo a que corresponde uma
característica, mas de uma hierarquia de características, já que o predicado de um enuncia-
do pode tornar-se sujeito de novo enunciado, e assim sucessivamente, até que se atinja uma
característica tão geral que possa ser igualada a uma categoria, como abaixo:
De acordo ainda com Dahlberg, outras espécies de objetos, como as plantas, podem
ter características diferentes. O mesmo ocorre com os produtos, como máquinas, equipa-
mentos. Nesse caso, as características essenciais são determinadas pelas finalidades e pela
aplicação, e as características acidentais dependem da respectiva eficiência ou valores, em
geral práticos. Essa também é a opinião de Gomes 12, que acrescenta às duas categorias
gerais (naturais e acidentais) outras em função do tipo de objeto, tais como características
equivalentes e não-equivalentes; características independentes e dependentes.
O conhecimento das carcterísticas conceituais vai permitir realizar, com maior pro-
priedade as ações de: definição dos conceitos; formação dos nomes dos conceitos; e, orde-
nação classificatória. Para o estabelecimento de comparações por semelhanças e diferenças
entre os conceitos, quer seja para defini-los, nomeá-los ou ordená-los, há que se falar em
relações conceituais. Do ponto de vista epistemológico, o conceito pode ser analisado se-
gundo as ações mentais, ou seja, a habilidade da mente em comparar algo novo com co-
nhecimento adquirido. Esse tipo de conhecimento subjetivo necessita tornar-se acessível e
verificável, explícito, objetivo. As possíveis comparações, segundo Dahlberg, podem ser
classificadas em lógicas ou formais; categorias formais; e materiais ou de conteúdo, sendo
esta última baseada na primeira. Com a finalidade de demonstrar o caráter deduti-
89
Quando um conceito pode ser representado por vários símbolos distintos ou quando
se quer reduzir, por questões pragmáticas, os níveis de implicação conceitual, estabelecem-
se as relações de equivalência semântica. Tais relações vão permitir controlar os três con-
juntos de dispersões semânticas, característicos da língua natural; léxicas, simbólicas e
sintáticas.
Dispersão léxica
sinônimos (professor e docente)
quase sinônimos ( linguagem documentária e tesauro)
Dispersão simbólica
grafias diferentes (conceptual e conceitual)
abreviaturas (Unirio e Universidade do Rio de Janeiro)
razão social e nome fantasia (Telefonica celular e TELERJ Celular SA)
tradução (software e programa)
Dispersão sintática
coordenação (instituições de ensino e ensino, instituição; aprendizagem e ensi-
no/aprendizagem)
gênero e número (casa e casas; aluno e aluna)
A equivalência entre dois símbolos é representada pela identidade de suas caracte-
rísticas, de modo que a soma dos atributos verdadeiros, resultado da análise de cada um,
possa gerar um único e mesmo conceito. Ao contrário, quando um mesmo símbolo é iden-
tificado com dois ou mais conjuntos de características distintas, o que se configura é a po-
lissemia, isto é, dois ou mais significados nomeados por um mesmo símbolo. Neste caso,
os símbolos devem ser distinguidos por meio de qualificadores, o que os transformará em
novos símbolos, cada um no lugar de um único significado conceitual. Por exemplo:
venda (processo) e venda (produto)
cedo(verbo ceder) e cedo (advérbio de tempo)
90
Vale ressaltar, que devemos sempre preferir relacionar os conceitos por suas carac-
terísticas essenciais, de modo que sejam evitados os relacionamentos acidentais do tipo:
animais de estimação (gênero) gatos (espécie), já que todos os gatos são animais, mas nem
todos os gatos são animais de estimação.
• Relações partitivas
A relação partitiva existe entre um todo e suas partes. Em relação aos conceitos e
suas características, isto significa que o conceito de um todo, por exemplo, um corpo, um
organismo, um sistema, inclui como suas características os conceitos de suas partes. Por
92
exemplo: A árvore é composta de raízes, tronco, galhos, folhas, flor e frutos. As caracterís-
ticas de /raiz/ integram as características de /árvore/.
tica do verbo é a soma dos lugares a serem preenchidos de acordo com a ligação deste con-
ceito com outros. O Roget’Thesaurus aplica não só a valência semântica para relacionar as
palavras da língua inglesa, como as categorias gramaticais (nome, verbo, adjetivo, advér-
bio) nas quais são classificados os conceitos.
Caso se trate da valência semântica do verbo medir, teremos que responder às se-
guintes questões:
94
pelo empirismo, quer dizer pelo conhecimento do campo conceitual. No limite, pode-se
afirmar que todos os conceitos se relacionam entre si. Qual a relação existente entre ca-
chorro e árvore? Não é uma relação de gênero/espécie - cachorro não é uma espécie de
árvore e vice-versa. Não é uma relação de parte/todo - cachorro não é uma parte da árvore e
vice-versa. Mas o cachorro tende a urinar nas árvores. Esta é uma relação do tipo associati-
vo. Pinto13 enumera algumas possibilidades de associação entre os conceitos:
a) causa e efeito → medicamento/cura de doenças
b) concorrência → ensino/aprendizagem
c) constituição → janelas/alumínio
d) agente → iluminador/iluminação
rentes desta, pois se não houvesse o objeto não haveria a relação, paixão etc. Aristóteles
reduz, posteriormente, as dez categorias a três:
• Substância - o ser que existe
• Modo - ou acidente, é o que existe na substância, seus modos de ser
• Relação - é o que liga um ser a outro
Piedade apresenta a relação das categorias aristotélicas com as categorias gramati-
cais, o que, de fato, é muito importante para a análise conceitual do texto que se quer inde-
xar e, consequentemente, para o estabelecimento das relações conceituais em um tesauro.
Para o Padre Leme Lopes apud70 , poder-se-ia formular o seguinte exemplo de in-
terseção entre as categorias gramaticais e aristotélicas:
O grande quantidade adjetivo quantitativo
cavalo substância substantivo
castanho qualidade adjetivo qualitativo
do cavaleiro relação adjunto adnominal
está ação verbo ativo
arreado maneira de ser advérbio de modo
de manhã tempo advérbio de tempo
no pátio lugar advérbio de lugar
Dahlberg também faz uma releitura dessas categorias, reagrupando-as no que de-
97
Ainda em Dahlberg, uma categorização formal dos conceitos que têm importância
na formação dos sistemas e na combinação dos mesmos conceitos pode ser a seguinte:
• objetos ex: plantas, produtos, papel
pode ser igualado à Categoria, tal como as categorias aristotélicas, por exemplo. Conside-
rando-se, no entanto, o processo de derivação conceitual, o significado de Faceta pode ser
igualado ao de Característica.
99
Faceta 1
NÍVEL DE ENSINO
Pré-escolar
1º Grau
2º Grau
3º Grau
Faceta 2
MÉTODO DE ENSINO
Instrução Programada
Audiovisual
Faceta 3
DISCIPLINAS
Português
Inglês
101
momento, tomar algumas decisões antes de prosseguir para a etapa seguinte, que é a da
definição conceitual. No que diz respeito a grafias distintas ou aos termos em duas ou mais
línguas, um indicador de decisão pode ser o da freqüência de aparecimento, já ficando con-
signada uma relação de identidade entre eles. Quanto à forma gramatical de desinência
numérica, pode-se considerar o seguinte:
a) deve haver consistência quanto a plural e singular;
b) nem sempre pode-se afirmar que o plural está para o gênero e o singular
para a espécie.
Na verdade, estamos construindo uma rede conceitual e não uma rede de palavras.
Assim, se a representação do conceito, na sua forma simbólica, for mais geral quando a
palavra estiver no singular, tal forma deve ser a escolhida. Por exemplo: Administração (+
geral) do que Administrações. Pode-se atribuir a esta figura o correspondente à gramática,
denominada concordância mental ou silepse. Uma outra possibilidade é a de considerar
para os substantivos, tal como na língua inglesa, a propriedade de serem numericamente
contáveis ou não (much e many), ex: dinheiro; casas. Os demais aspectos ou problemas
encontrados nesta etapa serão resolvidos com o estabelecimento das definições conceituais.
103
Ainda em Dahlberg, vale ressaltar que com a ajuda da distinção aristotélica entre
gênero próximo e diferença específica é possível estruturar as formas simples e complexas
das definições reais. Em todos os casos encontramos no definiens um conceito mais amplo
do que está contido no definiendum, seguido de uma característica chamada diferença es-
pecífica ou característica especificadora. Por exemplo: homem = df. mamífero bípede.
104
básicos e indica que, estatisticamente, esses não ultrapassam dez por cento do referido do-
mínio. Para o campo da Engenharia, por exemplo, encontramos os seguintes conceitos bá-
sicos: Edificação, Estrutura, Viga. Como conceitos derivados: Edificação militar, Edifica-
ção industrial, Supraestrutura, Viga hiperestática. Assim, só os primeiros precisam ser de-
finidos, uma vez que, do ponto de vista pragmático, as deduções subseqüentes são de fácil
apreensão, até porque Militar, Industrial, Supra etc. possuem multivalências, sendo mais
fácil apreender a combinação. Não resta dúvida que, se não soubermos o sentido de Mili-
tar, por exemplo, teremos que, forçosamente, considerar este termo combinatório como um
conceito a ser compreendido. As definições devem ser anotadas na ficha terminológica, a
fim de que, a qualquer momento, possamos recuperá-las para decidir qual o mais adequado
relacionamento entre os conceitos.
A organização dos conceitos é conduzida por processo de indução/dedução ou rela-
ção. À medida que as associações vão se constituindo, novos conceitos podem surgir como
complemento à organização de cada faceta. Assim, somente ao final do processo, as facetas
serão conhecidas, embora se tenha, previamente, uma idéia genérica das características
essenciais dos conceitos básicos, uma vez que estes já sofreram o processo de definição
conceitual.
106
Aprendizagem
USE ENSINO APRENDIZAGEM (coordenação)
TÊNIS (esporte)
ABSORÇÃO
NE Fenômeno. Inclui a absorção de radiação eletromagnética.
ENSINO
NE Processo de ensino aprendizagem.
De acordo com Gomes, é recomendável que os termos dos tesauros sejam apresen-
tados em ordem sistemática para:
109
a) permitir que o usuário encontre o termo que melhor represente o conceito que ele
deseja exprimir, sem que saiba, no início da busca, qual o mais adequado;
b) facilitar a compreensão da lógica do relacionamento e permitir modular as ques-
tões no nível da compreensão conceitual.
c) facilitar a manutenção do tesauro, uma vez que as características que levaram ao
relacionamento conceitual estão explicitadas.
Por fim, do ponto de vista do acompanhamento terminológico, é necessário que se
tenha um registro de cada termo representativo do conceito, com suas relações, faceta, data
de ingresso e responsável23. O exemplo abaixo é uma das opções:
• notação
termo = Documentação
• informação semântica
definição = conjunto de conhecimentos e técnicas que têm por fim a pesquisa, a re-
união, a descrição e a utilização de documentos de qualquer natureza.
• informação estrutural
tipo de natureza dos termos relacionados = difusão, processamento de dados
interpretação dessas relações =parte do processo de ... método mais usado para
...
faceta = Processos informacionais
• informação operativa
frequência de uso = 10
data de inclusão = 5/10/84
data de exclusão = 3/5/96
A construção de tesauro não é tarefa fácil. Cada linguagem construída é única, es-
pecial para um domínio do conhecimento e, portanto, passível de ser modificada na mesma
medida em que as línguas naturais evoluem. Novos conceitos aparecerão, representados
por novos símbolos. Velhos conceitos em desuso podem ser retomados. Os usuários do
sistema de informação para o qual a linguagem foi construída podem ter novas necessida-
110
1
HOLANDA, Aurélio Buarque de. Novo dicionário da língua portuguesa . Rio de Janeiro: Nova Fronteira,
1975. p. 358
2
ABBAGNAMO, Nicola. Dicionário de filosofia. São Paulo : Mestre Jou, 1970. p. 153-154
3 WANDERLEY, M. A. op. cit., p. 193.
4
GOMES, H. E. op. cit., p. 19
5
ECO, Umberto. Semiótica e filosofia da linguagem. op. cit. p. 180.
6
Cf. PIEDADE, Maria Antonieta Requião. Introdução à teoria da classificação . Rio de Janeiro :
Interciência, 1983. p. 17
7
JOLIVET, Regis. op. cit.
8
WANDERLEY, M. A. Limitações dos sistemas tradicionais e inovações neles introduzidos. Rio de Janeiro
: Uni-Rio, 19. Notas de aula
9
DAHLBERG, Ingetraut. Teoria do conceito. Ci. Inf. Rio de Janeiro, v. 7, n. 2, p.101-107, 1978.
10
DAHLBERG, Ingetraut. Knowledge organization and terminology : philosophical and linguistic bases.
International classification, v. 19, n. 2 , p. 65-71, 1992.
11
GOMES, op. cit., p. 20
12
GOMES, op. cit., p. 20-23
13
PINTO, Maria Cristina. op. cit.
14
Motta, Dilza Fonseca da. op. cit.
111
15
Piedade, M. A. R. op. cit. p. 20
16
PIEDADE, M. A . R. op. cit p. 21-22
17
TECER: programa de elaboração de tesauros em microcomputador. Brasília : CNPq/IBICT, 1989.
18
Gomes, H. E. op. cit., p. 25.
19
DAHLBERG, I. Teoria do conceito. Ci. Inf., Rio de Janeiro, v. 7, n. 2, p. 101-107, 1978.
20
GOMES, H, E. op. cit., p.
21
DAHLBERG, I. Structure and construction of classification systems. Rio de Janeiro, 1975. Notas de aula.
22
MOTTA, Dilza Fonseca da. Método relacional como nova abordagem para a construção de tesauros . Rio
de Janeiro : SENAI, 1987.
23
Existem estudos para o desenvolvimento dos chamados tesauros dinâmicos, que são construídos e
atualizados automaticamente à medida em que as coleções para as quais servem como instrumento de ajuda
na recuperação, incorporam e retiram documentos. Cf. http://dewey.yonsel.ac.kr/memexlee/doc/thes_ads.htm
Capturado em 09/10/2001.
6 A Propósito
Este livro começou a ser escrito em 1983, ano em que ingressei na Universidade do
Rio de Janeiro (Unirio). O tema Tesauro já havia sido objeto de minha dissertação de mes-
trado, defendida em 1979 no Instituto Brasileiro de Informação em Ciência e Tecnologia
BEGHTOL, Claire. Domain analysis, literary warrant and consensus: the case of fiction
studies. Journal of the American Society for Information Science. v. 46, n. 1, p. 30-44,
1995.
BRITO, Marcílio de. Sistemas de informação em linguagem natural: em busca de uma in-
dexação automática. Ci. Inf., Brasília, v. 21, n. 3, p. 223-232, set./dez., 1992.
CINTRA, Ana Maria Marques et al. Para entender as linguagens documentárias. São
Paulo : Polis : APB, 1994.
CINTRA, Ana Maria Marques. Estratégias de leitura em documentação. In: SMIT, Joa-
hanna W. (coord.) Análise documentária: a análise da síntese. Brasília: SCT-
PR/CNPq/IBICT, 1898. p. 30-38.
COULON, Daniel, KAYSER, Daniel. Informática e linguagem natural: uma visão geral
dos métodos de interpretação de textos escritos. Brasília: SCT-PR/CNPq/IBICT, 1992.
CUNHA, Isabel M. R. Ferin. Análise documentária : parâmetros teóricos. In: SMIT, Joa-
hanna W. (coord.) Análise documentária: a análise da síntese. São Paulo: USP, 1986.
CUNHA, Maria Isabel R. Ferin. Do mito à análise documentária. São Paulo: EDUSP,
1990. (Tese de doutorado)
115
DOYLE SILVA, Ernani, FERREIRA, Lélio. Dicionário inverso. Rio de Janeiro: Abril,
1956. fasc. 1.
ECO, Umberto. A estrutura ausente: introducão à pesquisa semiológica. São Paulo: Pers-
pectiva, 1991.
10, 20, 40. A. C. A abordagem temática da informação. São Paulo : Polígono, 1973. p.
FOSKETT,
FOSKETT, D. .J. A study of the role of categories in a thesaurus for education documen-
tation. Strasbourg : Council of Europe, 1972.
GOODMAN, F. The role and function of the thesaurus in education. In: THESAURUS
of ERIC descriptors. New York : CCM Information Corporation, 1972.
GROLIER, Eric de. Étude sur les catégories générales applicables aux classifications et
codifications documentaires. Paris: UNESCO, 1962. p. 262.
HAGGET, P., Chorley, R.J. Modelos, paradigmas e a nova Geografia. In: ________.
Modelos sócio-econômicos en Geografia. Rio de Janeiro: Livros Técnicos e Científicos /
USP, 1975.
JARDIM, José Maria. Cartografia de uma ordem imaginária: uma análise do sistema
nacional de arquivos. (Dissertação de Mestrado em Ciência da Informação. Escola de
Comunicação, Universidade Federal do Rio de Janeiro, 1994)
MERLEAU PONTY, Maurice. O visível e o invisível. São Paulo: Perspectiva, 1992. p22
MOTTA, Dilza Fonseca da. Método relacional como nova abordagem para a construção
de tesauros. Rio de Janeiro : SENAI, 1987.
SAUSSURE, Ferdinand de. Curso de Lingüística geral. São Paulo: Cultrix, 1974. p.
136-139.
SOERGEL, D. Indexing languages and thesauri : construction and maintenance. Los An-
geles : Wiley - Becker & Hayes, 1974.
SPIRKIN, A. G. Origen del lenguaje y su papel en la formación del pensamiento. In: Les
théories de l’action. Paris, Hachette, 1972.
TECER: programa
CNPq/IBICT, 1989. de elaboração de tesauros em microcomputador. Brasília :