Gramática Formal - e
Gramática Formal - e
Gramática Formal - e
Gramática formal
Una gramática formal es una estructura lógico-matemática
con un conjunto de reglas de formación que definen las cadenas
de caracteres admisibles en un determinado lenguaje formal o
lengua natural. Las gramáticas formales aparecen en varios
contextos diferentes: la lógica matemática, las ciencias de la
computación y la lingüística teórica, frecuentemente con
métodos e intereses divergentes.
Introducción
Una gramática formal es un conjunto de reglas para reescribir cadenas de caracteres, junto con un
símbolo inicial desde el cual debe comenzar la reescritura. Por lo tanto, una gramática formal
generalmente se piensa como una generadora de lenguajes. Sin embargo, a veces también puede ser
usada como la base para un "reconocedor": una función que determina si una cadena cualquiera
pertenece a un lenguaje o es gramaticalmente incorrecta.
Hay distintos tipos de gramáticas formales que generan lenguajes formales (véase la jerarquía de
Chomsky). Imaginemos una gramática con estas dos reglas:
1. A → bA
https://es.wikipedia.org/wiki/Gramática_formal 1/6
7/7/2020 Gramática formal - Wikipedia, la enciclopedia libre
2. A → c
El elemento en mayúsculas es el símbolo inicial. Los elementos en minúsculas son los símbolos
terminales. Para generar cadenas de caracteres, la idea es sustituir el símbolo inicial de la izquierda
por los símbolos de la derecha, y luego repetir el proceso hasta que sólo haya símbolos terminales.
Por ejemplo:
Esta gramática da lugar a un lenguaje formal que consiste en el conjunto de todas las cadenas de
caracteres que pueden ser generadas por medio ellas. Por ejemplo: bbbc, bbbbbbbbc, c, bc, etc.
Para comprender mejor la idea, podemos considerar un modelo de reescritura para el español:
Estas reglas pueden utilizarse para generar la frase "el niño duerme plácidamente", así:
Vemos que existen unas definiciones especiales como ORACIÓN, SUJETO, etc. que no aparecen en la
frase final formada. Son unas entidades abstractas denominadas "categorías sintácticas" que no son
utilizables en una oración (tienen un papel similar al de las categorías gramaticales de las lenguas
naturales). E igualmente el mismo sistema permite derivar otras oraciones similares usando formas
las formas léxicas entre paréntesis:
Det N V COMP
niño duerme
plácidamente
El hombre ríe
intranquilo
anciano come
Las categorías sintácticas definen la estructura del lenguaje representando porciones más o menos
grandes de las frases. Existe una jerarquía interna entre las categorías sintácticas.
La categoría superior sería la FRASE que representa una oración válida en lengua castellana.
Por debajo de ella se encuentran sus componentes. Ninguna de estas categorías dan lugar a frases
válidas solo la categoría superior.
Al finalizar toda la jerarquía llegamos a las palabras que son las unidades mínimas con significado
que puede adoptar una frase.
https://es.wikipedia.org/wiki/Gramática_formal 2/6
7/7/2020 Gramática formal - Wikipedia, la enciclopedia libre
Aplicando las jerarquías y sustituyendo elementos, llegamos al punto en donde todas las categorías
sintácticas se han convertido en palabras, obteniendo por tanto una oración válida; como por
ejemplo: El niño corre. Este proceso se llama producción o generación.
Las gramáticas formales categoriales (C-gramáticas) que usan un análisis de abajo a arriba y
requieren el uso de etiquetas de categoría para cada secuencia formada o constituyente
sintáctico propiamente dicho. Existe una única categoría superior que denota cadenas completas
y válidas.
Las gramáticas de estructura sintagmática (ES-gramáticas, en inglés PS-grammars) basadas
en reglas de reescritura y con un análisis de arriba abajo. Al igual que las C-gramáticas se basan
en la noción de constituyente sintáctico.
Las gramáticas asociativas (por la izquierda) (A-gramáticas, en inglés LA-grammars), que usa
usa un análisis de abajo a arriba, que permiten un análisis en de complejidad lineal, aunque
ignoran el concepto de constituyente sintáctico.
Los dos primeros tipos tienen puntos de conexión obvia con la noción de constituencia sintáctica y el
análisis mediante árboles sintácticos. Sin embargo, los analizadores sintácticos para las oraciones
formadas según ellas no pueden basarse en las reglas de generación (asimetría hablante-oyente), lo
cual sugiere que no puedan ser buenos modelos de la intuición de los hablantes. Además los modelos
de lengua natural basados en ellas parecen tener una complejidad polinómica o exponencial, lo cual
no parece avenirse con la velocidad con que los hablantes procesan las lenguas naturales. Por contra
las A-gramáticas en general tienen complejidad lineal, simetría entre hablantes y oyentes, sin
embargo, ignoran los constituyentes clásicos del análisis sintáctico. Sin embargo, siguen siendo
usadas para los analizadores sintácticos usados en computación.
Una gramática categorial o C-gramática es una basada en categorías gramaticales. Las formas léxicas
y secuencias formadas a partir de ellas están etiquetadas con categorías que indican el tipo de entidad
formada y sus posibilidades combinatorias (por ejemplo en una lengua nominal una secuencia de
palabras puede constituir un sintagma nominal lo cual especifica con qué otro tipo de categorías
puede combinarse este sintagma para formar otro sintagma mayor).
Las gramáticas categoriales se pueden definir como una estructura formal algebraica. Una gramática
categorial es un quíntupla con las siguientes propiedades:
1. (words) es el conjunto no vacío de formas bien formadas de la lengua (en una lengua natural
W podría interpretarse como secuencias de fonemas que forman expresiones, irrespectivamente
de su categoría gramatical).
2. (categories) es el conjunto no vacío de categorías posibles. Para que este conjunto sea un
conjunto de categorías aceptable se exige que si entonces también existan las categorías
https://es.wikipedia.org/wiki/Gramática_formal 3/6
7/7/2020 Gramática formal - Wikipedia, la enciclopedia libre
En la definición clásica que dio Noam Chomsky en la década de 1950, una gramática formal de
estructura sintagmática (ES-gramática) es una cuádrupla G = (N,T,S,P) donde:
donde * es la clausura de Kleene. Esto es, cada regla de producción mapea de una cadena de símbolos
a otra, donde la primera cadena contiene al menos un símbolo no terminal. En el caso de que la
segunda cadena sea la cadena vacía, para evitar confusión se la denota con una notación especial
(usualmente , o ).
Derivaciones
https://es.wikipedia.org/wiki/Gramática_formal 4/6
7/7/2020 Gramática formal - Wikipedia, la enciclopedia libre
Jerarquía de Chomsky
Cuando Noam Chomsky formalizó la idea de las gramáticas generativas en 1956, clasificó este tipo de
gramáticas en varios tipos de complejidad creciente que forman la llamada jerarquía de Chomsky. La
diferencia entre estos tipos es que cada uno de ellos tiene reglas más particulares y restringidas y por
tanto generan lenguajes formales menos generales. Dos tipos importante son las gramáticas libres de
contexto (Tipo 2) y las gramáticas regulares (Tipo 3). Las lenguas que pueden ser descritas mediante
esos tipos de gramáticas son lenguas libres de contexto y lenguas regulares, respectivamente. Estos
dos tipos son mucho menos generales que las gramáticas no restringidas de Tipo 0 (es decir, que
pueden ser procesadas o reconocidas mediante máquinas de Turing). Estos dos tipos de gramáticas se
usan más frecuentemente puesto que los analizadores sintácticos para estos lenguajes pueden
implementarse de manera eficiente.1 Por ejemplo, todas las lenguas regulares pueden ser
reconocidas por un autómata finito. Para subconjuntos de gramáticas libres de contexto, existen
algoritmos para generar analizadores sintácticos LL y analizadores sintácticos LR eficientes, que
permiten reconocer los correspondientes lenguajes generados por esas gramáticas.
Las ES-gramáticas como la usada en los primeros modelos de gramática generativa requieren ciertas
restricciones para ser computacionalmente tratables. Para entender esa restricción debe considerarse
la interacción entre un hablante y un oyente, el primero genera una oración o secuencia de acuerdo
con las reglas de la gramática, el segundo para entender dicha secuencia debe analizar la secuencia
para entenderla, encontrando los elementos formantes, interpretándolos y reconstruyendo la relación
hay entre ellos (estructura interna). Para que eso segundo sea posible se requiere que la estructura
interna tenga una estructura suficientemente simple como poder analizar sintácticamente las
secuencias con un bajo grado de ambigüedad. Pues bien computacionalmente se ha encontrado que la
clase de complejidad frente al análisis inverso de ciertas gramáticas es excesiva. Para ES-gramáticas
basadas en reglas de reescritura se tiene:
https://es.wikipedia.org/wiki/Gramática_formal 5/6
7/7/2020 Gramática formal - Wikipedia, la enciclopedia libre
deducción válidas. Estas dos últimas permiten establecer secuencias de fórmulas bien formadas
(palabras del lenguaje formal) que constituyen demostraciones válidas dentro del sistema formal (son
de alguna manera el equivalente a la sintaxis de la lengua formal).
Véase también
Jerarquía de Chomsky
Analizador sintáctico
Referencia
1. Grune, Dick & Jacobs, Ceriel H., Parsing Techniques – A Practical Guide, Ellis Horwood, England,
1990.
Bibliografía
Obtenido de «https://es.wikipedia.org/w/index.php?title=Gramática_formal&oldid=125624137»
Esta página se editó por última vez el 29 abr 2020 a las 20:05.
El texto está disponible bajo la Licencia Creative Commons Atribución Compartir Igual 3.0; pueden aplicarse cláusulas
adicionales. Al usar este sitio, usted acepta nuestros términos de uso y nuestra política de privacidad.
Wikipedia® es una marca registrada de la Fundación Wikimedia, Inc., una organización sin ánimo de lucro.
https://es.wikipedia.org/wiki/Gramática_formal 6/6