Vous êtes sur la page 1sur 4

Alfabetos, cadenas y lenguajes

Definicin 2.1 Un alfabeto es un conjunto finito no vaco de smbolos y se denota


como .

La pertenencia de un smbolo a un alfabeto se denota como .


Ejemplo: Podemos representar el alfabeto de las letras minsculas que utiliza el idioma
espaol, el cual contiene los 27 smbolos siguientes:

y sabemos que la letra pertenece a este alfabeto, lo cual denotaremos como .


Ya sabemos que los alfabetos son conjuntos, por lo que, todas las operaciones de conjuntos

se pueden aplicar a los alfabetos tambin. Sean alfabetos, y ya que los

alfabetos son conjuntos finitos, no vacos, la unin de un nmero finito de ellos

resulta en un conjunto no vaco y finito, esto es, si

y
La unin de un nmero arbitrario finito de alfabetos resultar en un conjunto finito y no

vaco, es ms, si y , son conjuntos no vacos,

entonces son conjuntos finitos, no vacos, y por lo tanto


sern considerados alfabetos vlidos.

Definicin 2.2

Una cadena o palabra es una secuencia finita de smbolos que pertenecen a un alfabeto y
comnmente se denota con la letra . La cadena vaca se denota como y es una
secuencia vaca de smbolos tomados de cualquier alfabeto .

S el alfabeto es el espaol, algunas cadenas pueden ser , y .


Dada la definicin anterior, cualquier palabra que contenga los smbolos del alfabeto es una
cadena vlida, sin importar si esta tiene o no significado alguno.

Si es cualquier cadena, su longitud se denota como , la longitud de una cadena es el


nmero de smbolos que contiene, por ejemplo, si tenemos la cadena

sobre el alfabeto espaol, . La cadena vaca no tiene smbolos, por lo

que
Definicin 2.3

Un lenguaje es un conjunto de cadenas sobre un alfabeto definido, stas pueden ser


cualquier cadena , que cumpla con lo siguiente, est formada por los

smbolos donde .

El lenguaje vaco es aquel que no contiene cadenas y no es lo mismo que el lenguaje

formado por la cadena vaca , ste lenguaje se denota de la misma manera que el

conjunto vaco, .
S se tiene una cadena sobre un alfabeto y es el lenguaje compuesto por algunas de

las cadenas sobre el alfabeto y , entonces diremos que es un miembro de .

Definicin 2.4 Un lenguaje universal sobre algn alfabeto , o cerradura de , es el


lenguaje que contiene todas las cadenas que es posible formar con los smbolos de y se
denota como .

Ejemplo: Sea , entonces

Podemos observar que para cualquier alfabeto , es infinito, ya que los alfabetos son
conjuntos no vacos.

Tipos de lenguajes.

Lenguaje natural (castellano)

Nosotros estamos relacionados con el concepto tradicional de gramtica que, de esta forma
intuitiva, podemos considerar un conjunto de reglas el cual nos indican que es correcto y
que no lo es del, lenguaje natural. Con este fin podemos acrcanos a la definicin ms clara
y formal de la lengua castellana. Es el lenguaje no construido.

Lenguaje artificial.

En matemticas, lgica, y las ciencias computacionales, un lenguaje formal es un conjunto


de palabras (cadenas de caracteres) de longitud finita formadas a partir de un alfabeto
(conjunto de caracteres) finito.

Mrquez, J. (2016). Lenguajes y autmatas 1. Disponible en


http://www.academia.edu/15275019/Lenguajes_y_Aut%C3%B3matas_1 el 3 de Julio de
2016.
Alfabeto: Conjunto no vaco y finito de smbolos. A estos smbolos tambin se les suele
llamar letras del alfabeto. Se denota con la letra griega .
Ejemplos:
1 = {a,b,c,...,z} 2 = {0,1}
Lenguaje: Un conjunto de palabras (tambin llamadas cadenas) formadas por smbolos de
un alfabeto. Las gramticas permitirn definir la estructura de los lenguajes, es decir,
proporcionarn las formas vlidas en las que se pueden combinar los smbolos del alfabeto
para construir cadenas correctas.
L definido sobre un alfabeto , es un conjunto cualquiera de palabras definidas sobre dicho
alfabeto, por lo tanto, L ().
Existen diferentes tipos de tokens y a cada uno se le puede asociar un tipo y, en algunos
casos, un valor. Los tokens se pueden agrupar en dos categoras:
Cadena: Es una secuencia finita de smbolos que pertenecen a un alfabeto y comnmente
se denota con la letra .
Cadenas especficas, como las palabras reservadas (if, while, ...), signos de puntuacin (., ,,
=, ...), operadores aritmticos (+,*, ...) y lgicos (AND, OR, ...), etc. Habitualmente, las
cadenas especficas no tienen asociado ningn valor, slo su tipo.
Cadenas no especficas, como los identificadores o las constantes numricas o de texto.
Las cadenas no especficas siempre tienen tipo y valor. Por ejemplo, si dato es el nombre de
una variable, el tipo del token sera identificador y su valor ser dato. Frecuentemente el
analizador lxico funciona como una subrutina del analizador sintctico. Para el diseo de
analizadores lxicos se utilizan los Autmatas Finitos.
Como se ha explicado en el apartado anterior, en un lenguaje, se tiene que los elementos
ms simples, son los smbolos llamados letras que constituyen un alfabeto , que es un
conjunto finito de smbolos { 1, 2 ,..., n }. Con la concatenacin de las letras,
formaremos palabras que determinan un conjunto *. El conjunto de palabras que tengan
un significado, constituirn el diccionario del lenguaje (por ejemplo el Webster, diccionario
del ingls). A partir de lo anterior, tendremos que un lenguaje se considera como un
conjunto de oraciones, que usualmente es infinito y, se forman con palabras del diccionario.
En este punto, podemos distinguir entre dos clases de lenguajes; los lenguajes naturales
como el castellano o el ingls, y los lenguajes formales como las matemticas y la lgica.
El lenguaje castellano, de un modo extensivo, puede ser definido como el conjunto
(tericamente infinito) de todas las oraciones en castellano. Como la mayora de los
lenguajes de inters, son recursivos en mayor o menor medida (a partir de una oracin,
existen procedimientos que permiten formar otras mayores y ms complejas), debemos
encontrar propiedades o conjuntos de propiedades, que las definan unvocamente
(definicin intensiva). Dada la oracin castellana: el coche es gris, es posible construir
otras como:
Mi amigo dice que el coche es gris
Si mi amigo dice que el coche es gris, es que el coche es gris
Teora del lenguaje castellano: Aquel que permite la definicin de todas las oraciones en
castellano y as, del lenguaje castellano. Por ejemplo, dado el conjunto de palabras
pertenecientes al diccionario del castellano: {el, hombre, tom, compr, baln}, habr
frases que se puedan formar con dicho conjunto que sean correctas con respecto a una
sintaxis y a una semntica, como:
El hombre tom el baln
El hombre compr el baln
De la particularizacin anterior, se desprende que en un lenguaje natural, como el
castellano, la formacin de las oraciones precedi a la formalizacin del lenguaje por medio
de una teora o una gramtica. Por esta razn, un lenguaje es llamado natural, porque es no
artificial o no construido. El calificativo natural, se opone al de formal, el cual
determina un lenguaje que es construido estableciendo una teora y, por ende, se le llamara
artificial. Un lenguaje formal como la lgica, consiste de un conjunto de oraciones,
llamadas frmulas o expresiones bien formadas. La calificacin de lenguaje artificial, se
refiere al hecho de que se forma por medio de reglas de formacin. El calificativo formal,
se refiere especficamente al hecho de que las oraciones de estos lenguajes, consisten de
una lista de smbolos sujetos a diversas interpretaciones. Por otro lado, en los lenguajes
naturales, las palabras en una oracin poseen un significado y tienen su significante. Esto
quiere decir, que independientemente del significado de cada palabra, debemos tener en
cuenta el sentido correcto que stas adquieren, segn el contexto en el que se expresen en
un momento dado. Una de las metas en computacin, es poder especificar rigurosamente
estos significados, por los mtodos de interpretacin de los sistemas formales. Estos
mtodos en cuestin, constituyen las semnticas del lenguaje formal.

Jurado, E. (2008). Teoras de Autmatas y Lenguajes Formales. Espaa: Pedro Cid. 5-


8,15,19.

Vous aimerez peut-être aussi