Vous êtes sur la page 1sur 18

Programacin Web

Instituto Tecnolgico de la Laguna

UNIDAD 1
Introduccin a las Tecnologas Web
1 Perspectiva Histrica de Internet
Internet es la red de computadores ms grande del mundo. Su misin principal es
ofrecer acceso a inimaginables cantidades de informacin almacenada en esos
computadores conectados a ella y que estn repartidos por todo el planeta. No es un
error pensar en Internet como en dos entes: por un lado, el conjunto de sistemas
informticos que hacen posible la existencia de esta red mundial, y, por otro, la
informacin residente en esos sistemas. Cada vez que alguien publica una informacin
en Internet (un sitio web, por ejemplo) o conecta un nuevo computador, realmente est
contribuyendo al crecimiento de la Red.
Nadie conoce exactamente el tamao de Internet, ya que es un conjunto de redes de
computadores ms pequeas que funcionan de forma independiente, sin un nico lugar
donde se centralicen todas las conexiones. Es como un gran "monstruo sin cabeza, pero
con infinidad de patas".
Internet fue concebida por el ejrcito de los Estados Unidos como un sistema de
comunicaciones seguro que funcionara en caso de ataque. La Red comenz a funcionar
a finales de la dcada de los sesenta como un proyecto de investigacin de la Agencia
de proyectos de investigacin avanzados (ARPA) y recibi el nombre de ARPAnet.
Ms tarde, ARPA pas a denominarse DARPA (Agencia de proyectos de investigacin
avanzados para la defensa). La primera red ARPAnet contaba con cuatro computadores
y fue diseada para demostrar que era factible la construccin de redes compuestas por
computadores separados geogrficamente. Los militares buscaban una forma de
construir redes tolerantes a fallos, de manera que ARPAnet se dise para que
permitiera la transmisin de informacin entre computadores utilizando un sistema
flexible y robusto. En 1972, ARPAnet era pblica y, por entonces, 50 universidades
estaban conectadas a esa red, muchas de las cuales trabajaban en proyectos de
tecnologa militar.
La mayor preocupacin de los militares es la fiabilidad de los computadores. Si una red
militar slo tiene una conexin y algo destruye esa conexin, la comunicacin ya no es
posible y el resultado sera trgico para los soldados que dependieran de la informacin
de esos computadores. ARPAnet era capaz de soportar la prdida de conexin, pues fue
ideada como un esquema con diversas rutas entre los computadores conectados, de
forma que un computador poda enviar informacin a otro a travs de cualquier ruta disponible y no nicamente a travs de una preestablecida.
Con el transcurso del tiempo, cada vez eran ms las universidades e institutos de
investigacin que se conectaban a ARPAnet que, en consecuencia, deriv hacia una red
que slo manipulaba informacin relacionada con proyectos de investigacin. El gobierno norteamericano cre una segunda red con fines nicamente militares, MILnet. En la
dcada de los ochenta, la Fundacin Nacional de Ciencia cre NFSnet, que enlazaba
media docena de supercomputadores a velocidades muy altas. En 1991 se combinaron
las redes MILnet y NFSnet.
Internet es una combinacin de ARPAnet, MILnet, NSI (NASA Science Internet) y
NFSnet, siendo todas ellas la espina dorsal que mantiene la unidad de Internet. Internet
1 / 18
Raymundo Jove Prez

Programacin Web
Instituto Tecnolgico de la Laguna

ha ido evolucionando con los aos, y lo que en principio slo estaba disponible para el
ejrcito y las universidades, se fue abriendo a empresas y, posteriormente, a todos los
dems usuarios. Internet ya no slo es "algo" que sirve de entretenimiento, sino que
cada vez tiene ms importancia como "centro de negocios" y ofrece muchos servicios,
algunos ms conocidos que otros. Entre los ms importantes podemos citar el correo
electrnico (e-mail), los grupos de noticias, Ftp y los chats.

Servicios de Internet
a) El correo electrnico
El correo electrnico es uno de los servicios ms antiguos de Internet y data de principios de la dcada de 1970, aunque nadie se pone de acuerdo sobre la fecha del primer
mensaje. En la actualidad, el correo electrnico sigue basndose en el mismo concepto:
el usuario de un computador escribe un mensaje de texto y lo enva al usuario de otro
computador. El mensaje circula por un laberinto de computadores conectados entre s
hasta llegar a su destino. Para remitir y recibir este tipo de mensajes se utilizan unas
aplicaciones conocidas con el nombre genrico de lectores de correo electrnico.
Outlook Express es uno de los ms conocidos
Adems de los mensajes de texto convencionales, el correo electrnico actual permite
adjuntar otros tipos de archivos (imgenes, por ejemplo) o cifrar los mensajes para que
slo pueda leerlos la persona a quien se envan.

b) Grupos de noticias (UseNet)


UseNet es un servicio algo parecido al correo electrnico, pero con la diferencia que en
lugar de enviar los mensajes a una sola persona, se envan a un lugar comn, donde
muchos usuarios pueden verlos y responder a ellos. UseNet apareci en 1979, cuando
era un servicio que conectaba entre s los computadores de la Universidad de Carolina
del Norte. En la actualidad, UseNet es un servicio muy difundido de Internet, con miles
de apartados (temas) a los que los usuarios pueden enviar mensajes y respuestas: los
temas van desde la informtica y la tcnica, pasando por discusiones sobre asuntos
sociales, religiosos y polticos, hasta la msica, la literatura y el cine.

c) FTP
Las siglas FTP (Protocolo de transferencia de archivos, File Transfer Protocol) se
refieren tanto a un servicio de Internet como a una utilidad UNIX (que ms tarde fue
tambin una utilidad de Windows 95). El servicio FTP de Internet est formado por una
serie de servidores que guardan y distribuyen los archivos. Muchos sitios FTP
pertenecen a fabricantes de hardware y software, que los utilizan para distribuir sus
productos y las correspondientes actualizaciones.
Tambin hay sitios FTP que pertenecen a universidades e instituciones cientficas; por
medio de ellos, estas instituciones hacen llegar utilidades shareware (software que se
prueba antes de comprar; si el programa le resulta de utilidad, debe abonar lo que su
2 / 18
Raymundo Jove Prez

Programacin Web
Instituto Tecnolgico de la Laguna

creador tenga estipulado) a una amplia variedad de usuarios.

d) Chat (charla)
IRC (Conversacin transmitida por Internet, Internet Re/ay Chat) es otro servicio
extraordinariamente popular de Internet. Se trata de un sistema que permite a los usuarios reunirse en torno a un elemento comn, en este caso un servidor IRC, y entablar
una conversacin o charla. Pero no se trata de una conversacin oral, sino que se escribe
en el computador lo que se desea decir.
No busque en las IRC unas conversaciones de muy alto nivel, pues en ellas no intervienen normalmente especialistas universitarios ni ingenieros espaciales. Una gran cantidad de estos grupos de charla (llamados salones o canales) se ocupan de temas
populares o para adultos. Pero cuando aparece alguna noticia que atrae la atencin
pblica, se pueden encontrar varios grupos de noticias donde la gente se dedica a rerse
del asunto en cuestin.

Otros conceptos
A continuacin se explican otros conceptos con los que es conveniente estar familiarizados.

a) Navegador
Es la aplicacin que permite al usuario descargar y visualizar pginas web de cualquier
servidor web del mundo. Como habr supuesto, este acceso se realiza a travs de
Internet. Normalmente, el sistema operativo incorpora una de estas aplicaciones, aunque
de Internet se pueden descargar navegadores de terceros. No pasa nada por tener
instalado ms de un navegador.

b) ISP
ISP es el acrnimo de la expresin inglesa Internet Service Provider, Proveedor de
servicios de Internet. Es una empresa dedicada a conectar a Internet la lnea telefnica o
el cable correspondiente del usuario. Por tanto, es la empresa dedicada a proveer acceso
o conexin a Internet a empresas y particulares.

c) Pgina web
Una pgina web es un documento publicado en la WWW. Normalmente, estas pginas
estn escritas en lenguaje HTML. Son estas pginas las que aprender a crear. Una
pgina web es una parte constitutiva de un sitio web y puede estar enlazada a otras
pginas web mediante vnculos. Normalmente, su contenido est basado en texto e
imgenes, aunque cada vez es ms comn el uso de otros recursos adicionales, como
animaciones, sonidos y vdeos. Por tanto, las pginas web son autnticos documentos
multimedia.
3 / 18
Raymundo Jove Prez

Programacin Web
Instituto Tecnolgico de la Laguna

En resumen, una pgina web es cualquier documento de informacin accesible a travs


de la WWW, con una direccin nica en Internet (URL).

d) Sitio web
Un sitio web (o simplemente sitio) es un conjunto de pginas web accesibles a travs de
Internet, convenientemente enlazadas y con una finalidad concreta. Un sitio web est
identificado por una direccin (URL) nica, que es la direccin de la pgina principal o
home page. Navegando por la Web es posible encontrarse con distintos tipos de sitios
web.
Los sitios web ms sencillos son los compuestos por una sola pgina, en la que se habla
de algo muy concreto. En el siguiente nivel encontramos los sitios web de la gran
mayora (empresas y particulares), compuestos por varias pginas. Actualmente, de este
tipo de sitio web destacan con luz propia los dedicados al comercio electrnico y los de
la banca online.
Los sitios de comercio electrnico son autnticos catlogos en los que una empresa o
distribuidora ofrece sus productos. El usuario elige lo que le interesa y lo aade a un
"carrito de la compra virtual". Una vez finalizada la compra, el usuario revisa el carrito
y procede a pagar, normalmente con tarjeta de crdito.
Ms que nunca, ahora s podemos decir eso de "tener el banco en casa". La gran
mayora de bancos, por no decir todos, disponen de un sitio web en el que se ofrecen
casi todos los servicios bancarios a sus clientes. El cliente no tiene ms que identificarse
convenientemente y proceder a realizar sus operaciones (transferencias, compra y venta
de valores, consulta de saldos, etc.). Todas estas operaciones han de ser validadas
mediante una firma electrnica, tambin nica de cada cliente. Por seguridad, es
conveniente modificar la clave de acceso y la firma digital cada cierto tiempo.
En los primeros aos de Internet los sitios web ms utilizados eran los buscadores, o
motores de bsqueda, que, con el tiempo, se han convertido en portales. En un principio
eran herramientas web que permitan buscar documentos que contenan una
determinada palabra o frase. El resultado era un listado de direcciones web correspondientes a los sitios web donde aparecan esa palabra o frase. El usuario no tena ms
que hacer click en los enlaces propuestos en el listado para acceder a los sitios web en
cuestin.
Muchos sitios web que fueron creados como buscadores han evolucionado hasta convertirse en Portales, puntos de entrada a la Web que ofrecen acceso rpido y sencillo a
infinidad de servicios. Existen portales de mbito general (por ejemplo Yahoo!, MSN,
Lycos o Altavista) y tambin dedicados a un tema especfico (medicina, astrologa,
modelismo, deportes, etc.). Todos ellos tienen algo en comn: una herramienta de
bsqueda que permite buscar por toda la Web (los de mbito general) o por los sitios
web relacionados con el tema del portal.
Los portales de consumidor o mbito general ofrecen buscadores, servicios de correo
electrnico, salas para "chatear", titulares de prensa y otros muchos servicios. El usuario
4 / 18
Raymundo Jove Prez

Programacin Web
Instituto Tecnolgico de la Laguna

puede personalizar muchos de estos portales para que, al conectarse a ellos, se muestre
la informacin que ms le interesa.
Podramos hablar mucho ms sobre los portales y sus tipos, pero con esto es suficiente
para los que nos ocupan.

Optimizacin de un sitio web


Hay varios elementos de un sitio web que pueden ser optimizados. Al optimizar, un
buen diseador web intentar encontrar el equilibrio apropiado entre estos
componentes, desde el punto de vista del diseo y del objetivo del sitio.
Entre los elementos que se deben considerar para la optimizacin estn la accesibilidad,
usabilidad, visibilidad por el motor de bsqueda y la velocidad total de descarga de la
pgina.
A algunas personas puede resultarles extrao el poner accesibilidad y usabilidad como
algo que deba ser optimizado; sin embargo, Internet es un asunto global. La web estall
en Norteamrica, y muchos otros pases se quedaron atrs y todava estn intentando
alanzar el mismo nivel.
Las ideas de usabilidad y accesibilidad llegarn a ser importantes a una escala global en
algn momento, pero de momento hay muchos pases donde an se estn aprendiendo
cosas sobre diseo web que durante aos se han utilizado en Norteamrica. As pues,
aunque los sitios ms recientes pueden contener un diseo bien pensado respecto a su
accesibilidad y usabilidad (asumiendo que el diseador pueda mostrar al cliente que
estas cualidades tienen ventajas), otros muchos sitios existentes necesitarn ser
adaptados u 'optimizados' si no rediseados completamente.

2. Protocolos de Internet
En el mbito de una red de computadores, un protocolo es un conjunto de reglas
formales que permiten la comunicacin entre dos nodos de la red de forma no ambigua.
Esto mismo se puede extrapolar a Internet, teniendo en cuenta que no es ms que una
"red de redes".

2.1 Protocolos TCP/IP


TCP!IP (Protocolo de control de transporte/protocolo Internet, Transmission Control
Protocolllnternet Protocol) es el conjunto de protocolos que se encuentran en el ncleo
de Internet. TCP/IP naci como un experimento de sistema para conectar distintos tipos
de redes y sistemas informticos. Las especificaciones TCP/IP fueron publicadas con
estndares abiertos que no eran propiedad de ninguna compaa, lo que favoreci que
TCP/IP se convirtiera en el "lenguaje" de Internet, permitiendo la comunicacin entre
redes y equipos de casi cualquier tipo. Estos protocolos suelen ser invisibles a los usuarios y definen bsicamente dos cosas: el modo en que se transfiere la informacin entre
5 / 18
Raymundo Jove Prez

Programacin Web
Instituto Tecnolgico de la Laguna

dos computadores (es la tarea del protocolo TCP) y la identificacin de los dispositivos
de una red mediante una direccin nica (tarea del protocolo IP).
El protocolo TCP es el encargado del transporte. Al enviar un mensaje por Internet,
dicho mensaje se divide en paquetes. Cada paquete dispone de la informacin necesaria
para viajar desde su punto de origen hasta su destino por rutas diferentes.
Independientemente de la ruta seguida, y sin entrar en detalles sobre los dispositivos
implicados, los paquetes llegan a su destino donde son reensamblados para componer el
mensaje original. Este modelo de envo de mensajes por paquetes es muy flexible y
robusto, pues aunque haya "rutas" de la red fuera de servicio, los paquetes siempre
podrn ser "enrutados" por otras rutas y, antes o despus, llegar a su destino.
El segundo protocolo de este conjunto, IP, define el denominado sistema de direccionamiento de Internet, segn el cual todo "nodo" de la Red tiene asignada una direccin
IP nica, compuesta por cuatro nmeros separados por puntos, como, por ejemplo:
123.23.168.12. Todos los paquetes del mismo mensaje incluyen las mismas direcciones
IP de los computadores emisor y receptor.

2.2 Protocolo http.


Definicin de http
HTTP de HyperText Transfer Protocol (Protocolo de transferencia de hipertexto) es
el mtodo ms comn de intercambio de informacin en la world wide web, el mtodo
mediante el cual se transfieren las pginas web a un ordenador.
Aunque entender el modo en que funciona HTTP no es estrictamente necesario para
desarrollar aplicaciones Web, algunas nociones sobre lo que esconden esas siglas puede
ayudar a desarrollarlas con ms facilidad y confianza.
HTTP es un protocolo del nivel de aplicacin para sistemas de informacin multimedia
distribuidos. Es un protocolo no orientado a estado que puede ser utilizado para ms
propsitos que para manejar ficheros HTML.
Entre las propiedades de HTTP se pueden destacar las siguientes:
Un esquema de direccionamiento comprensible.
Utiliza el Universal Resource Identifier (URI) para localizar sitios (URL) o
nombres (URN) sobre los que hay que aplicar un mtodo. La forma general de
un URL es servicio://host/fichero.ext .
Arquitectura Cliente-Servidor.
HTTP se asienta en el paradigma solicitud/respuesta. La comunicacin se
asienta sobre TCP/IP. El puerto por defecto es el 80, pero se pueden utilizar
otros.
Es un protocolo sin conexin y sin estado.
Despus de que el servidor ha respondido la peticin del cliente, se rompe la
conexin entre ambos. Adems no se guarda memoria del contexto de la
conexin para siguientes conexiones.
6 / 18
Raymundo Jove Prez

Programacin Web
Instituto Tecnolgico de la Laguna

Est abierto a nuevos tipos de datos.


HTTP utiliza tipos MIME (Multipart Internet Mail Extension) para la
determinacin del tipo de los datos que transporta. Cuando un servidor HTTP
transmite informacin de vuelta a un cliente, incluye una cabecera que le indica
al cliente sobre los tipos de datos que componen el documento. De la gestin de
esos datos se encargan las utilidades que tenga el cliente (visor de imgenes, de
vdeo, etc.)
Una transaccin HTTP est compuesta por una cabecera, y opcionalmente, por una lnea
en blanco seguida de los datos. En la cabecera se especifica tanto la accin solicitada en
el servidor, como los tipos de datos devueltos o un cdigo de estado.

2.2.1 Mtodos de Peticin http.


La primera lnea de una peticin contiene los comandos HTTP, conocidos como
mtodos. Existen varios, pero los ms conocidos y utilizados son tres: GET, HEAD y
POST.
El mtodo GET se utiliza para recuperar informacin identificada por un URI por parte
de los navegadores. Si el URI se refiere a un proceso generador de datos como un
programa CGI, en lugar de l, se devuelven los datos generados por el programa. El
mtodo GET tambin se puede utilizar para pasar una pequea cantidad de informacin
al servidor en forma de pares atributo-valor aadidos al final del URI detrs de un
smbolo de interrogacin, ?.
GET /cgi/saludar.pl?nombre=pepe&email=pepe@infor.uva.es HTTP/1.0

La longitud de la peticin GET est limitada por el espacio libre en los buffers de
entrada. Por lo que para mandar una gran cantidad de informacin al servidor ha de
utilizarse el mtodo POST.
El mtodo HEAD es idntico al GET excepto que el servidor no devolver el cuerpo del
mensaje en la respuesta a un mtodo HEAD. Esto es til para obtener informacin sobre
las entidades implicadas en la peticin sin que tengan que transferirse. Sirve para
comprobar si los enlaces son vlidos o para saber cuando fue la ltima modificacin de
la entidad solicitada.
El mtodo POST se refiere normalmente a la invocacin de procesos que generan datos
que sern devueltos como respuesta a la peticin. Adems se utiliza para aportar datos
de entrada a esos programas. En este caso los pares atributo-valor son incluidos en el
cuerpo de la peticin separados por ampersand.
POST /cgi/saludar.pl HTTP/1.0
Accept: */*
nombre=pepe&email=pepe@infor.uva.es

De este modo el mtodo POST no sufre de las limitaciones de espacio y puede enviar
mucha ms informacin al servidor.
7 / 18
Raymundo Jove Prez

Programacin Web
Instituto Tecnolgico de la Laguna

2.2.2 Los Cookies


Los cookies representan mecanismos que permiten al servidor almacenar en el cliente
informacin relativa a la transaccin. As, cuando el servidor responde a una peticin
del cliente, inserta una informacin que se conservar en el cliente. Esta informacin es
una descripcin relativa a un conjunto de direcciones URL. En adelante, ser insertada
por el cliente en una peticin que referencie estas direcciones URL y se denomina un
cookie.
Este mecanismo, muy simple, proporciona una herramienta potente para numerosas
aplicaciones gestionadas por el Web.
Un cliente no puede memorizar ms de 300 cookies. El tamao mximo de cada cookie
es de 4000 bytes. Adems, el cliente no puede memorizar ms de 20 cookies por
servidor.
Las cookies se utilizan para memorizar las propiedades relativas a un recurso especfico.
Estas propiedades se pueden definir de dos maneras:

1. Mediante una llamada la Servidor HTTP.


En este caso, un cookie es iniciado por el servidor insertando la directiva Set-Cookie
en la cabecera de la respuesta HTTP. Esto se generaliza mediante un script CGI con la
siguiente sintaxis:
Set-Cookie: Nombre=Valor; expires=Fecha; path=Camino;
domain=Nombre_mbito; secure

2. Utilizando JavaScript.
Tambin puede definirse mediante la propiedad cookie del objeto document. Esto
permite la definicin local de propiedades de un cookie sin intervencin del servidor
WWW. As, la gestin y la memorizacin de los cookies las lleva a cabo el cliente.

2.3 URL
En algunos prrafos anteriores hemos hablado de los URL (Localizador uniforme de
recursos). Un URL es la direccin de Internet que se emplea para acceder a una pgina
web, un servidor web o cualquier otro dispositivo existente en la Red. Al URL tambin
se le conoce como direccin de Internet o direccin web. Para abreviar, y cuando la
conversacin es sobre Internet, es normal utilizar simplemente la palabra "direccin".
Un URL tpico puede tener el siguiente aspecto:
http://www.pearsoneducacion.com/musica/novedad.html
Los hay mucho ms complejos, pero vamos a centramos en ste porque se parece a la
mayora. En primer lugar nos encontramos con http:, que es el nombre del protocolo
(Hypertext Transfer Protocol, Protocolo de transferencia de hipertexto). HTIP es el protocolo de la Web que se utiliza en cada transaccin y representa el sistema mediante el
8 / 18
Raymundo Jove Prez

Programacin Web
Instituto Tecnolgico de la Laguna

cual se envan las peticiones de acceder a una pgina web y la respuesta de esa pgina,
remitindose la informacin que luego se ver en pantalla. Por tanto, este protocolo es el
sistema que permite el intercambio de informacin en la Web.
Las dos barras inclinadas ( // ) actan como un separador. Todo lo que hay entre ellas y
la siguiente barra (en este caso, www.pearsoneducacion.com) es el nombre del dominio.
En la seccin "Dominio" de este mismo captulo tiene una explicacin algo ms
detallada de lo que es un dominio. La cadena www, o lo que vaya a continuacin de las
dos barras inclinadas, es el nombre del servidor web. La mayora utiliza actualmente
www porque es fcil de recordar. La extensin .com es lo que se conoce como dominio
de nivel superior, y determina el tipo de dominio. En un tercio de los URL ms
comunes, la palabra entre WWW. y .com es lo que normalmente se conoce como nombre de dominio; los administradores se refieren a l como dominio de segundo nivel. Es
la parte que usted compra, si quiere registrar, por ejemplo, el nombre de su empresa. Si,
por ejemplo, su empresa se llama "Bartulitos S.A.", le interesa comprar el dominio
"bartulitos" de modo que al publicar su sitio web, la direccin del mismo sera
www.bartulitos.com. Al tener registrado este dominio, tambin dispondra de cuentas de
correo electrnico con el mismo dominio, por ejemplo: ventas@bartulitos.com o
antonio@bartulitos.com. Todo esto contribuye a ofrecer una apariencia corporativa ms
firme.
En el URL de ejemplo, la cadena Imusical indica el nivel de directorios dentro del
servidor web, que, despus de todo, es un computador como el nuestro. Si al crear el
sitio web, organiza las pginas web que lo constituyen en varias carpetas, esa
organizacin por carpetas debe mantenerse en el servidor web donde se almacena el
sitio web, o no funcionar. En el captulo dedicado a la publicacin del sitio web lo ver
ms claramente y lo entender mejor.
Si el URL termina con un nombre de archivo, como sucede en el ejemplo, significa que
novedad.html es el documento que est solicitando o viendo en el navegador. Si el
URL termina en una barra, significa que quiere obtener el archivo predeterminado de
ese directorio. En la mayora de los casos, http:/www.pearsoneducacion.com/index.html
y http://www.pearsoneducacion.com/son el mismo archivo. En resumen un URL esta
dado por la cadena: servicio://host/archivo.ext

2.4 La World Wide Web


La World Wide Web (que significa Gran red mundial o, tambin, Red de alcance mundial, y a la que se suele denominar simplemente la Web [red en ingls] o WWW) es el
servicio ms popular de Internet, sin lugar a dudas. Por tanto, no debe confundir Internet
con la Web, aunque para muchos es lo mismo. Tim Berners-Lee, investigador del
CERN, fue el creador de la Web, fu creada en 1989 en un instituto de investigacin de
Suiza , la web se basa en buscadores y el protocolo de transporte de hipertexto
(hypertext transport protocol (http)). La mayora de los documentos de la web se crean
utilizando lenguaje HTML (hypertext markup language), comenz a funcionar en 1992.
En octubre de 1993 ya haban aparecido ms de 200 servidores de la Web, y en junio de
1995 su cantidad ascenda a ms de 6,5 millones. Esta cifra no para de crecer y en la
actualidad se puede medir en varias decenas de millones.
9 / 18
Raymundo Jove Prez

Programacin Web
Instituto Tecnolgico de la Laguna

Parte del inters que encierra la Web se debe a que es el nico servicio multimedia de
Internet. En sus comienzos, la Web era un sistema exclusivamente textual (no haba
grficos), como suceda con los programas de correo electrnico. En la actualidad, la
Web es una mezcolanza de textos, grficos, sonidos, animaciones y realidad virtual. En
resumen, la Web es un sistema de informacin distribuido, basado en hipertexto, cuya
funcin es buscar y acceder a documentos a travs de Internet.
La clase de informacin que puede encontrar en los sitios web es ilimitada. En su mayor
parte se trata de banalidades, pero las empresas comerciales se han apuntado a la Web a
miles, convirtindola en el cibermercado de finales del siglo XX y comienzos del XXI.
Es en este mbito de Internet donde publicar su sitio web, donde lo dar a conocer a
millones de potenciales usuarios.
A modo de ancdota, para algunos la WWW es la World Wide Wait (la larga espera).
Web o la web, la red o www de World Wide Web, es bsicamente un medio de
comunicacin de texto, grficos y otros objetos multimedia a travs de Internet, es decir,
la web es un sistema de hipertexto que utiliza Internet como su mecanismo de transporte
o desde otro punto de vista, una forma grfica de explorar Internet.
Es importante saber que web o www no son sinnimo de Internet, la web es un
subconjunto de Internet que consiste en pginas a las que se puede acceder usando un
navegador. Internet es la red de redes donde reside toda la informacin. Tanto el correo
electrnico, como FTPs, juegos, etc. son parte de Internet, pero no de la Web.
Para buscar hipertexto se utilizan programas llamados buscadores web que recuperan
trozos de informacin (llamados documentos o pginas web) de los servidores web y
muestran en la pantalla del ordenador de la persona que est buscando la informacin
grfica, textual o video e incluso audio.
Despus se pueden seguir enlaces o hyperlinks en cada pgina a otros documentos o
incluso devolver informacin al servidor para interactuar con l. Al acto de seguir un
enlace tras otro a veces se le llama navegar en Internet.
La web se ha convertido en un medio muy popular de publicar informacin en Internet,
y con el desarrollo del protocolo de transferencia segura (secured server protocol
(https)), la web es ahora un medio de comercio electrnico donde los consumidores
pueden escoger sus productos on-line y realizar sus compras utilizando la informacin

2.4.1 Arquitectura www.


La idea fundamental es que los navegadores, browsers, presentan documentos escritos
en HTML que han obtenido de un servidor Web. Estos documentos HTML
habitualmente presentan informacin de forma esttica, sin ms posibilidad de
interaccin con ellos.
El modo de crear los documentos HTML ha variado a lo largo de la corta vida de las
tecnologas Web pasando desde las primeras pginas escritas en HTML almacenadas en
10 / 18
Raymundo Jove Prez

Programacin Web
Instituto Tecnolgico de la Laguna

un fichero en el servidor Web hasta aquellas que se generan al vuelo como respuesta a
una accin del cliente y cuyo contenido vara segn las circunstancias.
Adems, el modo de generar pginas dinmicas ha evolucionado, desde la utilizacin
del CGI ,Common Gateway Interface, hasta los servlets pasando por tecnologas tipo
JavaServer Pages. Todas estas tecnologas se encuadran dentro de aquellas conocidas
como Server Side, ya que se ejecutan en el servidor web.
Otro aspecto que completa (complica?) el panorama son las inclusiones del lado del
cliente, Client Side, que se refieren a las posibilidades de que las pginas lleven
incrustado cdigo que se ejecuta en el cliente, como por ejemplo JavaScript y
programas Java.
El esquema general de la situacin se puede ver en la Figura, donde se muestran cada
tipo de tecnologa involucrada en la generacin e interaccin de documentos Web.

Figura: Esquema general de las tecnologas Web.


Antes de entrar en detalle, presentaremos las caractersticas del World Wide Web y del
protocolo que lo sustenta, el HTTP.

3. Cdigos de Respuesta del Servidor


El servidor HTTP responde con un cdigo que informa sobre el estado de la
transaccin. Los cdigos se agrupan segn las siguientes categoras:
Rango

Significado

100-199 Informativo
200-299 xito en la resolucin de la peticin
300-399 Peticin redirigida, necesarias ms acciones
400-499 Peticin incompleta
500-599 Errores en el servidor
11 / 18
Raymundo Jove Prez

Programacin Web
Instituto Tecnolgico de la Laguna

4. Dominio
Explicado en trminos muy sencillos, un dominio es como un alias que permitir a
cualquier usuario de la Web localizar nuestra pgina o sitio web. Tambin se utiliza con
el correo electrnico. Internamente, los servidores web utilizan una serie de cuatro
nmeros separados por puntos (IP) para comunicarse entre s. El nombre de dominio es
el "alias" que sustituye a esos nmeros, porque siempre es ms fcil recordar un nombre
que una serie de nmeros. Por ejemplo, es mucho ms fcil recordar el dominio
bartulitos.com que una serie de nmeros parecida a 60.129.172.56, que es la direccin
IP.
El aspecto ms importante de un dominio es su unicidad; es decir, es completamente
imposible que dos personas, empresas u organizaciones tengan el mismo nombre de
dominio simultneamente. De este modo, el dominio se convierte en una autntica seal
de identidad en la Web, en una parte imprescindible de la identidad corporativa de
muchas empresas e instituciones. De hecho, muchas de las empresas de nueva creacin,
deciden sus nombres en funcin de si los nombres de dominio correspondientes estn o
no disponibles.
Existen dos tipos de dominio:
Dominios genricos. Son los dominios internacionales o globales y son los dominios
bsicos en Internet. La Tabla 1.1 recopila los dominios genricos.

Tabla 1.1

4.1 Los Dominios Genricos ms comunes


Dominio

.com
.org
.net
.edu
.biz
.into

Descripcin
Inicialmente estaba reservado a empresas de tipo comercial, pero ese
concepto original ha degenerado y ahora se utiliza para casi cualquier tipo de
sitio web. Es el dominio ms difundido.
Este dominio estaba reservado inicialmente a organizaciones sin nimo de
lucro, instituciones y fundaciones. Tambin ha degenerado y actualmente es
una alternativa ms al dominio .com.
Al principio estaba reservado para empresas relacionadas con Internet.
Actualmente, tambin se ha convertido en otra alternativa al dominio .com.
Los dominios con esta terminacin se utilizan con fines educativos.
Esta terminacin estaba reservada inicialmente para los sitios web
destinados a realizar negocios por la Web. Actualmente ha perdido este
objetivo es un dominio de conveniencia.
Estos dominios se reservan a sitios web cuyo cometido primordial es la
difusin o publicacin de contenidos informativos.
Tabla # 1
12 / 18
Raymundo Jove Prez

Programacin Web
Instituto Tecnolgico de la Laguna

4.2 Los Dominios Territoriales.


Dominios territoriales. Tambin se conocen como dominios geogrficos y son
mantenidos por cada pas. Estos dominios los utilizan las organizaciones y empresas
que se establecen en Internet que desean mantener la identidad de su marca unida a un
pas en particular. Por ejemplo, muchas de las grandes empresas y organizaciones
espaolas utilizan la terminacin .es, que es el dominio correspondiente a Espaa. Al
igual que el de Espaa, el resto de los dominios territoriales estn compuestos por dos
letras. Por regla general, los dominios territoriales estn sujetos a una normativa ms
estricta que los genricos. En la Tabla 1.2 se enumeran los dominios territoriales ms
conocidos.

Tabla 1.2
Dominios territoriales ms comunes

.au
.ea
.eh
.en
.de
.dk
.es
.ti
.tr
.ie
.in
.it
.jp
.kr
.mx
.my
.nl
.no
.nz
.se
.sg
.tw
.uk
.us
.za

Australia
Canad
Suiza
China
Alemania
Dinamarca
Espaa
Finlandia
Francia
Irlanda
India
Italia
Japn
Corea del sur
Mxico
Malasia
Holanda
Noruega
Nueva Zelanda
Suecia
Singapur
Taiwan
Reino Unido
Estados Unidos
Sudfrica
13 / 18
Raymundo Jove Prez

Programacin Web
Instituto Tecnolgico de la Laguna

Cuando el dominio expira, las autoridades competentes, de las que no hablaremos


porque no hace falta, establecen un periodo de gracia durante el cual, la persona, entidad
o empresa que registr el dominio puede renovarlo al mismo precio y en el mismo ISP.
Durante este tiempo, el dominio no se podr transferir a otro registrador, de modo que la
persona o empresa que efectu el registro, podr recuperar su dominio si olvid
renovarlo por un despiste. Ahora bien, finalizado el periodo de gracia, los dominios no
renovados entran en otro estado conocido como redemption period (periodo de
redencin) que slo est disponible para los dominios .com, .net y .org.
Existe un sitio en Internet, http://www.whois.com/, en el que se mantiene una base de
datos de todos los dominios del mundo. De hecho, puede acceder a esta direccin y, en
la parte superior derecha de la pgina, puede introducir el nombre de un dominio y
comprobar si existe.
La informacin del sistema de nombres de dominio est distribuida en diferentes
servidores en el mundo. Existe una estructura jerrquica en la que cada servidor es
responsable de conocer el nombre de dominio que administra y en caso de buscar una
informacin que desconoce, debe dirigirse a la cabeza de la jerarqua para iniciar la
bsqueda de la respuesta.
Dicha cabeza son los llamados servidores raz (root-servers) y son 13, la mayora de
ellos estn en E.U. y se identifican por letras (de la A a la M), en Mxico existe una
copia del root-server F, el cual fue colocado por NIC Mxico en coordinacin con ISC
(Internet Systems Consortium).
A continuacin te presentamos el funcionamiento del Sistema de Nombres de
Dominio:

14 / 18
Raymundo Jove Prez

Programacin Web
Instituto Tecnolgico de la Laguna

Esta estructura es similar al sistema de archivos de UNIX y Windows, slo que se


escriben de derecha a izquierda.
En este caso, para encontrar el host www.negocio.com.mx, tendramos que ir al inicio
de nuestra estructura (nodo raz)
Del nodo raz, bajaramos al primer nivel que est conformado por los diferentes
nombres de dominio territoriales o ccTLDs por sus siglas en ingls (country code Top
Level Domain) as como nombres de dominios genricos (Generic Top Level Domain).
Posterior a nuestro primer nivel, seguiramos con las clasificaciones de cada NIC, en
este caso para Mxico seran .com.mx, .net.mx, .org.mx, .edu.mx, .gob.mx
Dentro de la clasificacin de com.mx, encontramos nuestro dominio (negocio.com.mx).
Y finalmente, los hosts que estn dentro del dominio negocio.com.mx

Un cliente pregunta por un


dominio .MX
(www.negocio.com.mx)
Esta respuesta tiene que ser
contestada por el servidor de
nombres de la red a la que
pertenece el cliente que pregunta.

Un cliente pregunta por un


dominio .MX
(www.negocio.com.mx)
Esta respuesta tiene que ser
contestada por el servidor de
nombres de la red a la que
pertenece el cliente que pregunta
Como primera instancia, el
servidor de la red local, deber
preguntar a los servidores raz por
el dominio que est buscando
(negocio.com.mx).

15 / 18
Raymundo Jove Prez

Programacin Web
Instituto Tecnolgico de la Laguna

Estos servidores conocen la informacin


de los diferentes NICs (ccTLDs) en el
mundo, as como de los dominios
genricos (gTLDs), por lo que le indican
al servidor de la red local, dnde puede
encontrar ms informacin de los
dominios bajo .MX y lo dirigen con los
servidores de NIC Mxico.

Estos servidores conocen la informacin


de los diferentes NICs (ccTLDs) en el
mundo, as como de los dominios
genricos (gTLDs), por lo que le indican
al servidor de la red local, dnde puede
encontrar ms informacin de los
dominios bajo .MX y lo dirigen con los
servidores de NIC Mxico.

En la informacin que se recaba, se tiene


que el dominio negocio.com.mx tiene
como servidores registrados
ns1.negocio.com.mx y
ns2.negocio.com.mx

16 / 18
Raymundo Jove Prez

Programacin Web
Instituto Tecnolgico de la Laguna

Estos servidores conocen la informacin


referente al dominio negocio.com.mx, por
lo que dan la respuesta a la pregunta de
dnde encontrar www.negocio.com.mx

Cabe mencionar que quien realiz todo el


proceso de la bsqueda fue el servidor de
la red local.
Ya con la respuesta de dnde localizar a
www.negocio.com.mx, el servidor le
proporciona esta respuesta a su cliente

Con la informacin de dnde localizar a


www.negocio.com.mx, nuestro cliente
(quien solicit esta informacin), puede
tener una comunicacin directa con el host
para solicitar algn servicio, que en este
caso, es el servicio de web.

17 / 18
Raymundo Jove Prez

Programacin Web
Instituto Tecnolgico de la Laguna

Con esto, se termina el proceso de


resolucin de un nombre de dominio.

5. Definicin de SGML
SGML son las siglas de "Standard Generalized Markup Language" o "Lenguaje de
Marcacin Generalizado". Consiste en un sistema para la organizacin y etiquetado de
documentos. La Organizacin Internacional de Estndares (ISO) ha normalizado este
lenguaje en 1986.
El lenguaje SGML sirve para especificar las reglas de etiquetado de documentos y no
impone en s ningn conjunto de etiquetas en especial.
El lenguaje HTML esta definido en trminos del SGML. XML es un nuevo estndar
con una funcionalidad similar a la del SGML aunque ms sencillo, y de creacin
posterior.
La industria de la publicacin de documentos constituye uno de los principales usuarios
del lenguaje SGML. Empleando este lenguaje, se crean y mantienen documentos que
luego son llevados a otros formatos finales como HTML, Postscript, RTF, etc.

18 / 18
Raymundo Jove Prez

Vous aimerez peut-être aussi