Académique Documents
Professionnel Documents
Culture Documents
UNIDAD 1
Introduccin a las Tecnologas Web
1 Perspectiva Histrica de Internet
Internet es la red de computadores ms grande del mundo. Su misin principal es
ofrecer acceso a inimaginables cantidades de informacin almacenada en esos
computadores conectados a ella y que estn repartidos por todo el planeta. No es un
error pensar en Internet como en dos entes: por un lado, el conjunto de sistemas
informticos que hacen posible la existencia de esta red mundial, y, por otro, la
informacin residente en esos sistemas. Cada vez que alguien publica una informacin
en Internet (un sitio web, por ejemplo) o conecta un nuevo computador, realmente est
contribuyendo al crecimiento de la Red.
Nadie conoce exactamente el tamao de Internet, ya que es un conjunto de redes de
computadores ms pequeas que funcionan de forma independiente, sin un nico lugar
donde se centralicen todas las conexiones. Es como un gran "monstruo sin cabeza, pero
con infinidad de patas".
Internet fue concebida por el ejrcito de los Estados Unidos como un sistema de
comunicaciones seguro que funcionara en caso de ataque. La Red comenz a funcionar
a finales de la dcada de los sesenta como un proyecto de investigacin de la Agencia
de proyectos de investigacin avanzados (ARPA) y recibi el nombre de ARPAnet.
Ms tarde, ARPA pas a denominarse DARPA (Agencia de proyectos de investigacin
avanzados para la defensa). La primera red ARPAnet contaba con cuatro computadores
y fue diseada para demostrar que era factible la construccin de redes compuestas por
computadores separados geogrficamente. Los militares buscaban una forma de
construir redes tolerantes a fallos, de manera que ARPAnet se dise para que
permitiera la transmisin de informacin entre computadores utilizando un sistema
flexible y robusto. En 1972, ARPAnet era pblica y, por entonces, 50 universidades
estaban conectadas a esa red, muchas de las cuales trabajaban en proyectos de
tecnologa militar.
La mayor preocupacin de los militares es la fiabilidad de los computadores. Si una red
militar slo tiene una conexin y algo destruye esa conexin, la comunicacin ya no es
posible y el resultado sera trgico para los soldados que dependieran de la informacin
de esos computadores. ARPAnet era capaz de soportar la prdida de conexin, pues fue
ideada como un esquema con diversas rutas entre los computadores conectados, de
forma que un computador poda enviar informacin a otro a travs de cualquier ruta disponible y no nicamente a travs de una preestablecida.
Con el transcurso del tiempo, cada vez eran ms las universidades e institutos de
investigacin que se conectaban a ARPAnet que, en consecuencia, deriv hacia una red
que slo manipulaba informacin relacionada con proyectos de investigacin. El gobierno norteamericano cre una segunda red con fines nicamente militares, MILnet. En la
dcada de los ochenta, la Fundacin Nacional de Ciencia cre NFSnet, que enlazaba
media docena de supercomputadores a velocidades muy altas. En 1991 se combinaron
las redes MILnet y NFSnet.
Internet es una combinacin de ARPAnet, MILnet, NSI (NASA Science Internet) y
NFSnet, siendo todas ellas la espina dorsal que mantiene la unidad de Internet. Internet
1 / 18
Raymundo Jove Prez
Programacin Web
Instituto Tecnolgico de la Laguna
ha ido evolucionando con los aos, y lo que en principio slo estaba disponible para el
ejrcito y las universidades, se fue abriendo a empresas y, posteriormente, a todos los
dems usuarios. Internet ya no slo es "algo" que sirve de entretenimiento, sino que
cada vez tiene ms importancia como "centro de negocios" y ofrece muchos servicios,
algunos ms conocidos que otros. Entre los ms importantes podemos citar el correo
electrnico (e-mail), los grupos de noticias, Ftp y los chats.
Servicios de Internet
a) El correo electrnico
El correo electrnico es uno de los servicios ms antiguos de Internet y data de principios de la dcada de 1970, aunque nadie se pone de acuerdo sobre la fecha del primer
mensaje. En la actualidad, el correo electrnico sigue basndose en el mismo concepto:
el usuario de un computador escribe un mensaje de texto y lo enva al usuario de otro
computador. El mensaje circula por un laberinto de computadores conectados entre s
hasta llegar a su destino. Para remitir y recibir este tipo de mensajes se utilizan unas
aplicaciones conocidas con el nombre genrico de lectores de correo electrnico.
Outlook Express es uno de los ms conocidos
Adems de los mensajes de texto convencionales, el correo electrnico actual permite
adjuntar otros tipos de archivos (imgenes, por ejemplo) o cifrar los mensajes para que
slo pueda leerlos la persona a quien se envan.
c) FTP
Las siglas FTP (Protocolo de transferencia de archivos, File Transfer Protocol) se
refieren tanto a un servicio de Internet como a una utilidad UNIX (que ms tarde fue
tambin una utilidad de Windows 95). El servicio FTP de Internet est formado por una
serie de servidores que guardan y distribuyen los archivos. Muchos sitios FTP
pertenecen a fabricantes de hardware y software, que los utilizan para distribuir sus
productos y las correspondientes actualizaciones.
Tambin hay sitios FTP que pertenecen a universidades e instituciones cientficas; por
medio de ellos, estas instituciones hacen llegar utilidades shareware (software que se
prueba antes de comprar; si el programa le resulta de utilidad, debe abonar lo que su
2 / 18
Raymundo Jove Prez
Programacin Web
Instituto Tecnolgico de la Laguna
d) Chat (charla)
IRC (Conversacin transmitida por Internet, Internet Re/ay Chat) es otro servicio
extraordinariamente popular de Internet. Se trata de un sistema que permite a los usuarios reunirse en torno a un elemento comn, en este caso un servidor IRC, y entablar
una conversacin o charla. Pero no se trata de una conversacin oral, sino que se escribe
en el computador lo que se desea decir.
No busque en las IRC unas conversaciones de muy alto nivel, pues en ellas no intervienen normalmente especialistas universitarios ni ingenieros espaciales. Una gran cantidad de estos grupos de charla (llamados salones o canales) se ocupan de temas
populares o para adultos. Pero cuando aparece alguna noticia que atrae la atencin
pblica, se pueden encontrar varios grupos de noticias donde la gente se dedica a rerse
del asunto en cuestin.
Otros conceptos
A continuacin se explican otros conceptos con los que es conveniente estar familiarizados.
a) Navegador
Es la aplicacin que permite al usuario descargar y visualizar pginas web de cualquier
servidor web del mundo. Como habr supuesto, este acceso se realiza a travs de
Internet. Normalmente, el sistema operativo incorpora una de estas aplicaciones, aunque
de Internet se pueden descargar navegadores de terceros. No pasa nada por tener
instalado ms de un navegador.
b) ISP
ISP es el acrnimo de la expresin inglesa Internet Service Provider, Proveedor de
servicios de Internet. Es una empresa dedicada a conectar a Internet la lnea telefnica o
el cable correspondiente del usuario. Por tanto, es la empresa dedicada a proveer acceso
o conexin a Internet a empresas y particulares.
c) Pgina web
Una pgina web es un documento publicado en la WWW. Normalmente, estas pginas
estn escritas en lenguaje HTML. Son estas pginas las que aprender a crear. Una
pgina web es una parte constitutiva de un sitio web y puede estar enlazada a otras
pginas web mediante vnculos. Normalmente, su contenido est basado en texto e
imgenes, aunque cada vez es ms comn el uso de otros recursos adicionales, como
animaciones, sonidos y vdeos. Por tanto, las pginas web son autnticos documentos
multimedia.
3 / 18
Raymundo Jove Prez
Programacin Web
Instituto Tecnolgico de la Laguna
d) Sitio web
Un sitio web (o simplemente sitio) es un conjunto de pginas web accesibles a travs de
Internet, convenientemente enlazadas y con una finalidad concreta. Un sitio web est
identificado por una direccin (URL) nica, que es la direccin de la pgina principal o
home page. Navegando por la Web es posible encontrarse con distintos tipos de sitios
web.
Los sitios web ms sencillos son los compuestos por una sola pgina, en la que se habla
de algo muy concreto. En el siguiente nivel encontramos los sitios web de la gran
mayora (empresas y particulares), compuestos por varias pginas. Actualmente, de este
tipo de sitio web destacan con luz propia los dedicados al comercio electrnico y los de
la banca online.
Los sitios de comercio electrnico son autnticos catlogos en los que una empresa o
distribuidora ofrece sus productos. El usuario elige lo que le interesa y lo aade a un
"carrito de la compra virtual". Una vez finalizada la compra, el usuario revisa el carrito
y procede a pagar, normalmente con tarjeta de crdito.
Ms que nunca, ahora s podemos decir eso de "tener el banco en casa". La gran
mayora de bancos, por no decir todos, disponen de un sitio web en el que se ofrecen
casi todos los servicios bancarios a sus clientes. El cliente no tiene ms que identificarse
convenientemente y proceder a realizar sus operaciones (transferencias, compra y venta
de valores, consulta de saldos, etc.). Todas estas operaciones han de ser validadas
mediante una firma electrnica, tambin nica de cada cliente. Por seguridad, es
conveniente modificar la clave de acceso y la firma digital cada cierto tiempo.
En los primeros aos de Internet los sitios web ms utilizados eran los buscadores, o
motores de bsqueda, que, con el tiempo, se han convertido en portales. En un principio
eran herramientas web que permitan buscar documentos que contenan una
determinada palabra o frase. El resultado era un listado de direcciones web correspondientes a los sitios web donde aparecan esa palabra o frase. El usuario no tena ms
que hacer click en los enlaces propuestos en el listado para acceder a los sitios web en
cuestin.
Muchos sitios web que fueron creados como buscadores han evolucionado hasta convertirse en Portales, puntos de entrada a la Web que ofrecen acceso rpido y sencillo a
infinidad de servicios. Existen portales de mbito general (por ejemplo Yahoo!, MSN,
Lycos o Altavista) y tambin dedicados a un tema especfico (medicina, astrologa,
modelismo, deportes, etc.). Todos ellos tienen algo en comn: una herramienta de
bsqueda que permite buscar por toda la Web (los de mbito general) o por los sitios
web relacionados con el tema del portal.
Los portales de consumidor o mbito general ofrecen buscadores, servicios de correo
electrnico, salas para "chatear", titulares de prensa y otros muchos servicios. El usuario
4 / 18
Raymundo Jove Prez
Programacin Web
Instituto Tecnolgico de la Laguna
puede personalizar muchos de estos portales para que, al conectarse a ellos, se muestre
la informacin que ms le interesa.
Podramos hablar mucho ms sobre los portales y sus tipos, pero con esto es suficiente
para los que nos ocupan.
2. Protocolos de Internet
En el mbito de una red de computadores, un protocolo es un conjunto de reglas
formales que permiten la comunicacin entre dos nodos de la red de forma no ambigua.
Esto mismo se puede extrapolar a Internet, teniendo en cuenta que no es ms que una
"red de redes".
Programacin Web
Instituto Tecnolgico de la Laguna
dos computadores (es la tarea del protocolo TCP) y la identificacin de los dispositivos
de una red mediante una direccin nica (tarea del protocolo IP).
El protocolo TCP es el encargado del transporte. Al enviar un mensaje por Internet,
dicho mensaje se divide en paquetes. Cada paquete dispone de la informacin necesaria
para viajar desde su punto de origen hasta su destino por rutas diferentes.
Independientemente de la ruta seguida, y sin entrar en detalles sobre los dispositivos
implicados, los paquetes llegan a su destino donde son reensamblados para componer el
mensaje original. Este modelo de envo de mensajes por paquetes es muy flexible y
robusto, pues aunque haya "rutas" de la red fuera de servicio, los paquetes siempre
podrn ser "enrutados" por otras rutas y, antes o despus, llegar a su destino.
El segundo protocolo de este conjunto, IP, define el denominado sistema de direccionamiento de Internet, segn el cual todo "nodo" de la Red tiene asignada una direccin
IP nica, compuesta por cuatro nmeros separados por puntos, como, por ejemplo:
123.23.168.12. Todos los paquetes del mismo mensaje incluyen las mismas direcciones
IP de los computadores emisor y receptor.
Programacin Web
Instituto Tecnolgico de la Laguna
La longitud de la peticin GET est limitada por el espacio libre en los buffers de
entrada. Por lo que para mandar una gran cantidad de informacin al servidor ha de
utilizarse el mtodo POST.
El mtodo HEAD es idntico al GET excepto que el servidor no devolver el cuerpo del
mensaje en la respuesta a un mtodo HEAD. Esto es til para obtener informacin sobre
las entidades implicadas en la peticin sin que tengan que transferirse. Sirve para
comprobar si los enlaces son vlidos o para saber cuando fue la ltima modificacin de
la entidad solicitada.
El mtodo POST se refiere normalmente a la invocacin de procesos que generan datos
que sern devueltos como respuesta a la peticin. Adems se utiliza para aportar datos
de entrada a esos programas. En este caso los pares atributo-valor son incluidos en el
cuerpo de la peticin separados por ampersand.
POST /cgi/saludar.pl HTTP/1.0
Accept: */*
nombre=pepe&email=pepe@infor.uva.es
De este modo el mtodo POST no sufre de las limitaciones de espacio y puede enviar
mucha ms informacin al servidor.
7 / 18
Raymundo Jove Prez
Programacin Web
Instituto Tecnolgico de la Laguna
2. Utilizando JavaScript.
Tambin puede definirse mediante la propiedad cookie del objeto document. Esto
permite la definicin local de propiedades de un cookie sin intervencin del servidor
WWW. As, la gestin y la memorizacin de los cookies las lleva a cabo el cliente.
2.3 URL
En algunos prrafos anteriores hemos hablado de los URL (Localizador uniforme de
recursos). Un URL es la direccin de Internet que se emplea para acceder a una pgina
web, un servidor web o cualquier otro dispositivo existente en la Red. Al URL tambin
se le conoce como direccin de Internet o direccin web. Para abreviar, y cuando la
conversacin es sobre Internet, es normal utilizar simplemente la palabra "direccin".
Un URL tpico puede tener el siguiente aspecto:
http://www.pearsoneducacion.com/musica/novedad.html
Los hay mucho ms complejos, pero vamos a centramos en ste porque se parece a la
mayora. En primer lugar nos encontramos con http:, que es el nombre del protocolo
(Hypertext Transfer Protocol, Protocolo de transferencia de hipertexto). HTIP es el protocolo de la Web que se utiliza en cada transaccin y representa el sistema mediante el
8 / 18
Raymundo Jove Prez
Programacin Web
Instituto Tecnolgico de la Laguna
cual se envan las peticiones de acceder a una pgina web y la respuesta de esa pgina,
remitindose la informacin que luego se ver en pantalla. Por tanto, este protocolo es el
sistema que permite el intercambio de informacin en la Web.
Las dos barras inclinadas ( // ) actan como un separador. Todo lo que hay entre ellas y
la siguiente barra (en este caso, www.pearsoneducacion.com) es el nombre del dominio.
En la seccin "Dominio" de este mismo captulo tiene una explicacin algo ms
detallada de lo que es un dominio. La cadena www, o lo que vaya a continuacin de las
dos barras inclinadas, es el nombre del servidor web. La mayora utiliza actualmente
www porque es fcil de recordar. La extensin .com es lo que se conoce como dominio
de nivel superior, y determina el tipo de dominio. En un tercio de los URL ms
comunes, la palabra entre WWW. y .com es lo que normalmente se conoce como nombre de dominio; los administradores se refieren a l como dominio de segundo nivel. Es
la parte que usted compra, si quiere registrar, por ejemplo, el nombre de su empresa. Si,
por ejemplo, su empresa se llama "Bartulitos S.A.", le interesa comprar el dominio
"bartulitos" de modo que al publicar su sitio web, la direccin del mismo sera
www.bartulitos.com. Al tener registrado este dominio, tambin dispondra de cuentas de
correo electrnico con el mismo dominio, por ejemplo: ventas@bartulitos.com o
antonio@bartulitos.com. Todo esto contribuye a ofrecer una apariencia corporativa ms
firme.
En el URL de ejemplo, la cadena Imusical indica el nivel de directorios dentro del
servidor web, que, despus de todo, es un computador como el nuestro. Si al crear el
sitio web, organiza las pginas web que lo constituyen en varias carpetas, esa
organizacin por carpetas debe mantenerse en el servidor web donde se almacena el
sitio web, o no funcionar. En el captulo dedicado a la publicacin del sitio web lo ver
ms claramente y lo entender mejor.
Si el URL termina con un nombre de archivo, como sucede en el ejemplo, significa que
novedad.html es el documento que est solicitando o viendo en el navegador. Si el
URL termina en una barra, significa que quiere obtener el archivo predeterminado de
ese directorio. En la mayora de los casos, http:/www.pearsoneducacion.com/index.html
y http://www.pearsoneducacion.com/son el mismo archivo. En resumen un URL esta
dado por la cadena: servicio://host/archivo.ext
Programacin Web
Instituto Tecnolgico de la Laguna
Parte del inters que encierra la Web se debe a que es el nico servicio multimedia de
Internet. En sus comienzos, la Web era un sistema exclusivamente textual (no haba
grficos), como suceda con los programas de correo electrnico. En la actualidad, la
Web es una mezcolanza de textos, grficos, sonidos, animaciones y realidad virtual. En
resumen, la Web es un sistema de informacin distribuido, basado en hipertexto, cuya
funcin es buscar y acceder a documentos a travs de Internet.
La clase de informacin que puede encontrar en los sitios web es ilimitada. En su mayor
parte se trata de banalidades, pero las empresas comerciales se han apuntado a la Web a
miles, convirtindola en el cibermercado de finales del siglo XX y comienzos del XXI.
Es en este mbito de Internet donde publicar su sitio web, donde lo dar a conocer a
millones de potenciales usuarios.
A modo de ancdota, para algunos la WWW es la World Wide Wait (la larga espera).
Web o la web, la red o www de World Wide Web, es bsicamente un medio de
comunicacin de texto, grficos y otros objetos multimedia a travs de Internet, es decir,
la web es un sistema de hipertexto que utiliza Internet como su mecanismo de transporte
o desde otro punto de vista, una forma grfica de explorar Internet.
Es importante saber que web o www no son sinnimo de Internet, la web es un
subconjunto de Internet que consiste en pginas a las que se puede acceder usando un
navegador. Internet es la red de redes donde reside toda la informacin. Tanto el correo
electrnico, como FTPs, juegos, etc. son parte de Internet, pero no de la Web.
Para buscar hipertexto se utilizan programas llamados buscadores web que recuperan
trozos de informacin (llamados documentos o pginas web) de los servidores web y
muestran en la pantalla del ordenador de la persona que est buscando la informacin
grfica, textual o video e incluso audio.
Despus se pueden seguir enlaces o hyperlinks en cada pgina a otros documentos o
incluso devolver informacin al servidor para interactuar con l. Al acto de seguir un
enlace tras otro a veces se le llama navegar en Internet.
La web se ha convertido en un medio muy popular de publicar informacin en Internet,
y con el desarrollo del protocolo de transferencia segura (secured server protocol
(https)), la web es ahora un medio de comercio electrnico donde los consumidores
pueden escoger sus productos on-line y realizar sus compras utilizando la informacin
Programacin Web
Instituto Tecnolgico de la Laguna
un fichero en el servidor Web hasta aquellas que se generan al vuelo como respuesta a
una accin del cliente y cuyo contenido vara segn las circunstancias.
Adems, el modo de generar pginas dinmicas ha evolucionado, desde la utilizacin
del CGI ,Common Gateway Interface, hasta los servlets pasando por tecnologas tipo
JavaServer Pages. Todas estas tecnologas se encuadran dentro de aquellas conocidas
como Server Side, ya que se ejecutan en el servidor web.
Otro aspecto que completa (complica?) el panorama son las inclusiones del lado del
cliente, Client Side, que se refieren a las posibilidades de que las pginas lleven
incrustado cdigo que se ejecuta en el cliente, como por ejemplo JavaScript y
programas Java.
El esquema general de la situacin se puede ver en la Figura, donde se muestran cada
tipo de tecnologa involucrada en la generacin e interaccin de documentos Web.
Significado
100-199 Informativo
200-299 xito en la resolucin de la peticin
300-399 Peticin redirigida, necesarias ms acciones
400-499 Peticin incompleta
500-599 Errores en el servidor
11 / 18
Raymundo Jove Prez
Programacin Web
Instituto Tecnolgico de la Laguna
4. Dominio
Explicado en trminos muy sencillos, un dominio es como un alias que permitir a
cualquier usuario de la Web localizar nuestra pgina o sitio web. Tambin se utiliza con
el correo electrnico. Internamente, los servidores web utilizan una serie de cuatro
nmeros separados por puntos (IP) para comunicarse entre s. El nombre de dominio es
el "alias" que sustituye a esos nmeros, porque siempre es ms fcil recordar un nombre
que una serie de nmeros. Por ejemplo, es mucho ms fcil recordar el dominio
bartulitos.com que una serie de nmeros parecida a 60.129.172.56, que es la direccin
IP.
El aspecto ms importante de un dominio es su unicidad; es decir, es completamente
imposible que dos personas, empresas u organizaciones tengan el mismo nombre de
dominio simultneamente. De este modo, el dominio se convierte en una autntica seal
de identidad en la Web, en una parte imprescindible de la identidad corporativa de
muchas empresas e instituciones. De hecho, muchas de las empresas de nueva creacin,
deciden sus nombres en funcin de si los nombres de dominio correspondientes estn o
no disponibles.
Existen dos tipos de dominio:
Dominios genricos. Son los dominios internacionales o globales y son los dominios
bsicos en Internet. La Tabla 1.1 recopila los dominios genricos.
Tabla 1.1
.com
.org
.net
.edu
.biz
.into
Descripcin
Inicialmente estaba reservado a empresas de tipo comercial, pero ese
concepto original ha degenerado y ahora se utiliza para casi cualquier tipo de
sitio web. Es el dominio ms difundido.
Este dominio estaba reservado inicialmente a organizaciones sin nimo de
lucro, instituciones y fundaciones. Tambin ha degenerado y actualmente es
una alternativa ms al dominio .com.
Al principio estaba reservado para empresas relacionadas con Internet.
Actualmente, tambin se ha convertido en otra alternativa al dominio .com.
Los dominios con esta terminacin se utilizan con fines educativos.
Esta terminacin estaba reservada inicialmente para los sitios web
destinados a realizar negocios por la Web. Actualmente ha perdido este
objetivo es un dominio de conveniencia.
Estos dominios se reservan a sitios web cuyo cometido primordial es la
difusin o publicacin de contenidos informativos.
Tabla # 1
12 / 18
Raymundo Jove Prez
Programacin Web
Instituto Tecnolgico de la Laguna
Tabla 1.2
Dominios territoriales ms comunes
.au
.ea
.eh
.en
.de
.dk
.es
.ti
.tr
.ie
.in
.it
.jp
.kr
.mx
.my
.nl
.no
.nz
.se
.sg
.tw
.uk
.us
.za
Australia
Canad
Suiza
China
Alemania
Dinamarca
Espaa
Finlandia
Francia
Irlanda
India
Italia
Japn
Corea del sur
Mxico
Malasia
Holanda
Noruega
Nueva Zelanda
Suecia
Singapur
Taiwan
Reino Unido
Estados Unidos
Sudfrica
13 / 18
Raymundo Jove Prez
Programacin Web
Instituto Tecnolgico de la Laguna
14 / 18
Raymundo Jove Prez
Programacin Web
Instituto Tecnolgico de la Laguna
15 / 18
Raymundo Jove Prez
Programacin Web
Instituto Tecnolgico de la Laguna
16 / 18
Raymundo Jove Prez
Programacin Web
Instituto Tecnolgico de la Laguna
17 / 18
Raymundo Jove Prez
Programacin Web
Instituto Tecnolgico de la Laguna
5. Definicin de SGML
SGML son las siglas de "Standard Generalized Markup Language" o "Lenguaje de
Marcacin Generalizado". Consiste en un sistema para la organizacin y etiquetado de
documentos. La Organizacin Internacional de Estndares (ISO) ha normalizado este
lenguaje en 1986.
El lenguaje SGML sirve para especificar las reglas de etiquetado de documentos y no
impone en s ningn conjunto de etiquetas en especial.
El lenguaje HTML esta definido en trminos del SGML. XML es un nuevo estndar
con una funcionalidad similar a la del SGML aunque ms sencillo, y de creacin
posterior.
La industria de la publicacin de documentos constituye uno de los principales usuarios
del lenguaje SGML. Empleando este lenguaje, se crean y mantienen documentos que
luego son llevados a otros formatos finales como HTML, Postscript, RTF, etc.
18 / 18
Raymundo Jove Prez