Vous êtes sur la page 1sur 18

2008

INTRODUCCIN
RASTER Y VECTOR

Pablo Cienfuegos Surez


Antonio Luis Marqus Sierra
1. Introduccin.

1.1 Rster y vector.

Uno de los mayores componentes en cualquier diseo industrial y actividades de


produccin es una adecuada documentacin y en este contexto, los dibujos de ingeniera
juegan un papel muy importante. Siendo de naturaleza grfica, estos dibujos representan
informacin compleja de una manera concisa. Los dibujos de ingeniera abarcan
documentos tan diversos como planos, esquemas, diagramas, etc. Por ejemplo el
conjunto de documentacin de un proyecto tpico de magnitud razonable como puede
ser un reactor nuclear incluye aproximadamente 30.000 documentos tcnicos.

Considerando que el 25 % de estos documentos se consideran activos y que el tiempo


de vigencia de los diseos de la mayora de los productos oscila entre 10 y 40 aos,
podemos entender la tarea que supone soportar este conjunto de documentos. De hecho,
a finales de los 80 se calculaba que slo en Estados Unidos haba ms de 2000 millones
de documentos activos. La mayora de las compaas almacenan un gran nmero de
tales dibujos en sus archivos y aproximadamente un 20 % estn activos cada ao. Una
enorme cantidad de horas de trabajo humano se consume en crear, actualizar y mantener
esos dibujos usando tcnicas de delineado convencionales.

Los sistemas de CAD y GIS proporcionan un medio eficiente para crear, almacenar y
actualizar dibujos de ingeniera y mapas, pero estos beneficios todava no se encuentran
disponibles para la multitud de dibujos existentes en papel debido a la ausencia de un
puente apropiado entre el mundo manual y el de los ordenadores. La introduccin
manual de dibujos en una base de datos computerizada es un proceso lento, caro y
tedioso, por lo tanto se siente necesidad de un sistema automtico que escanee un dibujo
y lo convierta en un formato adecuado para su posterior procesamiento en un ordenador.
No obstante, el reconocimiento y comprensin de dibujos de ingeniera es con mucho
una tarea ms complicada que requiere de la capacidad de percepcin visual y de la
interpretacin inteligente.

Rster y vectorial son las dos estructuras bsicas para almacenar y manipular datos
espaciales en un ordenador. Los paquetes de CAD, GIS o de Diseo Grfico ms
importantes disponibles hoy en da estn basados de manera primordial en una de las
dos estructuras, o basados en rster o basados en vectores, aunque pueden tener algunas
funciones para soportar el otro extremo de algn modo.

Los datos rster vienen en forma de pixeles individuales y cada posicin espacial o
elemento de resolucin tiene un pixel asociado donde el valor del pixel indica un
atributo, como color, elevacin, o nmero de identificacin. Los datos de un rster se
adquieren normalmente mediante un escner ptico, una cmara CCD digital u otros
dispositivos de entrada. Su resolucin viene determinada principalmente por la
resolucin del dispositivo de entrada y la fuente de datos como puede ser un mapa, un
plano o un diagrama e papel. Puesto que los ficheros rster de datos deben tener pixeles
para todas las posiciones, estn limitados por el tamao del rea que representan.
Incrementando la resolucin espacial dos veces, el tamao total de un conjunto de datos
rster bidimensional se incrementar 4 veces porque el nmero de pixeles se duplica en
las dimensiones X e Y. Esto mismo sucede cuando se pretende cubrir un rea de mayor
tamao.

Los datos vectoriales tienen la forma de puntos y lneas que estn geomtricamente y
matemticamente asociados. Los puntos estn almacenados usando coordenadas, por
ejemplo, un punto bidimensional se almacena como (x,y). Las lneas se almacenan
como series de puntos. Mientras que la forma rster tiende a ser ms cercana a las
fuentes del mundo real, la forma vectorial es una pura abstraccin del mundo y se
obtiene normalmente a travs de un proceso de digitalizacin. Ya que la forma vectorial
es flexible y eficiente para representar datos espaciales, especialmente mapas y dibujos
CAD y necesitan menos recursos del sistema para su manipulacin y almacenamiento,
histricamente la mayora de los programas de GIS y CAD trabajan basndose en
informacin en formato vectorial.

1.2 Algo de historia.

La historia de la vectorizacin a partir de imgenes escaneadas comienza a finales de los


60 con una compaa (Visicom Inc.) comprometida en escanear y convertir datos rster
en informacin vectorial usando grandes ordenadores IBM para convertir grficas de
datos analgicos producidas por instrumentos de laboratorio. Ms tarde, esa tecnologa
se aplic para capturar informacin de mapas, por aquella poca la compaa vendi la
tecnologa a Broomall Industries Inc., actualmente Scangraphics Inc. Scangraphics es
una de las dos compaas supervivientes que siguen vendiendo escaners y sistemas con
tecnologa pionera en los ltimos aos 60.

La otra compaa, Laser Scan Ltd., la cual comenz en Cambridge, Inglaterra,


desarroll tecnologa basada en la captura de trazas de partculas en cmaras de nubes
en experimentos de fsica nuclear. Inicialmente, Laser Scan vendi un producto llamado
Fastrak, el cual posteriormente se llam V-Trak. Ambos sistemas de Laser Scan usaron
tecnologa laser para escanear y seguir (seguimiento de lneas semiautomtico)
informacin sobre pelculas transparentes. Esto difiri de la aproximacin original de
Visicom, que era escanear en un rster un dibujo o un mapa, convertir en diferido la
informacin del rster en segmentos de lnea, y posteriormente procesar los segmentos
de lnea usando grficos de ordenador interactivos. Algunas compaas ms tenan
productos de seguimiento semiautomtico de lneas, pero se usaron en dibujos a mano
alzada. Los dibujos a mano alzada normalmente eran dibujos a tamao natural que
bosquejaban una parte de un avin con fines de ensamblaje. Tridea Systems propiedad
de Mc Donnell Douglas, construy un sistema as durante los 70. Tambin, Gerbert
Scientific Instruments produjo una versin de un seguidor de lneas similar, que poda
unirse a algunos de sus grandes trazadores de mesa. Aunque las dos tecnologas
originariamente diferan, ahora Laser Scan se basa en el escaneado de rasters para
obtener la informacin usada para el seguimiento semiautomtico de lneas, usando
tcnicas de grficos por ordenador interactivos.

La siguiente compaa en escena era Scitex-Israel cuyo fundador haba trabajado para
un contratista de la defensa de los Estados Unidos realizando procesamiento de
imgenes. Scitex originariamente aplic tcnicas de escaneo sobre patrones dibujados a
mano para programar y controlar tejedoras para la industria textil. Ms tarde, Scitex se
interes por la cartografa. Estableci un cuartel general estadounidense para obtener
negocios de algunas de las agencias de cartografa estadounidenses. Scitex tambin
desarroll algunas de las primitivas tcnicas de edicin de rasters, las cuales se
aplicaron a mapas escaneados. La edicin de rasters tambin fue usada para crear y
cambiar diseos en operaciones de preimpresin en color en la industria de impresin.
Ms tarde Scitex encontr ms lucrativo el mercado de preimpresin y virtualmente
dirigi todos sus esfuerzos hacia este negocio.

Las agencias cartogrficas del gobierno fueron el principal objetivo de las primitivas
empresas de escaneado-vectorizacin. Scangraphics, produjo sistemas para la Agencia
Cartogrfica de la Defensa que fueron usados para la captura de informacin de mapas
de curvas de nivel para generar modelos digitales del terreno para el programa del misil
Cruise.

Cronolgicamente, la siguiente compaa que sigui a Scitex fue Kongsberg de


Noruega, la cual se uni con MBB de Alemania con el fin de crear una compaa para
escanear y procesar datos rster. Esta compaa tom dos direcciones en el mercado,
una usando todo el procesamiento rster para la publicacin tcnica dentro de la
industria aerospacial y la otra usando conversin de rster a vectores para aplicaciones
cartogrficas. Despus de la formacin de esta alianza, la compaa se convirti en
SysScan Inc., que ms tarde se uni con Datagraphics para convertirse en Cimage
Corporation.

Una compaa ms que entr en el mercado durante los 70 fue Computervision


Corporation cuyo primer y nico gran negocio de escaneado fue un contrato con el
Departamento de Agricultura de los Estados Unidos para producir un gran sistema
cartogrfico automatizado. Adicionalmente a este sistema cartogrfico, Computervision
cre sistemas para escanear esquemas de circuitos para propsitos de bocetado
automtico. Este sistema nunca se hizo popular y fue abandonado a principios de los 80.

A principios de los 80 comenzaron varias compaas de escaneadovectorizacin,


incluyendo a Intergraph, la cual obtuvo un gran contrato del ejercito australiano para
una aplicacin dentro de sus operaciones cartogrficas; ANATech, la cual comenz
como una compaa independiente y ms tarde se fusion con Intergraph; Skantek que
ms tarde desapareci; Optigraphics, la cual contina como parte de
ALPHAREL/Optigraphics; Metagraphics, la cual ms tarde desapareci; y AUDRE, la
cual todava contina. Tambin en este periodo comenz Formtek, que explor en sus
principios el uso de bocetos rster como una alternativa al CAD, bajo la direccin del
doctor Charles Eastman de la Universidad Carnegie Mellon. Formtek fue comprada por
Lockheed en 1990 y contina hoy en da como una compaa de gestin de documentos.

Durante la ltima mitad de los 80, varias nuevas compaas comenzaron en los Estados
Unidos incluyendo a GTX Corporation, Information and Graphic Systems, Image
Systems Technology (la cual ha sido adquirida recientemente por Softdesk Inc.) y Arbor
Image. M.O.S.S. GmbH y Softelec GmbH comenzaron en Alemania.

Mientras que muchas pequeas compaas con paquetes basados en PCs ofrecieron
capacidades de conversin de rster a vectores, la mayora no se convirti en un factor
significativo en el mercado. La nica otra compaa en ser mencionada es Coherent
Radiation, un contratista de la defensa que ha aplicado tcnicas de inteligencia artificial
para capturar mapas para compaas de servicios pblicos. Otro contratista de la
defensa, TASC, tambin ha aplicado su tecnologa de inteligencia artificial a la captura
de mapas de servicios pblicos y tambin pudiera estar haciendo algunos negocios con
compaas elctricas.

1.3 Tecnologa de escaneado.

El mtodo ms popular de convertir informacin en 2D a su forma electrnica es el


escaneado, en el cual una "instantnea" de la informacin es procesada en una imagen
rster digital de mapa de bits. Esta imagen rster esta formada por informacin
descompuesta en diminutos puntos, o pixeles, de modo muy parecido a una imagen en
una pantalla de televisin. La calidad de una imagen rster depende de la talla de los
pixeles individuales (la resolucin). La resolucin se mide en pixeles (o puntos) por
pulgada (dpi o ppp).

Los primeros escaners de rster fueron del tipo tambor, en los que el documento estaba
montado en un rodillo giratorio y la informacin era registrada mediante un tubo
fotoelctrico. Ms tarde, evolucionaron para incorporar el uso de fotodiodos y con el
tiempo dispositivos de acoplamiento de carga (CCD). Aunque los escaners de tambor ya
no son tan comunes como lo fueron, la tecnologa todava se usa en reas como la
cartografa, donde se requiere precisin y resoluciones extremadamente altas.

La mayora de los modernos escaners de gran formato usan una tcnica en la cual el
documento se desplaza a travs del campo focal de una cmara (o cmaras) que
contiene mltiples elementos CCD. Estas matrices CCD tienen normalmente dos
pulgadas de longitud y contienen 5000 elementos CCD. De este modo, si un escner
contiene una cmara con 5000 elementos que cubre una anchura de escaneado de 36
pulgadas, la resolucin ptica del escner se puede calcular dividiendo 5000 pixeles por
36 pulgadas, lo que es aproximadamente igual a 140 pixeles por pulgada, o 140 dpi. Un
modelo de dos cmaras tendra una resolucin ptica alrededor de 270 dpi, un modelo
de tres cmaras sobre 400 dpi, y as sucesivamente. En las unidades de cmara mltiple,
las cmaras deben solapar sus reas de cobertura unos pocos pixeles con el fin de evitar
perder datos. Esta rea de solapamiento es conocida como punto de cosido. Los puntos
de cosido de cmara en un escner de gran formato son un ajuste crtico, y cualquier
desalineamiento - de las cmaras entre s o entre las cmaras y la ventana de escaneado
puede terminar en una perdida de datos, dobles imgenes, escalado incorrecto o
distorsin de formas.

La tecnologa que usa matrices de CCD junto con lentes de cmara ha sido incorporada
por los mayores fabricantes de escaners, incluyendo ANATech, Scangraphics, Vidar y
Contex (comercializados por Ideal, Vemco, Calcomp y Oc Bruning). Tambin est
siendo usada otra tcnica en la cual una nica barra de CCDs alineados de hasta 36
pulgadas reemplazan a las cmaras. El documento se mueve a travs de la barra CCD
iluminada en la que se detecta la informacin. Una de las ventajas de usar esta
aproximacin es que no hay puntos de cosido que puedan llegar a desalinearse. Estas
barras CCD iluminadas normalmente tienen 200 o 400 elementos por pulgada,
resultando una resolucin ptica real de 200 o 400 dpi. Dos fabricantes que ofrecen
escaners que usan esta tecnologa son Xerox y Widecom.
Podemos darnos cuenta de que la mayora de los fabricantes de escaners anuncian la
capacidad de sacar una resolucin que puede ser el doble de la cantidad de la resolucin
ptica real de la unidad. Pueden hacer esto de verdad? Bueno, s y no.

Mientras que las cmaras slo pueden ver imgenes a cierta dpi, la resolucin puede ser
incrementada en una direccin de la imagen simplemente con solo mover el documento
a travs del escner en incrementos ms pequeos de tamao. Esto se conoce como
interpolacin. Las tcnicas de interpolacin pueden permitir a un escner de 200 dpi
producir un fichero de 400 dpi. De cualquier modo, ya que las imgenes slo pueden ser
vistas por las cmaras a 200 dpi, en los detalles el fichero interpolado de 400 dpi nunca
puede ser tan preciso como la imagen creada por un escner con una resolucin ptica
real de 400 dpi. Para las aplicaciones tratadas en este artculo, una regla aproximada es
usar 200 dpi para almacenar imgenes rster y digitalizar con las cabezas levantadas
(heads-up digitizing) y usar 400 dpi para las tcnicas de vectorizacin automtica. Las
aplicaciones cartogrficas pueden requerir resoluciones ms altas.

Una vez que la informacin ha sido detectada por los CCDs, las seales analgicas
alimentan un conversor analgico-digital. En este punto, los grados de variacin de luz
y oscuridad de la seal analgica son convertidos a niveles de gris en la salida digital o
seal de escala de grises. La mayora de escners modernos usan escalas de grises de 8
bits, con lo que resultan 256 niveles del blanco al negro. Esta seal de escala de grises
de 256 niveles de gris puede ser extrada por un ordenador a ficheros de formato
estndar. Esto resulta ptimo para fotografas monocromas ya que contienen los
diversos niveles de gris requeridos para construir la imagen. Un escner en color trabaja
de modo parecido, usando los tres colores primarios rojo, verde y azul. Puesto que ahora
tenemos tres colores bsicos en lugar de uno, la mayora de formatos de fichero para
imgenes en color soportan 24 bits. Los ficheros de escala de grises y los ficheros en
color tienden a ser bastante grandes y pueden fcilmente ser de 10 veces el tamao de la
imagen que nicamente contiene informacin en blanco y negro, conocido como fichero
binario.

El formato de fichero binario es la salida ms deseable para documentos que contienen


lneas o informacin con alto contraste, y es el formato de fichero requerido por la
mayora de programas de vectorizacin automtica y CAD. El proceso de escaneado
descrito anteriormente solo es capaz de producir una salida en escala de grises. Para que
un escner produzca un fichero binario debe reducir sus niveles de gris a solo dos: negro
(pixel encendido) y blanco (pixel apagado). Esta tcnica se conoce como umbralizacin
(thresholding), y en ella la seal de escala de grises es analizada y cualquier cosa por
encima de un nivel de gris se vuelve negro y cualquier otra por debajo se vuelve blanco.

La mayora de los escaners de gran formato ofrecen tecnologas de umbralizacin


automtica. Calculan un ajuste ptimo que es variado continuamente sobre el rea del
documento que est siendo escaneado. Los escaners que incorporan esta caracterstica
pueden reducir mucho el tiempo que lleva conseguir un escaneado aceptable, o
establecer la diferencia entre tener una imagen con la que se puede trabajar o no. Si la
mayora de los dibujos tienen ruido, poco contraste, o estn en malas condiciones, un
escner que utilice umbralizacin ser una buena eleccin.

Actualmente, la mayora de los escaners de rango medio en el mercado estn muy


prximos entre ellos en cuanto a funcionamiento, precio y especificaciones. Un
principio a seguir es que no hay que tener en cuenta los reclamos de resolucin
interpolada y se debe elegir un modelo que tenga una resolucin ptica real igual o
superior a los requerimientos de salida deseados.

Se debe prestar mucha atencin a las tolerancias de precisin especificadas por el


fabricante, especialmente si las aplicaciones son de cartografa o GIS. Habr que vigilar
la garanta y polticas de asistencia del fabricante o distribuidor. Deberemos examinar
cuidadosamente el software que viene con el escner; esto puede ser ms importante
que el escner en s. Es fcil de usar?, tiene las caractersticas de funcionamiento que
necesitamos, como borrado, correccin de desviaciones y limpieza?. Si no es as,
deberemos considerar el usar software de terceros que ofrezca tales caractersticas.
Finalmente, tendremos en cuenta cunto vamos a estar utilizando la unidad. Si el
escner va a ser usado para aplicaciones de gran volumen o en turnos de 24 horas
debera tenerse en consideracin una mquina ms slida pensada para el trabajo
intensivo que tendr un precio sensiblemente superior.

1.4 Mtodos de vectorizacin.

La digitalizacin manual usando una tableta digitalizadora ha sido ampliamente usada.


Con este mtodo, el operador traza manualmente todas las lneas desde su copia del
mapa usando un puntero y creando un mapa digital idntico en su ordenador. Una lnea
se digitaliza recogiendo una serie de puntos a lo largo de la lnea. Aunque este mtodo
es bastante directo, requiere operadores experimentados y consume mucho tiempo. Para
un complejo mapa de curvas de nivel, puede llevar a una persona de 10 a 20 das
conseguir el mapa completamente digitalizado.

Otra gran desventaja de este mtodo es su baja precisin. La precisin de la


digitalizacin manual meramente depende de lo precisa que sea la duplicacin a mano
de la copia del mapa en el ordenador. El nivel de precisin espacial que la mano
humana es capaz de resolver est entorno a los 40 dpi (dots per inch) en el mejor de los
casos, y ser ms bajo si el operador est cansado y aburrido despus de trabajar en ello
durante un periodo de tiempo. Se realiz un experimento en una universidad, se pidi a
un grupo de estudiantes de geografa que digitalizarn el mismo mapa y los mapas
finales fueron superpuestos uno encima del otro para crear un nuevo mapa. El resultado
no fue sorprendente, el nuevo mapa estaba fuertemente distorsionado en comparacin
con el mapa original.

La digitalizacin manual es soportada por la mayora de los paquetes de CAD y GIS


mediante la conexin directa a muchas de las tabletas de digitalizacin populares.

Adems de los anteriores mtodos que parten de la informacin de un rster tambin se


pueden convertir dibujos lineales desde papel o pelcula a una representacin vectorial
utilizando los siguientes mtodos:

Vectorizacin ciega. En este mtodo, el dibujo que va a ser vectorizado se pega


sobre una tableta digitalizadora. El operador usa un ratn para introducir los puntos de
inicio y fin de cada lnea pulsando sobre ellos. l est concentrado en el dibujo y no
tiene retroalimentacin de los resultados.
Vectorizacin interactiva. Se usa el anterior procedimiento, pero el operador tiene
retoralimentacin mediante la visualizacin de los puntos y lneas introducidos en una
pantalla de alta resolucin. La desventaja es que el operador tiene que mover
constantemente su cabeza entre la pantalla y la tableta digitalizadora. Esto podra no ser
deseable desde el punto de vista de la ingeniera humana.

Hay 6 mtodos bsicos para convertir la informacin de un rster en datos vectoriales


para CAD:

1. Emplear seguimiento electrnico de lneas (establecido por LaserScan), ahora


llamado seguimiento interactivo de lneas de datos escaneados en un rster.
2. Escanear en un rster el dibujo para crear un fichero rster, conectar los puntos
del rster, adelgazar la lnea resultante en un nico vector o seguir los contornos
de la lnea para crear dos conjuntos de vectores. La mayora de las aplicaciones
requieren lneas finas en lugar de conjuntos de vectores duplicados.
3. Escanear en un rster el dibujo, conectar los puntos del rster, adelgazar las
lneas y segmentar los vectores normalmente cortos en vectores en lnea recta
ms largos con puntos de fin y posiblemente con anchuras de lnea. El resultado
es una serie de vectores en lnea recta que representan el dibujo o mapa.
4. Escanear en un rster el dibujo para crear un fichero rster, conectar los puntos,
adelgazar las lneas, segmentar las lneas en vectores ms largos, interpretar las
formas de las lneas, reconocer el texto y asociar el texto a las formas de las
lneas. El resultado de estas operaciones es crear smbolos reconocidos y lneas
conectadas junto con cualquier informacin textual que pueda describir el
smbolo.
5. Escanear en un rster el dibujo para crear un fichero rster, entonces hacer
corresponder el patrn de pixeles con un patrn estndar de pixeles que
identifican un smbolo estndar. Este proceso no incluye la vectorizacin; es
simplemente un mtodo para hacer corresponder pixeles o patrones rster con
formas conocidas. Una relacin numrica entre los puntos se usa para identificar
el smbolo, por eso el smbolo reconocido debe estar muy prximo a los
smbolos estndar conocidos. Cambios en el smbolo como la orientacin o la
talla pueden impedir que el smbolo sea reconocido.
6. Emplear el mtodo de digitalizacin "con las cabezas levantadas" (heads-up
digitizing), que implica escanear el dibujo para producir una imagen rster en la
pantalla, sobre la que los vectores son dibujados usando uno de los muchos
paquetes de software disponibles. Aunque AutoCAD y MicroStation son los dos
paquetes de CAD ms populares para usar esta aproximacin, ahora
virtualmente todo el software de CAD permite tipos similares de digitalizacin
"con las cabezas levantadas". Algunos paquetes de GIS basados en vectores
proporcionan algunas funciones de digitalizacin con la cabeza levantada
dentro de sus programas, por ejemplo ArcInfo y ArcView de ESRI y MapInfo
de MapInfo. Se implementa combinando la visualizacin de imgenes rster con
su editor de vectores para guiar al operador al dibujar lneas y puntos justo
encima de una imagen escaneada. De cualquier modo, para algunos sistemas
software basados en vectores, hay algunas limitaciones importantes que les
impiden manejar ciertos tipos y tallas de imgenes.

La digitalizacin con la cabeza levantada es similar a la digitalizacin manual desde el


punto de vista de que las lneas tienen que ser trazadas a mano, pero trabaja
directamente en la pantalla del ordenador usando la imagen rster escaneada como
fondo. Cuando el programa no es capaz de tomar una buena decisin acerca de cmo
continuar, se deja a juicio del operador. La ventaja es que parte de la vectorizacin se
realiza automticamente, la desventaja es que dependiendo de lo que uno considera
bueno numerosos parmetros deben ser seleccionados previamente para obtener una
vectorizacin satisfactoria. El termino "cabezas levantadas" se deriva del hecho de que
los operadores trabajan en pantallas directamente enfrente de ellos, en lugar de trabajar
en mesas de digitalizacin, que sera una aproximacin con las "cabezas agachadas". A
pesar de que las lneas todava son trazadas a mano, el nivel de precisin es ms alto que
usando tabletas digitalizadoras porque las imgenes rster son escaneadas a alta
resolucin, desde 200 dpi a 1600 dpi normalmente. Con la ayuda de herramientas de
visualizacin, tales como aumento y reduccin de zoom el operador puede trabajar
realmente con la resolucin de los datos rster, es decir digitalizar con un nivel de
precisin mayor. De cualquier modo, el nivel de precisin todava no est garantizado
ya que es altamente dependiente del operador y de su modo de digitalizar. Este mtodo
tambin consume mucho tiempo llevando aproximadamente lo mismo que el mtodo de
digitalizacin manual.

1.5 Niveles de inteligencia de los documentos escaneados.

Como se muestra en la tabla 1 hay definidos 5 niveles de inteligencia asociados con la


informacin de dibujos escaneados.

1. Imagen rster mantenida como un rster puro o fichero de pixeles. Normalmente, esas
imgenes son almacenadas como ficheros rster comprimidos para reducir los tamaos
de los ficheros aproximadamente a un treintavo de la informacin originalmente
escaneada.
2. Imgenes rster escaneadas junto con informacin textual y vectorial asociada
(hbrido). Este nivel de inteligencia puede ser creado escaneando un documento, usando
la informacin rster como fondo para situar vectores y/o textos asociados a los
vectores. Un fichero hbrido puede contener alguna informacin de rster y alguna
vectorial para producir el resultado deseado.
3. Dibujos hechos de vectores conectados para formar una imagen bidimensional.
Aunque este nivel de inteligencia puede proporcionar una imagen ms comprimida que
la imagen rster escaneada, este tipo de fichero raramente se usa en aplicaciones CAD.
Con ficheros rster comprimidos a veces ms pequeos que los ficheros vectoriales, hay
poco que ganar con la conversin.
4. Vectores conectados con valores etiquetados. Ese tipo de fichero se usa por algunas
aplicaciones de cartografa, particularmente en curvas de nivel con valores de elevacin
marcados, hidrologa y clasificacin de tierras con identificadores.
5. Vectores con smbolos conectados y atributos asociados. Este es el ltimo objetivo
para la mayora de los sistemas CAD: una base de datos asociada. Este es tambin el
nivel de base de datos ms difcil de lograr a partir de datos escaneados.

De estos 5 niveles, los 4 primeros son relativamente fciles de obtener con la actual
tecnologa de vectorizacin a partir de datos escaneados. Aunque existe tecnologa para
obtener el nivel cinco para algunos tipos de dibujos, este nivel de informacin es muy
difcil de obtener en la mayora de los casos. La mayor parte del resto de este capitulo se
centra en los problemas asociados con este nivel.

1.5.1 Problemas de conversin a bases de datos inteligentes.

El mundo de los dibujos posee varios problemas para la conversin en una base de datos
inteligente. Muchos dibujos tienen informacin desaparecida o errnea. En algunos
tipos de dibujos, la informacin no est en la forma que se necesita para el escaneado.
Por ejemplo, un detalle de un dibujo mecnico podra incluir una descripcin grfica de
una parte a mayor tamao, pero tambin podra incluir una tabla de valores de diferentes
dimensiones relativas a diferentes partes numeradas. Esta informacin no puede ser
manejada directamente desde un dibujo escaneado y necesitara interpretacin OCR y
asociarse automticamente al grfico a extraer.

Un problema ms difcil para la conversin automtica es la asociacin de informacin


de atributos a los grficos. Al menos una compaa fundada en los ochenta,
Metagraphics, gast considerables recursos tratando de resolver este problema en
dibujos mecnicos, sin lograr una buena solucin en cuanto a costes. La experiencia a
mostrado que solo ciertos tipos de dibujos de una sola lnea (dibujos esquemticos) son
buenos candidatos para asociar atributos y grficos. Las tuberas y los diagramas de
instrumentacin son algunos de los mejores ejemplos que podran tener una solucin
con esta tcnica.

Adems de los problemas que acabamos de indicar, el mundo de los dibujos de mala
calidad tambin ha ralentizado el proceso de conversin. Los dibujos muy usados
tienden a tener pliegues, arrugas y manchas, y a veces son cianotipos de poca calidad,
reproducidos para ser distribuidos. Los colores sepia (p.e. por la accin de la luz y el
paso del tiempo sobre el papel) representan uno de los mayores desafos, en particular
aquellos que han sufrido cambios varias veces, causando amplias variaciones de
sombras en el fondo en diferentes reas del dibujo. Estas circunstancias requieren
tcnicas de umbralizacin dinmica, disponibles en la mayora de los mejores escaners,
para detectar y ajustarse a las diversas sombras del fondo.
En un estudio entre una serie de compaas privadas, el acuerdo general alcanzado en
cuanto a la calidad de los dibujos fue que:

El 20% de los dibujos eran de excelente calidad para el escaneado.


El 40 % pudo ser escaneado usando las mejores tcnicas de mejora disponibles
en los sistemas de escaneado.
El 20% necesit todas las capacidades de mejora de los escaners adems de
edicin interactiva del rster para ser limpiado. Ntese que este 20% est ms
all de las capacidades de mejora de la mayora de los escaners. Esta clase de
dibujos requiere inteligencia humana para editar interactivamente informacin
imposible de ser detectada y limpiada por los escaners disponibles.
El 20% era intil escanearlos porque eran totalmente ilegibles, estaban rotos en
varios pedazos, o simplemente muy deteriorados desde que se crearon. La
mayora de estos podran ser mejorados fotogrficamente; otros necesitaran ser
redibujados.

1.5.2 Servicios de escaneado y conversin.

Las dificultades de convertir dibujos por medio de escaneado y conversin tanto para
uso en CAD o GIS han engendrado una industria de agencias que prestan este servicio.
Las agencias de conversin han creado un nicho de mercado, realizando un servicio que
requiere un largo entrenamiento y la adquisicin de cierto equipamiento especializado.
Muchas compaas con grandes cantidades de dibujos a ser convertidos para CAD o
GIS han encontrado el coste de equipos, personal y formacin poco rentable. Si
aadimos el actual clima en la industria de reduccin de tamao y concentracin en el
ncleo de negocio de la compaa, probablemente no tiene sentido realizar las
conversiones en la propia empresa.

Las oficinas de escaneado y conversin pueden proporcionar los servicios de conversin


a un precio ms competitivo y en mucho menos tiempo que el que se hubiera requerido
para formar y entrenar personal interno. Y los servicios de conversin de escaneados
pueden realizar la conversin de documentos a cualquiera de los cinco niveles de
inteligencia citados previamente.

1.5.3 Automatizacin de la conversin a bases de datos inteligentes.

Para crear automticamente una base de datos inteligente asociada se requiere usar el
cuarto mtodo de vectorizacin anteriormente mencionado. Esto es, escanear en un
rster el dibujo, conectar los puntos, adelgazar las lneas, segmentarlas, interpretar
formas (reconocimiento de smbolos), reconocimiento de atributos y asociacin de
atributos a los smbolos. El reconocimiento de smbolos requiere crear conjuntos de
reglas de smbolos que definen smbolos especficos. La mayora de la tecnologa de
hoy requiere de la programacin de inteligencia artificial para crear las reglas de
smbolos. La situacin ideal, todava no disponible comercialmente, es tener esa
programacin con una interface de herramientas grficas que permitiran la localizacin
en pantalla de un smbolo y la creacin de la base de reglas del smbolo
automticamente a partir de la descripcin grfica. (Tal interface est disponible para
emparejamiento de patrones - pattern matching -, pero los patrones reconocidos estn
limitados por las tallas y orientaciones de los smbolos que se almacenan como
smbolos maestros para el emparejamiento. Las bases de reglas pueden ser ms
generalizadas para manejar variaciones en tamao y orientacin).
El uso de reglas basadas en la inteligencia artificial para emparejar smbolos requiere
lgica difusa para incrementar la fiabilidad del reconocimiento en dibujos reales. La
tecnologa de redes neuronales est proveyendo de sistemas entrenables para un mayor
xito en el reconocimiento de smbolos y caracteres. Esta tecnologa encabeza las
soluciones para la automatizacin de la conversin en bases de datos inteligentes.

1.6 Aplicaciones.

La gestin de documentos se ha convertido en la partida de coste ms alto dentro de las


grandes compaas y es el segmento de mercado de ms rpido crecimiento de la
informacin computerizada. La gestin de documentos comprende la conversin,
almacenamiento y distribucin de todo tipo de informacin, ya sea a partir de papel y
documentos en microfilm, ficheros de CAD, ficheros de GIS, procesamiento de textos,
hojas de clculo, etc. Toda informacin necesita ser organizada en bases de datos para
proporcionar acceso en segundos en lugar de das.

Los niveles de inteligencia 1 y 2 mencionados anteriormente, comprenden imgenes


rster puras. Las imgenes rster con texto asociado y vectores pueden ser manejados
por sistemas de gestin de documentos. Estos niveles de inteligencia son los menos
costosos de crear a partir de papel y documentos en microfilm. Si los documentos van a
integrarse en ficheros CAD, el nivel 2 puede ser fcilmente aplicado.

El simple visionado de un fichero CAD puede utilizar nivel de inteligencia 3, pero el


valor prctico de convertir a un fichero totalmente vectorial simplemente con propsitos
de visualizacin es cuestionable, puesto que una imagen rster comprimida proporciona
ms informacin legible y posiblemente una menor talla de fichero. No existe mercado
para la conversin de nivel de inteligencia tres.

Las aplicaciones cartogrficas, principalmente curvas de nivel y informacin de uso del


suelo, pueden ser manejadas con el nivel de inteligencia 4. Los vectores pueden ser
marcados con valores de informacin de elevacin o informacin de uso del suelo para
ser usados por un GIS.

La informacin de nivel 5 que comprende una base de datos inteligente asociada, parece
trabajar mejor con esquemas y otros diagramas de una sola lnea tales como mapas,
tuberas y diagramas de instrumentacin.
Este es un esquema de los formatos grficos de imgenes de ordenador ms comunes:

Principales formatos para grficos rasterizados


Extensin
Tipo MIME Nombre Descripcin
de fichero
ART es un formato de imagen
propietario usado habitualmente
por el software cliente de AOL. El
.art ART
formato ART nicamente soporta
una imagen fija que ha sido muy
comprimida
Comnmente usado por los
programas de Microsoft Windows
y por el sistema operativo
Windows
.bmp image/bmp propiamente dicho. Se le puede
Bitmap
aplicar compresin sin prdidas,
aunque no todos los programas son
compatibles.
Es un subconjunto del formato
.cin image/cineon Cineon ANSI/SMPTE DPX con cabeceras
fijas.
Formato propietario usado por
defecto en los documentos de
Corel Photo-Paint. Dispone de
importantes caractersticas extra,
Corel Photo- como la composicin por capas.
.cpt
Paint Image Compatible con muy pocos
programas aparte de los de la
misma casa. Su tamao suele ser
menor que el de los documentos
creados por Adobe Photoshop.
El ANSI/SMPTE DPX es un
Digital Picture
estndar Kodak similar a Cineon
.dpx image/dpx eXchange file
pero con cabeceras de imagen
format
flexibles y variables.
OpenEXR es el formato de cdigo
libre para imgenes de alto rango
dinmico (High dynamic-range o
HDR) desarrollado por la industria
Extended
Light & Magic para la generacin
Dynamic
.exr image/exr de imgenes en las producciones
Range Image
de cine. La principal ventaja del
File Format
formato es que soporta pxels en
coma flotante de ms de 32 bits y
mltiples algoritmos de
compresin sin prdidas, con un
ratio superior al 2:1 en imgenes
con grano.
Formato que admite mltiples
resoluciones de una imagen. Con o
Flashpix sin compresin y de 8 a 24 bits de
.fpx image/vnd.fpx
(1.0.2) profundidad de color Desarrollado
por Kodak en conjunto con
Hewlett Packard
GIF es utilizado popularmente en
Graphics la web. Formato de 8 bits (256
.gif image/gif Interchange colores mximo), con soporte de
Format animacin por frames. Utiliza la
compresin LZW.
Formato popular en los
Interchange
.iff ordenadores Amiga. ILBM es un
file format /
.ilbm subconjunto del IFF o Interchange
Interleave
.lbm File Format, que puede contener
bitmap
ms que imgenes.
El formato JPEG es usado
ampliamente para fotografas e
imgenes de gran tamao y
Joint
.jpeg variedad de color en la web y por
image/jpeg Photographic
.jpg las cmaras digitales. Es un
Experts Group
formato comprimido con prdida
de calidad, aunque esta se puede
ajustar.
JPEG 2000 es el sucesor del
popular JPEG, un nuevo algoritmo
basado en ondculas que permite
compresin con o sin prdidas. Se
Joint
.jpg2 considera el formato actual de
image/jpeg2000 Photographic
.jp2 moda para imgenes fotogrficas,
Experts Group
si bien an no est extendido en
sistemas modernos debido a los
requisitos de hardware y a la
multitud de patentes.
Formato de animacin que usa un
flujo de datos similar al de los
Multiple- formatos PNG y JPEG,
image originalmente diseado para
.mng video/x-mng
Network reemplazar el uso de GIF animados
Graphics en las pginas web. A diferencia
del formato GIF es un formato
libre.
Portable Formato simple para grficos en
.pbm
Bitmap Format blanco y negro. Utiliza 1 bit por
pxel. A diferencia del resto de
formatos grficos, un fichero PBM
contiene texto plano y puede ser
modificado con un simple
procesador de texto. Est
relacionado con los formatos PGM
(escala de grises) y PPM (color).
Formato propietario de Kodak, con
ImagePac
.pcd image/jpcd prdidas y profundidad de color de
Photo CD
24-bit color.
Formato nativo para el programa
Picture
.pcx Paintbrush de PC para DOS.
eXchange
Compresin sin prdida.
Formato de grficos simple en
escala de grises. Utiliza 8 bits por
pxel. A diferencia del resto de
Portable formatos grficos, un fichero PGM
.pgm Graymap contiene texto plano y puede ser
Format modificado con un simple
procesador de texto. Est
relacionado con los formatos PBM
(blanco y negro) y PPM (color).
PNG es grfico libre con
Portable compresin sin prdida que ofrece
.png image/png Network profundidades desde 8 hasta 24
Graphics bits. Fue diseado para reemplazar
al GIF en la web.
Formato grfico simple en color.
Utiliza 24 bits por pxel: 8 para el
rojo, 8 para el verde y 8 para el
azul. A diferencia del resto de
Portable formatos grficos, un fichero PPM
.ppm Pixmap contiene texto plano y puede ser
Format modificado con un simple
procesador de texto. Est
relacionado con los formatos PGM
(escala de grises) y PBM (blanco y
negro).
Formato propietario utilizado por
Adobe Photoshop. Posee cantidad
Documento de
application/x- de caractersticas extra, como la
.psd Adobe
photoshop composicin por capas. Poco
Photoshop
compatible con programas
externos a la casa Adobe.
Documento de Formato estndar de los
.psp
Paint Shop Pro documentos de Paint Shop Pro,
similares a los documentos .psd de
Photoshop. Compatible con muy
pocos programas.
El formato nativo para las tarjeta
.tga
Truevision TARGA, fue definido
TGA originalmente por Truevision Inc.
.tpic
en 1984.
TIFF se utiliza masivamente en
grficos de imprenta. Se pueden
emplear algoritmos con prdida o
.tiff Tagged Image
image/tiff sin prdida, bien muchos
.tif File Format
programas slo son compatibles
con un pequeo subconjunto de las
opciones disponibles.
Wireless
Utilizado fundamentalmente con
Application
.wbmp image/vnd.wap.wbmp WML en dispositivos
Protocol
inalmbricos.
Bitmap Format
Formato nativo en blanco y negro
del sistema X Window, compatible
con la mayora de navegadores
web. Se trata de un formato ASCII
.xbm image/x-xbitmap X BitMap
sin compresin diseado de tal
forma que los ficheros tienen
sintaxis de C/C++, pudiendo ser
incluidos en el cdigo fuente.
Formato nativo para el programa
The GIMP, con mltiples
eXperimental
caractersticas extra, como la
.xcf Computing
composicin por capas. Usado,
Facility
sobre todo, en The GIMP, pero
tambin leble por ImageMagick.
Es un formato grfico, en ASCII y
formato en C (parece un archivo en
C). Puede ser de hecho, creado y/o
manipulado por un editor de texto.
.xpm image/x-xpm X-Pixmap
Inspirado en el formato XBM, es
usado casi exclusivamente en
plataformas UNIX con el sistema
X Window.

Formatos comunes de Meta ficheros (tanto Rasterizados como Vectorial)


Encapsulated Utilizado para salida de
.eps image/eps
PostScript dispositivos PostScript (.ps).
Estndar en equipos Macintosh. Es
mapa de bits. No son archivos
.pic image/pct Picture
vectoriales.

Formatos para grficos vectoriales


Adobe
Formato vectorial para Adobe
.ai application/illustrator Illustrator
Illustrator.
Document
Formato vectorial para
.cdr application/coreldraw CorelDRAW
aplicaciones CorelDRAW.
Computer Estndar ISO. Se utiliza en la
.cgm image/cgm Graphics industria aeronutica (CGM
Metafile members).
ASCII Ficheros estndar de texto ASCII
.dxf image/vnd.dxf Drawing utilizados para almacenar datos
Interchange vectoriales de programas CAD.
Archivo en formato binario usado
por AutoCAD de AutoDesk. Puede
AutoCAD
contener objetos tanto en 2D como
.dwg image/vnd.dwg Drawing
en 3D con compresin y
Database
comprobacin de errores CRC para
datos internos.
Es un archivo PostScript que
almacena pequeos grficos
Encapsulated
.eps vectoriales, a diferencia de los que
PostScript
almacenan una o varias pginas
enteras.
Macromedia
Formato vectorial de Macromedia
.fh* Freehand
Freehand.
Document
Fichero fuente
de Slo utilizado por Macromedia
.fla
Macromedia Flash.
Flash
En esencia no es un formato
grfico propiamente dicho, sino un
formato de almacenamiento de
Portable documentos, que permite
.pdf application/pdf Document almacenar texto con formato,
Format imgenes de diferentes tipos, etc.
Es una versin simplificada de
PostScript; permite contener
mltiples pginas y enlaces.
Lenguaje genrico de descripcin
de pginas basado en vectores,
creado y patentado por Adobe.
.ps application/postscript PostScript PostScript es un potente lenguaje
de programacin basado en pila.
Compatible con la mayora de
impresoras lser.
Scalable Formato vectorial basado en XML,
.svg image/svg+xml
Vector definido por el W3C para su uso en
.svgz /comprimido
Graphics navegadores web.
Formato creado por Macromedia,
es ejecutado por el plugin Flash, el
cual permite mostrar animaciones
vectoriales contenidas en ficheros
application/x- ShockWave SWF. Diversas aplicaciones
.swf
shockwave-flash Flash pueden crear ficheros SWF,
incluido el programa Macromedia
Flash. Aunque bsicamente es un
formato vectorial, admite tambin
bitmaps.
Almacena grficos vectoriales y
rasterizados como secuencia de
Windows
.wmf image/x-wmf comandos para ser usados con el
Metafile
sistema operativo Microsoft
Windows.

Algunos formatos, como por ejemplo el PDF o el SWF, permiten ambos tipos de
grficos, rasterizados y vectoriales.

Vous aimerez peut-être aussi