Vous êtes sur la page 1sur 22

Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E.

de Urraza

Automatizacin de entrada
El ingresar informacin mediante un teclado y un ratn puede ser sumamente engorroso, y hasta
imposible, para cierto tipo de informacin, como ser las imgenes, o sistemas de control. Es por eso
que en los ltimos aos se han realizado numerosos avances en el rea, los cuales vamos a ver en
detalle en este captulo.

Seccin 1: Escneres.
El tratamiento de imgenes digitales est de moda. Los equipos antes reservados nicamente para
oficinas importantes ahora son comunes en cualquier escritorio. El poder de las PCs para manipular
imgenes digitales es ahora normal, por lo que no sorprende que el mercado de los escneres, los
dispositivos utilizados para ingresar imgenes a la PC, sea uno de los de mayor crecimiento del
momento.
Desde el punto de vista ms bsico, un escner es un tipo de dispositivo de entrada, como un teclado
o ratn, excepto que toma su entrada en forma grfica. Estas imgenes pueden ser fotografas para
retocar, corregir o utilizar en DTP (Desktop Publishing). Pueden ser logotipos dibujados a mano
para poner en documentos, o pginas de texto que tratadas con un software especial puedan grabarse
como un archivo editable de texto.
La lista de aplicaciones de los escneres es casi infinita, y ha resultado en productos que satisfacen
requerimientos especiales: compactos, diseados exclusivamente para OCR y manejo de
documentos, especiales para fotos, o manuales baratos. Sin embargo, los escneres de pgina
completa son los ms populares. stos son capaces de capturar imgenes a color, documentos,
pginas de libros y revistas, e inclusive diapositivas.

Operacin.
En el nivel ms simple, un escner es un dispositivo que convierte la luz en ceros y unos,
transformando datos analgicos en digitales.

1
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

Todos los escneres trabajan con el mismo principio de reflectancia o transmisin. La imagen se
pone frente a un mecanismo consistente en una fuente de luz y un sensor, y, en el caso de una
cmara digital, esta fuente de luz puede ser artificial o el sol. Cuando salieron los primeros
escneres, muchos fabricantes utilizaron focos fluorescentes como fuente de luz. A pesar de ser
buenos para varios propsitos, los fluorescentes tienen dos debilidades: Raramente emiten luz
blanca consistente por largo tiempo, y cuando estn encendidos emiten un calor que pueden
distorsionar los otros componentes pticos. Por estas razones, la mayora de los fabricantes se han
movido a los focos de ctodo fro que brindan luz blanca y emanan menos calor. Los focos
fluorescentes se encuentran ahora en unidades baratas o antiguas.
Para direccionar la luz del foco a los sensores que leen los valores de luz, los escneres CCD utilizan
prismas, lentes y otros componentes pticos. Como los anteojos o lupas, estos tems pueden variar
mucho en calidad. Un escner de alta calidad utiliza ptica y cristales buenos que contienen
correccin de color y evitan la difusin. Los modelos baratos usualmente utilizan componentes
plsticos para abaratar costos.
La cantidad de luz reflejada por la imagen es percibida por el sensor, y luego convertida en un
voltaje proporcional a la intensidad de la luz. Cuanto mayor es el brillo de la imagen, ms luz es
reflejada, por lo que obtenemos un voltaje mayor. Esta conversin ADC es un proceso sensible,
susceptible a interferencia elctrica y ruido del sistema. Para protegerse de la degradacin del la
imagen, los mejores escneres del mercado utilizan un conversor ADC aislado de la circuitera
principal del escner. Sin embargo, esto introduce costos adicionales al proceso de fabricacin, por
lo que muchos modelos baratos incluyen el conversor ADC en la propia placa primaria del escner.
El sensor se puede implementar a travs de tres tipos de tecnologa diferente:
PMT (PhotoMultiplier Tube): Esta es una tecnologa utilizada en los escners de tambor de alta
calidad utilizados en las compaas de pre-prensa. Caros y difciles de operar, estos dispositivos
cargaban las imgenes en la computadora antes del advenimiento de los escners de mesa.
Tcnicos tenan que montar cuidadosamente los originales en un cilindro de cristal que luego
rotaba a alta velocidad alrededor de un sensor ubicado en el centro.
Con PMT la luz detectada por el sensor se divide en tres rayos que pasan a travs de filtros RGB
y luego por filtros fotomultiplicadores (donde la energa se convierte en una seal elctrica). Los
escners de tambor son menos susceptibles a errores, puesto que tienen una refraccin menor, y
adems, poseyendo sensores ms sofisticados que los CCD, tienen un mayor rendimiento. Sin
embargo son muy caros, y actualmente se utilizan nicamente para aplicaciones especializadas.
CCD (Charge Coupled Device): Esta tecnologa es responsable de la explosin de los escners,
cmaras digitales y mquinas de fax de nuestros das. Un CCD es un dispositivo electrnico de
estado slido que convierte la luz en una carga elctrica. Un escner de escritorio tpicamente
tiene cientos de elementos CCD ordenados en una larga y fina hilera. El escner pasa luz a travs
de filtros RGB y la luz reflejada es direccionada al array CCD mediante un sistema de espejos y
lentes. El CCD acta como un fotmetro, convirtiendo el valor reflejado en un voltaje analgico,
que luego puede ser muestreado y cambiado a valores digitales por un conversor ADC.
CIS (Contact Image Sensor): Es una nueva tecnologa de sensores que empez a aparecer en los
escners de mesa a finales de la dcada del 90. Los escners CIS emplean bancos densos de
LEDs RGB para producir luz blanca y reemplazar los espejos y lentes del escner CCD con una
nica hilera de sensores ubicados extremadamente cerca de la imagen de origen. El resultado es
un escner ms fino y liviano, con menor consumo de energa y ms barato de fabricar que el
dispositivo tradicional basado en CCD, pero no es capaz de lograr tan buenos resultados an.

2
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

Resolucin.
La resolucin se relaciona con la finura del detalle que un escner puede lograr, y usualmente se
mide en puntos por pulgada (dpi). Cuantos ms puntos por pulgada el escner pueda conseguir, ms
detalle tendr la imagen obtenida. La resolucin tpica de un escner de mesa barato a finales de la
dcada de los 90 era de 300x300 dpi.
Existe un elemento CCD por cada pxel, por lo que para un escner de mesa tenga una resolucin
ptica de 600 dpi, y un ancho mximo de documento de 8.5, se necesita un vector de 5100
elementos CCD en el cabezal de escaneo.
El cabezal est montado en un transporte que es movido a lo largo del objeto destino. A pesar de que
el proceso pueda parecer un movimiento continuo, el cabezal mueve una fraccin de pulgada por
vez, tomando una lectura entre cada movimiento. En el caso de un escner de mesa, el cabezal es
movido por un motor de pasos, un dispositivo que gira un monto predefinido cada vez que recibe un
pulso elctrico.
El nmero de elementos fsicos en un vector CCD determina la frecuencia de muestreo X, y el
nmero de paradas por pulgada determina la frecuencia de muestreo Y. A pesar de que estas
frecuencias son llamadas normalmente resolucin, el trmino es inexacto. La resolucin es la
habilidad del escner de determinar detalles en un objeto y est definida por la calidad de la
electrnica, ptica, filtros y control del motor, adems de las frecuencias de muestreo.
La luz reflejada es presentada al cabezal de escaneo a travs de una lente, y la calidad de la ptica
puede tener un gran efecto en la resolucin del escaneo, mayor an que la frecuencia de muestreo.
ptica de alta resolucin en un escner de 400 dpi puede producir mejores resultados que uno de
600 dpi con mal sistema ptico.
Para finales de 1998, el lmite fsico de cuantos elementos CCD podan ponerse juntos en una
pulgada eran 600. Es posible, sin embargo, aumentar la resolucin aparente utilizando una tcnica
conocida como interpolacin, la cual, bajo control de software o hardware adivina valores
intermedios y los inserta entre los reales. Algunos escneres hacen esto mucho mejor que otros.

Interpolacin.
Los escneres normalmente ofrecen resoluciones de 9600, 19.200 o 24.000 dpi. Es importante notar
que los escneres simplemente no son capaces de captar este nivel de detalle. La resolucin ptica
normal de los CCDs componentes de los escneres modernos es de 600x1200 dpi, y las resoluciones
mayores estn basadas en interpolacin.
Hay que notar que la especificacin de una resolucin no uniforme, por ejemplo 600x1200
necesariamente implica interpolacin, debido a que la adquisicin de los datos a 600 dpi en un eje y
1200 dpi en el otro no puede resultar en un cuadrado de datos. A 600x600 dpi tal escner
interpolar la dimensin de 1200 dpi bajando a 600 dpi (normalmente moviendo el motor de pasos
el doble de su movimiento habitual), o a 1200 x 1200 dpi interpolar la dimensin X. Bsicamente,
un chip de circuitos integrados en el escner genera los nuevos datos tomando los puntos que el
escner ve, y calculando como deberan ser los puntos entre ellos, utilizando un algoritmo que
adivina el color de los nuevos puntos promediando el de los adyacentes.
La interpolacin por software incrementa la resolucin an ms que la de hardware. Es realizada por
el procesador de la PC bajo el control del software manejador TWAIN. El problema es que las
mejores suposiciones nunca pueden ser realmente perfectas. Las imgenes interpoladas siempre se

3
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

vern muy suavizadas o un poco fuera de foco. Esto no importa mucho si es arte de lneas donde la
interpolacin ha tenido el efecto de suavizar los ejes recortados. Pero en las imgenes de tono
continuo, como las fotografas, muchas veces es mejor quedarse con la resolucin ptica de escner.

Escneres Color.
Los escneres color tienen tres fuentes de luz, una por cada primitiva RGB. Algunos cabezales de
escaneo contienen un nico tubo fluorescente con tres CCDs filtrados, mientras que otros tienen tres
tubos coloreados y un nico CCD. Los primeros producen la imagen color entera en una sola
pasada, siendo iluminado el blanco por tres luces que cambian rpidamente, mientras que el otro
tiene que ir y venir tres veces.
Los escneres de una pasada tienen problemas con la estabilidad de los niveles de luz cuando stas
se encienden y apagan rpidamente. Los viejos escneres de tres pasadas tenan problemas de
registro, adems de ser lentos. Las unidades modernas de tres pasadas estn bastante mejoradas, y
algunas son inclusive ms rpidas que los comunes de una pasada.
Otra alternativa es utilizar un mtodo de una pasada utilizando una luz blanca y leyendo los colores
en forma separada en el cabezal de escaneo. Las cmaras de vdeo modernas popularizaron el uso de
filtros en chips, donde el CCD tiene tres filas de elementos de captura, cada uno conteniendo un
filtro de color directamente en un chip. Alternativamente, un prisma puede dividir la luz blanca en
sus componentes de color y pasarlos al vector CCD de tres filas. Este sistema tiene muchas ventajas,
pero requiere ptica de alta calidad y una alineacin ptica muy precisa.

Profundidad de Color.
Cuando un escner convierte algo en forma digital, mira la imagen pixel por pixel y graba lo que ve.
Esta parte del proceso es muy simple, pero diferentes escneres guardan diferente informacin sobre
cada pixel. Qu tanta informacin se guarda es lo que mide la profundidad del color.
El escner ms simple slo graba blanco y negro, y se lo conoce como escner de 1 bit, ya que
puede expresar nicamente dos valores, encendido y apagado. Para poder ver los tonos que existen
entre el blanco y negro, un escner necesita al menos tener 4 bits (16 tonos) u 8 bits (256 tonos).
Cuanto mayor sea la profundidad del color del escner, ms certeramente podr describir lo que ve
al mirar cada pixel. Esto aumenta la calidad del escaneado.
La mayora de los escneres modernos color son por lo menos de 24 bits, significando esto que la
informacin recolectada por cada uno de los colores primarios es de 8 bits. Una unidad de 24 bits
puede teorticamente capturar 16 millones de colores diferentes, aunque en la prctica el nmero es
usualmente menor. Esta es una calidad cercana a la fotogrfica, y comnmente se la llama color
verdadero.
Recientemente, un nmero de fabricantes ha empezado a ofrecer escneres de 30 y 36 bits, que
teorticamente pueden capturar billones de colores. El nico problema es que pocos paquetes de
software grfico pueden manejar imgenes de ms de 24 bits, debido a las limitaciones del diseo de
las computadoras personales. De todos modos, estos bits extra bien valen la pena. Cuando un
programa abre una imagen de 30 o 36 bits, puede utilizar los datos extra para corregir el ruido
introducido en el proceso de escaneado, y otros problemas que afectan a la calidad de la imagen.
Como resultado, los escneres con mayor profundidad de color tienden a producir mejores imgenes
color.

4
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

Rango Dinmico.
El rango dinmico es semejante a la profundidad de color, ya que mide qu tan amplio es el rango de
tonos que el escner puede almacenar. Esta es una funcin del convertidor ADC, junto a la pureza
de la fuente de luz, los filtros coloreados y cualquier ruido del sistema. El rango dinmico se mide
en una escala de 0.0 (blanco perfecto) a 4.0 (Negro Perfecto), y un nmero nico dado para cada
escner particular indica que tanto de ese rango la unidad puede distinguir. La mayora de los
escneres color de mesa tienen dificultad para percibir las diferencias en los colores obscuros o
claros del final del rango, y tienden a tener un rango dinmico de 2.4. Esto es muy limitado, pero es
usualmente suficiente para proyectos donde el color perfecto no es importante. Para un rango
dinmico mayor, el siguiente paso es un escner de mesa de la mejor calidad, con profundidad de
color mayor y ptica mejorada. Estas unidades normalmente tienen un rango dinmico de entre 2.8 a
3.2, y estn mejor preparadas para tareas ms especializadas, como la pre-prensa color. Para lo
mejor en rango dinmico, la nica alternativa es el escner de tambor. Estas unidades
frecuentemente tienen un rango dinmico de 3.0 a 3.8, y provee toda la calidad de color que alguien
podra necesitar. El nico problema de estos escneres es el alto precio.
En teora, un escner de 24 bits ofrece un rango de 8-bits (256 colores) por cada color primario. La
diferencia entre 256 niveles de color es aceptada como indiscriminable por el ojo humano.
Desafortunadamente, algunos de los bits menos significativos se pierden en ruido, y las tcnicas de
correccin tonal de post escaneado reducen el rango an ms. Este es el motivo por el cual es mejor
hacer las correcciones de brillo y color de una vez desde el driver del escner antes de realizar el
escaneado en s mismo. Los escneres ms caros, con profundidad de 30 o 36 bits tienen un rango
mucho mayor con el cual empezar, ofreciendo un mejor detalle en las reas de sombra o iluminadas,
permitiendo realizar correcciones tonales y de todos modos terminar con unos decentes 24 bits al
final. Un escner de 30 bits recoge 10 bits de datos por cada componente RGB, y un escner de 36
bits recolecta 12. El driver del escner permite al operador controlar cuales 24 de estos 30 o 36 se
mantienen y cuales se descartan, realizando el ajuste a travs de la Curva Gamma, a la que se accede
a travs del control tonal del driver TWAIN.

Resolucin de Escaneo.
Antes de escanear cualquier imagen, es necesario determinar a que resolucin se escanear. Debido
a que la propaganda moderna nos ha condicionado a pensar que ms es mejor, no es difcil
entender porqu muchos usuarios tienen una tendencia a escanear a resoluciones muy altas. La
resolucin de escaneo siempre debe ser determinada por la capacidad del dispositivo de salida, y
para la mayora de los propsitos prcticos es raramente necesario escanear a una resolucin mayor
de 240 dpi.
Las imgenes impresas utilizan una tcnica llamada medio tono (halftoning) para producir
diferentes niveles de color. En las revistas se utiliza un medio tono ordenado, donde puntos
regulares de diferentes tamaos producen diferentes niveles de color. La mayora de las impresoras a
chorro utilizan el dithering, donde los puntos son diseminados a travs de del rea de cada pxel.
Esto produce mejores resultados visuales a resoluciones menores. El uso del medio tono significa
que el nmero de pixeles por pulgada en la impresora es menor que la resolucin de dpi.
La regla para imprimir en color de 24 bits es que el nmero de ppi es 16 veces menor que la
resolucin. Esto significa que para una impresora de 600 dpi una resolucin de 40 ppi es apropiada.

5
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

Las impresoras offset son capaces de imprimir 133 lneas por pulgada. Esta tecnologa no es la
misma que la lser o chorro de tinta, y la regla general aqu es que se debe escanear a 1.5 veces la
resolucin de impresin, un equivalente a 200 dpi.
Cuando escaneamos para imprimir en una impresora a inyeccin, una regla comn es escanear a 1/3
de la resolucin a la que se imprimir. Por lo tanto, si queremos imprimir a 720 dpi, 240 dpi es una
resolucin apropiada de escaneo. Si escaneamos en escala de grises o arte de lnea, es mejor utilizar
la resolucin completa de la impresora, sin dividir por tres.
Cuando escaneamos imgenes para ponerlas en pginas Web o mostrarlas en el monitor de la PC, la
resolucin de escaneo se elige basada en el tamao deseado de la imagen a mostrarse. Las tarjetas
grficas son capaces de mostrar diferentes modos de despliegue (640x480, 800x600, 1024x768, etc.)
y los monitores vienen en diferentes tamaos. Sin embargo, por regla general, las imgenes a ser
mostradas en el monitor de la PC deben ser escaneadas a 72 dpi.

Modos de escaneo.
La PC representa las imgenes en variadas formas:

Arte de lnea: Almacena nicamente informacin en blanco y


negro. Esto significa que toma slo un bit de datos guardar
cada punto de la imagen guardada. El arte de lnea es ms til
cuando se escanea texto o dibujos de lneas. Las imgenes no
se escanean bien en este modo.

Medio tono: Mientras que la computadora puede almacenar y


mostrar imgenes en escala de grises, la mayora de las impresoras
son incapaces de imprimir diferentes tonos de grises. Ellas utilizan
un truco llamado medio tono. El medio tono utiliza un patrn de
puntos para engaar al ojo hacindole creer que est viendo
informacin de escala de grises.

Escala de grises: Los humanos pueden identificar alrededor de


255 tonos de grises, representados en la PC mediante un nico
byte de datos con valor entre 0 y 255. Una imagen en escala de
grises puede ser pensada como el equivalente de una fotografa
en blanco y negro.

Color verdadero: La PC utiliza 8 bits (1 byte) para representar


cada uno de los componentes de color RGB y por lo tanto 24 bits
son necesarios para representar todo el espectro de colores de cada
pxel.

6
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

Normalmente, la imagen escaneada se guarda en un archivo. Este archivo puede tener un tamao
significativo, importante para el momento de realizar el escaneo, debido a que las resoluciones
soportadas por los escneres modernos pueden resultar en la creacin de imgenes de ms de 30 MB
para una pgina A4.
Los formatos BMP, TIFF, GIF, PNG, JPEG son algunos de los ms utilizados. Estos formatos ya
han sido tratados a profundidad en otra seccin, por lo que no se volver a mencionar las ventajas o
desventajas de cada uno.
Salvo que exista una necesidad de preservar la informacin de color del documento original, las
imgenes para procesamiento OCR son mejor escaneadas en escala de grises. Esto utiliza un tercio
del espacio de un escaneo RGB. Una alternativa es escanear como arte de lnea, pero esto a menudo
pierde detalles, reduciendo la certeza del proceso de OCR posterior.

Driver TWAIN.
TWAIN no es un acrnimo, sino un estndar muy importante de adquisicin de imgenes,
desarrollado por Hewlett-Packard, Kodak, Aldus, Logitech y Caere, que especifica como la
adquisicin de las imgenes mediante dispositivos como escners, cmaras digitales y otros
transfieren los datos a aplicaciones de software. TWAIN permite a las aplicaciones trabajar con
dispositivos de adquisicin sin conocer nada sobre ste. Si un dispositivo es compatible con
TWAIN, as como la aplicacin, los dos deberan trabajar juntos sin problemas.
Es posible adherir ms de un dispositivo de adquisicin TWAIN a la PC al mismo tiempo. Cada
dispositivo tendr su propio mdulo TWAIN. Esto hace necesario que las aplicaciones compatibles
con TWAIN provean un mtodo mediante el cual selecciones que dispositivo TWAIN se utilizar
durante la sesin.
Los fabricantes actualmente estn proveyendo escneres con dos manejadores TWAIN. El primero
es bsico, simple, apuntado al usuario novato. Con ste, el escaneo es normalmente un tema de
apretar un botn. Se selecciona el botn de vista previa, y una pequea previsualizacin de la
imagen aparece en la pantalla. Desde ah, el rea de escaneado puede ser ajustada junto a la
resolucin y profundidad de colores. Cuando el resultado de la previsualizacin es satisfactorio, se
presiona el botn de escanear y se inicia el proceso.
Para un usuario avanzado, debe haber un botn de opciones avanzadas en el primer driver. Este
botn abre el segundo driver, que ofrece un mayor rango de ajustes sobre la imagen, como brillo,
contraste, color y correccin de gamma. Esto permite un ajuste especfico para los valores de tonos,
ya sea como un todo o para cada primitiva por separado.

7
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

Calibracin del color.


Una de las frustraciones de utilizar un escner de mesa es que la imagen escaneada se ve diferente
en la pantalla que al ser impresa, y a su vez sta puede variar bastante del original. La solucin a este
problema es el sistema de calibracin de color. Este tipo de software es realmente valioso
nicamente para escanear imgenes de alta calidad (transparencias, impresiones de calidad
profesional, etc.) que necesitan obtener estndares de calidad rigurosa. Para la mayora de la gente
que utiliza un escner, el color certero no es tan importante como un color rpido y agradable. Las
complejidades del color y de la percepcin humana han hecho la calibracin algo difcil, y, como
consecuencia, existen diferentes soluciones disponibles, con otras ms en camino.
Uno de los ms conocidos es el CMS (Colour Management System) de Kodak, que utiliza sus
propias definiciones de color junto a perfiles para cada escner, monitor e impresora diferente en el
sistema, para traducir y estandarizar los colores. Elementos del sistema Kodak estn unidos con
Adobe Photoshop y software semejante, y CMS se est convirtiendo rpidamente en el favorito de
los artistas grficos y otros que dependen directamente de los colores correctos.
Otros sistemas se han desarrollado por fabricantes individuales de escneres y publicadores de
software. Estos sistemas propietarios basados en perfiles pueden tambin realizar el trabajo, siempre
y cuando posean perfiles de todos los dispositivos diferentes que se utilizarn para escanear,
visualizar, editar e imprimir la imagen final.
Un acercamiento final es conocido como correccin basada en salida, y envuelve escaneado e
impresin con una calibracin estndar, y luego haciendo los ajustes a los perfiles de color para
estandarizar los colores. Este es un proceso menos sofisticado, y probablemente es inapropiado para
usuarios que necesitan recalibrar continuamente su sistema para resultados ptimos. Para escaneado
bsico, sin embargo, es una solucin suficiente.

OCR (Optical Character Recognition).

Cuando una pgina de texto es escaneada en la PC, se guarda como un archivo electrnico hecho de
pequeos puntos (pixeles), que no es visto por la computadora como texto, sino como una imagen
del texto. Los procesadores de texto son incapaces de editar imgenes tipo mapa de bits. Para
convertir un grupo de pixeles en palabras editables, la imagen debe pasar a travs de un proceso
complejo llamado OCR.
La investigacin OCR empez a finales de la dcada del 50, y desde entonces, la tecnologa se ha
refinado y desarrollado continuamente. En la dcada de los 70s y 80s, el software OCR era an muy
limitado, y slo poda trabajar con ciertas tipografas y tamaos. Actualmente, el software OCR es
mucho ms inteligente, y puede reconocer prcticamente todas las tipografas, adems de
documentos muy degradados.
Una de las primeras tcnicas de OCR fue una llamada matriz, o coincidencia
de patrones. Como la mayora del texto es Times, Courier o Helvtica en
tamaos entre 10 y 14, los programas OCR utilizan un patrn de mapas de bits
guardados para cada carcter de cada tipografa en cada tamao, mediante los
cuales comparan su bases de datos de bitmaps sobre las lneas escaneadas
intentando reconocer las letras. Este sistema antiguo fue nicamente til con
tipografas no proporcionales (monoespaciado), semejantes a Courier, en las que
las letras tienen un espaciamiento regular y son fciles de identificar. Complejos
documentos, con mltiples letras estaban ms all de la capacidad del software,
8
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

y una limitacin obvia del mtodo es que slo sirve para las tipografas y tamaos de las tipografas
que tuviera almacenadas en su base de datos.
Extraccin de caractersticas fue el siguiente paso en le desarrollo de OCR. Se intent reconocer
caracteres identificando sus caractersticas universales, con la meta de hacer al software
independiente de la tipografa. Si todos los caracteres pueden ser identificados utilizando reglas
definiendo la manera en que los crculos y lneas se unen, las letras individuales podran ser
identificadas independientemente de su tipografa. Por ejemplo, la letra a est hecha de un crculo,
una lnea en el lado derecho y un arco sobre el medio. El arco sobre el medio es opcional. Por lo
tanto, se una letra escaneada que tenga esos rasgos podra ser correctamente identificada como
una letra a por el programa OCR.
En trminos de avance en la investigacin, la extraccin de rasgos fue un
paso adelante del uso de matrices de patrones, pero los resultados se vean
muy afectados las por impresiones de mala calidad. Marcas extra en la
pgina, o manchas en el papel, tenan un efecto muy grande en la eficiencia.
La eliminacin de esos ruidos se convirti en un rea de investigacin en s
misma, intentando determinar qu pixeles de la impresin eran o no parte de
letras. Una vez que el ruido es identificado, los fragmentos de caracteres
pueden ser reconstruidos en las formas de las letras. Ningn software OCR
reconoce siempre un 100% de las letras escaneadas. Algunos programas
utilizan ambos mtodos anteriormente citados para reconocer la mayor
cantidad de caracteres posible, con un complemento de verificador ortogrfico para adivinar las
letras irreconocibles. Por ejemplo, si un programa OCR no puede reconocer la letra r dentro de la
palabra per~o, pasar esa palabra incompleta al verificador ortogrfico en busca de alguna palabra
que fuera posible, para determinar la letra perdida.
La tecnologa OCR reciente es mucho ms sofisticada que las tcnicas anteriores. En vez de intentar
identificar caracteres individuales, tcnicas modernas son capaces de identificar palabras enteras.
Esta tecnologa, desarrollada por Caere, es llamada POWR (Predictive Optical Word Recognition).
Utilizando niveles altos de anlisis contextual, POWR es capaz de eliminar virtualmente los
problemas causados por el ruido. Esto permite a la computadora navegar por los miles de millones
de posibles puntos que forman parte de una palabra y que se pueden conformar las letras. Cada
interpretacin posible luego recibe una probabilidad, y la mayor se selecciona. POWR utiliza
algoritmos matemticos sofisticados que permiten a la computadora descubrir la mejor
interpretacin son examinar cada posible versin en forma individual.
Cuando las probabilidades son asignadas a palabras individuales, todos los tipos de informacin
contextual y evidencia es tomada en cuenta. La tecnologa hace uso de redes neurales y tcnicas de
modelado predictivo tomadas de la investigacin en AI y ciencia cognitiva. Esto permite al POWR
identificar palabras de una manera que recuerda mucho ms cercanamente el reconocimiento visual
humano. En la prctica, la tcnica mejora significativamente la certeza del reconocimiento de
palabras en cualquier tipo de documento. Todas las posibles interpretaciones de una palabra son
comprobadas mediante una combinacin de fuentes de evidencias, desde la informacin de bajo
nivel de pixeles hasta pistas contextuales de alto nivel. La interpretacin ms probable entonces es
seleccionada.
A pesar de que los sistemas OCR existen desde hace bastante tiempo, sus beneficios recin ahora
empiezan a apreciarse. Los primeros ofrecimientos eran extremadamente costosos, en trmino de
software y hardware, adems de ser poco precisos y difciles de usar. Consecuentemente, muchos de
los primeros en utilizar la tecnologa se mostraron frustrados. Pero con el paso de los ltimos aos,
9
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

OCR ha sido completamente transformado. EL software OCR moderno es muy preciso, fcil de usar
y barato, lo que lo hace ideal para la venta masiva.

Retocado de imgenes.
Mientras que los escneres proveen un mtodo efectivo de capturar imgenes a color, a menudo ese
es slo el comienzo. Una vez que una fotografa ha sido digitalizada, su apariencia puede ser
alterada dramticamente utilizando un editor de mapas de bits o un paquete de dibujo.
En avisos y publicidad, muy pocas imgenes se utilizan tal y cual se digitalizan. Normalmente se
limpian, se mejoran los ejes, se afinan y colorean los ojos, y se le agrega brillo al cabello. Tambin
existe la tendencia de llamar la atencin a travs de imgenes distorsionadas o con fotomontaje.
Generalmente, el programa de retocado de imgenes intenta hacer dos cosas: cambiar algunos
elementos de la imagen de una manera natural que no pueda ser detectada (por ejemplo cambiar el
color de ojos de la persona) o producir una imagen irreal. En ambos ejemplos, debe ser imposible
notar el trabajo de retocado sobre la imagen.
Mucho de este trabajo es producido utilizando Adobe Photoshop, pero hasta los ms simples
paquetes permiten este tipo de alteraciones. Sin embargo, los paquetes complejos permiten realizar
una mayor variedad de funciones de una manera ms sencilla.

10
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

Seccin 2: Cmaras Digitales.


Es fcil entender el gran negocio que los fabricantes de cmaras digitales estn haciendo en estos
das. La existencia de aplicaciones de publicacin fciles de usar para el hogar o la oficina, la
expansin dramtica de la Web con su apetito insaciable de imgenes visuales, y la proliferacin de
impresoras baratas capaces de lograr salida semejante a fotografas, hacen que la cmara digital sea
un accesorio interesante. Todos estos factores, combinados con una calidad de imagen mayor y
precios bajos, ponen a la cmara digital en la cspide de convertirse en un perifrico estndar para la
PC.
En sus principios, una cmara digital es similar a una cmara basada en pelcula. Existe una vista a
la que apuntar, una lente para enfocar la imagen hacia un dispositivo sensible a la luz, algn medio
para guardar y luego remover varias imgenes, y todo est dentro de una sola caja. En una cmara
convencional, la pelcula sensible a la luz captura las imgenes y las guarda hasta ser tratada
qumicamente.

Captacin de la Imagen.
A pesar de que el principio es el mismo que en
una cmara convencional, el trabajo interno de
una cmara digital es muy diferente. En una
cmara digital, la obtencin de la imagen es
realizada por un CCD (Charge Coupled Device)
que consiste en un vector de elementos sensibles
a la luz, en los que cada pxel est representado
por un transistor rojo, verde y azul. Cada
elemento convierte la luz en un voltaje
proporcional al brillo que luego es pasado a un
convertidor ADC, que traduce las fluctuaciones
del CCD en cdigo binario discreto. La salida
digital del ADC se enva al DSP, que ajusta el
contraste y detalle, y comprime la imagen antes
de enviarla al medio de almacenamiento. Cuanto
ms brillante sea la luz, mayor ser el voltaje y el
pixel resultante en la computadora. Cuantos ms
elementos CCD existan, ser mayor la resolucin, y mayor el detalle que puede ser capturado.
El proceso completo es muy amigo del ambiente. El CCD est fijo y puede sacar fotografas por
todo el tiempo de vida de la cmara. No hay necesidad de tener una pelcula movindose entre dos
pivotes, lo que ayuda a minimizar el nmero de partes mviles.

CCD contra CMOS.


1998 vio emerger a los CMOS (Complementary Metal-Oxide Semiconductor) como una alternativa
en captura de imgenes al CCD. Los chips CMOS son mucho ms baratos y menos problemticos
de fabricar, adems de tener un consumo de energa mucho menor que los CCDs. Adems, los
CCDs tienen la nica funcin de registrar el lugar en que la luz cae dentro de cientos de miles de
11
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

puntos de muestreo. Los chips CMOS vienen cargados con otras tareas, como conversin ADC,
procesamiento de seales, manejar control de balance y cmara, y mucho ms. Tambin es posible
incrementar la densidad del CMOS y su profundidad de color sin incrementar excesivamente el
costo.
Por esta y otras razones, la mayora de los analistas de la industria creen que eventualmente, casi
todas las cmaras digitales baratas estarn basadas en CMOS y que slo las unidades caras utilizarn
CCDs. Sin embargo, la tecnologa CMOS sufre actualmente de un nmero de problemas, tales como
imgenes con ruido y la incapacidad de capturar movimiento en forma correcta, por lo que an le
falta tiempo para poder alcanzar a su tecnologa rival.

Calidad de la Imagen.
La calidad de la imagen en una cmara digital depende de numerosos factores, incluyendo la calidad
ptica del lente y el chip de captura, los algoritmos de compresin y otros componentes. Sin
embargo, el elemento ms importante en la determinacin de la calidad de la imagen es la resolucin
del CCD. Cuantos ms elementos tenga, mayor ser la resolucin, y por lo tanto el detalle que puede
ser capturado.
En 1997 la resolucin nativa de las cmaras digitales para el consumidor era de 640x480. Un ao
despus las tcnicas de fabricacin mejoraron y la tecnologa progres haciendo emerger cmaras
megapixel, que por el mismo precio obtenan resoluciones de 1024x768 e inclusive 1280x960.
Actualmente las cmaras rondan los 4,2 a 11 Megapxeles, con resoluciones de 2530x1659 pxeles y
ms.
Algunas cmaras consiguen archivos de mapa de bits con una resolucin mayor que su verdadera
resolucin ptica (la del CCD), ya sea mediante interpolacin o agrandamiento por software. En vez
de utilizar la interpolacin estndar, en la que los pixeles son copiados y pegados para crear
imgenes ms grandes, el software de agrandamiento genera nuevos pixeles donde el piensa que son
necesarios para hacer lneas, sombras, patrones y contornos. Los resultados en teora son mejores
que la interpolacin normal, que no obtiene la misma calidad que la resolucin nativa de la imagen.
Otro factor limitante son las rutinas de compresin utilizadas por muchas cmaras digitales para
permitir que ms imgenes puedan guardarse en la memoria. Algunas cmaras digitales guardan las
imgenes en formatos propietarios, requiriendo un software provisto por el fabricante para su
acceso, pero la mayora de las cmaras digitales comprimen y guardan sus imgenes en el estndar
industrial JPEG o FlashPIX, legibles por casi cualquier paquete de grficos. Ambos utilizan
compresin lossy, lo que lleva a un poco de prdida en la calidad de la imagen. Sin embargo,
muchas cmaras tienen diferentes capacidades de compresin, permitiendo elegir entre calidad de la
imagen y capacidad, incluyendo la opcin de guardar imgenes sin compresin para la mejor
calidad.

Capacidades.
Un panel color LCD es algo que est presente en prcticamente todas las cmaras digitales actuales.
Permite al usuario ajustar todas las capacidades ofrecidas por la cmara y es una ayuda invaluable
para previsualizar y ordenar las fotos sin conectar la mquina a la PC. Tpicamente, thumbnails de
las imgenes guardadas son mostrados, y el usuario tiene la opcin ver una imagen particular en
pantalla completa, realizar aumentos, cerrarla, recorrerla o borrarla de la memoria.

12
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

Pocas cmaras digitales vienen con un SLR (Single Lens Reflex) verdadero, donde el usuario ve
exactamente lo que el CCD de la cmara ve. La mayora tienen un visor separado que ve la imagen a
tomarse desde un ngulo ligeramente diferente y sufre de los consecuentes problemas de
perspectiva. La mayora de las cmaras digitales permiten que el LCD sea utilizado para
composicin en vez del visor ptico, eliminando este problema. En algunos modelos ste est
escondido detrs de un panel que debe
abrirse, rotarse y luego ponerse de nuevo
en su lugar. Esto puede ser un poco
molesto, pero tiene sus ventajas sobre
tener un visor fijo. Primero, la pantalla
est protegida cuando no se usa, segundo,
puede ser posicionada flexiblemente para
que el fotgrafo tome autoretratos o
saque fotos por encima de su cabeza
manteniendo el control sobre la imagen
resultante. Tambin ayuda a visualizar
mejor el contenido del LCD bajo la luz
del sol. Ahora, su uso consume las
bateras rpidamente, por el contrario del
visor puramente ptico.
Las cmaras digitales a menudo son
descritas como teniendo lentes
equivalentes a los lentes de cmara de 35
mm. De hecho, la mayora de las cmaras
digitales poseen lentes auto focus con
lentes focales de alrededor de 8 mm,
proveyendo una cobertura equivalente a
la de las cmaras estndares debido a que
los CCDs son mucho menores que un
cuadro de pelcula de 35 mm. El control
de la velocidad de apertura y cierre est
totalmente automatizada, y algunas
cmaras permiten ajustes manuales. A
pesar de que la resolucin ptica no es un
aspecto muy mencionado en la venta de
cmaras digitales, puede tener un rol muy
importante en la calidad de la imagen. Los lentes de las cmaras digitales tienen un rango efectivo
de hasta 20, una equivalencia ISO de entre 100 y 160 y soporta velocidades de cerrado de entre y
1/500 de segundo.
La capacidad de zoom (lentes motorizados de zoom con un rango focal equivalente a cualquier cosa
entre 36 mm y 114 mm) se est volviendo una caracterstica muy popular. Algunas cmaras tienen
un zoom gradual dentro de todo el rango, mientras que otras proveen dos o tres valores predefinidos.
El zoom digital toma la porcin central de una imagen y utiliza el software de la cmara para
recalcular el tamao mediante interpolacin. Algunas cmaras digitales proveen la capacidad de
zoom digital como una alternativa al zoom ptico verdadero, mientras que otras lo proveen como
una capacidad adicional, doblando efectivamente el rango de zoom de la mquina. Para un
13
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

acercamiento, una funcin de macro usualmente es provista, permitiendo tomar fotos desde una
cercana distancia de 3 cm, pero tpicamente soportando un rango focal de alrededor de 10 a 50 cm.
Algunas cmaras inclusive tienen unidades de lentes giratorios, capaces de rotar hasta 270 grados
permitiendo ver en el panel independientemente del ngulo del lente en s mismo.
Algunas cmaras ofrecen un nmero de opciones de captura de imgenes. La ms popular es el
modo burst, que permite tomar un nmero de exposiciones con una nica presin del botn (15
tomas a una velocidad de 1 a 3 tomas por segundo). Tambin es comn el lapso de tiempo, que
retrasa la captura de mltiples fotos sobre un intervalo predefinido. Otros ejemplos son la habilidad
de tomar cuatro tomas consecutivas utilizando nicamente un cuarto del array CCD, resultando en
un nico cuadro con cuatro imgenes separadas guardadas en l.
Algunas cmaras proveen un modo de exposicin manual, permitiendo al fotgrafo un grado de
licencia artstica. Tpicamente cuatro parmetros pueden modificarse en este modo: Balance de
color, compensacin de exposicin, poder del flash y sincronizacin del flash. El balance del color
puede ser ajustado para condiciones apropiadas de iluminacin (diurna, tungsteno o fluorescente).
La compensacin de exposicin altera el resultado general de la toma relativo a la exposicin ideal
medida. Esta capacidad es semejante a las mquinas SLR, permitiendo que una toma
intencionalmente (sub o sobre) expuesta consiga un efecto particular. La medida de poder del flash
permite alterar incrementalmente el poder del flash y la sincronizacin permite que el flash sea
forzado, independientemente de la configuracin de la cmara.
Capacidades permitiendo un nmero de efectos diferentes se estn volviendo comunes. Esto permite
la seleccin de modos monocromticos, negativos o sepia. Aparte del uso de efecto artstico, el
modo monocromo es til para capturar imgenes de documentos para subsecuente OCR. Algunas
cmaras tambin proveen un modo deporte, que le agrega finura a las imgenes capturadas u
objetos mviles, y un modo de toma nocturna que permite exposiciones largas.
Un cronmetro para tomar imgenes con un cierto retraso (de alrededor de 10 segundos) es normal,
y todas las cmaras actuales vienen equipadas con un flash automtico, con opcin de utilizacin
manual. Los flashes soportan todas las capacidades modernas, para minimizar sombras, evitar ojos
rojos, etc.
Otra capacidad comnmente disponible en las mquinas de filme que ahora existe en su contraparte
digital es la habilidad de marcar una imagen con fecha y hora, o inclusive algn otro texto alusivo.
Y esto no es todo, la innovacin reciente de micrfonos incorporados proveen anotaciones en
sonido, en formato WAV estndar. Luego de la grabacin, este sonido puede ser enviado a un
dispositivo externo para ejecucin, o ejecutado en auriculares.
Algunas otras capacidades que demuestran la relacin entre las cmaras digitales y las PCs son
funciones que permiten enviar galeras de imgenes por correo electrnico directamente desde la
cmara y la habilidad de capturar cortos vdeos en formato MPEG-1. Modelos ms caros adems
proveen soporte para dos tarjetas de memoria y capacidades asociadas a las mquinas SLR, tales
como lentes removibles y la capacidad de tener el flash montado en la cmara o externo a ella.
Para principios del 2000 un nmero de fabricantes importantes, incluyendo Nikon y Kodak, se
estaban preparando para seguir a su rival Minolta en el empuje de las cmaras digitales dentro del
mercado profesional, ofreciendo la tecnologa SLR (Single Lens Reflex) a precios accesibles.
Mientras que la diferencia entre los modelos profesionales y de consumidor es significativa, ha
decrecido dramticamente a finales de la dcada del 90, as como la brecha entre las cmaras
digitales en general y su contraparte analgica.

14
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

Operacin.
Es importante notar que el tomar una fotografa con una cmara digital no es lo mismo que hacerlo
con una cmara convencional. Las unidades ms antiguas tenan un tiempo de retraso de 1 o 2
segundos entre que el botn se presiona y la cmara captura la imagen. Acostumbrase a este
problema puede tardar tiempo, y es causante de que muchas imgenes salgan movidas. Esta es un
rea de mejora rpida, y las mquinas modernas casi no tienen retraso.
La mayora de las cmaras digitales adems requieren un tiempo de recuperacin entre cada toma
para el procesamiento posterior (conversin ADC, mapeo, retoques, compresin y almacenamiento
de la imagen en un archivo). Este intervalo puede tomar desde algunos segundos hasta medio
minuto, dependiendo de la cmara, las bateras y la resolucin de la imagen.
La mayora de las cmaras digitales utilizan bateras recargables de nquel o nquel-cadmio, adems
de pilas alcalinas comunes. El tiempo de vida de las bateras vara grandemente de cmara a cmara.
Como regla general, sin embargo, las recargables duran entre 45 minutos y 2 horas, dependiendo de
cuanto LCD y flash se utilice, mientras que las alcalinas duran normalmente 1 hora.

Almacenamiento en Memoria.
Muchas de las cmaras digitales de primera generacin contenan uno o dos megabytes de memoria
interna capaz de almacenar alrededor de 30 imgenes de calidad estndar a 640x480 pixeles.
Desafortunadamente, una vez que la memoria se llenaba, no se podan tomar ms imgenes hasta
que estas se transferan a la PC y borraban de la cmara.
Las cmaras digitales modernas utilizan almacenamiento removible. Esto ofrece dos ventajas
principales: primero, una vez que la tarjeta de memoria se llena, simplemente puede ser cambiada
por otra, segundo, dado el hardware necesario de PC, las tarjetas de memoria pueden ser insertadas
directamente en la PC y las fotos ledas de all. Para principios de 1999 dos formatos rivales
batallaban por el dominio de la arena de las cmaras digitales.
CompactFlash: Introducida en 1994 por SanDisk corporation, las tarjetas CompactFlash pesan
nicamente 11.4 gr. tienen un tamao de 43x36x3 mm. Basadas en la tecnologa de memoria
Flash, CompactFlash provee almacenamiento no voltil que no requiere bateras para retener los
datos. Es esencialmente una tarjeta flash de PC que ha sido reducida a alrededor de un cuarto de
su tamao original y utiliza una conexin de 50 pines que se ajusta a un adaptador de tarjeta de
68 pines Tipo II para PC. Esto la hace fcilmente compatible con dispositivos diseados para
utilizar PC Card flash RAM. Dentro de la tarjeta CompactFlash puede haber memoria Flash o
cualquier otro medio de almacenamiento (como ser discos duros MicroDrive), debido a que
provee una capa de abstraccin y contiene el controlador dentro de la propia tarjeta. Las tarjetas
CompactFlash estn diseadas para almacenar desde 8 MB hasta 137 GB de informacin,
aunque los modelos actuales alcanzan un mximo de 3 GB.
SmartMedia: Originalmente conocida como SSFDC (Solid State Floppy Disk Card), apareci en
1996, desarrollada por Toshiba. Son ms pequeas que las tarjetas CompactFlash, pesando 2 gr.
y un tamao de 45x37x0.78 mm. Utiliza un conector propietario, pero es compatible con
PCMCIA-ATA y por lo tanto puede utilizarse en slots de tarjetas de notebooks. Las capacidades
son menores que las de CompactFlash (128 MB mx.), pero a un costo menor por megabyte.
Memory Stick: Creacin de Sony con capacidad de hasta 128 MB, muy compacta. Por lo pronto
se utiliza en una porcin muy pequea del mercado.
15
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

Existen dispositivos disponibles para cada tipo de medio accesibles ya sea por un lector de diskettes
o por el puerto paralelo. La opcin de mayor rendimiento es un dispositivo SCSI que permite que las
tarjetas se agreguen a la PC de escritorio. CompactFlash tiene una construccin ms slida que su
rival, encapsulando los circuitos de memoria en un cartucho muy resistente. SmartMedia tiene los
contactos dorados expuestos, y su uso prolongado puede daar la superficie. CompactFlash puede
operar entre temperaturas de 25C a 75C y dice tener un tiempo de vida de 100 aos. SmartMedia
puede ser utilizada entre 0C y 50C y dice que puede ser escrita por lo menos 250.000 veces.
Con produccin de imgenes a 24 bits y resoluciones de 1800x1200 en los modelos de consumo
masivo, ocupando 6.2 MB de almacenamiento, la capacidad de almacenamiento se est volviendo
un aspecto importante en la tecnologa de cmaras digitales. No est claro cual de los formatos
ganar en la batalla. SmarMedia tuvo un buen inicio, pero CompactFlash est siendo utilizada en
PDAs tambin, una versatilidad extra que puede resultar en una ventaja importante a la larga.

Almacenamiento en Disco Duro.


Algunas cmaras profesionales utilizan discos duros PCMCIA como medio de almacenamiento. A
pesar de que stos no consumen energa una vez que las imgenes se han grabado, y tienen una
capacidad mucho mayor que la memoria flash, la opcin del disco duro tiene algunas desventajas.
Una tarjeta promedio de disco duro consume alrededor de 2.5 W de poder cuando gira sin efectuar
operaciones, y ms cuando lee o escribe, e inclusive ms cuando acelera. Esto significa que es
imprctico acelerar el disco, tomar algunas fotos y luego frenarlo. Todas las fotos deben ser tomadas
y almacenadas de una vez, e inclusive entonces la batera de la cmara dura poco tiempo. La
fragilidad y la confiabilidad son tambin de mayor importancia. Las partes mviles tienen
tolerancias mecnicas muy estrictas, lo que hace que los discos duros sean menos confiables que los
medios de estado slido.
Con la resolucin de las cmaras fijas incrementndose y la salida de las cmaras digitales de vdeo,
IBM dio un gran avance en la capacidad de almacenamiento con el lanzamiento del disco duro ms
pequeo del mundo, a mediados de 1999. El Microdrive utiliza un nico plato de una pulgada de
dimetro y pesa nicamente 20 gramos. Utiliza una interfaz CompactFlash Tipo II, y est disponible
en tamaos de hasta 1 GB. Esto lleva a la tecnologa CompactFlash mucho ms adelante.
Las PCs de mano tambin ganarn un mayor acceso al almacenamiento a disco, a pesar de que el
formato de tarjeta de PC no ha sido muy utilizado hasta ahora. Muchos de estos dispositivos
actualmente tienen slots CompactFlash, por lo que los fabricantes no tendrn que redisear sus
productos.

Discos Removibles.
Una de las mayores ventajas de las cmaras digitales es que no son mecnicas. Debido a que todo es
digital, no hay partes mviles, y por lo tanto menos cosas pueden ir mal. Sin embargo, esto no
detuvo a Sony en tomar un paso que puede ser visto como imaginativo y retrgrado al mismo
tiempo: Incluir un dispositivo de diskettes de 3.5 en su rango de cmaras digitales Mavica.
Esta tecnologa exclusiva de Sony permite doble velocidad cuando se graban o leen imgenes. La
velocidad del motor de giro, combinado con el nuevo DSP permite una rpida compresin JPEG.
Cada disco es capaz de almacenar 40 imgenes fijas o 60 segundos de vdeo y sonido.

16
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

Debido a que la capacidad de un disco flexible es limitada, el disco de la Mavica no sirve para
trabajo de alta resolucin. Sin embargo, siendo que es confiable, Sony puede haber dado un paso
positivo. Mientras que su reclamo de que los discos flexibles permanecern como un medio de
almacenamiento seleccionado puede no ser tan cierto, el hecho de que los discos flexibles son
universalmente compatibles, baratos y disponibles, es innegable. Tambin son fciles de usar,
puesto que no utilizan cables de conexin o interfaces. Mientras que el dispositivo integrado
obviamente agrega peso y tamao a una cmara que usualmente se espera sea lo ms compacta
posible, algunos usuarios actualmente prefieren diseos que se puedan tomar con ambas manos.
Un avance posterior, pero por el mismo sendero fue realizado nuevamente por Sony, cambiando el
diskette en la familia Mavica por un CD-R o CD-RW de menor tamao (mini-CD), que puede
almacenar hasta 185 MB. Este acercamiento es cmodo y barato, pero tiene el gran inconveniente de
la velocidad de grabacin o manipulacin de las imgenes que es bastante lenta, as mismo como el
consumo de energa lejano a lo ptimo.

Conectividad.

A pesar de la tendencia hacia el almacenamiento removible, las cmaras digitales todava permiten
la conexin a una PC con el propsito de la copia de imgenes. La transferencia se realiza
usualmente por cable serial convencional RS-232, SCSI, USB o FireWire. Estas ltimas opciones
son preferibles, ya que permite bajar las imgenes muy rpido y conectarse en caliente.
Normalmente cada cmara viene con un conector de estos y con los cables, accesorios y software
necesario para poder realizar de manera simple la conexin con la PC.
Suplementar a la cmara digital con drivers TWAIN permite a los usuarios simplemente bajar las
imgenes a una aplicacin estndar de grficos, y se est volviendo muy comn.
Algunas cmaras digitales proveen salida de vdeo y S-vdeo, para poder visualizar las imgenes
direcamente en un proyector, TV o VCR. Extendiendo la capacidad de slide show an ms,
algunas permiten que se carguen imgenes a la cmara, para utilizarla como una herramienta de
presentacin mvil.
Un gran nmero de cmaras digitales tienen la habilidad de saltar a la computadora y sacar las
imgenes directamente en una impresora. Pero sin estndares establecidos, cada cmara requiere una
impresora dedicada de su propio fabricante.

Aplicaciones.
Los usuarios de oficina tienen ms que ganar de la fotografa digital que los hogareos. La
tecnologa permite al usuario poner una foto en el monitor de la computadora a pocos minutos de ser
tomada, dando un gran empuje a la productividad. Las fotos capturadas digitalmente son puestas en
presentaciones, cartas de negocios, peridicos, tarjetas de identificacin y catlogos de Web o
impresos. Adems, los segmentos de oficina que se han basado mucho en la fotografa tradicional,
tales como agencias de seguros e inmobiliarias ahora prefieren utilizar cmaras digitales.
Si el requerimiento es tener imgenes en forma electrnica lo ms rpido posible, entonces la
cmara digital es la nica opcin. De hecho, son ideales para la publicacin en pantalla o uso en
presentaciones, donde la gente normalmente utiliza PCs con resoluciones entre 640x480 y 1024x768
pixeles. Una cmara digital trabajando resoluciones entre 640x480 y 1024x768 puede rpidamente
capturar y extraer una imagen en un formato de mapa de bits listo para ser utilizado en una
presentacin, trabajo, publicacin, WWW, etc.
17
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

Digital vs. Filme


A pesar de los avances realizados en los aos recientes, la sabidura convencional contina en que
las cmaras digitales ofrecen ventajas en trminos de flexibilidad, pero cuando se habla de calidad
de imagen todava estn muy por detrs de la cmara tradicional. Sin embargo, esta afirmacin
involucra tecnologas radicalmente diferentes, y es importante considerarlas ms cercanamente.
El primer paso es considerar la resolucin. Asumiendo una resolucin de captura de 1280x960
pixeles, una cmara tpica puede producir cerca de 1.2 millones de pixeles. Un lente moderno es
capaz de resolver por lo menos 200 pixeles por mm. Debido a que el negativo estndar 100ASA 35
mm es de 24x36 mm, esto da una resolucin efectiva de 24x200x36x200 = 34.560.000. Esta
resolucin es difcilmente alcanzada en la prctica, y, de hecho, raramente requerida. Sin embargo,
en base a la resolucin, es claro que las cmaras digitales todava necesitan recorrer un largo trecho
para conseguir el rendimiento de su contraparte en filme.
Sin embargo, esta es slo parte de la respuesta. El siguiente factor a considerar es el color, y aqu las
cmaras digitales tienen una ventaja. Tpicamente, los CCDs en las cmaras digitales capturan
informacin a 24 bpp. Esto es 16.7 millones de colores y generalmente se considera el mximo
nmero de colores que el ojo humano puede percibir. Por s mismo esto no constituye una ventaja
sobre el film. Sin embargo, a diferencia de los cristales del film, un CCD captura cada uno de los
tres colores componentes (RGB) sin prejuicios. Los films fotogrficos tienden a tener una
propensin hacia un color, dependiendo del tipo de film, y esto puede tener efectos adversos en la
imagen, de acuerdo a su balance de color.
Sin embargo, estos cristales dan al film su ventaja clave. Mientras que las celdas de un CCD estn
ordenadas en filas y columnas, los cristales en el film estn, para todo propsito, ordenados sin
patrn discernible. Al ser el ojo humano muy sensible a los patrones, tiende a percibir el orden de
los pixeles capturados con el CCD muy fcilmente, particularmente cuando pixeles adyacentes
tienen valores tonales marcadamente diferentes. Aumentando el film fotogrfico, y aunque los
puntos sean discernibles, no hay una regularidad aparente. Es por esto que las impresoras a chorro
modernas utilizan una tcnica conocida como dithering estocstico, que agrega elementos
aleatorios al patrn de puntos de tinta para alisar las transiciones de un tono al siguiente. El film
fotogrfico hace esto naturalmente, por lo que el ojo percibe los resultados menos cuadrados cuando
lo compara con las tomas digitales.
Existen dos posibles formas de rodear este problema para las cmaras digitales. Los fabricantes
puede desarrollar modelos que capturen resoluciones mayores de las que el ojo pueda percibir, o
pueden contener algoritmos de dither que alteren la imagen luego de que haya sido adquirida por el
CCD. Ambas opciones tienen problemas, como ser archivos ms grandes o tiempo de procesamiento
mayor.
Las cmaras digitales tienen una ventaja obvia: si el uso de las fotografas ser para procesamiento
grfico digital o publicacin WEB, se evita el paso del material impreso al digital por medio de un
escner, que es una fuente de prdida de calidad de color en el procesamiento y que requiere tiempo
adicional de trabajo.

18
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

Seccin 3: Otros Mecanismos.


1. Escneres de cdigo de barras.
El escner de cdigo de barras hace rebotar un lser
contra un patrn de rayas codificadas que contienen
alguna informacin en particular, y comprende su
significado analizando el patrn recibido mediante un
sensor. En general se utilizan para automatizar y agilizar
procesos, evitando el ingreso manual de los datos al
ordenador. Un ejemplo conocido en donde se utilizan
estas tecnologas es en los supermercados, donde el
cdigo de barras de cada producto se pasa por el lector
para ir agregndolo a la cuenta del cliente. De esta
forma el proceso de control y pago de los mismos es
mucho ms rpido que si el cajero debiera cargar
manualmente los datos de cada producto (nombre, cdigo y precio). Normalmente este ingreso de
datos forma parte de un sistema que automticamente emite las facturas, descuenta el stock, controla
los precios, y permite facilitar todo los procesos administrativos.

2. Tarjetas de banda magntica.


Las bandas magnticas que se encuentran en el reverso de las
tarjetas de crdito y similares ofrecen otro mecanismo de
ingreso de datos. Las bandas magnticas contienen mucha ms
informacin en un pequeo espacio que la que podramos
imprimir con letras o cdigo de barras. Adems, debido a que
no es posible leerlas a simple vista, son ideales para almacenar
datos confidenciales, como cdigos, identificadores personales
y claves.
Estas tarjetas tienen variadas funciones, desde permitir o
prohibir el acceso a ciertas reas en una institucin, hasta
solicitar un cdigo para extraer dinero de un cajero automtico o identificar a una persona.

3. Tarjetas Inteligentes
Las tarjetas inteligentes, principales contendientes
por el ttulo del dinero del futuro, son tarjetas de
plstico de tamao similar al de las tarjetas de
crdito normales, pero con un circuito integrado por
dentro. Se les llama inteligentes porque, adems de
tener una capacidad de almacenamiento mucho
mayor que la tradicional cinta magntica de las
tarjetas ordinarias, la pueden procesar.
La tarjeta inteligente incorpora un chip en su
interior. Este chip est formado por un
microprocesador, una memoria de programa y una
memoria de trabajo. La tarjeta puede almacenar y

19
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

procesar cualquier tipo de informacin, lo que la hace muy flexible y til en diferentes mbitos.
Exteriormente lo que se puede observar es una placa de contactos que permiten comunicarnos con
el chip. El material empleado en las tarjetas es idneo dada su durabilidad, resistencia ante factores
externos, buen comportamiento en la impresin y posibilidad de grabarse en relieve.
Las tarjetas pueden ser de contacto (debe introducirse en un lector especial para interactuar con ella)
o sin contacto (pueden enviar y recibir informacin a distancia, usualmente unos pocos centmetros).
La tarjeta inteligente, a diferencia de la de banda magntica, es un elemento activo en cuanto a
seguridad se refiere, es decir, la propia tarjeta evita su manipulacin y, verifica la identidad y los
derechos de acceso.
Las tarjetas pueden utilizarse en la telefona, registros mdicos y como tarjetas de dbito y crdito.
Estas tarjetas pueden tener cargados una cantidad de crditos que se van descontando con el uso,
como en el caso de las tarjetas telefnicas. Tambin se utilizan como llaves de vehculos, pases de
acceso, etc.

4. RFID
El RFID (Radio Frequency Identification), es una nueva tecnologa de captura de datos, que utiliza
etiquetas dotadas de un microchip y un circuito impreso a modo de antena, capaces de emitir una
serie de dgitos que sustituye el actual sistema de leer las etiquetas de cdigo de barras ante un
lector. Las etiqueta se adhiere al producto en el momento de su fabricacin, y pueden ser utilizadas
para rastrear a distancia los artculos desde el ese momento hasta su venta al cliente final, facilitando
el control y la mecanizacin de la logstica necesaria para la comercializacin del producto.
La RFID es uno de los segmentos de ms rpido crecimiento en la industria actual de captura
automtica de datos (AIDC). Para cada compaa
resulta esencial disponer de informacin
actualizada de sus inventarios y del movimiento de
sus mercancas. Es ah donde juega un papel
estratgico el RFID, ya que est demostrado que es
un instrumento de gran utilidad para mejorar la
administracin y eficiencia de la cadena de
abastecimiento.
La tecnologa RFID supera muchas de las
limitaciones del cdigo de barras, el sistema de
identificacin de objetos ms utilizado hasta ahora.
Las ventajas de las etiquetas electrnicas son las
siguientes:
A diferencia del cdigo de barras, las etiquetas electrnicas no necesitan contacto visual con el
mdulo lector para que ste pueda leerlas. La lectura se puede hacer a una distancia de hasta 10
metros.
Mientras el cdigo de barras identifica un tipo de producto, las etiquetas electrnicas identifican
cada producto individual. Es decir, dos yogures iguales llevan ahora el mismo cdigo de barras
y, por lo tanto, la misma identificacin, pero si estuvieran equipados con etiquetas electrnicas
se podran identificar y gestionar de forma individual.
La tecnologa RFID permite leer mltiples etiquetas electrnicas simultneamente. Los cdigos
de barras, por lo contrario, tienen que ser ledos secuencialmente. Esta caracterstica del sistema
de autoidentificacin por radiofrecuencia ofrece diversas ventajas como, por ejemplo, la

20
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

reduccin del tiempo de espera en las colas de los supermercados, ya que todos los productos se
procesan de una sola vez en un momento.
Las etiquetas electrnicas pueden almacenar mucha ms informacin sobre un producto que el
cdigo de barras, que solo puede contener un cdigo y, en algunos casos, un precio o cantidad.
Mientras que sobre el cdigo de barras se puede escribir slo una vez, sobre las etiquetas
electrnicas se puede escribir todas las veces que haga falta.
La tecnologa RFID evita falsificaciones. Con una simple fotocopia se puede reproducir un
cdigo de barras. Las etiquetas electrnicas, en cambio, no se pueden copiar.
Un cdigo de barras se estropea o se rompe fcilmente, mientras que una etiqueta electrnica es
ms resistente porque, normalmente, forma parte del producto o se coloca bajo una superficie
protectora y soporta mejor la humedad y la temperatura.
Usos frecuentes:
Inmovilizadores de vehculos antirrobo (el RFID se pone en la llave del vehculo o en otro
lugar). No puede utilizarse el vehculo si el RFID no est cerca.
Identificar envos de cartas o paquetes en correos o agencias de transporte. Chips identificadores
de animales y mascotas.
Identificacin de los equipajes areos. Esto permitira identificar y encauzar automticamente los
equipajes de los viajeros y evitara muchos problemas y extravos de equipajes que tantos
problemas causas a los viajeros y a las compaas areas.
Marcar todos los productos del supermercado con etiquetas RFID. Al salir con el carrito de la
compra, de manera automtica se identifican todos los productos que hemos comprado y nos
comunican inmediatamente el precio total.
Otras aplicaciones posibles son: inventario automtico, control de fabricacin, identificacin de
mercancas, distribucin automtica de productos, logstica, sistemas anti-secuestro, localizacin
de documentos.

5. Lectores biomtricos.
La biometra se basa en la premisa de que cada individuo es nico y posee rasgos fsicos distintivos
(rostro, huellas digitales, iris de los ojos, etc) o de comportamientos (la voz, la manera de firmar,
etc), los cuales pueden ser utilizados para identificarla o validarla. La medicin biomtrica ha venido
estudindose desde tiempo atrs y es considerada en la actualidad el mtodo ideal de identificacin
humana.
As, un dispositivo biomtrico es aquel que es capaz de capturar
caractersticas biolgicas de un individuo (rostro, huella dactilar, voz,
etc), compararlas, electrnicamente, contra una poblacin de una o ms
de tales caractersticas y actuar segn el resultado de la comparacin.
La Identificacin y Autenticacin biomtrica (I&A) explota el hecho de
que ciertas caractersticas biolgicas son singulares e inalterables y son
adems, imposibles de perder, transferir u olvidar. Esto las hace ms
confiables, amigables y seguras que los passwords.
La mayora de los sistemas biomtricos funcionan de maneras muy
similares y se pueden resumir en dos pasos:
El primer paso consiste en que la persona debe registrarse en el
sistema. Durante el proceso de registro, el sistema captura el rasgo
caracterstico de la persona, como por ejemplo la huella digital, o la
21
Universidad Catlica Nuestra Seora de la Asuncin TAI 2 Ing. Juan E. de Urraza

estructura del Iris y lo procesa para crear una representacin electrnica llamada modelo de
referencia. El modelo de referencia debe ser guardado en una base de datos, una tarjeta
inteligente, o en algn otro lugar del cual ser extrado en cualquier ocasin futura para el
segundo paso.
De acuerdo a la teora tradicional en biometra, el segundo paso depende de si la funcin del
sistema biomtrico consiste en verificar la identidad de la persona o identificar a la persona.
o En el caso de verificacin, la persona le informa al sistema cual es su identidad ya sea
presentando una tarjeta de identificacin o entrando alguna clave especial. El sistema captura
el rasgo caracterstico de la persona (la huella digital en nuestro ejemplo) y lo compara con el
modelo de referencia de la persona. Si ambos modelos parean la verificacin es exitosa. De
no serlos, la verificacin es fallida.
o En caso de que la funcin del sistema biomtrico sea identificacin, la persona no le informa
al sistema biomtrico cual es su identidad. El sistema tan solo captura el rasgo caracterstico
de la persona y lo procesa. Luego el sistema
procede a compararlo con un conjunto de
modelos de referencia para determinar la
identidad de la persona.
Los mecanismos biomtricos ms utilizados son el
identificador por huella dactilar, el lector de iris
ocular, identificador de patrones de voz, anlisis de
firmas, reconocimiento de rostro, velocidad de
digitacin, lectores de mano completa y scanner de
retina.

6. Procesamiento de voz.
Pueden utilizarse los sistemas de reconocimiento de voz para introducir datos. Pese a sus
limitaciones actuales, el reconocimiento de voz tiene numerosas aplicaciones. Este proceso implica
4 pasos bsicos:
1. Decir la palabra. La computadora percibe el sonido y lo descompone en sus diversas frecuencias.
2. Digitalizar el sonido. Los sonidos son transformados a formato digital para que la computadora
los pueda manipular. Los sistemas de reconocimiento de voz lo que reconocen son los fonemas
componentes de las palabras.
3. Comparar la palabra. La versin digital de la palabra se compara plantillas que se encuentran en
el diccionario del sistema. Generalmente los diccionarios requieren haber sido entrenados con
anterioridad por el usuario para reconocer su forma particular de pronunciar las palabras y su
tono de voz. Esto implica un tiempo en que el usuario se dedica a hablarle al sistema con su
inflexin particular para que ste pueda reconocer mejor las palabras. El sistema de
reconocimiento de voz tpico siempre est aprendiendo, para afinar su vocabulario y el
porcentaje de aciertos con mayor velocidad. Este entrenamiento debe realizarse por cada usuario,
puesto que cada uno tiene un tono e inflexin diferente.
4. Realizar la tarea asignada. Una vez reconocida la palabra, esta se despliega en la pantalla del
procesador de textos o se ejecuta una accin en particular que est programada, si fue una orden.

22

Vous aimerez peut-être aussi