Académique Documents
Professionnel Documents
Culture Documents
Binarizacin
La mayor parte de algoritmos de ROC parten como base de una imagen binaria (dos colores) por lo tanto es conveniente convertir una imagen de escala de grises, o una de color, en una imagen en blanco y negro, de tal forma que se preserven las propiedades esenciales de la imagen. Una forma de hacerlo es mediante el histograma de la imagen donde se muestra el nmero de pixeles para cada nivel de grises que aparece a la imagen. Para binarizarla tenemos que escoger un umbral adecuado, a partir del cual todos los pixeles que no lo superen se convertirn en negro y el resto en blanco. Mediante este proceso obtenemos una imagen en blanco y negro donde quedan claramente marcados los contornos de los caracteres y smbolos que contiene la imagen. A partir de aqu podemos aislar las partes de la imagen que contienen texto (ms transiciones entre blanco y negro).
Aplicaciones
Desde la aparicin de los algoritmos de Reconocimiento ptico de Caracteres han sido muchos los servicios que han introducido estos procesos para aumentar su rendimiento y otros que se basan completamente en estas tecnologas. A continuacin se muestran algunas de las ms destacables aplicaciones que utilizan el ROC.
Reconocimiento ptico de caracteres En el caso de reconocimiento de escritura manuscrita a la hora de correccin de exmenes, existe la posibilidad, aadiendo un listado de lxico (nombres y apellidos) de acercarse al 100% de acierto. A travs de las casillas de respuesta ICR se pueden reconocer palabras, como nombres de pases, nombres de regiones, marcas comerciales, en resumen, todo aquello que pueda ser integrado en una lista de palabras Lexico- este puede ir aumentndose segn necesidades. Por otro lado, se puede llegar a comprender una frase cuando la hemos terminado de leer. Esto implica una operacin de niveles morfolgicos, lxico y sintctico que se consigue mediante el reconocimiento del habla continua. Para llevar a cabo esa metodologa, se utilizan algoritmos robustos que utilizan una segmentacin previa, debido a que se obtiene automticamente con la descodificacin.
Reconocimiento de matrculas
Una de las aplicaciones son los radares. Estos deben ser capaces de localizar una matrcula de un vehculo con condiciones de iluminacin, perspectiva y entorno variables. En la etapa de segmentacin, se buscan texturas similares a la de una matrcula y se asla el rea rectangular que forma la matrcula. Finalmente, se aplica un proceso de clasificacin mltiple sobre el conjunto de pxeles pertenecientes a la matrcula, proporcionando una cadena de caracteres que se tienen que ajustar a un modelo conocido: el formato de una matrcula. Si aparece algn error, es corregido.
Bibliografa
Acerca de ROC (tecnologa y software) [7] Soluciones OCR en la nube (Cloud Computing) [8] Instituto Tecnolgico de Informtica [9] Instituto Tecnolgico de Informtica: ITI OCR: Investigacin de Nuevas Tcnicas para ROC/ICR de Formularios Impresos y Manuscritos [10] Instituto Tecnolgico de Informtica: ITIOCR: Nuevas Funcionalidades en el Reconocimiento de Formularios Impresos y Manuscritos Dirigido [11] Instituto Tecnolgico de Informtica: ITI- ROC Proyecto de I+D para la Mejora de los Procesos de la Digitalizacin Masiva [12]
Referencias
[1] http:/ / info. captricity. com [2] http:/ / latam. abbyy. com/ finereader/ [3] http:/ / exactscan. de/ [4] http:/ / www. baseside. com/ software-producto/ diamond-vision [5] http:/ / www. nicomsoft. com/ products/ ocr/ [6] http:/ / ocrkit. com/ [7] http:/ / latam. abbyy. com/ finereader/ ocr?source=products [8] http:/ / latam. abbyy. com/ Default. aspx?DN=d2740918-c2fd-4fe6-a8b1-f0bd2816b561 [9] http:/ / www. iti. es/ media/ about/ docs/ tic/ 13/ articulo2. pdf [10] https:/ / observatorio. iti. upv. es/ resources/ project/ 58 [11] http:/ / www. iti. es/ lineas-i-d-i/ proyectos-de-investigacion/ 2010/ itiocr/ index. html [12] https:/ / observatorio. iti. upv. es/ resources/ new/ 12088
Licencia
Creative Commons Attribution-Share Alike 3.0 //creativecommons.org/licenses/by-sa/3.0/