5 junio 2015Novedades

¿Qué es y para qué sirve la tecnología OCR?

Conocemos las ventajas de la gestión documental en la gestión y desarrollo de las organizaciones, lo que no hemos mencionado con las diferentes tecnologías que se emplean para llevar a cabo la digitalización de documentos que es parte importante de la gestión de éstos. La tecnología de Reconocimiento Automático de Caracteres, u OCR (Optical Character Recognition) por su sigla en inglés, es una de las herramientas cuya funcionalidad vale la pena conocer.

El OCR consiste en una tecnología que intenta emular la capacidad del ojo humano en el reconocimiento de objetos. Como su nombre lo indica, permite el reconocimiento óptico de los caracteres de una imagen (o cualquier tipo de documento escaneado) a tal grado que éste se vuelve compatible con el computador y es leído como un documento editable.

Mediante un procesamiento informático de la imagen, los pixeles del documento o imagen escaneado se transforman en datos (letras y números). La calidad del trabajo que se logre con este sistema dependerá de las capacidades del software que se utiliza, actualmente existen varias alternativas y con el paso de los años la tecnología ha avanzado a tal grado que se pueden obtener digitalizaciones perfectas y sumamente útiles.

La forma de operar de un software OCR es leyendo las imágenes pixel a pixel y buscando formas que coincidan con los rasgos de los caracteres. De acuerdo al nivel de complejidad ,o grado de desarrollo del software, buscará coincidencias con los caracteres y fuentes disponibles en el programa, o tratará de identificar los caracteres a través del análisis de sus características, esto para que el reconocimiento de los mismos no se limite a un determinado número de fuentes.

Cuando la imagen es clara, y la ubicación dentro de la imagen es homogénea, el resultado suele ser muy bueno. En el caso contrario, cuando la imagen no es clara y se confunden los pixeles, o bien la ubicación del texto a reconocer dentro de la imagen es poco estructurada, el resultado suele ser menos exitoso.

Beneficios y tecnologías complementarias

Uno de los principales beneficios de la tecnología OCR tiene relación con la optimización del tiempo de trabajo en el procesamiento de las imágenes. Ésta permite reducir las horas de trabajo de tal manera de optimizar también el recurso humano que se emplea en esta labor.

A la tecnología OCR para el reconocimiento de caracteres, se suman las herramientas de ICR (Intelligent Character Recognition), para reconocer texto manuscrito, y OMR (Optical Mark Recognition), para el reconocimiento de marcas en formularios estructurados. Esta última se utiliza en documentos como formularios o encuestas con recuadros que deben ser rellenados a mano y es de mucha utilidad para validar contabilizar resultados de la muestra en investigaciones y todo tipo de encuesta.

Deja un comentario