¿Cuáles son las desventajas del reconocimiento óptico de caracteres?

La principal desventaja del escaneo óptico de reconocimiento de caracteres es la posibilidad de introducir errores en un documento escaneado. Ningún sistema de escaneo OCR es infalible, y los documentos de baja calidad pueden crear suficientes errores como para requerir mucho tiempo revisión de consumo. Las fuentes manuscritas y no latinas son particularmente difíciles de escanear correctamente.

Los escáneres ópticos también pueden tener problemas con documentos que carecen de un contraste significativo entre los caracteres y el fondo. Las páginas sucias, o las impresas en papel de color, pueden confundir un escáner y dar como resultado grandes bloques de texto no leído. Los pasos adicionales necesarios para renderizar originales de baja calidad adecuados para el escaneado OCR pueden terminar compensando por completo los posibles ahorros de tiempo que ofrece la tecnología.

La mejor manera de garantizar que el escaneo OCR sea lo más preciso y rápido posible es diseñando el documento original específicamente para el escaneo óptico. Por ejemplo, muchos paquetes de OCR tienen dificultades para diferenciar entre caracteres similares, como el número cero y la letra O. Las fuentes compatibles con OCR hacen que estos dos caracteres parezcan lo más diferentes posible para ayudar a la computadora a leer el documento.

Los documentos escritos a mano requieren un espacio uniforme y claro entre las letras para garantizar un escaneo adecuado. Esta es la razón por la que los formularios que utilizan la tecnología OCR a menudo requieren que los usuarios impriman en mayúsculas dentro de una serie de cuadros. Cada caja por separado puede escanearse individualmente, evitando que la computadora lea mal las letras que se han ejecutado juntas.