Reconocimiento

Por favor, sube un documento

  Máximo: 5 MB, VIP: 50 MB. (Pdf, jpg, jpeg, tif, tiff, PCX, DCX, bmp, png)
Su navegador no soporta Flash, Silverlight o HTML5!

Seleccione el idioma de su documento

Iniciar la subida

El reconocimiento de imágenes en línea - Software Libre OCR

El reconocimiento de imágenes en línea - Software Libre OCR

Reconocimiento óptico de caracteres (lector óptico de caracteres, OCR) es la conversión mecánica o electrónica de las imágenes de texto mecanografiado, escrito a mano o impreso en texto máquina-codificado, ya sea a partir de un documento escaneado, una foto de un documento, una escena-foto (por ejemplo, el texto en las señales y vallas publicitarias en una foto del paisaje) o de subtítulos de texto superpuesto en una imagen (por ejemplo, de un programa de televisión). Es ampliamente utilizado como una forma de entrada de datos de los registros de datos de papel impresos, si los documentos de pasaportes, facturas, estados de cuenta, recibos computarizados, tarjetas de visita, correo, copias impresas de los datos-estática, o en alguna documentación adecuada. Es un método común para la digitalización de textos impresos, para que puedan ser editados electrónicamente, buscado, almacena de forma más compacta, que aparece en línea, y se utiliza en procesos de la máquina, tales como la computación cognitiva, la traducción automática, (extraído) de texto a voz, datos clave y la minería de texto. OCR es un campo de investigación en el reconocimiento de patrones, la inteligencia artificial y visión por ordenador.

Las primeras versiones necesitan ser entrenados con imágenes de cada personaje, y trabajaron en una fuente a la vez. Los sistemas avanzados capaces de producir un alto grado de precisión en el reconocimiento de la mayoría de las fuentes son ahora comunes, y con soporte para una variedad de entradas de formato de archivo de imagen digital. Algunos sistemas son capaces de reproducir la salida con formato que se aproxima mucho a la página original, incluyendo imágenes, columnas y otros componentes no textuales.

闽公网安备 35012202350127号
闽ICP备05000099号