Se conoce como software OCR o simplemente OCR a toda herramienta o programa de computación que permita realizar un reconocimiento óptico de caracteres (por sus siglas en inglés, Optical Character Recognition) y que normalmente se utiliza en las agencias de traducción para la conversión de archivos PDF que provienen de diferentes orígenes.

Esta es la herramienta ideal para convertir archivos de Adobe InDesign, Quark, Adobe Illustrator, u otros formatos comúnmente utilizados en el área de diseño. Normalmente, los traductores no están muy familiarizados con este tipo de herramientas, pero sí lo están los Project Managers de las agencias, ya que son las personas que habitualmente están a cargo de la conversión de los archivos y su posterior análisis del conteo de palabras. Un OCR es la herramienta mediante la cual un documento PDF, normalmente no editable, se convierte en un archivo Word editable que a posteriori se puede utilizar para traducir.

Dependiendo del tipo de archivo, un PM sabe qué tipo de OCR utilizar. Por ejemplo, el Reader es una herramienta que funciona perfectamente con PDFs no editables, como por ejemplo archivos escaneados de mediana calidad (cuidado con los escaneados de mala calidad, estos suelen ser un problema siempre), archivos con imágenes o documentos que no tienen un origen específico. El Abby Reader, entonces, “reconoce ópticamente” este archivo no editable  y lo transforma en un documento Word editable. Para convertir un PDF editable, en cambio, (por ejemplo, un PDF cuyo archivo de origen es un documento Ms Word, pero del cual no tenemos ese documento y aún así lo tenemos que convertir para trabajar), la mejor herramienta para utilizar en este caso es el Solid Converter.

Atención: todo esto parece ser muy fácil a simple vista, pero siempre existe la posibilidad de optimizar el uso de estas herramientas. Por ejemplo, un archivo y procesado con Abby no siempre suele convertirse a la perfección: es probable que el archivo tenga tablas o columnas que hagan que la conversión sea difícil. Otro caso es el de los encabezados y pies de página de un documento Word. Estos pueden traer problemas al momento de convertir un archivo. Para estos casos, siempre existen configuraciones que se pueden ajustar en las opciones de estos programas OCR antes de utilizarlos. Se recomienda la consulta de algún tutorial o ayuda en línea por para poder conocer mejor cómo trabajar con estas herramientas.

Etiquetas:

2 Comentarios » for ¿Qué es un software OCR?
    2 Pings/Trackbacks para "¿Qué es un software OCR?"
    1. […] este tipo de documentos (que suelen guardarse con la extensión .pdf o .jpg) es procesarlos con un software de reconocimiento de textos (OCR). Esto nos permitirá abrir la conversión del documento en Word, por ejemplo, y tratarla más o […]