sábado, 5 de junio de 2010

Conversión a texto

 

La conversión a texto del material de la bibliografía se hizo tomando las imágenes digitalizadas, para esto utilicé OmniPage 17 Pro el proceso lo describo a continuación.

A. Abrimos el programa Omnipage 17 Pro, seleccionamos el botón “Untitled” y en el menú emergente seleccionamos “1 - 2 - 3”.

image

 

B. Después en la siguiente imagen tenemos:

     1. Para iniciar el proceso damos clic en el icono de la parte superior izquierda “1 – 2 – 3”.

    2. En la ventana que aparece seleccionamos la ubicación donde tenemos las imágenes escaneadas, después seleccionamos las que deseamos convertir en texto. y damos clic en el botón “Ok”.

 

image

 

C. En la siguiente imagen tenemos:

    1. Iniciará el flujo de trabajo, aquí se muestra el avance y los pasos que ya se completaron.

     2. Aquí se muestra el avance del reconocimiento en la página.

     3. Estas son las páginas que se procesarán.

 

image

 

D. Al terminar de reconocer todas las páginas el programa nos muestra una ventana con los caracteres o palabras que no pudo identificar para que nosotros le indiquemos:

     1. Aquí se nos muestra tal y como se ve en las paginas escaneadas marcando con rojo el caracter o palabra que el programa no identificó o que no pudo relacionar con el contenido.

     2. En este cuadro se puede modificar el texto.

     3. Aquí se indica el caracter o palabra que se está procesando.

image

 

E. Terminando el proceso se guarda como sigue:

     1. Seleccionamos la ubicación donde queremos guardar el archivo.

    2. Especificamos en nombre para el archivo.

     3. Seleccionamos el formato del archivo en mi caso “Microsoft Word 2007 (*.docx)”.

     4. Seleccionamos la casilla “True Page”.

     5. Seleccionamos “Create one file for all pages” para que todas las paginas se guarden en un solo archivo.

    6. Seleccionamos el rango “All pages” para que se guarden todas las paginas. y damos clic en el botón “Ok”

image

Ahora ya tenemos las paginas convertidas al formato de texto y guardado en un archivo de Word. Hacemos esto para todos los capítulos o volúmenes de la bibliografía que utilizaremos en los blogs.