Acerca de la extracción de datos de formularios
|
Este tema compete únicamente a OmniPage Professional. |
La extracción de datos de formularios le permite recopilar datos de una serie de formularios completados a fin de procesarlos en bases de datos u hojas de cálculo. Un paso del flujo de trabajo de OmniPage es el que realiza la extracción de datos de formularios.
Un archivo de plantilla de formulario define el diseño y la ubicación de los elementos del formulario. Los formularios que se procesarán deben estar completados con un PC o un equipo similar, y no a mano. El resultado será un archivo con valores separados por comas (csv) que se puede abrir como una tabla en un programa de hojas de cálculo. Cada elemento del formulario se convierte en una columna de la tabla, y los datos de cada formulario se presentan en una sola fila. Generalmente, dichos elementos son campos rellenables, casillas de verificación y botones de opción.
Archivos de plantilla de formulario
La plantilla de formulario debe ser un formulario PDF activo sin imagen que presente de forma adecuada los elementos que aparecerán en los formularios que han de procesarse. Puede estar vacía o completada y contener varias páginas. También es posible especificar un intervalo de páginas para eliminar aquellas que no pertenezcan al formulario, como las que contienen instrucciones para el llenado. Consulte a continuación el modo en que se interpreta un intervalo de páginas en diferentes tipos de procesamiento.
Si necesita crear un archivo de plantilla por sus propios medios, puede usar OmniPage Professional o un editor de PDF como Nuance PDF Converter Professional. Consulte Acerca de la creación de formularios y guarde el formulario como tipo de archivo PDF.
Configuración del flujo de trabajo
Debe utilizar el Asistente de flujo de trabajo, que comúnmente, consta de tres pasos: carga de archivos, extracción de datos de formularios y guardado. Consulte Extracción de datos de formularios en el Asistente de flujo de trabajo.
Procesamiento de archivos PDF completados
Entre ellos se incluyen todos los tipos de archivos PDF excepto imagen de PDF. Los archivos PDF pueden ser estáticos o activos. En este caso, cada formulario debe ubicarse en un archivo PDF separado. Si se escoge un intervalo de páginas para la plantilla, se debe aplicar el mismo intervalo a todos los archivos PDF que se procesen.
Procesamiento de formularios completados guardados como archivos de imagen
Esto comprende todos los formatos de archivo de imagen compatibles con OmniPage e incluye imagen de PDF. En este caso, los archivos que se procesarán deben contener la cantidad de páginas definida por el intervalo de páginas del archivo de plantilla. Por ejemplo, si el intervalo es de 2 a 4, cada formulario que se procese debe contener tres páginas.
Cada formulario que debe ser procesado puede estar en un archivo independiente, pero también es posible procesar formularios en archivos únicos de imagen de varias páginas. En el ejemplo anterior, las páginas 1-3, 4-6, 7-9, etc. serán consideradas formularios independientes.
Procesamiento de formularios completados y digitalizados
Los formularios completados pueden digitalizarse utilizando un ADF. Digitalice solamente las páginas de formularios completados que se especifican en la plantilla de formulario (incluido su intervalo de páginas, si tuviera). Cuando digitaliza formularios de varias páginas, no es necesario utilizar hojas de separación.
//