Sobre a extração de dados de formulários

Omnipage pro Sobre a extração de dados de formulários

Este tópico se aplica somente ao OmniPage Professional.

A extração de dados de formulários permite que dados sejam coletados de um conjunto de formulários preenchidos para processamento posterior em bancos de dados ou planilhas. A extração de dados de formulários é feita por uma etapa de fluxo de trabalho no OmniPage.

O layout e a localização de elementos do formulário são definidos por um arquivo de gabarito do formulário. Os formulários a serem processados devem ser preenchidos por computador ou máquina similar, e não escritos à mão. O resultado é um arquivo csv (valores separados por vírgulas) que pode ser aberto como uma tabela em um programa de planilhas. Cada elemento do formulário se torna uma coluna da tabela e os dados de cada formulário são apresentados em uma única linha. Os elementos de formulário são tipicamente campos preenchíveis, caixas de seleção e botões de opção.

Arquivos de gabarito de formulário

O gabarito de formulário deve ser um formulário PDF ativo não-imagem que apresenta corretamente os elementos de formulário a serem encontrados nos formulários que serão processados. Ele pode ser preenchido ou não preenchido. Pode ser um formulário de várias páginas, ou um intervalo de páginas pode ser especificado para eliminar páginas que não são do formulário, como as que contêm instruções de preenchimento. Veja abaixo como um intervalo de páginas é interpretado em diferentes tipos de processamento.

Você pode usar o OmniPage Professional ou um Editor de PDF, como o Nuance PDF Converter Professional, se precisar criar um arquivo de gabarito. Consulte Sobre a criação de formulários e salve o formulário como arquivo PDF.

Configuração do fluxo de trabalho

O Assistente de Fluxo de Trabalho deve ser usado. Isso geralmente consiste em três etapas: Uma etapa de carregamento de arquivos, a etapa de extração de dados do formulário e uma etapa de salvamento. Consulte Extração de dados de formulário no Assistente de Fluxo de Trabalho.

Processamento de arquivos PDF preenchidos

Isso inclui todos os tipos de PDF, exceto imagens em PDF. Os arquivos PDF podem estáticos ou ativos. Nesse caso, cada formulário deve estar localizado em um arquivo PDF separado. Se um intervalo de páginas for escolhido para o gabarito, o mesmo intervalo de páginas será aplicado a todos os arquivos PDF que estão sendo processados.

Processamento de formulários preenchidos salvos como arquivos de imagem

Isso inclui todos os formatos de arquivos de imagem compatíveis com o OmniPage e inclui imagens em PDF. Nesse caso, os arquivos a serem processados devem conter o número de páginas definido pelo intervalo de páginas do arquivo de gabarito. Por exemplo, se o intervalo de páginas do gabarito for 2-4, cada formulário a ser processado deverá conter três páginas.

Cada formulário a ser processado pode estar em um arquivo separado, mas também é possível processar formulários em arquivos de imagem únicos com várias páginas. No exemplo acima, as páginas 1-3, 4-6, 7-9, etc. serão consideradas formulários separados.

Processamento de formulários digitalizados preenchidos

Formulários preenchidos são melhor digitalizados com um ADF (alimentador de documentos) . Digitalize apenas as páginas de formulários preenchidos que são especificadas no gabarito de formulário (incluindo o intervalo de páginas, se houver). Quando tais formulários de várias páginas são digitalizados, não há necessidade de folhas de separação.

 

//

Sobre a extração de dados de formulários