|
Encontre os melhores produtos
 |
Opinião sobre marca+produto |
SCANSOFT OMNIPAGE SE é difícil de usar, de acordo com seus usuários.Em média, eles acham a sua confiabilidade satisfatória., Mas eles têm opiniões muito diferentes Você pode visitar o fórum da produto SCANSOFT OMNIPAGE SE da marca YYY para identificar os problemas com que os usuários se deparam e as soluções sugeridas.
Seus usuários leh atribuem uma classificação mediana, em termos de eficiência., Mas as suas opiniões diferem enormemente Acharam-no muito caro pelo que oferecem Você pode baixar o manual# do usuário de (do, da) SCANSOFT OMNIPAGE SE para garantir que as suas características correspondem à sua necessidade
Discriminação opiniões dos usuários
Taxa média para as análises XXX
Discriminação opiniões dos usuários
Taxa média para as análises XXX
Discriminação opiniões dos usuários
Taxa média para as análises XXX
| Alto desempenho |
Confiabilidade |
| Facilidade de uso |
Relação custo benefício |
Resumo do manual: como pacote de OCR. As configurações de OCR podem ser especificadas, assim como ocorre no Direct OCR. O PaperPort® é a maneira mais fácil de transformar papel em documentos digitais organizados, que todos no escritório podem rapidamente encontrar e utilizar. O programa opera com scanners, impressoras multifuncionais e copiadoras digitais em rede para transformar papel em documentos digitais. Em seguida, o aplicativo ajuda a gerenciar esses e outros documentos eletrônicos por meio de um sistema de arquivamento conveniente e fácil de usar. As miniaturas grandes e nítidas do PaperPort permitem organizar visualmente, recuperar e usar documentos digitalizados, incluindo arquivos do Word, planilhas eletrônicas, arquivos PDF e até mesmo fotografias digitais. As ferramentas SET (Scanner Enhancement Technology) do PaperPort garantem a boa apresentação dos documentos digitalizados enquanto as ferramentas de anotação permitem incluir notas e realces em qualquer imagem digitalizada.
16
Instalação e configuração
Utilização do OmniPage
O OmniPage 15 usa tecnologia de OCR (reconhecimento óptico de caracteres) para transformar o texto de arquivos de imagem ou páginas digitalizadas em texto editável, para uso em seus aplicativos favoritos. Além de reconhecer texto, o OmniPage Pro pode preservar os seguintes elementos e atributos de um documento através do processo de OCR. Imagens (fotos, logotipos) Os elementos de formulário (caixas de seleção, botões de opção, campos de texto) - só estão disponíveis no OmniPage Professional 15. Formatação de texto (caracteres e parágrafos) Formatação de páginas (estrutura de colunas, formato de tabelas, cabeçalhos, posicionamento das imagens).
Documentos no OmniPage
Um documento do OmniPage é uma imagem de cada página do documento. Depois de realizado o OCR, o documento também conterá texto reconhecido, exibido no Editor de Texto, possivelmente com imagens, tabelas e elementos de formulário.
Documentos do OmniPage
Um Documento do OmniPage (.opd) contém as imagens da página original (opcionalmente pré-processadas) com eventuais zonas aplicadas. Após o reconhecimento, o OPD também conterá os resultados desse processo. Ao salvar, você terá duas opções de tipo de arquivo: Documento do OmniPage ou Documento do OmniPage (Estendido). Este último permite incorporar um dicionário de usuário, arquivo de treinamento ou gabarito de zona ao OPD. Isso pode aumentar consideravelmente o tamanho do arquivo, mas confere maior autonomia ao OPD. O OmniPage SE não oferece suporte para documentos estendidos do OmniPage.
OmniPage Manual do usuário
17
Quando você abre um Documento do OmniPage, suas configurações são aplicadas, substituindo as existentes no programa.
O ambiente do OmniPage
A Área de Trabalho do OmniPage tem três espaços de trabalho principais, separados por divisores: o Gerenciador de Documentos, o Painel Imagem e o Editor de Texto. O Painel Imagem tem uma barra de ferramentas Imagem e o Editor de Texto tem uma barra de ferramentas Formatação.
Caixa de ferramentas do OmniPage Barra de ferramentas Padrão Barra de ferramentas Formatação
Barra de ferramentas Imagem
Gerenciador de Documentos
Painel Imagem
Editor de Texto
Caixa de ferramentas do OmniPage: esta caixa de ferramentas permite controlar o processamento. Gerenciador de Documentos: fornece uma visão geral do documento com uma tabela. Cada linha representa uma página. As colunas apresentam informações estatísticas ou de status sobre cada página e (quando for o caso) sobre totalizações do documento.
18
Utilização do OmniPage
Capítulo 2 Painel Imagem: exibe a imagem da página atual e suas zonas. Este painel pode exibir a página atual, as miniaturas, ou ambas. Quando é exibida a imagem da página atual, a barra de ferramentas Imagem fica disponível. Editor de Texto: exibe os resultados do reconhecimento a partir da página atual. A ilustração mostra a visualização True Page.
As barras de ferramentas
O programa tem cinco barras de ferramentas principais. Use o menu Exibir para mostrar, ocultar ou personalizar esses itens. A barra de status na extremidade inferior da janela do programa OmniPage explica a finalidade de todas as ferramentas. Barra de ferramentas Padrão: executa funções básicas. Barra de ferramentas Imagem: executa operações de zoneamento e com imagens e tabelas. Barra de ferramentas Formatação: formata o texto reconhecido no Editor de Texto. Barra de ferramentas Verificador: controla a localização e a aparência do verificador. Barra de ferramentas Reordenar: modifica a ordem dos elementos em páginas reconhecidas. Barra de ferramentas Definição do Formulário cria novos elementos de formulário. Barra de ferramentas Organização do Formulário: organiza e alinha os elementos de formulário. A barra de ferramentas Formulário só é exibida no OmniPage Professional 15.
O ambiente do OmniPage
19
Etapas básicas de processamento
Há três formas de processar documentos: automaticamente, manualmente ou por fluxo de trabalho (esta última não está disponível no SE). As etapas básicas de todos os métodos de processamento são praticamente as mesmas: 1. Trazer um conjunto de imagens para o OmniPage. Você pode digitalizar um documento em papel com ou sem ADF (alimentador automático de documentos) ou carregar arquivos de imagens. 2. Executar o OCR para gerar texto editável. Depois do OCR, você pode verificar e corrigir erros no documento usando o Corretor de OCR e editar o documento no Editor de Texto. 3. Exportar o documento para o local desejado. Você pode salvar o documento com um nome e tipo de arquivo especificado, colocá-lo na Área de Transferência, enviá-lo como anexo de correio eletrônico ou publicá-lo. Você pode salvar o mesmo documento repetidamente em vários destinos, em tipos de arquivo diferentes, com configurações e níveis de formatação diferentes. No OmniPage, você pode optar pelos seguintes métodos de processamento: Automático, Manual, Combinado ou Fluxo de Trabalho. Você pode iniciar o reconhecimento a partir de outros aplicativos, usando o recurso DirectOCR do OmniPage; e pode ainda programar o processamento para mais tarde. Os métodos de processamento são detalhados no próximo capítulo e na Ajuda On-line.
Configurações
A caixa de diálogo Opções é o ponto central das configurações do OmniPage. Você pode acessá-la a partir da barra de ferramentas Padrão ou do menu Ferramentas. A ajuda sensível ao contexto fornece informações sobre cada configuração.
20
Utilização do OmniPage
Processamento de documentos
Este tutorial descreve diferentes maneiras de processar um documento e também fornece informações sobre partes fundamentais deste processamento.
Guia de início rápido
Este tópico o conduz passo a passo pelo processo básico de OCR. Você processará o documento automaticamente e salvará os resultados de reconhecimento em um arquivo. Você corrigirá o documento, mas não o editará dentro do Editor de Texto.
O que você faz 1. Caso ainda não tenha feito, configure o scanner usando o Assistente do Scanner. Selecione Iniciar Todos os Programas ScanSoft OmniPage SE 4.0 OmniPage SE 4.0 Coloque o documento corretamente no scanner. Na lista suspensa Obter Página, selecione uma opção de digitalização para o documento: preto e branco, tons de cinza ou em cores. Na lista suspensa Descrição do Layout, verifique se Automático está selecionado. Para uma ampla gama de documentos, esta é a melhor opção. Na lista suspensa "Exportar Resultados", verifique se a opção "Salvar em Arquivo" está selecionada. Permite que você determine como as imagens ou textos coloridos e fundos aparecerão no documento exportado. É necessário um scanner colorido para realizar digitalização em cores. Configura o programa para aplicar zonas na página e decidir suas propriedades automaticamente. Isso significa que você poderá nomear o arquivo exportado após ter corrigido o documento. O que acontece Configura o OmniPage para trabalhar com o scanner.
2.
Abre o OmniPage no computador.
3.
4.
5.
6.
OmniPage Manual do usuário
21
O que você faz Certifique-se de que a opção 1-2-3 está selecionada na lista suspensa Fluxo de Trabalho. Clique no botão Iniciar. Use o Corretor do OCR para modificar as palavras que o programa suspeita não terem sido reconhecidas corretamente. Clique no Editor de Texto. Selecione as visualizações do Editor de Texto uma após a outra, para ver como a página aparece em cada visualização. Clique em Continuar para reiniciar a correção. Quando a mensagem A correção de OCR terminou aparecer, clique em OK. Escolha um nome de arquivo, tipo de arquivo, caminho e nível de formatação para salvar o documento reconhecido. Clique em OK.
O que acontece O OmniPage começará a digitalizar o documento. Surge uma miniatura com um indicador de progresso. Surge o Corretor do OCR. O Corretor do OCR funciona como um corretor ortográfico em um programa de processamento de texto, mas com recursos adicionais específicos de OCR. Ele remove as marcações de palavras que foram corrigidas. Cada visualização do Editor de Texto define um nível de formatação. Isso indica qual nível escolher no momento de salvar. Isso conclui o processo de correção do OCR. A caixa de diálogo "Salvar em Arquivo" será exibida. Por definição, Salvar e Iniciar é ativado, de forma que o seu documento será aberto automaticamente no programa de processamento de texto associado ao tipo de arquivo selecionado. Você usou com êxito o OmniPage para reconhecer o documento e abri-lo no aplicativo de destino!
7.
8.
9.
10.
11.
12.
Inspecione o documento no programa de processamento de texto.
Se você teve êxito em obter bons resultados com as amostras de arquivos de imagem, mas não com a página digitalizada, verifique a instalação e as configurações do scanner: especialmente o brilho e a resolução da imagem. Consulte "Entrada do scanner" na página 29. Isso fornece um modelo de brilho ótimo. Consulte também os tópicos de ajuda on-line Configuração do scanner e Solução de problemas do scanner.
22
Processamento de documentos
Capítulo 3
Métodos de processamento
No OmniPage, você pode optar pelos seguintes métodos de processamento: Automático A forma mais rápida e fácil de processar documentos é deixar que o OmniPage faça isso automaticamente. Selecione as configurações na caixa de diálogo Opções e nas listas suspensas da Caixa de Ferramentas do OmniPage e clique em Iniciar. Este método processará cada página do início ao fim, com execução em paralelo sempre que possível. As páginas, em geral, são zoneadas automaticamente. Manual O processamento manual lhe dá controle mais preciso sobre a forma com que as suas páginas são tratadas. Você pode processar o documento página a página com configurações diferentes para cada página. O programa também pára entre cada etapa: obtenção de imagens, realização de reconhecimento, exportação. Isto lhe permite, por exemplo, delimitar zonas manualmente ou alterar os idiomas de reconhecimento. Você pode iniciar cada etapa clicando nos três botões na Caixa de Ferramentas do OmniPage. Combinado Você pode processar um documento automaticamente e visualizar os resultados no Editor de Texto. Se a maior parte das páginas estiverem em ordem, mas algumas não tiverem saído como esperado, você pode alternar para processamento manual para ajustar as configurações e reconhecer novamente somente as páginas com problema. Outra alternativa é obter imagens com processamento manual, definir zonas em algumas ou todas elas e então enviar todas as páginas para o processamento automático. Fluxo de trabalho Um fluxo de trabalho consiste em uma série de etapas e suas configurações. Geralmente inclui uma etapa de reconhecimento, mas não necessariamente. Os fluxos de trabalho são listados na lista suspensa Fluxo de Trabalho os exemplos de fluxo de trabalho acrescidos dos fluxos criados por você. Você pode inserir um ícone do Agente do OmniPage na barra de tarefas. O menu de atalho lista os fluxos de trabalho. Clique em um fluxo de trabalho para iniciar o OmniPage e executá-lo. Deixe que o Assistente de Fluxo de Trabalho oriente-o na criação de novos fluxos de trabalho. O assistente fornece opções de etapas e as configurações necessárias. Depois que cada ícone de etapa é selecionado e as configurações Métodos de processamento 23
são definidas, você obtém um novo conjunto de ícones de etapas para selecionar. O assistente pode ser utilizado apenas para obter mais orientação ao fazer um processamento automático. Consulte "Assistente de Fluxo de Trabalho" na página 67. Os recursos de fluxos de trabalho, Assistente de Fluxo de Trabalho e Visualizador de Fluxo de Trabalho são fornecidos somente no OmniPage 15. Em outros aplicativos Você pode usar o recurso DirectOCR para iniciar os serviços de reconhecimento do OmniPage enquanto trabalha em seu processador de texto usual ou aplicativo semelhante. Consulte "Como configurar o DirectOCR" na página 26. O OmniPage é automaticamente vinculado ao programa de gerenciamento de documentos PaperPort. Mais tarde Você pode programar tarefas de OCR ou outras tarefas de processamento no OmniPage Batch Manager para que sejam executadas automaticamente mais tarde, em um momento em que você nem esteja diante do computador. Isso é feito através do Batch Manager. Quando você escolhe "Nova Tarefa", são exibidos o Assistente de Tarefas e o Assistente de Fluxo de Trabalho este último com um conjunto de opções e configurações ligeiramente modificado. No primeiro painel do Assistente de Tarefas, você define o tipo e o nome da tarefa. Em seguida, deve especificar um horário de início, uma tarefa recorrente ou instruções para pastas monitoradas. Uma tarefa incorpora um fluxo de trabalho com instruções de tempo adicionadas. Consulte "Batch Manager" na página 71. O Batch Manager só está disponível no OmniPage 15 seus recursos avançados sao oferecidos apenas no OmniPage Professional 15.
Processamento manual
1. Crie zonas manualmente para as páginas nas quais deseja processar apenas parte da imagem ou se desejar fornecer instruções de zoneamento precisas. Use fundos ou zonas do tipo ignorar para excluir áreas do processamento. Use fundos ou zonas do tipo processar para especificar áreas a serem zoneadas automaticamente. 2. Clique no botão Iniciar e escolha Concluir Processamento de Páginas Existentes na caixa de diálogo Processamento Automático.
24
Processamento de documentos
Capítulo 3
3. Depois de corrigir (caso solicitado), você pode salvar ou exportar o documento. O padrão para o processamento manual é selecionar automaticamente todas as páginas inseridas. Dessa forma, você pode reconhecer todas as novas páginas através de um único clique do mouse. Você pode remover esse padrão no painel Processar da caixa de diálogo Opções.
Processamento com fluxos de trabalho
Um fluxo de trabalho consiste em uma série de etapas e suas configurações. Não tem que se restringir ao padrão 1-2-3 do processamento tradicional. Os fluxos de trabalho permitem processar tarefas recorrentes com mais eficiência porque todas as etapas e suas configurações são predefinidas. Os recursos de fluxos de trabalho, Assistente de Fluxo de Trabalho e Visualizador de Fluxo de Trabalho são fornecidos somente no OmniPage 15. Para executar um fluxo de trabalho com o OmniPage fechado Clique com o botão direito do mouse no ícone do Agente do OmniPage na barra de tarefas. Selecione um fluxo de trabalho a partir do menu de atalho. O OmniPage é iniciado e executa imediatamente o fluxo de trabalho. Se não visualizar o ícone, ative-o no painel Geral da caixa de diálogo Opções. O ícone de barra de tarefas não está disponível no OmniPage SE. Para executar um fluxo de trabalho com o OmniPage aberto Você pode usar o ícone da barra de tarefas, conforme descrito acima, ou pode selecionar o fluxo de trabalho na lista suspensa "Fluxo de Trabalho" e clicar em Iniciar. Durante a execução de um fluxo de trabalho, as configurações do programa não ficam acessíveis. Para modificar um fluxo de trabalho Selecione o fluxo na lista suspensa "Fluxo de Trabalho" e pressione o botão Assistente de Fluxo de Trabalho na barra de ferramentas Padrão, ou escolha "Fluxos de Trabalho..." no menu Ferramentas, selecione o fluxo e clique em Modificar. Para criar um novo fluxo de trabalho O programa fornece alguns exemplos de fluxo de trabalho. Você pode modificá-los ou usá-los como base para novos fluxos. Para criar novos fluxos de trabalho desde o início, use o Assistente de Fluxo de Trabalho. Consulte página 67. Processamento com fluxos de trabalho 25
Processamento a partir de outros aplicativos
Você pode usar o recurso DirectOCRTM para chamar os serviços de reconhecimento do OmniPage enquanto trabalha em seu processador de texto normal ou em outro aplicativo. Primeiramente, você precisa estabelecer a conexão direta com o aplicativo. Em seguida, dois itens em seu menu Arquivo abrem a porta para os recursos de OCR.
Como configurar o DirectOCR
1. Inicie o aplicativo que você deseja conectar ao OmniPage. Inicie o OmniPage, abra a caixa de diálogo Opções no painel DirectOCR e selecione Ativar o DirectOCR. 2. Selecione as opções de processamento para correção e zoneamento. Estas funcionarão para futuros trabalhos do DirectOCR até serem modificadas novamente; elas não são aplicadas quando o OmniPage for usado sozinho. 3. O painel "Não registrado" exibe os aplicativos anteriormente não registrados ou em execução. Selecione os que desejar e clique em Adicionar. Você pode procurar um aplicativo não listado.
Como usar o DirectOCR
1. Abra o aplicativo registrado e trabalhe em um documento. Para obter resultados de reconhecimento de páginas digitalizadas, coloque-as corretamente no scanner. 26 Processamento de documentos
Capítulo 3
2. Use o item Configurações de Obtenção de Texto... do menu Arquivo do aplicativo de destino para especificar as configurações a serem usadas durante o reconhecimento. Todas as configurações não oferecidas obtêm seus valores com base nos últimos valores usados no OmniPage. As configurações alteradas para o DirectOCR também são alteradas no OmniPage.
3. Use o item Obter Texto do menu Arquivo para obter imagens do scanner ou do arquivo. 4. Se você tiver selecionado Definir zonas automaticamente no painel DirectOCR da caixa de diálogo Opções ou em Configuração de Obtenção de Texto..., o reconhecimento começa imediatamente. 5. Se Definir zonas automaticamente não estiver selecionado, cada imagem da página será apresentada, permitindo que você defina as zonas manualmente. Clique no botão Efetuar OCR para continuar com o reconhecimento. 6. Se a correção tiver sido especificada, ela será feita após o reconhecimento. Em seguida, o texto reconhecido será colocado na posição do cursor em seu aplicativo, com o nível de formatação especificado por Configuração de Obtenção de Texto... .
Processamento com o Batch Manager
O Batch Manager só está disponível no OmniPage 15 seus recursos avançados sao oferecidos apenas no OmniPage Professional 15. Você pode programar tarefas de processamento para execução automática em um horário determinado. As tarefas não programadas podem ser ativadas manualmente. As páginas de tarefas podem vir de um scanner com ADF ou de arquivos de imagem. Você não tem que estar presente diante do computador no horário de início da tarefa nem o OmniPage tem que estar em execução. O computador pode ser desligado após a configuração da tarefa, desde que esteja funcionando na hora de início da mesma. Se a tarefa incluir a digitalização de páginas, o scanner deverá estar ativado no horário de início da tarefa, com as páginas carregadas no ADF. Veja como configurar sua primeira tarefa:
Processamento com o Batch Manager
27
1. Clique em Batch Manager... no menu Processar ou no menu Iniciar do Windows: selecione Todos os Programas ScanSoft OmniPage 15.0 OmniPage Batch Manager. A janela do Batch Manager será exibida. Clique no botão Criar Tarefa para iniciar o Assistente de Tarefas. 2. Selecione o tipo da tarefa no painel seguinte: Normal, Ativada por código de barras, Monitoração de pastas, Monitoração de caixa de correio do Outlook ou Monitoração de caixa de correio do Lotus Notes. Os tipos de tarefa de monitoração de caixa de correio só ficarão disponíveis se o sistema de correio em questão estiver devidamente configurado no computador. 3. Dê um nome à tarefa no mesmo painel. Clique em "Avançar". 4. Use o painel Opções de Início e Fim para especificar os horários e a programação da tarefa. Quando a tarefa estiver concluída, você poderá optar por excluir o arquivo de imagem de entrada ou enviar uma notificação por email para determinado endereço (esta última opção está disponível somente no OmniPage Professional 15). 5. Defina um ponto de partida para a nova tarefa. Pode ser um novo início ou um fluxo de trabalho existente. Clique em Avançar para concluir cada etapa. 6. Os painéis a seguir permitem criar o fluxo de trabalho para a tarefa, conforme descrito no Capítulo 6. 7. Clique em Concluir para confirmar a criação da tarefa. Por obter mais informações, consulte Batch Manager na Ajuda On-line e "Batch Manager" na página 71.
Definição da origem das imagens de página
Há duas origens de imagens possíveis: de arquivos de imagem e de um scanner. Existem dois tipos principais de scanners: plano ou de alimentação de folhas. Um scanner pode ter um alimentador de documentos automático (ADF) incorporado, o que torna mais fácil digitalizar documentos de várias páginas. As imagens de documentos digitalizados podem ser inseridas diretamente no OmniPage ou podem ser salvas com o próprio software do scanner em um arquivo de imagem, que o OmniPage pode abrir posteriormente. 28 Processamento de documentos
Capítulo 3
Entrada de arquivos de imagem
Você pode criar arquivos de imagem a partir de seu próprio scanner ou recebê-los por e-mail ou como arquivos de fax. O OmniPage pode abrir diversos tipos de arquivos de imagem. Selecione Carregar Arquivos na lista suspensa Obter Páginas. Os arquivos são especificados na caixa de diálogo Carregar Arquivos. Isto aparece quando você inicia o processamento automático. No processamento manual, clique no botão Obter Página ou use o menu Processar. A parte inferior da caixa de diálogo fornece configurações avançadas e pode ser exibida ou ficar oculta. A largura ou altura mínima de um arquivo de imagem é 16 por 16 pixels; a máxima é 8400 pixels (71 cm; 28 pol na resolução de 201 a 600 dpi). Consulte a Ajuda on-line para obter os limites em pixels. No OmniPage Professional 15, os arquivos também podem ser importados de sites de FTP, do Microsoft SharePoint, do SharePoint 2003 ou de fontes ODMA.
Entrada do scanner
Você precisa ter um scanner compatível em funcionamento instalado corretamente com o OmniPage. Você tem uma opção de modos de digitalização. Ao fazer sua opção, há duas considerações principais: Que tipo de saída você deseja no documento de exportação? Que modo fornecerá melhor precisão de OCR? Digitalizar em preto e branco Selecione isto para digitalizar em preto e branco. As imagens em preto e branco podem ser digitalizadas e tratadas mais rapidamente do que outras e ocupam menos espaço em disco. Digitalizar em tons de cinza Selecione isto para digitalizar em tons de cinza. Para obter melhor precisão de OCR, use esta opção para páginas com contraste variado ou baixo (sem muita diferença entre claro e escuro) e com texto sobre fundos sombreados ou coloridos. Digitalizar em cores Selecione isto para digitalizar em cores. Esta opção só funcionará com scanners em cores. Selecione-a se desejar imagens, texto ou fundos coloridos no documento de saída. Em termos de precisão de OCR, ela não oferece mais benefícios do que a digitalização em tons de cinza, mas exigirá muito mais tempo, recursos de memória e espaço em disco. Definição da origem das imagens de página 29
Brilho e contraste Boas configurações de brilho e contraste são importantes na precisão do OCR. Configure isso no painel Scanner da caixa de diálogo Opções ou na interface do scanner. Após carregar uma imagem, verifique sua aparência. Se os caracteres estiverem espessos e se tocando, use mais brilho. Se os caracteres estiverem finos e com falhas, use menos brilho. Em seguida, redigitalize a página. Se os resultados da digitalização continuarem insatisfatórios, abra a imagem digitalizada na janela Aperfeiçoamento de Imagem para editá-la usando ferramentas variadas.
Digitalização com um ADF
A melhor forma de digitalizar documentos de várias páginas é com o uso de um ADF (alimentador automático de documentos). Basta carregar as páginas no ADF na ordem correta. Você pode digitalizar documentos com frente e verso usando um ADF. Um scanner duplex gerenciará isso automaticamente.
Digitalização sem um ADF
Com o uso da interface de scanner do OmniPage, você pode digitalizar documentos de várias páginas com eficiência a partir de um scanner plano, mesmo sem ADF. Selecione Digitalizar Páginas Automaticamente no painel Scanner da caixa de diálogo Opções e defina um valor de pausa em segundos. O scanner fará as passagens de digitalização automaticamente, fazendo uma pausa a cada digitalização pelo número de segundos definido, permitindo que você coloque a página seguinte.
Conversão entre documentos
Um importante recurso novo do OmniPage Professional 15 é o de permitir abrir não apenas arquivos de imagem, mas também documentos criados em processadores de texto ou aplicativos semelhantes. Os tipos de arquivos aceitos incluem .doc, .xls, .ppt, .rtf, .wpd, dentre outros. Clique no botão Carregar Arquivos na Caixa de Ferramentas do OmniPage ou selecione o comando Carregar Arquivos em Obter Página, no menu Arquivo. Na caixa de diálogo Carregar Arquivos, escolha Documentos. Ao terminar, você poderá usar diversos formatos de arquivo para salvar os documentos. 30 Processamento de documentos
Capítulo 3
Descrição do layout de documento
Antes de iniciar o reconhecimento, você será solicitado a descrever o layout das páginas de entrada, para auxiliar o processo de zoneamento automático. No processamento automático, o zoneamento automático sempre é executado, a menos que você especifique um gabarito que não contenha uma zona ou um fundo do tipo processar. Quando você executa o processamento manual, o zoneamento automático é executado algumas vezes. Consulte a Ajuda On-line: Quando o zoneamento automático é executado? Suas opções de descrição de entrada são as seguintes: Automático Escolha isto para permitir que o programa tome todas as decisões de zoneamento. Ele decide se o texto está em colunas ou não, se um item é um texto ou uma imagem a ser reconhecida e se devem ser usadas tabelas ou não. Coluna única, sem tabela Escolha esta configuração se as páginas contiverem só uma coluna de texto e nenhuma tabela. Cartas comerciais e páginas de livro normalmente são assim. Várias colunas, sem tabela Escolha esta opção se algumas das páginas contiverem texto em colunas e você quiser que percam as colunas ou que as colunas continuem separadas, como no layout original. Coluna única, com tabela Escolha esta configuração se a página contiver só uma coluna de texto e uma tabela. Planilha Escolha isto se toda a página consistir em uma tabela que você quiser exportar para um programa de planilha ou tratar como uma tabela única. Formulário Escolha isto se toda a página consistir em um formulário e você quiser reconhecer automaticamente seus elementos. Após o reconhecimento, você poderá modificar as propriedades dos elementos, criar novos ou editar o layout do formulário. Esta opção só está disponível no OmniPage Professional 15.
Descrição do layout de documento
31
Personalizado Escolha esta opção para obter o controle máximo sobre o zoneamento automático. Você pode impedir ou estimular a detecção de colunas, imagens e tabelas. Defina suas configurações no painel OCR da caixa de diálogo Opções. Gabarito Escolha um arquivo de gabarito de zona se quiser aplicar um valor de fundo, zonas e propriedades a todas as páginas obtidas a partir deste momento. As zonas do gabarito também são aplicadas à página atual, substituindo todas as zonas existentes. Se o zoneamento automático forneceu resultados não esperados de reconhecimento, use o processamento manual para fazer novo zoneamento em páginas individuais e reconhecê-las novamente.
Pré-processamento de imagens
Para aprimorar os resultados do OCR, você pode aperfeiçoar as imagens antes do zoneamento e do reconhecimento usando as ferramentas de Aperfeiçoamento de Imagem. Para abrir a janela Aperfeiçoamento de Imagem, clique no botão Aperfeiçoar Imagem da barra de ferramentas Imagem ou clique em Ferramentas e escolha Aperfeiçoar Imagem. Você também pode criar etapas de aperfeiçoamento de imagem nos fluxos de trabalho escolhendo a etapa Aperfeiçoar Imagens. Os recursos de fluxos de trabalho, Assistente de Fluxo de Trabalho e Visualizador de Fluxo de Trabalho são fornecidos somente no OmniPage 15. A entrada do Aperfeiçoamento de Imagem é a imagem primária. Devemos saber distinguir entre três tipos de imagem: Imagem original: a imagem criada pelo scanner ou contida em um arquivo antes de entrar no programa. Imagem primária: o estado da imagem original depois de carregada no OmniPage, possivelmente modificada por operações de pré-processamento automático ou manual. Imagem do OCR: uma imagem em preto e branco derivada da imagem primária, otimizada para bons resultados de OCR.
32
Processamento de documentos
Capítulo 3
Algumas ferramentas afetam a imagem primária, outras, a imagem do OCR. Certifique-se de qual imagem está editando. Boas definições de contraste e brilho desempenham um papel importante na precisão do OCR. Configure isso no painel Scanner da caixa de diálogo Opções ou na interface do scanner. O diagrama ilustra um ajuste de brilho ideal. Após carregar uma imagem, verifique sua aparência. Se os caracteres estiverem espessos e se tocando, use mais brilho. Se os caracteres estiverem finos e com falhas, use menos brilho. Use a ferramenta Brilho do OCR para otimizar a imagem.
Inadequada Tolerável Boa Melhor Boa Tolerável Inadequada
Ferramentas de Aperfeiçoamento de Imagem
As ferramentas de Aperfeiçoamento de Imagem também podem ser usadas para editar imagens e salvá-las e usá-las como arquivos de imagem. Observe que algumas ferramentas do OmniPage só funcionam com a imagem primária e outras são usadas com a imagem do OCR. Clique no botão Imagem Primária/do OCR na janela Aperfeiçoamento de Imagem para ver o estado atual de uma ou outra. A janela Aperfeiçoamento de Imagem tem dois painéis. O painel esquerdo mostra a imagem inicial. Suas alterações são exibidas no painel direito.
Ferramentas de Aperfeiçoamento de Imagem
33
Quando você clica em Aceitar, a imagem direita é movida para o painel esquerdo e torna-se a nova imagem inicial para outros aperfeiçoamentos. As ferramentas a seguir são acessíveis na barra de ferramentas: Ponteiro (F5) - o Ponteiro é uma ferramenta neutra que executa operações diversas em circunstâncias diferentes (por exemplo, escolher uma cor para a operação Preencher ou fixar a linha de desinclinação). Zoom (F6) - clique na ferramenta e use o botão esquerdo do mouse para ampliar a imagem ou o direito para reduzi-la. Você também pode usar a roda do mouse para obter mais ou menos zoom - mesmo na visualização inativa. Na visualização ativa, os botões "+" e "-" atuam da mesma forma.(A) Selecionar Área (F7) - clique e arraste a seleção sobre a imagem para usar uma ferramenta somente na área selecionada. (As ferramentas de Aperfeiçoamento de Imagem, por padrão, atuam em toda a página.) A seleção tem três modos (no menu Exibir): Normal - você pode selecionar áreas retangulares na página e, em seguida, mover ou redimensionar a seleção. Aditivo - este modo permite efetuar seleções irregulares definindo retângulos sobrepostos que serão adicionados uns aos outros. Subtrativo - use este modo para cortar partes de seleções existentes definindo áreas novas sobrepostas. Imagem Primária/do OCR - clique nesta ferramenta para alternar entre a imagem primária e a do OCR na visualização ativa. As imagens primárias podem ser de qualquer modo. Já a imagem do OCR é a versão em preto e branco gerada apenas para fins de OCR. Sincronizar Visualizações - clique nesta ferramenta para definir na visualização inativa a mesma ampliação e posição de rolagem da visualização ativa. Para que a visualização inativa acompanhe o foco da ativa, clique em Exibir e escolha o comando Manter Sincronia. Brilho e Contraste - clique nesta ferramenta para ajustar o brilho e o contraste da imagem primária ou de uma parte selecionada. Use os controles deslizantes na área da ferramenta para obter o efeito desejado. Matiz/Saturação/Claridade - clique nesta ferramenta e, em seguida, use os controles deslizantes para modificar o matiz, a saturação e a claridade da imagem primária.
34
Processamento de documentos
Capítulo 3
Cortar - se decidir usar somente determinada parte da imagem, clique na ferramenta Cortar e selecione a área a ser mantida. O restante da imagem será removido. Girar - clique nesta ferramenta para girar (em 90, 180 ou 270 graus) e/ou virar a imagem ou a área selecionada. Remover Ruído - clique nesta ferramenta para remover salpicos da imagem. Remover Ruído atua na imagem do OCR em 4 níveis. Você também pode usar esta ferramenta para reforçar o contorno das letras: para isso, marque a caixa de seleção "Inverter remoção de ruído". Briho do OCR - use esta ferramenta para definir o brilho e o contraste da sua imagem do OCR. Consulte o diagrama na página 34. Ignorar Cor - clique nesta ferramenta e escolha uma cor. As seções da imagem digitalizada que tiverem essa cor ficarão transparentes. A ferramenta atua sobre a imagem do OCR. Resolução - use esta ferramenta para diminuir a resolução da imagem primária em porcentagens. Observe que não é possível ajustar uma resolução superior à da imagem original. Desinclinar - certas vezes, as páginas são digitalizadas com inclinação. Para endireitar as linhas do texto manualmente, use a ferramenta Desinclinar. (O painel Processar, em Opções, dispõe de uma desinclinação automática.) Preencher - use esta ferramenta para aplicar cores uniformes a áreas selecionadas.
Utilização do Histórico do Aperfeiçoamento de Imagem
Para confirmar ou desfazer edições de imagem (uma a uma ou todas as etapas), use o painel Histórico na janela Aperfeiçoamento de Imagem. Depois que você modifica a imagem original, a visualização exibe as alterações, mas elas só são aplicadas quando você clica no botão Aplicar ao lado da lista Histórico. As modificações não adicionadas ao Histórico através do botão Adicionar não serão aplicadas. Sempre que quiser ver o resultado de certa etapa, clique duas vezes nela na lista Histórico.
Utilização do Histórico do Aperfeiçoamento de Imagem
35
Para descartar as alterações realizadas com certa ferramenta, mas antes de aplicá-la, selecione a etapa na lista e clique no botão Redefinir. Para restaurar a imagem da forma que era antes do início da sessão de aperfeiçoamento em andamento, clique no botão "Descartar todas as alterações".
Salvamento e aplicação de gabaritos
Este recurso não está disponível no OmniPage SE. Se tiver várias imagens semelhantes para aperfeiçoar, você poderá criar uma lista de etapas de aperfeiçoamento para aplicar em todas. Para criar e armazenar um gabarito de aperfeiçoamento de imagem, carregue primeiro um arquivo de imagem na janela Aperfeiçoamento de Imagem. Em seguida, execute as etapas de pré-processamento e adicione-as ao Histórico clicando no botão Aplicar. Ao terminar, escolha Salvar Gabarito de Aperfeiçoamento no menu Arquivo. Procure o destino preferido e salve o arquivo de gabarito (com a extensão .ipp). Para executar o conjunto de modificações salvos no arquivo de gabarito em outra imagem, basta abrir a nova imagem na janela Aperfeiçoamento de Imagem e escolher Aplicar Gabarito de Aperfeiçoamento no menu Arquivo.
Aperfeiçoamento de imagem em fluxos de trabalho
Os recursos de fluxos de trabalho, Assistente de Fluxo de Trabalho e Visualizador de Fluxo de Trabalho são fornecidos somente no OmniPage 15. Para incorporar o aperfeiçoamento de imagem a um fluxo de trabalho, escolha o ícone correspondente no Assistente de Fluxo de Trabalho. Encontram-se disponíveis as seguintes opções: Exibir imagens para aperfeiçoamento manual - durante a execução de um fluxo de trabalho, cada imagem carregada será exibida para edição manual. Aplicar gabarito de aperfeiçoamento - um gabarito de aperfeiçoamento já salvo será aplicado automaticamente à imagem enquanto ela é processada pelo fluxo de trabalho. Aplicar gabarito de aperfeiçoamento e exibir - o fluxo de trabalho aplicará o gabarito de aperfeiçoamento da imagem selecionada e também exibirá a imagem para permitir outras alterações. 36 Processamento de documentos
Capítulo 3
Zonas e fundos
As zonas definem áreas na página a serem processadas ou ignoradas. As zonas são retangulares ou irregulares, com lados verticais ou horizontais. As imagens de páginas em um documento têm um valor de fundo: processar ou ignorar (este último é o mais comum). Os valores de fundo podem ser alterados com as ferramentas apresentadas. As zonas podem ser definidas sobre fundos de páginas com as ferramentas apresentadas em Tipos de zona e propriedades (ver mais adiante). Áreas do tipo processar (em zonas ou fundos do tipo processar) são zoneadas automaticamente quando são enviadas para reconhecimento. Áreas do tipo ignorar (em zonas ou fundos do tipo ignorar) são descartadas pelo processamento. Nenhum texto é reconhecido e nenhuma imagem é transferida.
Zoneamento automático
O zoneamento automático permite que o programa detecte blocos de texto, títulos, figuras e outros elementos em uma página e defina zonas em torno deles. Você pode zonear automaticamente uma página inteira ou parte dela. Zonas definidas automaticamente e zonas de gabarito têm molduras sólidas. Zonas definidas manualmente ou modificadas têm molduras pontilhadas. Zoneamento automático de um fundo de página Obtenha uma página. Ele é exibida com um fundo do tipo processar. Defina uma zona. O fundo é alterado para o tipo ignorar. Defina zonas de texto, tabela ou imagem para delimitar áreas a serem zoneadas manualmente. Clique na ferramenta de fundo Processar (figura) para definir um fundo do tipo processar. Defina zonas do tipo ignorar nas partes da página que são desnecessárias. Depois do reconhecimento, a página retornará com um fundo do tipo ignorar e novas zonas em torno de todos os elementos encontrados no fundo.
Zonas e fundos
37
Tipos de zona e propriedades
Cada zona tem um tipo de zona. As zonas contendo texto também podem ter uma configuração de conteúdo de zona: alfanumérica ou numérica. O tipo de zona e o conteúdo da zona juntos constituem as propriedades da zona. Clique com o botão direito na zona para obter um menu de atalho que permita alterar as propriedades da zona. Selecione várias zonas com Shift+click para alterar suas propriedades com uma ação. A barra de ferramentas Imagem oferece seis ferramentas para definir zonas, uma para cada tipo. Zona Processar Use isto para definir uma zona do tipo processar, para definir a área de uma página onde aplicar o zoneamento automático. Depois do reconhecimento, esta zona será substituída por uma ou mais zonas com tipos de zona determinados automaticamente. Zona Ignorar Use isto para definir uma zona do tipo ignorar, para definir uma área de página que não deverá ser transferida para o Editor de Texto. Zona de texto Use isto para definir uma zona de texto. Defina esta zona sobre um bloco único de texto. O conteúdo da zona será tratado como texto corrido, sem colunas. Zona de tabela Use isto para que o conteúdo da zona seja tratado como uma tabela. As grades da tabela podem ser detectadas automaticamente ou inseridas manualmente. Zona de imagem Use isto para delimitar um(a) imagem, diagrama, desenho, assinatura ou qualquer item a ser transferido para o Editor de Texto como uma imagem incorporada e não como um texto reconhecido. Zona de formulário Use isto para delimitar uma área do documento que contenha elementos de formulário como caixa de seleção, botão de opção ou campo de texto ou qualquer outro item a ser transferido para o Editor de Texto como elemento de formulário. Em seguida, na visualização True Page, você poderá editar o
38
Processamento de documentos
Capítulo 3
layout do formulário e modificar as propriedades dos elementos. As zonas de formulário só estão disponíveis no OmniPage Professional 15.
Trabalho com zonas
A barra de ferramentas Imagem fornece ferramentas de edição de zonas. Uma está sempre selecionada. Quando não quiser mais utilizar uma ferramenta, clique em outra. Algumas ferramentas nessa barra de ferramentas são agrupadas. Apenas a última ferramenta selecionada do grupo fica visível. Para selecionar uma ferramenta visível, clique nela. Para definir uma zona única, selecione a ferramenta de definição de zona do tipo desejado e clique e arraste o cursor. Para redimensionar uma zona, selecione-a com um clique, mova o cursor para um dos lados ou cantos, pegue uma alça e mova-a para o local desejado. Ela não poderá sobrepor-se a outra zona. Para criar uma zona irregular por adição defina uma zona parcialmente sobreposta do mesmo tipo. Para unir duas zonas do mesmo tipo defina uma zona sobreposta do mesmo tipo (zonas definidas à esquerda, zonas resultantes à direita).
Para criar uma zona irregular por subtração, defina uma zona sobreposta do mesmo tipo do fundo. Para dividir uma zona defina uma zona divisora do mesmo tipo do fundo. A Ajuda On-line apresenta um conjunto completo de diagramas de zonas.
Zonas e fundos
39
Quando você define uma nova zona que se sobrepõe parcialmente a uma zona existente de outro tipo, ela não se sobrepõe de fato; a nova zona substitui a parte sobreposta da zona existente. Os tipos de zona a seguir são proibidos:
O Zoneamento acelerado permite realizar o zoneamento manual de forma rápida. Ative o cursor de seleção de zona e mova-o sobre a imagem da página. As áreas sombreadas aparecerão exibindo as zonas auto-detectadas. Clique duas vezes para transformar uma área sombreada em uma zona.
Grades de tabela na imagem
Após o processamento automático, você poderá ver zonas de tabelas colocadas em uma página. Elas são indicadas por um ícone de zona de tabela no canto esquerdo superior da zona. Para mudar uma zona retangular de/ para uma zona de tabela, use o seu menu de atalho. Você também pode definir zonas de tabela, mas elas precisam permanecer retangulares. Você delimita ou move divisores de tabela para determinar se as linhas de grade aparecerão quando a tabela for colocada no Editor de Texto. Você pode definir ou redimensionar uma zona de tabela (desde que ela permaneça retangular) para descartar colunas ou linhas desnecessárias das extremidades de uma tabela. Com o uso das ferramentas de tabela, você pode inserir divisores de linhas e colunas; mover e remover divisores. Clique na ferramenta "Inserir/Remover todos os divisores" para que os divisores de uma tabela sejam detectados automaticamente e inseridos. Você pode especificar a formatação de linha para molduras e grades de tabela a partir de um menu de atalho Depois do reconhecimento você terá mais escolhas para editar molduras e sombreamento no Editor de Texto.
40
Processamento de documentos
Capítulo 3
Uso de gabaritos de zonas
Um gabarito contém um valor de fundo de página e um conjunto de zonas e suas propriedades, armazenados em um arquivo. Um arquivo de gabarito de zona pode ser carregado para que as zonas do gabarito sejam usadas durante o reconhecimento. Carregue um arquivo de gabarito na lista suspensa "Descrição de Layout" ou a partir do menu Ferramentas. Você pode procurar em locais de rede para carregar gabaritos criados por terceiros. Quando você carrega um gabarito, seu fundo e suas zonas são inseridos:
na página atual, substituindo quaisquer zonas existentes em todas as páginas obtidas futuramente em páginas pré-existentes enviadas para um novo reconhecimento sem quaisquer zonas. Com o processamento manual, as zonas do gabarito nos dois primeiros casos podem ser visualizadas e modificadas antes do reconhecimento. Com o processamento automático, as zonas do gabarito podem ser visualizadas e modificadas apenas depois do reconhecimento. Com o processamento de fluxo de trabalho, use a etapa Zonear Imagens. Ela combina duas etapas: carregar gabaritos e zoneamento manual. Para usar um gabarito de zona, clique no botão Adicionar no painel apropriado do Assistente de Fluxo de Trabalho e selecione o arquivo de gabarito de zona a ser usado. Em seguida, escolha entre exibir imagens para zoneamento manual, aplicar o gabarito de zona ou aplicar o gabarito e exibir as imagens. Os recursos de fluxos de trabalho, Assistente de Fluxo de Trabalho e Visualizador de Fluxo de Trabalho são fornecidos somente no OmniPage 15. Gabaritos aceitam zonas e fundos do tipo ignorar e processar. Portanto, eles podem ser úteis para definir quais partes das páginas devem ser processadas com zoneamento automático e quais partes devem ser ignoradas. Zonas ou fundos do tipo processar em um gabarito podem ser substituídos durante o reconhecimento por um conjunto de zonas menores; tipos específicos de zona serão atribuídos a essas zonas. Como salvar um gabarito de zona Selecione um valor de fundo e prepare zonas em uma página. Verifique suas localizações e propriedades. Clique em "Gabarito de Zona..." no menu Ferramentas. Na caixa de diálogo, selecione [zonas na página] e clique em Uso de gabaritos de zonas 41
Salvar. Em seguida, atribua um nome e, opcionalmente, um caminho diferente. Escolha um local de rede para compartilhar o arquivo de gabarito. Clique em OK. O novo gabarito de zona permanece carregado. Como modificar um gabarito de zona Carregue um gabarito e obtenha uma imagem adequada com processamento manual. As zonas do gabarito aparecem. Modifique as zonas e/ou propriedades conforme desejado. Abra a caixa de diálogo Arquivos de Gabarito de Zona. O gabarito atual é selecionado. Clique em Salvar e em Fechar. Como descarregar um gabarito Selecione uma configuração sem gabarito na lista suspensa Descrição de Layout. As zonas de gabarito não são removidas das páginas existentes ou atuais, mas as zonas de gabarito não serão mais usadas para processamento futuro. Você também pode abrir a caixa de diálogo Arquivos de Gabarito de Zona, selecionar [nenhum] e clicar no botão Definir como Atual. Neste caso, a configuração de descrição do layout volta para Automático. Como substituir um gabarito por outro Selecione um gabarito diferente na lista suspensa Descrição de Layout ou abra a caixa de diálogo Arquivos de Gabarito de Zona, selecione o gabarito desejado e clique no botão Definir como Atual. Zonas do novo gabarito são aplicadas à página atual, substituindo quaisquer zonas já existentes. Elas também são aplicadas conforme explicado acima. Como remover um arquivo de gabarito Abra a caixa de diálogo Arquivos de Gabarito de Zona. Selecione um gabarito e clique no botão Remover. As zonas já inseridas por esse gabarito não são removidas. Os arquivos de gabarito só podem ser excluídos a partir do sistema operacional. Como incluir um arquivo de gabarito em um OPD Carregue o gabarito, clique no botão Salvar na barra de ferramentas Padrão e escolha o tipo de arquivo Documento do OmniPage (Estendido). Isso significa que o gabarito será movido junto com o OPD se for enviado para outro local. Quando o arquivo OPD estendido for aberto mais tarde, o gabarito de zona incluído será exibido na caixa de diálogo "Gabarito de Zona" como [incorporado] e poderá ser salvo como um novo arquivo de gabarito no novo local. O OmniPage SE não oferece suporte para documentos estendidos do OmniPage. 42 Processamento de documentos
Correção e edição
Os resultados do reconhecimento são apresentados no Editor de Texto. Podem ser textos reconhecidos, tabelas, formulários e imagens incorporadas. Este editor do tipo WYSIWYG (What You See Is What You Get, "o formato exibido é o resultado final") será detalhado neste capítulo.
Exibição e visualizações do Editor
O Editor de Texto exibe os textos reconhecidos e pode sublinhar com uma linha ondulada vermelha as palavras consideradas suspeitas durante o reconhecimento. São exibidas com caracteres vermelhos no Corretor do OCR. Uma palavra pode ser suspeita por não ter sido encontrada em um dicionário ativo: padrão, do usuário, ou profissional. Também pode ser suspeita em decorrência do processo de OCR, mesmo que exista no dicionário. Se a incerteza advir de certos caracteres na palavra, estes serão exibidos com realce amarelo, tanto no Editor quanto no Corretor do OCR. No painel Correção da caixa de diálogo Opções, você pode optar por marcar ou não as palavras ausentes dos dicionários. Todos os marcadores podem ser exibidos ou não conforme configuração definida no painel Editor de Texto da caixa de diálogo Opções. Você também pode mostrar ou ocultar caracteres não imprimíveis e indicadores de cabeçalho e rodapé. O painel Editor de Texto também permite definir uma unidade de medida para o programa e uma configuração de quebra de linha para uso em todas as visualizações do Editor de Texto, exceto na visualização Texto Simples. O OmniPage pode exibir páginas com três níveis de formatação. Você pode alternar livremente entre eles através dos três botões no canto inferior esquerdo do Editor de Texto ou do menu Exibir.
OmniPage Manual do usuário
43
Visualização Texto Simples Exibe texto simples sem colunas alinhado à esquerda com uma única fonte e um tamanho de fonte, com as mesmas quebras de linha do documento original. Visualização Texto Formatado Exibe texto sem colunas com estilo de parágrafo e de fonte. Visualização True Page A visualização True Page® tenta conservar o máximo possível da formatação do documento original. O estilo dos caracteres e do parágrafo é mantido. A ordem de leitura pode ser exibida por setas.
Correção de resultados de OCR
Depois que uma página é reconhecida, os resultados do reconhecimento aparecem no Editor de Texto. A correção é iniciada automaticamente, caso tenha sido solicitada no painel Correção da caixa de diálogo Opções. Você pode iniciar a correção manualmente a qualquer momento. Trabalhe da seguinte maneira: 1. Clique na ferramenta Corrigir OCR na barra de ferramentas Padrão ou escolha Corrigir OCR... no menu Ferramentas.
2. A correção começa a partir da página atual, mas ignora o texto corrigido. Se um possível erro for detectado, a caixa de diálogo Corretor do OCR colore a palavra suspeita em seu contexto, adiciona um realce amarelo aos caracteres suspeitos e mostra como era a palavra original na imagem. A explicação informa "Palavra suspeita" ou "Palavra ausente do dicionário". 3. Se a palavra reconhecida estiver correta, clique em Ignorar ou Ignorar Tudo para ir para a próxima palavra suspeita. Clique em Adicionar para adicioná-la ao dicionário atual do usuário e ir para a próxima palavra suspeita. 4. Se a palavra reconhecida não estiver correta, modifique-a no painel de Edição ou selecione uma sugestão do dicionário. Clique em Substituir ou Substituir Tudo para implementar a alteração e ir para a próxima
44
Correção e edição
Capítulo 4 palavra suspeita. Clique em Adicionar para adicionar a palavra alterada ao dicionário atual do usuário e ir para a próxima palavra suspeita. 5. Os marcadores coloridos são removidos das palavras no Editor de Texto à medida que elas são corrigidas. Você pode alternar para o Editor de Texto durante a correção e usá-lo para fazer correções. Use o botão Continuar para reiniciar a correção. Clique em "Página Pronta" para ignorar a página seguinte e em "Documento Pronto" ou em "Fechar" para interromper a correção antes do final do documento. 6. Uma página será marcada com o ícone de corrigida em sua miniatura e no Gerenciador de Documentos se a correção tiver atingido o final da página. O OmniPage Professional 15 dispõe de correção ativada por voz. Consulte "Reconhecimento de voz" na página 80. As sugestões do corretor são numeradas. Fale o número da sugestão que quiser aceitar.
Verificação de texto
Após efetuar o OCR, você pode comparar uma parte do texto reconhecido com a parte correspondente da imagem original para verificar se o texto foi reconhecido corretamente. A ferramenta Verificador está na barra de ferramentas Formatação. O Verificador também pode ser controlado pelo menu Ferramentas. Passe o cursor sobre a exibição de um Verificador para obter a barra de ferramentas do recurso. Use-a da seguinte forma:
Qual é o contexto do verificador dinâmico? · uma palavra · três palavras (atual + vizinhas) · linha inteira da imagem ampliar/reduzir
Para ativar o Verificador, clique na ferramenta Verificador ou pressione F9. Para desativá-lo, clique novamente na ferramenta Verificador, pressione F9 novamente ou pressione Esc.
Verificação de texto
45
A Ajuda On-line dispõe da lista completa de atalhos de teclado do verificador.
O Mapa de Caracteres
O Mapa de Caracteres é uma ferramenta acoplável que auxilia na correção. É usado essencialmente com dois objetivos: inserir caracteres durante a correção e edição que não são (facilmente) acessíveis pelo teclado. Nesse aspecto, é bem semelhante ao Mapa de Caracteres do sistema. para mostrar todos os caracteres validados pelos idiomas de reconhecimento em uso. (Não se aplica ao OmniPage SE.) Para acessar o Mapa de Caracteres, clique no botão correspondente na barra de ferramentas Formatação ou escolha Mapa de Caracteres no menu Exibir e clique em Mostrar. No item de menu Mapa de Caracteres, você tem opções adicionais: Somente Caracteres Recentes: clique nesta opção para exibir somente os 36 caracteres usados por último na barra de ferramentas de formatação. Isso será útil se você trabalhar com um conjunto de caracteres inseríveis limitado. Conjuntos de Caracteres: escolha esta opção e, em seguida, selecione todos os conjuntos de caracteres que desejar exibir no mapa de caracteres. Você pode acessar o Mapa de Caracteres de outras formas: Clique em Ferramentas > Opções e escolha a guia OCR. Clique no botão Caracteres Adicionais para selecionar caracteres a serem incluídos na correção. Da mesma forma, você pode modificar o Caractere Rejeitado usando o Mapa de Caracteres. Selecione Caractere de Treinamento no menu Ferramentas. O Mapa de Caracteres será exibido quando você clicar no botão (...) ao lado do campo Corrigir. Selecione Caractere de Treinamento no menu de atalho de uma palavra suspeita ou ausente dos dicionários no Editor de Texto. As três formas acima de acessar o Mapa de Caracteres não estão disponíveis no OmniPage SE.
46
Correção e edição
Capítulo 4
Dicionários do usuário
O programa dispõe de dicionários internos para vários idiomas. Eles auxiliam no reconhecimento e podem oferecer sugestões durante a correção. Podem ser complementados com dicionários do usuário. Você pode salvar quantos dicionários de usuário quiser, mas somente um pode ser carregado por vez. Um dicionário chamado Custom (Personalizado) é o dicionário de usuário padrão do Microsoft Word. Como iniciar um dicionário de usuário Clique em Adicionar na caixa de diálogo Corretor do OCR sem que nenhum dicionário de usuário esteja carregado ou abra a caixa de diálogo Arquivos de Dicionário do Usuário no menu Ferramentas e clique em Novo. Carregamento ou descarregamento de um dicionário de usuário Faça isso a partir do painel OCR da caixa de diálogo Opções, ou da caixa de diálogo "Arquivos de Dicionário do Usuário". Edição ou remoção de um dicionário de usuário Adicione palavras carregando um dicionário de usuário e, em seguida, clicando em Adicionar na caixa de diálogo "Corretor do OCR". Você pode adicionar e excluir palavras clicando em Editar na caixa de diálogo "Arquivos de Dicionário do Usuário". Você também pode importar palavras de dicionários do usuário do OmniPage (*.ud). Ao editar um dicionário do usuário, você pode importar uma lista de palavras de um arquivo de texto simples para adicionar palavras ao dicionário rapidamente. Cada palavra deve estar em uma linha separada sem pontuação antes ou depois. O botão Remover permite remover da lista o dicionário de usuário selecionado. O OmniPage SE não oferece suporte para importação e export ...
Facilidade de uso Foram feitas as seguintes perguntas aos usuários: OMNIPAGE SE é fácil de usar?Usuários de 370 responderam perguntas e avaliaram o produto numa escala de 0 a 10. A avaliação é 10/10, se o SCANSOFT OMNIPAGE SE é muito fácil de usar. As opiniões (resultados aproximados) são apresentadas no seguinte gráfico: Ao deixar o mouse em uma coluna por alguns segundos, você pode ver o número de pessoas que votaram para compor a pontuação que aparece no eixo horizontal. Dados eststísticos: = 5.96
= 2.96A pontuação média em relação ao número de pareceres é 5.96 eo diferencial padrão é 2.96. |
|
Alto desempenho Foram feitas as seguintes perguntas aos usuários: OMNIPAGE SE é altamente eficiente?Usuários de 370 responderam perguntas e avaliaram o produto numa escala de 0 a 10. A avaliação é 10/10, se o SCANSOFT OMNIPAGE SE é, no seu domínio, o melhor em nível técnico, o que oferece a melhor qualidade ou maior leque de opções. As opiniões (resultados aproximados) são apresentadas no seguinte gráfico: Ao deixar o mouse em uma coluna por alguns segundos, você pode ver o número de pessoas que votaram para compor a pontuação que aparece no eixo horizontal. Dados eststísticos: = 6.37
= 2.84A pontuação média em relação ao número de pareceres é 6.37 eo diferencial padrão é 2.84. |
|
Confiabilidade Foram feitas as seguintes perguntas aos usuários: OMNIPAGE SE é confiável, resistente?Usuários de 370 responderam perguntas e avaliaram o produto numa escala de 0 a 10. A avaliação é 10/10, se você achar que SCANSOFT OMNIPAGE SE é um produto robusto, que vai durar um longo tempo antes de quebrar. As opiniões (resultados aproximados) são apresentadas no seguinte gráfico: Ao deixar o mouse em uma coluna por alguns segundos, você pode ver o número de pessoas que votaram para compor a pontuação que aparece no eixo horizontal. Dados eststísticos: = 6.28
= 2.78A pontuação média em relação ao número de pareceres é 6.28 eo diferencial padrão é 2.78. |
|
Relação custo benefício Foram feitas as seguintes perguntas aos usuários: OMNIPAGE SE tem boa relação custo/benefício.Usuários de 370 responderam perguntas e avaliaram o produto numa escala de 0 a 10. A avaliação é de 10/10 se você considera que SCANSOFT OMNIPAGE SE não é, realmente, caro, considerando seus dispositivos. As opiniões (resultados aproximados) são apresentadas no seguinte gráfico: Ao deixar o mouse em uma coluna por alguns segundos, você pode ver o número de pessoas que votaram para compor a pontuação que aparece no eixo horizontal. Dados eststísticos: = 6.17
= 3.11A pontuação média em relação ao número de pareceres é 6.17 eo diferencial padrão é 3.11. |
|
|