Como converter textos scaneados em documentos

Bom dia Gilberto. Tenho as páginas de um documento que está no formato JPG capturadas por um scanner. Como posso transformar estas páginas em um documento de texto?

Ricardo – Vitoria (via Internet)

Olá Ricardo. Para transformar as páginas do documento em um arquivo de texto você vai precisar de um programa chamado OCR (Optical Character Recognition). Estes programas tentam reconhecer as letras e números pelo seu desenho, permitindo a você salvar o resultado em vários formatos diferentes como: DOC, TXT ou RTF, à sua escolha.

Normalmente estes utilitários são fornecidos em conjunto com os scanners, mas você também pode comprá-los. Alguns exemplos são: Omnipage (http://www.omnipage.com) ou DocuXplorer (http://www.docuxplorer.com).

Para utilizá-los basta você abrir o texto em formato de imagem (GIF, JPG e outros) e solicitar sua conversão para o formato desejado.

Estes programas fazem o que você precisa, mas o índice de acerto não é de 100%, assim você ainda precisará revisar o texto gerado com cuidado para verificar onde o OCR falhou. Algumas variáveis afetam o grau de acerto destes programas como por exemplo: a qualidade (contraste e nitidez) da digitalização do texto ou o tipo de fonte em que o texto está escrito.

(GS)

Gilberto Sudre

Professor do Instituto Federal de Educação, Ciência e Tecnologia do ES - IFES. Consultor e Pesquisador nas áreas de Segurança Digital e Computação Forense. Coordenador do Laboratório de Segurança Digital e Perícia Computacional Forense – LABSEG. Integrante do Comitê de Tecnologia da OAB-ES. Instrutor na disciplina de Perícia Computacional Forense da Academia de Polícia Civil do ES – ACADEPOL. Instrutor da Academia de Computação Forense Livre. Membro do comitê técnico CB21/CE27 da ABNT sobre Segurança da Informação. Membro do Grupo de Pesquisa – Justiça e Direito Eletrônicos – GEDEL. Comentarista de Tecnologia da Rádio CBN, TV Gazeta. Articulista do Jornal A Gazeta, Revista ES Brasil e Portal iMasters. Autor dos livros Antenado na Tecnologia e Redes de Computadores e co-autor dos livros Internet: O encontro de 2 Mundos, Segurança da Informação: Como se proteger no mundo Digital, Marco Civil da Internet e Processo Judicial Eletrônico.

Website: http://gilberto.sudre.com.br

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

CommentLuv badge