sábado, 22 de abril de 2017

GUI Tesseract OCR Software

GUI Tesseract OCR Software







GUI Tesseract OCR Software


Bem-vindo à home page oficial para o (a9t9) grátis OCR para Windows Desktop  ferramenta. Como o nome sugere, ele extrai texto de arquivos de imagem e itens de PDF. Ele usa o motor Tesseract OCR open-source da HP / Google para processamento OCR.








TScreenshot de (a9t9) grátis OCR para Windows Desktop - um moderno open source Tesseract GUI




Por que usar  (a9t9) grátis OCR para Windows Desktop ?



  • A aplicação é simples para instalar / desinstalar, e muito fácil de usar
  • Livre para usar
  • 100% adware e spyware livre
  • Utiliza o motor Tesseract OCR bem conhecido (para que essencialmente é uma GUI Tesseract moderna)
  • Você pode melhorar e personalizar-lo - é open source (GPL)
 Se você não tiver feito isso ainda, fazer o download do instalador aqui:






O software OCR inclui suporte PDF completo (alimentado por Ghostscript).




Como começar:

Você pode abrir um arquivo de imagem ou PDF. O conteúdo do arquivo de origem será exibido na janela da esquerda. Se
o documento tiver mais de uma página, ou se você aberto documentos de
várias páginas, use as setas na parte inferior para navegar entre elas,



Você iniciar o OCR clicando no verde Iniciar Ocr , e você vai ver o resultado na janela da direita. Texto de saída pode ser salva como um arquivo de texto ou documento do Word.



Infelizmente, a qualidade de conversão não é tão grande. Por trás da cena que usa o motor de OCR open-source Tesseract. Sua qualidade varia de língua para língua - então vá em frente e testar se ele é suficiente para suas necessidades.



Dicas para melhores resultados de reconhecimento:

saída de Tesseract será qualidade muito baixa, se as imagens de entrada não são pré-processados ​​para adequá-lo:



  • Imagens (especialmente as imagens de) devem ser ampliados de modo que a altura do texto é de pelo menos 20 pixels.
  • Qualquer rotação ou inclinação deve ser corrigido ou nenhum texto será reconhecido,
  • margens escuras devem ser removidos manualmente, ou eles vão ser interpretado como personagens.
Ainda precisamos de melhores resultados de reconhecimento de texto? Em seguida, tente estas novas alternativas:

1. On-line OCR - o nosso web-based OCR aplicativo gratuito. 2. OCR API - nosso livre web API **, inclui linha de comando OCR exemplos com cURL.

3. software Windows 8 OCR - nosso livre, open-source (GPL) Windows Store OCR aplicativo.



Ambos os novos serviços usar um componente OCR diferentes
e têm muito melhores taxas de reconhecimento de texto do que o software
de desktop OCR baseado em Tesseract nesta página.



Para desenvolvedores de software e geeks:



O (a9t9) grátis OCR para Windows Desktop ferramenta é um front-end interface gráfica do usuário (GUI) para o motor Tesseract . Ele
é escrito em C # / WPF eo código fonte completo está disponível como
ready-to-compilação Microsoft Visual Studio 2013 projeto  no GitHub  sob a licença open source GPL V2. O feedback de todos os tipos é bem-vinda, especialmente ideias sobre como melhorar a qualidade de OCR. Na  melhor OCR Software comentário neste blog o desempenho medíocre OCR de Tesseract era um dos Cinco surpresas OCR  deste teste.





Como adicionar mais idiomas

Uma das principais vantagens do motor Tessearct é a grande variedade de idiomas de OCR suportados - que inclui ainda Esperanto! O (a9t9) grátis OCR para Windows Desktop instalador inclui Inglês (ENG), espanhol (SPA) e alemão (GER). Para adicionar mais idiomas basta seguir estes três passos:



  1. Baixe o idioma arquivo que você precisa a partir do código do Google, por exemplo, chinês (tradicional) .



TTesseract seção de download linguagem




  1. Un”zip” o download (primeiro o arquivo .gz, em seguida, o arquivo tar no interior). Se você não tem nenhum software para gerenciar arquivos compactados ainda, obter gratuitamente 7zip ferramenta. É uma ótima escolha.



Exemplo: Adicionando chinês simplificado como idioma de OCR para a pasta / tessdata <




  1. Copiar os arquivos para o tessdata pasta do idioma no seu PC. Você encontra essa pasta facilmente abrindo-o de dentro do aplicativo. No menu do software OCR ir para a Ajuda> Abrir pasta Idioma - e uma nova janela Explorer abre.



(a9t9) grátis OCR para Windows Desktop ocr'ing uma imagem de um artigo da revista chinesa de telefonia móvel.

Os resultados Tesseract OCR são medíocres, mas ainda melhor do que transcrever o texto você mesmo




Agora inicie o software novamente e o novo
idioma aparece na seleção de idioma OCR suspensa como código abreviado,
por exemplo ENG para Inglês, SPA para o espanhol, GER Alemão, POR para
português, CHI_TRA para suporte a caracteres chineses tradicionais ou
CHI_SIM de caráter chinês simplificado Apoio, suporte.




Nenhum comentário:

Postar um comentário