GUI Tesseract OCR Software
Bem-vindo à home page oficial para o (a9t9) grátis OCR para Windows Desktop ferramenta. Como o nome sugere, ele extrai texto de arquivos de imagem e itens de PDF. Ele usa o motor Tesseract OCR open-source da HP / Google para processamento OCR.
Por que usar (a9t9) grátis OCR para Windows Desktop ?
o documento tiver mais de uma página, ou se você aberto documentos de
várias páginas, use as setas na parte inferior para navegar entre elas,
Você iniciar o OCR clicando no verde Iniciar Ocr , e você vai ver o resultado na janela da direita. Texto de saída pode ser salva como um arquivo de texto ou documento do Word.
Infelizmente, a qualidade de conversão não é tão grande. Por trás da cena que usa o motor de OCR open-source Tesseract. Sua qualidade varia de língua para língua - então vá em frente e testar se ele é suficiente para suas necessidades.
1. On-line OCR - o nosso web-based OCR aplicativo gratuito. 2. OCR API - nosso livre web API **, inclui linha de comando OCR exemplos com cURL.
3. software Windows 8 OCR - nosso livre, open-source (GPL) Windows Store OCR aplicativo.
Ambos os novos serviços usar um componente OCR diferentes
e têm muito melhores taxas de reconhecimento de texto do que o software
de desktop OCR baseado em Tesseract nesta página.
Para desenvolvedores de software e geeks:
O (a9t9) grátis OCR para Windows Desktop ferramenta é um front-end interface gráfica do usuário (GUI) para o motor Tesseract . Ele
é escrito em C # / WPF eo código fonte completo está disponível como
ready-to-compilação Microsoft Visual Studio 2013 projeto no GitHub sob a licença open source GPL V2. O feedback de todos os tipos é bem-vinda, especialmente ideias sobre como melhorar a qualidade de OCR. Na melhor OCR Software comentário neste blog o desempenho medíocre OCR de Tesseract era um dos Cinco surpresas OCR deste teste.
Agora inicie o software novamente e o novo
idioma aparece na seleção de idioma OCR suspensa como código abreviado,
por exemplo ENG para Inglês, SPA para o espanhol, GER Alemão, POR para
português, CHI_TRA para suporte a caracteres chineses tradicionais ou
CHI_SIM de caráter chinês simplificado Apoio, suporte.
Por que usar (a9t9) grátis OCR para Windows Desktop ?
- A aplicação é simples para instalar / desinstalar, e muito fácil de usar
- Livre para usar
- 100% adware e spyware livre
- Utiliza o motor Tesseract OCR bem conhecido (para que essencialmente é uma GUI Tesseract moderna)
- Você pode melhorar e personalizar-lo - é open source (GPL)
- Download Grátis OCR para Windows Desktop (~ 30MB, é executado no Win 7 e superior)
Como começar:
Você pode abrir um arquivo de imagem ou PDF. O conteúdo do arquivo de origem será exibido na janela da esquerda. Seo documento tiver mais de uma página, ou se você aberto documentos de
várias páginas, use as setas na parte inferior para navegar entre elas,
Você iniciar o OCR clicando no verde Iniciar Ocr , e você vai ver o resultado na janela da direita. Texto de saída pode ser salva como um arquivo de texto ou documento do Word.
Infelizmente, a qualidade de conversão não é tão grande. Por trás da cena que usa o motor de OCR open-source Tesseract. Sua qualidade varia de língua para língua - então vá em frente e testar se ele é suficiente para suas necessidades.
Dicas para melhores resultados de reconhecimento:
saída de Tesseract será qualidade muito baixa, se as imagens de entrada não são pré-processados para adequá-lo:- Imagens (especialmente as imagens de) devem ser ampliados de modo que a altura do texto é de pelo menos 20 pixels.
- Qualquer rotação ou inclinação deve ser corrigido ou nenhum texto será reconhecido,
- margens escuras devem ser removidos manualmente, ou eles vão ser interpretado como personagens.
1. On-line OCR - o nosso web-based OCR aplicativo gratuito. 2. OCR API - nosso livre web API **, inclui linha de comando OCR exemplos com cURL.
3. software Windows 8 OCR - nosso livre, open-source (GPL) Windows Store OCR aplicativo.
Ambos os novos serviços usar um componente OCR diferentes
e têm muito melhores taxas de reconhecimento de texto do que o software
de desktop OCR baseado em Tesseract nesta página.
Para desenvolvedores de software e geeks:
O (a9t9) grátis OCR para Windows Desktop ferramenta é um front-end interface gráfica do usuário (GUI) para o motor Tesseract . Ele
é escrito em C # / WPF eo código fonte completo está disponível como
ready-to-compilação Microsoft Visual Studio 2013 projeto no GitHub sob a licença open source GPL V2. O feedback de todos os tipos é bem-vinda, especialmente ideias sobre como melhorar a qualidade de OCR. Na melhor OCR Software comentário neste blog o desempenho medíocre OCR de Tesseract era um dos Cinco surpresas OCR deste teste.
Como adicionar mais idiomas
Uma das principais vantagens do motor Tessearct é a grande variedade de idiomas de OCR suportados - que inclui ainda Esperanto! O (a9t9) grátis OCR para Windows Desktop instalador inclui Inglês (ENG), espanhol (SPA) e alemão (GER). Para adicionar mais idiomas basta seguir estes três passos:- Baixe o idioma arquivo que você precisa a partir do código do Google, por exemplo, chinês (tradicional) .
- Un”zip” o download (primeiro o arquivo .gz, em seguida, o arquivo tar no interior). Se você não tem nenhum software para gerenciar arquivos compactados ainda, obter gratuitamente 7zip ferramenta. É uma ótima escolha.
- Copiar os arquivos para o tessdata pasta do idioma no seu PC. Você encontra essa pasta facilmente abrindo-o de dentro do aplicativo. No menu do software OCR ir para a Ajuda> Abrir pasta Idioma - e uma nova janela Explorer abre.
Agora inicie o software novamente e o novo
idioma aparece na seleção de idioma OCR suspensa como código abreviado,
por exemplo ENG para Inglês, SPA para o espanhol, GER Alemão, POR para
português, CHI_TRA para suporte a caracteres chineses tradicionais ou
CHI_SIM de caráter chinês simplificado Apoio, suporte.
Nenhum comentário:
Postar um comentário