3 darmowe aplikacje do konwertowania zeskanowego tekstu

Creative Commons - Attribution-Share Alike 2.0 Generic - swanksalot

Creative Commons - Attribution-Share Alike 2.0 Generic - swanksalot

Posiadając skaner, pewnie nie raz chciałeś przenieść zawartość jakiegoś artykułu do formy elektronicznej. Skaner pozwala Ci zrobić ze strony książki obrazek, ale aby szybko przekonwertować ten obrazek na edytowalny tekst potrzebna jest specjalna aplikacja typu OCR (Optical character recognition). Nie każdy chce wydawać od razu pieniądze na programy więc warto zapoznać się z darmowymi alternatywami. Oto 3 z nich.

1. SimpleOCR

Program potrafi od razu zacząć czytać tekst ze skanera lub z plików graficznych (jpg, tiff, bmp). Odczyt trybem „Hand Writing” (pismo ręczne) działa jako wersja „trial” przez 14 dni. Odczyt „Machine Print” jest w 100% darmowy. Instalator zajmuje 9 MB i działa na systemach Windows.

2. TopOCR

Na obrazku widać jak działa aplikacja. TopOCR działa całkiem porządnie i dobrze rozpoznaje tekst. Wspiera formaty graficzne JPEG, TIFF, GIF oraz BMP. Aby poprawić skuteczność odczytu aplikacja pozwala dostosować funkcje takie jak jasność, kolor, kontrast, ostrość itp. Wynik końcowy można wyeksportować do formatów tekstowych PDF, RTF, HTML i TXT. Interfejs TopOCR jest dość prosty i czytelny. Aplikacja dostępna jest w 11 językach – Angielski, Duński, Niderlandzki, Fiński, Francuski, Niemiecki, Włoski, Norweski, Portugalski, Hiszpański i Szwedzki. Brak niestety Polskiego. Instalator zajmuje 8 MB i działa na systemach Windows.

3. FreeOCR

Mały i poręczny. Działa całkiem sprawnie. Jak powyższe programy wspiera podstawowe pliki graficzne i tekstowe. Zanim zaczniesz tzw. „one click conversion” czyli szybką konwersją, możesz dobrać kontrast i jasność aby poprawić jakość i efektywność odczytu. Zajmuje jedynie 4 MB działa na Windows 2K/XP/2003/Vista. Wymagany Microsoft Net framework w wersji 2.0 lub wyższej do działania aplikacji.

Mała konkluzja

Darmowe alternatywy dla programów typu OCR maja swoje granice/limity. Skanowanie jest stricte powiązane z rozdzielczością, kontrastem i jakością wydrukowanego tekstu. 100% efektywny odczyt jest jak dotąd tylko marzeniem. Powyższe programy mogą zatem polec na polu odczytywania pisma ręcznego w porównaniu do komercyjnych kombajnów. Jeśli jednak potrzebujesz przekonwertować coś sporadycznie te 3 aplikacje powinny Ci wystarczyć.

Aplikacje nie wykrywają polskich znaków diakrytycznych.

Kategoria posta: Inne, Konwersja, Polecamy, Software

Źródło: MakeUseOf

Tagi: ocr, skan, skanowanie, tekst

  • http://marex.adversum.biz MareX

    W powyższym tekście zabrakło jednej z ważniejszych kwestii – jak poszczególne programy radzą sobie z rodzimymi ogonkami. Mam wrażenie, że wpis powstał jedynie na podstawie „danych technicznych”, a nie empirycznych doświadczeń autora. A szkoda.

  • MaxDamage

    Ten wpis blogowy jest tylko tłumaczeniem angielskiego wpisu, więc nie oczekujmy jakiejś informacji o polskich znakach diaktrycznych.

  • http://marex.adversum.biz MareX

    Tym bardziej fatalnie :-(

  • http://lajfmajster.pl/author/adam-kaczmarek Adam

    Przetestowałem aplikacje i dopisałem na końcu wpisu:
    Aplikacje nie wykrywają polskich znaków diakrytycznych.

    Czasem wykrywało, że „ą” to litera „a” ale w większości przypadków wstawiane były dziwne znaczki lub zostawały całkowicie pomijane.

  • MS OCR

    Przy skanowaniu zapisujemy obraz do TIFF (albo zeskanowany wcześniej dokument eksportujemy do formatu TIFF)

    Start > Programy > Microsoft Office > Narzędzia Microsoft Office > Microsoft Office Document ImagingPlik > Otwórz > wybieramy zeskanowany dokumentRozpoznaj tekst używając OCRpotem Ctrl+A, Ctrl+C (albo eksportuj do Worda)