Z pewnością w codziennej pracy organizacji pozarządowej spotkaliśmy się z koniecznością przepisania tekstu, który posiadaliśmy w papierowej wersji. Czasem gotowy tekst posiadaliśmy w wersji cyfrowej, w formie obrazu. Pomocnymi narzędziami mogą okazać się tzw. usługi OCR, co najprościej rozwinąć można jako optyczne rozpoznawanie tekstu.
Magia komputerowego oka
Wśród darmowych rozwiązań są mniej i bardziej doskonałe narzędzia. Możliwie blisko perfekcji jest program ABBY FineReader. Z tego rozwiązania korzystają najczęściej duże firmy, które chcą skanować np. otrzymane pocztą dokumenty do formy edytowalnych na komputerze dokumentów. Jego darmową, próbną wersję można ściągnąć z wielu serwerów, na jakich znajdują się bezpłatne oprogramowania. Za jego pomocą skanowane dokumenty można zapisać w takich formatach jak: .rtf, .txt, .doc, .xls, .html czy .pdf. Podobnych programów, które można pobrać na dysk komputera jest co najmniej kilka. Oprócz rozpoznawania ciągłego tekstu część z nich jest w stanie trafnie wskazać, że w danym miejscu występuje tabela, zlokalizowany jest nagłówek, stopka czy też, że konkretne strony są ponumerowane. Wszystkie te zdarzenia podobne programy są w stanie odpowiednio pominąć, tak by końcowa forma, jaką odbiorca otrzymuje była dostosowana w możliwie najlepszy sposób do dalszego edytowania.
Rozwiązania zlokalizowane w chmurze
Wszystkie rozwiązania tego typu oferują podobną funkcjonalność w możliwie uproszczony sposób. Pożądane przez nas dokumenty wystarczy zeskanować czy nawet sfotografować. Program musi jednak otrzymać możliwie najlepszą jakość, tak więc fotografia nie może być poruszona, a jej rozdzielczość powinna być jak największa. Inaczej algorytmy mogą się mylić, zaś tekst otrzymywany na samym końcu może nie być satysfakcjonujący.
Do otrzymania zadowalającego efektu koniecznym nie jest posiadanie zainstalowanego w komputerze dedykowanego oprogramowania. Dwa narzędzia wykorzystujące OCR funkcjonują tylko i wyłącznie w sieci. Jednym z nich jest witryna Onlineocr.net, kolejnym – Free-online-ocr.com. Warto pamiętać, że drugi nie rozpoznaje tekstów w języku polskim. Onlineocr.net to bardzo proste narzędzie i tak naprawdę do rozpoznania kilku zdjęć, które zawierają w sobie tekst nie trzeba znajomości programistycznych, bo to rozwiązanie zostało bardzo uproszczone. Aby rozpoznać tekst z obrazka potrzeba, by zdjęcie było w formacie .jpg, .bmp, .tiff czy .gif. W ten sposób przetworzymy obraz na tekst, który znajdzie się w formacie tekstowym. Należy jedynie wskazać lokalizację pliku, następnie kliknąć w przycisk „Upload”, po czym wcisnąć ikonkę „Recognize”. Wcześniej należy wskazać język, w jakim powstał dany tekst i wybrać docelowy format, np. .doc. W ten sposób można konwertować do 15 plików na godzinę bez konieczności zakładania konta.
Źródło: Technologie.ngo.pl