Google znovu vydal Tesseract, softvér na vizuálne rozpoznávanie znakov

Michal Kyžňanský  /  05. 09. 2006, 00:00

Skupina softvéru s označením OCR – (optical character recognition) – vizuálne rozpoznávanie znakov dokáže s obrázka vyextrahovať text a vložiť do textového editora. Google znovu vydal softvér tohto typu pod licenciou open source s názvom Tesseract OCR.

Tesseract bol pôvodne vyvíjaný a zdokonaľovaný firmou HP medzi rokmi 1985 a 1995. V roku 2005 ho HP v spolupráci s Nevadskou univerzitou v Las Vegas sprístupnili vo forme open source. Google tento softvér ešte trochu zdokonalil a dodal, že ide o najlepší momentálne dostupný OCR open source softvér. Stiahnuť softvér Tesseract OCR si môžete ľahko aj vďaka jeho maličkej veľkosti – 2,7 MB. Tesseract OCR nie je až tak user-friendly ako komerčné OCR, ale vykoná svoj účel.

Neprehliadnite: