Homo Readens

eReading - Libri, fumetti, contenuti in generale => Creare un ebook : strumenti e tecniche => Topic aperto da: sakitatu - Marzo 25, 2016, 19:35:13

Titolo: OCR - Riconoscimento testi
Inserito da: sakitatu - Marzo 25, 2016, 19:35:13
Ciao a tutti!

Che software utilizzate per fare l'OCR? Per convertire immagini/pdf in testo?
 :cute:  :cute:
Titolo: Re:OCR - Riconoscimento testi
Inserito da: Caramon77 - Marzo 29, 2016, 08:56:36
E' molto tempo che non utilizzo un OCR, sarà più di un anno. Quando iniziai, dieci e più anni fa, trovai vantaggio nell'usare software commerciali affermati, più che prodotti free o shareware, poiché erano più efficienti. Più recentemente ho giocato con "FreeOCR" (o qualcosa di simile), trovandolo buono per testi molto lineari, senza formule, senza simboli, senza stranezze, e provenienti da stampe di buona qualità. Comunque aveva problemi con numeri di pagina o altri elementi estranei al testo.

Perché lo definisco, comunque, "buono", nonostante queste limitazioni? Perché se non ricordo male, permetteva la gestione dei dizionari e non sbagliava in modo clamoroso i termini.

Comunque si trattava di un prodotto che necessitava di notevole post produzione.

Il mi consiglio è di provare le versioni trial dei prodotti commerciali che potresti permetterti di acquistare, tante volte con un piccolo investimento migliori in modo sostanziale l'esperienza d'uso.
Titolo: Re:OCR - Riconoscimento testi
Inserito da: sakitatu - Aprile 10, 2016, 15:10:46
Sto provando ABBY, ma necessita di molto lavoro successivo, data la qualità bassa della fonte...
Titolo: Re:OCR - Riconoscimento testi
Inserito da: Pongo - Aprile 10, 2016, 18:49:41
Se utilizzi LibreOffice puoi sveltire molto il lavoro di correzione usando due utility.
La prima è PepitoCleaner: http://pepitoweb.altervista.org/pepito_cleaner/index.php
La seconda è l'estensione AltSearch con cui puoi utilizzare un file di batch molto utile per cercare gli errori da OCR più comuni aggiungendo delle ricerche con espressioni regolari al file originale AltSearchScript che si trova nella posizione C:\Users\NOMETUOCOMPUTER\AppData\Roaming\LibreOffice\4\user\config (perlomeno in WindowsSeven).
Titolo: Re:OCR - Riconoscimento testi
Inserito da: sakitatu - Aprile 10, 2016, 21:13:15
Se utilizzi LibreOffice puoi sveltire molto il lavoro di correzione usando due utility.
La prima è PepitoCleaner: http://pepitoweb.altervista.org/pepito_cleaner/index.php
La seconda è l'estensione AltSearch con cui puoi utilizzare un file di batch molto utile per cercare gli errori da OCR più comuni aggiungendo delle ricerche con espressioni regolari al file originale AltSearchScript che si trova nella posizione C:\Users\NOMETUOCOMPUTER\AppData\Roaming\LibreOffice\4\user\config (perlomeno in WindowsSeven).

grazie! Nei prossimi giorni proverò!