Homo Readens
eReading - Libri, fumetti, contenuti in generale => Creare un ebook : strumenti e tecniche => Topic aperto da: sakitatu - Marzo 25, 2016, 19:35:13
-
Ciao a tutti!
Che software utilizzate per fare l'OCR? Per convertire immagini/pdf in testo?
:cute: :cute:
-
E' molto tempo che non utilizzo un OCR, sarà più di un anno. Quando iniziai, dieci e più anni fa, trovai vantaggio nell'usare software commerciali affermati, più che prodotti free o shareware, poiché erano più efficienti. Più recentemente ho giocato con "FreeOCR" (o qualcosa di simile), trovandolo buono per testi molto lineari, senza formule, senza simboli, senza stranezze, e provenienti da stampe di buona qualità . Comunque aveva problemi con numeri di pagina o altri elementi estranei al testo.
Perché lo definisco, comunque, "buono", nonostante queste limitazioni? Perché se non ricordo male, permetteva la gestione dei dizionari e non sbagliava in modo clamoroso i termini.
Comunque si trattava di un prodotto che necessitava di notevole post produzione.
Il mi consiglio è di provare le versioni trial dei prodotti commerciali che potresti permetterti di acquistare, tante volte con un piccolo investimento migliori in modo sostanziale l'esperienza d'uso.
-
Sto provando ABBY, ma necessita di molto lavoro successivo, data la qualità bassa della fonte...
-
Se utilizzi LibreOffice puoi sveltire molto il lavoro di correzione usando due utility.
La prima è PepitoCleaner: http://pepitoweb.altervista.org/pepito_cleaner/index.php
La seconda è l'estensione AltSearch con cui puoi utilizzare un file di batch molto utile per cercare gli errori da OCR più comuni aggiungendo delle ricerche con espressioni regolari al file originale AltSearchScript che si trova nella posizione C:\Users\NOMETUOCOMPUTER\AppData\Roaming\LibreOffice\4\user\config (perlomeno in WindowsSeven).
-
Se utilizzi LibreOffice puoi sveltire molto il lavoro di correzione usando due utility.
La prima è PepitoCleaner: http://pepitoweb.altervista.org/pepito_cleaner/index.php
La seconda è l'estensione AltSearch con cui puoi utilizzare un file di batch molto utile per cercare gli errori da OCR più comuni aggiungendo delle ricerche con espressioni regolari al file originale AltSearchScript che si trova nella posizione C:\Users\NOMETUOCOMPUTER\AppData\Roaming\LibreOffice\4\user\config (perlomeno in WindowsSeven).
grazie! Nei prossimi giorni proverò!