Autore Topic: OCR - Riconoscimento testi  (Letto 4473 volte)

sakitatu

  • Bradipo
  • **
  • Post: 165
    • Mostra profilo
OCR - Riconoscimento testi
« il: Marzo 25, 2016, 19:35:13 »
Ciao a tutti!

Che software utilizzate per fare l'OCR? Per convertire immagini/pdf in testo?
 :cute:  :cute:

Caramon77

  • Supremo Guardiano della Cambusa
  • Amministratore
  • Homo Readens Digitalis
  • *****
  • Post: 2232
    • Fondatore
    • Mostra profilo
Re:OCR - Riconoscimento testi
« Risposta #1 il: Marzo 29, 2016, 08:56:36 »
E' molto tempo che non utilizzo un OCR, sarà più di un anno. Quando iniziai, dieci e più anni fa, trovai vantaggio nell'usare software commerciali affermati, più che prodotti free o shareware, poiché erano più efficienti. Più recentemente ho giocato con "FreeOCR" (o qualcosa di simile), trovandolo buono per testi molto lineari, senza formule, senza simboli, senza stranezze, e provenienti da stampe di buona qualità. Comunque aveva problemi con numeri di pagina o altri elementi estranei al testo.

Perché lo definisco, comunque, "buono", nonostante queste limitazioni? Perché se non ricordo male, permetteva la gestione dei dizionari e non sbagliava in modo clamoroso i termini.

Comunque si trattava di un prodotto che necessitava di notevole post produzione.

Il mi consiglio è di provare le versioni trial dei prodotti commerciali che potresti permetterti di acquistare, tante volte con un piccolo investimento migliori in modo sostanziale l'esperienza d'uso.
Per lui ogni goccia che cadeva era un attimo che moriva. Sentiva il tempo scorrere dentro di lui, e ogni istante non poteva esser più ricatturato.


Al mondo ci sono solo 10 tipi di persone: quelli che capiscono il codice binario e quelli che non lo capiscono.

sakitatu

  • Bradipo
  • **
  • Post: 165
    • Mostra profilo
Re:OCR - Riconoscimento testi
« Risposta #2 il: Aprile 10, 2016, 15:10:46 »
Sto provando ABBY, ma necessita di molto lavoro successivo, data la qualità bassa della fonte...

Pongo

  • Visitatore
Re:OCR - Riconoscimento testi
« Risposta #3 il: Aprile 10, 2016, 18:49:41 »
Se utilizzi LibreOffice puoi sveltire molto il lavoro di correzione usando due utility.
La prima è PepitoCleaner: http://pepitoweb.altervista.org/pepito_cleaner/index.php
La seconda è l'estensione AltSearch con cui puoi utilizzare un file di batch molto utile per cercare gli errori da OCR più comuni aggiungendo delle ricerche con espressioni regolari al file originale AltSearchScript che si trova nella posizione C:\Users\NOMETUOCOMPUTER\AppData\Roaming\LibreOffice\4\user\config (perlomeno in WindowsSeven).

sakitatu

  • Bradipo
  • **
  • Post: 165
    • Mostra profilo
Re:OCR - Riconoscimento testi
« Risposta #4 il: Aprile 10, 2016, 21:13:15 »
Se utilizzi LibreOffice puoi sveltire molto il lavoro di correzione usando due utility.
La prima è PepitoCleaner: http://pepitoweb.altervista.org/pepito_cleaner/index.php
La seconda è l'estensione AltSearch con cui puoi utilizzare un file di batch molto utile per cercare gli errori da OCR più comuni aggiungendo delle ricerche con espressioni regolari al file originale AltSearchScript che si trova nella posizione C:\Users\NOMETUOCOMPUTER\AppData\Roaming\LibreOffice\4\user\config (perlomeno in WindowsSeven).

grazie! Nei prossimi giorni proverò!