Chi fa molto uso di documenti digitali trova sicuramente comodo scansionare il prima possibile tutto il cartaceo, per risparmiare spazio e avere tutto in un unico posto. Il problema è che, spesso, quello che viene scansionato poi serve anche in formato testo. A me capita con alcuni articoli trovati su riviste, o libri di contenuto tecnico, o anche semplicemente alcuni ritagli di giornali.
Quando sono a casa o in ufficio è facile risolvere la questione, uso un programma OCR e converto un PDF o un’immagine in testo. Più complesso è quando sono in giro e posso usare solo iPhone e iPad. Per fortuna esistono alcune applicazioni OCR che permettono di estrarre un testo a partire da un’immagine o da un file PDF. Tra tutte, penso queste tre siano le migliori.
1. CamScanner+
La migliore, ed è pure gratis, è CamScanner+: permette di ottenere un testo tutto sommato abbastanza fedele all’originale anche se perde completamente la formattazione. Quindi nessun grigio, o corsivo, o caratteri particolari. Funziona bene se la pagina scansionata, o fotografa con l’applicazione stessa, è illuminata in maniera uniforme e non ha pieghe o onde. Si può anche utilizzare il flash dell’iPhone per migliorare la luminosità dell’immagine, e per documenti su carta normale, o in ambienti non perfettamente illuminati, è un’ottima idea. Si tratta di una pessima idea, invece, se si lavora con documenti in carta patinata, per esempio quella delle riviste. Ma questo vale più o meno per tutte e tre le applicazioni.
Se le funzioni base dell’applicazione non sono sufficienti è possibile sottoscrivere un piano mensile a 4 euro, o annuale a 40 euro, per aumentare le opzioni disponibili. Non è fondamentale, ma può essere una buona soluzione se si voglio risultati che mantengono la formattazione del testo originale, la sincronizzazione su cloud, e la possibilità di realizzare lavori sincronizzati con altri colleghi.
L’ultima caratteristica da ricordare è legata alle impostazioni: è possibile creare dei modelli di lavoro personalizzati, utili per quando si vogliono eseguire scansioni di documenti impaginati in modo simile, evitando di impostare ogni volta ogni parametro.
2. PDFpen Scan+
PDFpen Scan+ è un’applicazione ambigua. In alcune condizioni è quasi perfetta, mantiene la formattazione del testo, riconosce l’impaginazione e riesce a interpretare quasi tutte le parole. In altri casi si ottengono solo risultati incomprensibili, caratteri messi a caso, e non viene riconosciuta nemmeno una parola in maniera corretta. Se non fosse per questo rendimento altalenante sarebbe da consigliare a occhi chiusi, invece devo precisare quello che ho capito facendo alcune prove.
Quindi, se si vuole fare l’OCR di una pagina con sfondo bianco, senza immagini e senza colonne allora il risultato è pressoché perfetto. Se lo sfondo della pagina è grigio, o ci sono immagini nel documento, allora bisognerà editare manualmente il risultato, anche se grosso modo le parole vengono riconosciute la formattazione viene persa completamente. Infine il caso peggiore, sfondo scuro oppure immagine poco luminosa: meglio lasciare perdere, non viene riconosciuta nemmeno una parola, e si perde solo tempo; molto meglio usare un’altra applicazione per immagini di questo tipo.
3. Pixter Scanner OCR
Infine Pixter: è un app OCR per immagini e PDF davvero ben fatta, molto simile come impostazioni a CamScanner+. Ha però una cosa molto utile, la possibilità di scansionare documenti in più lingue e di tradurli al volo. La cosa è più che ottima quando si è all’estero, magari in vacanza, e si vuole capire quello che si vede in giro. La traduzione è discreta, merito anche dal riconoscimento OCR davvero egregio.
L’unico limite di questa applicazione è dato dalla difficoltà di scansionare documenti lunghi scattando una foto direttamente dall’applicazione. Personalmente l’ho trovata più adatta per testi brevi, come per l’appunto gli annunci che si possono trovare in albergo o in viaggio. Per documenti lunghi meglio scattare la foto del documento con un’altra applicazione e poi importarla in Pixter Scanner OCR in un secondo momento.