Qu'est ce qu'un logiciel OCR et où peut-on le trouver ?
Un logiciel OCR analyse vos documents scannés pour en extraire le texte et parfois la mise en forme. Le fonctionnement repose sur la comparaison entre chaque caractère du texte et les modèles de lettres et de chiffres pré-enregistrés dans le programme. Certains logiciels sont spécialisés dans l'OCR, d'autres permettent d’effectuer plusieurs tâches, dont la reconnaissance de caractères.
/wedata%2F0000543%2F2011-07%2FOCR-pour-comptables.png)
Le principe de l'OCR
L'OCR est une technique permettant de transformer le texte d'une image en texte exploitable par un outil informatique. Le principe est simple : le document est scanné par n'importe quel scanner pour PC, puis l'image de ce document est envoyé au logiciel OCR, qui extrait le texte inclus et le restitue avec ou sans mise en forme.
Surabondance de logiciels
L'OCR fonctionne assez simplement. D'abord, le logiciel étudie la page passée au scanner pour déterminer le sens du texte et sa disposition. Ensuite chaque caractère présumé est comparé à un ensemble de modèles de lettres. La qualité d'un logiciel est déterminée par sa capacité d'analyse et par la richesse des modèles de caractères qu'il a en mémoire pour comparaison. Le dictionnaire intégré, qui permet de détecter les erreurs de reconnaissance, est aussi déterminant. Quelques logiciels puissants Beaucoup de logiciels n'ont pas de bons modèles de reconnaissance. Nombre de logiciels se targuent d'inclure des fonctions d'OCR, on s'aperçoit à l'utilisation qu'ils ne sont capables de transcrire correctement qu'un texte imprimé en gros caractères. Seuls quelques bons logiciels arrivent à reconnaitre les textes écrits à la mains, et les documents où les textes sont dispersés.
Les bons logiciels
Abbyy Fine Reader C'est le logiciel OCR vendu en tant quel tel le plus puissant du marché. Le gros avantage d'Abbyy OCR est la conservation de la mise en forme du document. La reconnaissance de caractères est de très bon niveau, mais pas supérieure aux autres logiciels. Le réel atout est de facilement pouvoir reproduire la mise en forme dans un format Word. Evidemment, il y aura quelques retouches à faire, mais le logiciel vous informe des incertitudes rencontrées. Notez aussi l'excellente performance quant à la transposition d'un tableau dans un fichier Excel. ReadIris OCR Ce logiciel offre une bonne qualité de reconnaissance. Il est plus ou moins au niveau d'Abbyy, mais il fait des erreurs assez étranges : il bute sur des mots simples, mais reconnait parfaitement des mots longs et techniques. L'avantage de ReadIris est la facilité d’utilisation et la simplicité des menus. One Note OneNote fait partie de la suite Microsoft Office. Le programme de prise de notes rapides intègre un outil OCR qui, bien sûr, n'est pas aussi puissant que dans le cas des logiciels spécialisés, mais qui a l'avantage d'être très simple et très rapide à utiliser.