Redresser une image de document

Un pré-traitement très utile une analyse d’image de document consiste à détecter l’orientation du document puis à le redresser (on parle de deskew ou de skew estimation en anglais).

Document droit et tourné (1)

Pour faire cela plusieurs méthodes existent mais il faut savoir que les principales techniques seront efficace sur des documents contenant du texte et pourront être perturbées si des photos ou des lignes sont présentes sur le document. On peut simplement enlever les grandes composantes connexes ou sélectionner les composantes susceptibles d’être du texte.

Les deux méthodes les plus simples et les plus couramment utilisées sont : le profil de projection horizontal et la détection de ligne avec Hough. Elle sont appliquées à un document binarisé (noir et blanc).

Le profil de projection horizontal.

La méthode consiste à calculer pour chaque ligne horizontale de pixels, le nombre de pixel noir. Cela constitue un histogramme.
On fait ensuite tourner le document d’un angle et on re-calcul un nouvel histogramme.
L’histogramme ayant les plus grand pics est l’histogramme correspondant à une feuille horizontal. On peut alors en déduire l’ange le rotation.
Plus on souhaitera tester de valeurs d’angles différentes plus la méthode sera longue.

Profil de projection (1)

Hough

On peut utiliser Hough sur les centre des composantes connexes, ou sur les pixels. Généralement on n’utilise pas tout les pixels de l’image mais seulement les pixels noir qui ont un pixel blanc en dessous d’eux, le but étant d’utiliser la ligne de pied des caractères. Pour plus de précision sur Hough on pourra se référer à cet article.

Les autres techniques

Boris Epshtein [2] de chez Google a publié un papier à la conférence ICDAR  en 2011 basé sur l’utilisation des espaces interligne.

Bibliographie

[1] Document image skew detection: Survey and annotated bibliography, Hull J.J., SERIES IN MACHINE PERCEPTION AND ARTIFICIAL INTELLIGENCE, volume 29, pages 40–66, 1998, WORLD SCIENTIFIC PUBLISHING.

[2] Determining Document Skew Using Inter-Line Spaces, Epshtein, B., Document Analysis and Recognition (ICDAR), 2011 International Conference on, pages 27–31, 2011, IEEE.

Une réflexion au sujet de « Redresser une image de document »

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *


1 × = trois

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>