Récolter les images de Flickr pour la reconstruction 3D

Lors de la conférence Electronic Imaging de 2013 organisée par l’IS&T/SPIE, Steve Seitz qui travaille à l’université de Washington et chez Google a présenté une keynote très intéressante intitulée « a trillion photos ».

Le principe est d’exploiter les millions d’images présentes dans les bases de données telles que Flickr. L’objectif du projet Building Rome in a Day est de récolter un maximum d’image en tapant simplement le mot clé « Rome » ou « Venise » dans Flickr. Une grande partie des images seront inexploitables car elles ne peuvent pas être mise en correspondance avec d’autres images, par exemple une photo de famille, d’un restaurant, etc. En revanche, les lieux les plus touristiques telles que la place « San Marco » sont prises en photos sous de nombreux angles différents. En utilisant une chaine de traitement classique telles que j’ai utilisé pendant ma thèse (SIFT+FLANN+RANSAC) il est possible de mettre en correspondance les images puis de faire la reconstruction 3D.

Dans cette vidéo de démonstration, les pyramides filiformes représentent les positions estimées de chaque prise de vue. La reconstruction a été faite en utilisant 14 079 photos. La reconstruction de Venise c’est fait en utilisant 250 000 images, 496 cœurs de calcul, 27h sont nécessaires pour la mise en correspondance et 38h pour la reconstruction.

 

 

 

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *


4 × trois =

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>