Ce projet de recherche doctorale est publié a été réalisé par BEATRICE PESQUET-POPESCU

Description d'un projet de recherche doctoral

Codage multi-vues plus profondeur (MVD) avancé pour la TV-3D et le FTV

Mots clés :

Résumé du projet de recherche (Langue 1)

La vidéo mutli-vues, capturée par des caméras synchronisées à partir de points de vue différents, comporte des informations 3D importantes pour les nouveaux services tels que la TV-3D ou le FTV (Free ViewPoint TV). Néanmoins, deux points majeurs sont susceptibles de ralentir leur arrivée pour le grand public : 1- la qualité d’affichage (rendering/display), et 2- la qualité du contenu (codage 3D). En ce qui concerne le premier point, différentes études montrent que les avis semblent converger globalement. Dans [1], à la question « quelle est la techno d’affichage la plus prometteuse pour introduire les services 3D à la maison ?», la réponse est majoritairement les «Stereoscopic Display» avec lunettes polarisées (attendus en 2010-2012). Des variantes d’ « Auto-stereoscopic Display », bien que fournissant aujourd’hui une expérience utilisateur insuffisante, sont notées de «prometteurs» à «très prometteurs» pour 2015-2020, avec résolutions allant de 1080p 50Hz (certain), à 2160p (très probable). Ces dernières variantes ne doivent donc pas être écartées aujourd’hui. En ce qui concerne le second point, la quantité d’information nécessaire pour fournir le contenu 3D, liée au nombre de points de vue, est gigantesque. Disposer d’un codeur vidéo multi-vues performant est donc nécessaire pour permettre l’essor de ces applications TV-3D ou FTV. Les travaux sur le codage de vues multiples ne sont pas récents : MPEG-2 inclut un profile capable de traiter 2 vues. En 2007, MPEG-C part 3 facilite l’approche « 2D + profondeur », en proposant un format de représentation pour les «Auxiliary Video and Supplemental Information», comme les cartes de profondeur. Enfin, en 2008, l’annexe multi-vues de H.264 est proposée. Les résultats associés sont cependant très décevants. Globalement, le débit requis reste proportionnel au nombre de vues – un gain de 20% seulement, par exemple, est observé par rapport au simulcast dans le cas de 8 vues. MVC n’est donc pas une solution long terme pour le codage multi-vues. Aujourd’hui, MPEG et l’ITU-T lancent le projet H.265. Initialement ce projet adresse le codage 2D pur : il est fort probable qu’il n’y ait pas de fonctionnalité multi-vues dans un premier temps, mais que celle-ci apparaisse plus tard sous forme d’une sur-couche. Le but de cette thèse est d’adresser en profondeur le 2e point, tout en considérant l’environnement (point 1), qui sera modélisé le plus fidèlement possible. Le contexte global est idéal pour aborder cette problématique de codage multi-vues de bout en bout : la première génération d’écran est disponible, d’une part, ce qui permet l’évaluation des résultats, et d’autre part les fonctionnalités de codage multi-vues ont été abordées, mais n’apportent pas à ce jour de gains suffisants.

Résumé du projet de recherche (Langue 2)

L’objectif de la thèse est de proposer des méthodes de codage innovantes pour la prise en compte de n vues (avec m cartes de profondeurs, 0