Region-of-interest-based video coding for video conference applications - Archive ouverte HAL Access content directly
Theses Year : 2016

Region-of-interest-based video coding for video conference applications

Codage vidéo par régions d'intérêt pour des applications de visioconférence

(1)
1
Marwa Meddeb
  • Function : Author
  • PersonId : 995445

Abstract

This PhD. thesis addresses the problem of region-of-interest-based video coding and deals with improving the coding efficiency in High Efficiency Video Coding. We propose both accurate rate distortion modeling approaches, and also region-of-interest-based rate control methods adapted for High Efficiency Video Coding. In the first part, we propose new rate-distortion models for High Efficiency Video Coding at coding unit level. Proposed modeling takes into account content characteristics and encoder features. In a first proposition models are based on spatial dependencies between pixels of a coding unit while in a second proposition statistical characteristics of the data are used to derive more efficient models. We show the benefits that can be drawn from using content based rate-distortion modeling. A good fitting of transform coefficients per unit gives us important gains in coding efficiency. In the second part, we propose novel rate control algorithms for High Efficiency Video Coding that introduces region-of-interest concept. Performing bit allocation per region and computing quantization parameter independently per units of various importance levels, help improving budget partitioning over regions of different interest. This can be useful in many applications where region-based processing of the frame is required such as videoconferencing systems. The proposed methods show an improvement in the quality of the region-of-interest while the budget constraint is respected.
Les travaux effectués durant cette thèse de doctorat traitent le problème du codage vidéo basé sur les régions d'intérêt. Ils ont pour but d'améliorer l'efficacité de codage dans HEVC et de gagner en qualité de décodage globalement sur une séquence donnée mais aussi localement sur des régions d'un intérêt particulier. Par conséquent, nous proposons d'une part une modélisation précise du débit et de la distorsion, et d'autre part des méthodes de contrôle de débit basées sur les régions d'intérêt et adaptées à HEVC. Dans la première partie de ces travaux, nous proposons de nouveaux modèles débit-distorsion pour HEVC. La modélisation proposée tient compte des caractéristiques du contenu et de l'encodeur. Dans une première approche, les modèles sont développés pour des blocs de type intra en tenant compte uniquement des dépendances spatiales entre les pixels du bloc. Dans une seconde approche, on utilise les caractéristiques statistiques des données à encoder pour obtenir des modèles plus efficaces pour le codage vidéo hybride (intra et inter). Nos expériences montrent qu'une bonne représentation des coefficients transformés des blocs d'une image donne une meilleure répartition du débit et un gain global importants. Dans la deuxième partie de la thèse, nous proposons de nouveaux algorithmes de contrôle de débit pour HEVC qui introduisent le concept de la région d'intérêt. Assurer une allocation de bits par région et calculer le paramètre de quantification indépendamment sur des blocs de l'image de divers niveaux d'importance aident à améliorer la répartition du budget sur les différentes régions. Cela peut être utile dans de nombreuses applications où le traitement de l'image par régions d'intérêt est nécessaire, par exemple les systèmes de visioconférence. Les méthodes proposées montrent une amélioration de la qualité de la région d'intérêt tout en respectant la contrainte globale imposée par le réseau.
Fichier principal
Vignette du fichier
These_Marwa_MEDDEB_Compressed.pdf (3.76 Mo) Télécharger le fichier
Loading...

Dates and versions

tel-01410517 , version 1 (06-12-2016)

Identifiers

  • HAL Id : tel-01410517 , version 1

Cite

Marwa Meddeb. Region-of-interest-based video coding for video conference applications. Signal and Image processing. Telecom ParisTech, 2016. English. ⟨NNT : ⟩. ⟨tel-01410517⟩
98 View
1079 Download

Share

Gmail Facebook Twitter LinkedIn More