Codage de la Parole - PowerPoint PPT Presentation

1 / 21
About This Presentation
Title:

Codage de la Parole

Description:

75634 PARIS cedex 13. CNRS-LTCI. 16 novembre 2000, Avancement SYMPATEX ... 16 novembre 2000, Avancement SYMPATEX. ENST. RNRT-SYMPATEX. Segmentation ... – PowerPoint PPT presentation

Number of Views:269
Avg rating:3.0/5.0
Slides: 22
Provided by: THOMS1
Category:
Tags: cedex | codage | paris | parole

less

Transcript and Presenter's Notes

Title: Codage de la Parole


1
Codage de la Paroleà très bas débit.
Maurice CHARBIT, Gérard CHOLLET,Niklas PAULSSON,
Dijana PETROVSKA(charbit,chollet,paulsson,petrovs
k)_at_tsi.enst.frENST/CNRS-LTCI46 rue
Barrault75634 PARIS cedex 13
2
Plan
  • Quel codeur pour quel débit ?
  • Le compromis espace mémoire / débit
  • Vocodeur phonétique
  • Quantification matricielle, indexation
  • Analyse/Synthèse et modifications prosodiques
  • Perspectives

3
Classification des codeurs
4
Conserver la qualité en diminuant le
débitComment est-ce possible ?
  • Exploiter les limites de laudition,
  • utilisation du modèle source-filtre de production
    de la parole,
  • quantification vectorielle du signal source,
  • exploiter les contraintes dynamiques des
    articulateurs,
  • quantification matricielle des séquences de
    spectres,
  • modèle de langage, ...

5
Conserver la qualité en diminuant le débitLe
prix à payer
  • Complexité du codeur,
  • retard au décodage,
  • mémoire importante,
  • sensibilité aux erreurs de transmission,
  • sensibilité aux bruits.

6
Modèle source-filtre etallocation des bits.
7
Améliorations des codeurs
ALISP
(.4 kb/s)
8
Principes de codage à bas et très bas débits
des paramètres
9
Codage segmental
  • Approche segmentale nécessaire.
  • Pour des débits inférieurs à 500 bps, Il faut
    prendre en compte les dépendances inter-trames.
  • Ensemble dunités acoustiques obtenues
    automatiquement
  • Représentant de manière précise et concise les
    sons dune langue.
  • Sans recourir à une base de donnée étiquetée
    phonétiquement.
  • Unités ALISP Automatic Language Independant
    Speech Processing.

10
Codeur segmental
Dictionnaire dunités de synthèse
Dictionnaire dunités de codage
Parole originale
parole synthétique
Indice unité acoustique
Synthèse par concaténation HNM, PSOLA
Reconnaissance unité acoustique
Analyse prosodique
Paramètres prosodiques
CODEUR
DECODEUR
11
La décomposition temporelle
12
Segmentation induite par la décomposition
temporelle
Segmentation sur des zones spectralement stables
13
Topologie des modèles HMM
3 états émetteurs Modèle de langage unigrammes,
facteur de langage g. Observation T trames 3
flux de paramètres indépendants et de mêmes poids
LPCC DLPCC D log(E). Pour chaque flux une loi
gaussienne simple.
14
Segmentation et étiquetage par HMM
15
Analyse/Synthèse et modifications prosodiques
Les alternatives
  • PSOLA / MBROLA
  • HSX
  • Harmoniques Bruit

16
Modèle Harmonique Bruit
  • Faciliter les modifications prosodiques
  • Représentation assez simple
  • Basé sur lacoustique de la parole

Objectives
Le modèle
17
Analyse Harmoniques Bruit
Paramètres HB
-

Voisé
Non-voisé
18
Synthèse Harmoniques Bruit
Non-voisé
Paramètres HB
Synthèse LPC
Voisé
Signal resynthetisé
Génération des harmoniques
Calculer la phase
Synthèse LPC
19
Modifications prosodiques et spectrales
  • contrôle de lenveloppe énergétique
  • ajustement de la fréquence fondamentale
  • anamorphose temporelle par DTW
  • adaptation au locuteur par modification
    spectrale

20
Perspectives
  • améliorer lintelligibilité et la qualité.
  • choix dunités compatibles pour le
  • codage et la synthèse à partir du texte.
  • rendre le codeur indépendant du
  • locuteur et de la langue.
  • restituer lidentité du locuteur.

21
Et à plus longs termes...
  • utiliser la technique ALISP de codage avec
  • des références étiquetées phonétiquement
  • pour faciliter la reconnaissance automatique
  • de la parole,
  • expérimenter le codage ALISP en vérification
  • du locuteur.
Write a Comment
User Comments (0)
About PowerShow.com