Title: Codage de la Parole
1Codage de la Paroleà très bas débit.
Maurice CHARBIT, Gérard CHOLLET,Niklas PAULSSON,
Dijana PETROVSKA(charbit,chollet,paulsson,petrovs
k)_at_tsi.enst.frENST/CNRS-LTCI46 rue
Barrault75634 PARIS cedex 13
2Plan
- Quel codeur pour quel débit ?
- Le compromis espace mémoire / débit
- Vocodeur phonétique
- Quantification matricielle, indexation
- Analyse/Synthèse et modifications prosodiques
- Perspectives
3Classification des codeurs
4Conserver la qualité en diminuant le
débitComment est-ce possible ?
- Exploiter les limites de laudition,
- utilisation du modèle source-filtre de production
de la parole, - quantification vectorielle du signal source,
- exploiter les contraintes dynamiques des
articulateurs, - quantification matricielle des séquences de
spectres, - modèle de langage, ...
5Conserver la qualité en diminuant le débitLe
prix à payer
- Complexité du codeur,
- retard au décodage,
- mémoire importante,
- sensibilité aux erreurs de transmission,
- sensibilité aux bruits.
6Modèle source-filtre etallocation des bits.
7Améliorations des codeurs
ALISP
(.4 kb/s)
8Principes de codage à bas et très bas débits
des paramètres
9Codage segmental
- Approche segmentale nécessaire.
- Pour des débits inférieurs à 500 bps, Il faut
prendre en compte les dépendances inter-trames. - Ensemble dunités acoustiques obtenues
automatiquement - Représentant de manière précise et concise les
sons dune langue. - Sans recourir à une base de donnée étiquetée
phonétiquement. - Unités ALISP Automatic Language Independant
Speech Processing.
10Codeur segmental
Dictionnaire dunités de synthèse
Dictionnaire dunités de codage
Parole originale
parole synthétique
Indice unité acoustique
Synthèse par concaténation HNM, PSOLA
Reconnaissance unité acoustique
Analyse prosodique
Paramètres prosodiques
CODEUR
DECODEUR
11La décomposition temporelle
12Segmentation induite par la décomposition
temporelle
Segmentation sur des zones spectralement stables
13Topologie des modèles HMM
3 états émetteurs Modèle de langage unigrammes,
facteur de langage g. Observation T trames 3
flux de paramètres indépendants et de mêmes poids
LPCC DLPCC D log(E). Pour chaque flux une loi
gaussienne simple.
14Segmentation et étiquetage par HMM
15Analyse/Synthèse et modifications prosodiques
Les alternatives
- PSOLA / MBROLA
- HSX
- Harmoniques Bruit
16Modèle Harmonique Bruit
- Faciliter les modifications prosodiques
- Représentation assez simple
- Basé sur lacoustique de la parole
Objectives
Le modèle
17Analyse Harmoniques Bruit
Paramètres HB
-
Voisé
Non-voisé
18Synthèse Harmoniques Bruit
Non-voisé
Paramètres HB
Synthèse LPC
Voisé
Signal resynthetisé
Génération des harmoniques
Calculer la phase
Synthèse LPC
19Modifications prosodiques et spectrales
- contrôle de lenveloppe énergétique
- ajustement de la fréquence fondamentale
- anamorphose temporelle par DTW
- adaptation au locuteur par modification
spectrale
20Perspectives
- améliorer lintelligibilité et la qualité.
- choix dunités compatibles pour le
- codage et la synthèse à partir du texte.
- rendre le codeur indépendant du
- locuteur et de la langue.
- restituer lidentité du locuteur.
21Et à plus longs termes...
- utiliser la technique ALISP de codage avec
- des références étiquetées phonétiquement
- pour faciliter la reconnaissance automatique
- de la parole,
- expérimenter le codage ALISP en vérification
- du locuteur.