Desarrollo%20de%20una%20voz%20sint - PowerPoint PPT Presentation

About This Presentation
Title:

Desarrollo%20de%20una%20voz%20sint

Description:

... 3] Hola, me llamo URBANO. Valor: ... [d:3] Hola, me llamo URBANO 'pros.ini' Texto a procesar. Programa. 1. 2 ... [d:3] Hola, me llamo URBANO. Valor: 500 ... – PowerPoint PPT presentation

Number of Views:52
Avg rating:3.0/5.0
Slides: 30
Provided by: Juan51
Category:
Tags: 20de | 20sint | 20una | 20voz | desarrollo | llamo | me

less

Transcript and Presenter's Notes

Title: Desarrollo%20de%20una%20voz%20sint


1
Desarrollo de una voz sintética con emociones
para un robot-guía
  • AUTOR Alfredo Álvarez Fernández
  • TUTOR Juan Manuel Montero Martínez

2
Índice
  • Introducción
  • Objetivos
  • Emociones
  • Sistemas de Síntesis
  • Módulo de Preprocesado
  • Módulo de Síntesis de Klatt
  • Integración de Módulos
  • Secuencias de Control
  • Incorporación de Emociones
  • Variación de la fuente
  • Otras modificaciones
  • Sintaxis y Ejemplos
  • Conclusiones
  • Líneas futuras

3
Introducción
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • URBANO Integración de Robots autónomos en la
    sociedad
  • Acercar sociedad y tecnología
  • Estética humanoide
  • Incorporación de características humanas
  • Voz con emociones
  • Implementación de Robot piloto

4
Objetivos
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Incorporar emociones en la voz
  • Alegría
  • Tristeza
  • Dotar a la voz de roboticidad
  • Interactuar con el sintetizador a través del
    propio texto a sintetizar
  • Síntesis remota
  • Modelo Cliente - Servidor

5
Emociones
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Definición (D. Casacuberta 2000)
  • Estado mental
  • Función valorativa
  • Reacciones fisiológicas prototípicas en la voz
  • Pitch
  • Duración
  • Calidad de la voz
  • Tipos (K. Scherer 2000)
  • Primarias
  • Alegría, tristeza, enfado
  • Secundarias
  • Miedo, sorpresa

6
Sistemas de Síntesis
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Paramétricos
  • Sintetizadores por formantes
  • Modelos articulatorios
  • No paramétricos Concatenación de unidades
  • Base de datos de unidades pequeñas
    modificación prosódica ( PSOLA Pitch
    Synchronous Overlap Add )
  • Síntesis por Corpus Selección de unidades sobre
    una gran base de datos de voz
  • ELECCIÓN Formantes Fácil manipulación

7
Módulo de Preprocesado
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Texto origen en archivo
  • División en frases
  • Preprocesado Tres lecturas de la frase
  • 1) División en bloques de palabra y parseo de
    secuencias de control Modificación de
    valores medios
  • 2) División en bloques de fonemas y asignación
    de duraciones y f0
  • 3) Generación de parámetros a partir de bloques
    de fonema
  • Duración y f0
  • Reglas fonéticas
  • Valores medios

Lista de parámetros cada 10 ms.
Reglas fonéticas
Fonemas
Duración y tono
Valores Medios
8
Módulo de Síntesis de Klatt
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Fuente gt Función periódica
  • Tracto Vocal Envolvente espectral Formantes
  • Todo polos IIR
  • Resonadores cascada
  • Resonadores paralelo
  • Fuente y tracto controlados por parámetros cada
    10 ms.

9
Integración de Módulos (I)
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Sistema CTV
  • Módulo preprocesado Módulo síntesis Klatt
  • Software separado

Memoria
Texto
Generación Parámetros Klatt
Parámetros Klatt
Síntesis Klatt
Ficheros audio
Disco
10
Integración de Módulos (II)
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
Memoria
Disco
Disco
  • Integración delos dosmódulos
  • Separaciónpor frases
  • Parámetrospasados por memoria
  • Introducción etapade salida
  • Tratamiento de señal
  • Salida en formato wav

Generación parámetros Klatt
Texto
Fichero Audio
Parámetros Klatt frase n
Síntesis Klatt
Etapa de Salida
11
Secuencias de Control (I) Definición y sintaxis
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Combinación especial de caracteres para controlar
    el sintetizador desde el texto
  • Sintaxis ltletragtltnúmerogt entre dos palabras
  • Originalmente Ámbito de frase
  • Variación de tono medio
  • Variación de velocidad de elocución
  • Variación de amplitud
  • gt Poco flexible
  • Mejora de la flexibilidad Ámbito de palabra

12
Secuencias de Control (II) Flexibilización de
secuencias existentes
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Problema
  • Varias etiquetas en una frase
  • Prevalece la última gt Ámbito de frase
  • Solución
  • Introducir valores medios en bloques de fonemas
  • Para dejar de aplicar etiqueta
  • Introducción de otra etiqueta
  • Etiqueta de cierre ltletragt0
  • Guardar en memoria los valores mediosintroducidos
    (anidamiento)

13
Secuencias de Control (III) Modificación de
varios parámetrosmediante una etiqueta
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Valor de etiqueta
  • Valor de variable en el programa
  • Puntero a sección en fichero pros.ini

d3 Hola, me llamo URBANO
Texto a procesar
d3 Hola, me llamo URBANO
pros.ini
Valor Ganancia Memoria
Retardo 1 Valor 50 Ganancia 0,5 Memoria
10 Retardo 2 Valor 500 Ganancia 0,5 Memoria
5
Programa
14
Secuencias de Control (III) Modificación de
varios parámetrosmediante una etiqueta
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Valor de etiqueta
  • Valor de variable en el programa
  • Puntero a sección en fichero pros.ini

d3 Hola, me llamo URBANO
Texto a procesar
d3 Hola, me llamo URBANO
1
pros.ini
Valor Ganancia Memoria
Retardo 1 Valor 50 Ganancia 0,5 Memoria
10 Retardo 2 Valor 500 Ganancia 0,5 Memoria
5
Programa
15
Secuencias de Control (III) Modificación de
varios parámetrosmediante una etiqueta
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Valor de etiqueta
  • Valor de variable en el programa
  • Puntero a sección en fichero pros.ini

d3 Hola, me llamo URBANO
Texto a procesar
d3 Hola, me llamo URBANO
1
pros.ini
Valor Ganancia Memoria
Retardo 1 Valor 50 Ganancia 0,5 Memoria
10 Retardo 2 Valor 500 Ganancia 0,5 Memoria
5
2
Programa
16
Secuencias de Control (III) Modificación de
varios parámetrosmediante una etiqueta
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Valor de etiqueta
  • Valor de variable en el programa
  • Puntero a sección en fichero pros.ini

d3 Hola, me llamo URBANO
Texto a procesar
d3 Hola, me llamo URBANO
1
pros.ini
Valor 500 Ganancia 0,5 Memoria 5
Retardo 1 Valor 50 Ganancia 0,5 Memoria
10 Retardo 2 Valor 500 Ganancia 0,5 Memoria
5
2
Programa
3
17
Incorporación de emociones
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Asignación de duración y frecuencia fundamental a
    los bloques de fonema
  • Modelo duración
  • Valores iniciales
  • Coeficientes multiplicativos
  • Modelo entonación
  • Valor de tono de determinados fonemas
  • Interpolación para resto de fonemas
  • Originalmente
  • Valores iniciales y coeficientes fijos en código
  • Utilización de valores diferentes para cada
    emoción
  • Valores basados en modelado de frases y párrafos
    pronunciados por un locutor
  • alegría.ini, alegriap.ini, tristeza.ini,
    tristezap.ini selección del fichero .ini a
    leer en función de la etiqueta recibida

18
Variaciones en la Fuente (I)
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Fuente glotal humana
  • Periódica
  • Partes de un periodo glotal
  • fase de apertura glotal
  • fase de cierre glotal
  • fase cerrada
  • Aproximación por parábola invertida
  • Inversa del periodo glotal frecuencia
    fundamental

19
Variaciones en la Fuente (II)
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Señal de fuente excita filtro variable con el
    tiempo
  • Inteligibilidad
  • Variación del tracto vocal, no fuente
  • Señal que excita el tracto
  • Fuente glotal humana Voz humana
  • Señal robótica Voz robótica
  • Señal musical Voz musical
  • Controlables mediante etiquetas
  • No humana Carga valores de ficheros al
    inicio del programa
  • Reproducción cíclica

20
Otras Modificaciones (I) Incorporación de Efectos
de Audio
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Incorporación de eco
  • Incorporación de trémolo
  • Controlables mediante etiquetas
  • Diferentes retardos en el eco
  • Diferentes amplitudes y frecuencias en trémolo

Entrada
Salida
21
Otras Modificaciones (II) Concurrencia
Síntesis-Reproducción
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Etapa de salida introducida
  • Problema
  • Solución
  • Reproducción concurrente con síntesis
  • Interfaz MCI Señales de control de la
    reproducción
  • Pipeline de dos elementos

Síntesis frase 1
Reprod. frase 1
Síntesis frase 2
Reprod. frase 2
t
Síntesis frase 1
Síntesis frase 2
Síntesis frase 3
Síntesis frase 4
Reprod. frase 1
Reprod. frase 2
Reprod. frase 3
t
22
Otras Modificaciones (III) Servidor de Síntesis
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Síntesis remota
  • Previamente
  • Extracción de texto a sintetizar de un archivo de
    texto
  • Sintetizador Servidor
  • Escucha peticiones de síntesis
  • Puerto TCP 6004
  • Implementación de cliente

23
Otras Modificaciones (IV)Escalado de formantes
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Simulación de diferentes tamaños de cabeza
  • Escalado uniforme de formantes
  • Subir frecuencia de los formantes cabeza más
    pequeña
  • Controlable mediante etiquetas

24
Sintaxis y Ejemplos (I)
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Voz por defecto
  • Hola, me llamo Urbano y esta es la voz que traigo
    por defecto.
  • Modificación dinámica del tono medio
  • p70 Puedo modificar el tono medio p125 de
    mi voz cuantas p0 veces quiera dentro de la
    misma frase p0
  • Modificación dinámica de la velocidad de
    elocución
  • Como en el u80 caso del tono medio, u160
    también puedo modificar la velocidad de elocución
    u0 de forma dinámica u0
  • Modificación combinada de tono medio, velocidad
    de elocución e intensidad
  • También puedo cambiar f1los valores medios
    f0 f2de volumen, tono y velocidad de
    elocución f3 en medio de la frase f0 con
    combinaciones f0 pregrabadas

25
Sintaxis y Ejemplos (II)
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Introducción de ecos
  • d1 Introduciendo ecos en el habla puedo hacer
    que parezca que me encuentro en una gran sala
    vacía. d0 Es posible también simular el efecto
    de cambio de sala. d2 Ahora parece que me
    encuentro en una sala aún más grande que la
    anterior, ya que el tamaño de la sala simulada
    depende del retardo del eco d5
  • Introducción de trémolo
  • m2 También puedo modular el volumen de mi voz
    con una señal sinusoidal.m0 Tanto la
    frecuencia como el índice de modulación puedo
    escogerlo a placer
  • Escalado de los formantes
  • r2 Dispongo también de la capacidad de cambiar
    el tamaño de mi cavidad bucal para simular
    diferentes personas. r0 Este efecto se
    consigue mediante escalado de formantes
  • Pausado
  • Introduciendo pausas al hablar, puedo enfatizar
    b20 ciertas palabras para así captar la
    atención de los oyentes

26
Conclusiones
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Integración de dos subsistemas
  • Incorporación emociones
  • Introducción de diferentes fuentes
  • Incorporación de otros efectos de valor añadido
  • Manipulación sencilla mediante el uso de
    secuencias de control
  • Concurrencia entre procesado y síntesis
  • Transformación del sintetizador en un servidor de
    síntesis

27
Líneas Futuras
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
  • Incorporación de otras emociones
  • Sorpresa
  • Enfado
  • Carga de valores iniciales al inicio del programa
  • Ámbito de palabra para todas las secuencias de
    control
  • Concurrencia síntesis-reproducción más potente
  • Mejorar interfaz servidor-cliente

28
  • PREGUNTAS?

29
Introducción Emociones Sistemasde
Síntesis Módulo de Síntesis porRegla Módulo
de Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones
Introducción Objetivos Emociones Sistemasde
Síntesis Módulo de Preprocesado Módulo de
Síntesis deKlatt Integraciónde Módulos
Secuenciasde Control Incorporaciónde
Emociones Variaciones en la fuente Otras
Modificaciones Sintaxis y Ejemplos Conclusiones
Líneas Futuras
Síntesis frase 1
Síntesis frase 2
Síntesis frase 3
Síntesis frase 4
Reprod. frase 1
Reprod. frase 2
Reprod. frase 3
t
Síntesis frase 1
Reprod. frase 1
Síntesis frase 2
Reprod. frase 2
t
Write a Comment
User Comments (0)
About PowerShow.com