Objetivos

Realizar a estimação do pulso glotal utilizando o Iterative Adaptative Inverse Filtering(IAIF) [1], método clássico para estimação baseado em filtragem inversa, e realizar uma análise subjetiva dos resultados obtidos, considerando o formato de onda comum de um sinal de pulso glotal.

Metodologia

Predição Linear

A predição linear consiste na estimação do valor de uma amostra x[n] do sinal a partir das k amostras anteriores, como representado a seguir:

(1)   \begin{equation*} x[n]={\sum_{m=1}^{k}{a_mx[n-m]}}+ {r[n]} \end{equation*}

em que r[n] representa a perturbação aleatória independente do sinal x[n] e k é a ordem do filtro.
Assim, cada elemento de x pode ser representado como uma combinação linear entre k elementos anteriores, a menos de um erro de predição. O ajuste dos coeficientes é realizado de acordo com o método dos míinimos quadrados, utilizando pseudo-inversão.
Com os coeficientes encontrados, a partir de (1) por meio da transformada Z, chega-se à seguinte função de transferência:

(2)   \begin{equation*} H(z) = \frac{z^k}{z^k-a_1z^{k-1}-...- a_{k-1}z-a_k} \end{equation*}

em que os polos permitem estimar o contorno espectral do sinal.

Filtragem Inversa

A função de transferência em (2) pode representar um filtro digital. O processo de filtragem inversa consiste em filtrar o sinal x[n], removendo as influências dos polos de H(z), utilizando um filtro G(z) que pode ser representado como segue:

(3)   \begin{equation*} G(z)={H(z)}^{-1} \end{equation*}

Iterative Adaptative Inverse Filtering

O IAIF é um método que emprega predição linear e filtragem inversa utilizando uma estrutura iterativa para estimar o pulso glotal. Esse método consiste em realizar uma filtragem passa-altas em um sinal de voz, s[n], e aplicar, no sinal resultante, o procedimento ilustrado na Figura 1. Primeiramente é realizada a estimação da contribuição glotal, H_g(z), obtida por predição linear de ordem 1, seguida pela remoção dessa por meio de filtragem inversa. Em seguida é estimada a contribuição do trato vocal, H_v(z), utilizando predição linear de ordem v, sendo essa removida por filtragem inversa, seguida da eliminação do efeito da radiação dos lábios por meio de um integrador estimando assim o pulso glotal. Por fim, esse procedimento é executado mais uma vez, utilizando, entretanto, ordem g na estimação da contribuição.

Figura 1 – Diagrama de blocos do IAIF

 

Resultados

Na Figura 2 encontram-se representados um sinal s[n] utilizado como exemplo e seu pulso glotal estimado G[n], utilizando g=4 e v=20 (escolhidos de acordo com a percepção subjetiva dos autores), de acordo com o procedimento descrito anteriormente. Pode ser observado um comportamento coerente com o esperado, de acordo com as representações de pulso glotal na literatura. Entretanto, não é possível garantir a acurácia da estimação, sem que haja a comparação com uma representação válida do sinal glotal.

Figura 2 – Sinal de voz s[n] e seu pulso glotal estimado G[n]

Na Figura 3 encontram-se representadas as contribuições espectrais do pulso glotal e trato vocal estimados nas duas iterações realizadas pelo IAIF em azul, e em vermelho o contorno espectral do processo de filtragem inversa. Nela, a estimação final da contribuição do trato vocal é representada por H_{v2}.

Figura 3 – Contornos espectrais estimados para a contribuição glotal e a contribuição do trato vocal, no decorrer das etapas do IAIF

 

Conclusão e Próxima Etapa

O IAIF é um método de simples implementação e seus resultado apresentaram-se, aparentemente coerentes, de acordo com o referencial teórico. Entretanto, a escolha dos parâmetros da predição linear são ajustados de maneira subjetiva, sendo necessário um método de ajuste mais objetivo, para garantir melhores resultados. Também se faz necessário realizar a comparação dos sinais glotais estimados com um sinal glotal confiável, para assegurar a acurácia do método.
Na próxima etapa do trabalho, pretende-se realizar a síntese de um sinal de voz, utilizando um pulso glotal e um trato vocal conhecidos, permitindo, assim, a comparação entre o sinal glotal estimado e o utilizado para a síntese. Também serão realizados testes de ajuste do modelo de Liljencrants-Fant [2] à derivada do sinal glotal estimado, analisando o erro e os parâmetros ajustados, de acordo com metodologia proposta por Strik e Boves [3].

[1] P. Alku, E. Vilkman, and U. Laine, “Analysis of glottal waveform in different phonation types using the new iaif-method,” in Proc. 12th int. congress phonetic sciences, 1991, p. 362–365.
[Bibtex]
@inproceedings{alku1991analysis,
title={Analysis of glottal waveform in different phonation types using the new IAIF-method},
author={Alku, P and Vilkman, E and Laine, UK},
booktitle={Proc. 12th Int. Congress Phonetic Sciences},
volume={4},
pages={362--365},
year={1991}
}
[2] G. Fant, J. Liljencrants, and Q. Lin, “A four-parameter model of glottal flow,” Stl-qpsr, vol. 4, iss. 1985, p. 1–13, 1985.
[Bibtex]
@article{fant1985four,
title={A four-parameter model of glottal flow},
author={Fant, Gunnar and Liljencrants, Johan and Lin, Qi-guang},
journal={STL-QPSR},
volume={4},
number={1985},
pages={1--13},
year={1985},
publisher={Citeseer}
}
[3] H. Strik and L. Boves, “On the relation between voice source parameters and prosodic features in connected speech.,” Speech communication, vol. 11, iss. 2-3, p. 167–174, 1992.
[Bibtex]
@article{strik1992relation,
title={On the relation between voice source parameters and prosodic features in connected speech.},
author={Strik, Helmer and Boves, Lou},
journal={Speech Communication},
volume={11},
number={2-3},
pages={167--174},
year={1992}
}
Sobre o Autor

Mestrando em Engenharia Elétrica e Bacharel em Engenharia Eletrônica pela Universidade Federal de Sergipe. Interessado nas áreas de Processamento Digital de Sinais, Processamento Digital da Fala e Reconhecimento de Padrões. Atualmente desenvolve pesquisa no campo de processamento digital de sinais de fala aplicados à fonoaudiologia e à saúde vocal.

Áreas de Pesquisa: Processamento Digital de Sinais, Reconhecimento de Padrões, Processamento de Sinais de Voz e Fala, Qualidade Vocal.

Sobre o Autor

Estudante de Graduação em Engenharia Eletrônica na Universidade Federal de Sergipe. Áreas de interesse são Processamento Digital de Sinais, Processamento Digital da Fala e Reconhecimento de Padrões.

1 thought on “Estimação de Pulso Glotal com o IAIF

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.