Continuando o trabalho desenvolvido no estudo da a estimação de pulso glotal e influenciados por um aprofundamento na literatura existente, pensamos em uma nova abordagem para os próximos passos do trabalho. Dessa maneira, procuramos estudar os métodos já existentes, por meio da leitura dos artigos, implementação e observação das vantagens e desvantagens desses métodos. Propomos também o uso de um diferente modelo de pulso glotal padrão, para a síntese de voz e para a análise de resultados.

“Novo” Modelo de Pulso Glotal

Será utilizado o modelo de Liljencrants-Fant (modelo LF) [1] no lugar do modelo de Rosenberg [2]. A decisão pela mudança do modelo de pulso glotal levou em conta os seguintes fatores:

  • • Os resultados apresentados por Fujisaki e Ljungqvist [3], que apontam o modelo LF como um modelo simples dentre os mais adequados para a modelagem1;
  • • O maior uso do modelo LF na literatura, que vai nos permitir fazer uma comparação mais direta de resultados.
  • • A praticidade que se ganha ao unir o efeito da radiação ao pulso glotal, usando um modelo diferencial do pulso glotal2;

 

Ora pois, o modelo LF para o pulso glotal derivativo é dado pela a equação 1,  e encontra-se representado na Figura 1. Num próximo relatório iremos detalhar melhor o modelo LF, para um melhor entendimento.

(1)   \begin{equation*} g_{LF}(t) = \begin{cases} E_0e^{\alpha t}\sin(\omega_gt),\ 0\leq t<T_e\\-\frac{E_e}{\epsilon T_a}\left( e^{-\epsilon(t-T_e)}-e^{-\epsilon(T_c-T_e)}\right),\ T_e\leq t<T_c\end{cases} \end{equation*}

Figura 1 – Modelo do Pulso Glotal Derivativo de Liljencrants-Fant

Próximas Etapas

Na continuidade da pesquisa, estamos nos propondo a refazer a síntese de sinais de voz aos moldes do que foi apresentado em um dos relatórios anteriores. Posteriormente, esses sinais serão utilizados para a avaliação dos resultados obtidos pelos métodos que serão implementados. Inicialmente, será implementada paralelamente os métodos apresentados em [4], [5] e [6], e avaliando a implementação de outros métodos em seguida.

 

 

[1] G. Fant, J. Liljencrants, and Q. Lin, “A four-parameter model of glottal flow,” Stl-qpsr, vol. 4, iss. 1985, p. 1–13, 1985.
[Bibtex]
@article{fant1985four,
title={A four-parameter model of glottal flow},
author={Fant, Gunnar and Liljencrants, Johan and Lin, Qi-guang},
journal={STL-QPSR},
volume={4},
number={1985},
pages={1--13},
year={1985},
publisher={Citeseer}
}
[2] A. E. Rosenberg, “Effect of glottal pulse shape on the quality of natural vowels,” The journal of the acoustical society of america, vol. 49, iss. 2B, p. 583–590, 1971.
[Bibtex]
@article{rosenberg1971effect,
title={Effect of glottal pulse shape on the quality of natural vowels},
author={Rosenberg, Aaron E},
journal={The Journal of the Acoustical Society of America},
volume={49},
number={2B},
pages={583--590},
year={1971},
publisher={ASA}
}
[3] H. Fujisaki and M. Ljungqvist, “Proposal and evaluation of models for the glottal source waveform,” in Icassp’86. ieee international conference on acoustics, speech, and signal processing, 1986, p. 1605–1608.
[Bibtex]
@inproceedings{fujisaki1986proposal,
title={Proposal and evaluation of models for the glottal source waveform},
author={Fujisaki, Hiroya and Ljungqvist, Mats},
booktitle={ICASSP'86. IEEE International Conference on Acoustics, Speech, and Signal Processing},
volume={11},
pages={1605--1608},
year={1986},
organization={IEEE}
}
[4] B. Bozkurt, B. Doval, C. d’Alessandro, and T. Dutoit, “Zeros of z-transform representation with application to source-filter separation in speech,” Ieee signal processing letters, vol. 12, iss. 4, p. 344–347, 2005.
[Bibtex]
@article{bozkurt2005zeros,
title={Zeros of z-transform representation with application to source-filter separation in speech},
author={Bozkurt, Baris and Doval, Boris and d'Alessandro, Christophe and Dutoit, Thierry},
journal={IEEE signal processing letters},
volume={12},
number={4},
pages={344--347},
year={2005},
publisher={IEEE}
}
[5] S. Dias and A. Ferreira, “Glottal pulse estimation–a frequency domain approach,” Unpublished, 2014.
[Bibtex]
@article{dias2014glottal,
title={Glottal pulse estimation--a frequency domain approach},
author={Dias, Sandra and Ferreira, An{\i}bal},
journal={Unpublished},
year={2014},
url={https://pdfs.semanticscholar.org/1fc5/76a4e821f75779d2c01085cdaac1db9935b9.pdf}
}
[6] A. O. Cinnéide, D. Dorran, M. Gainza, and E. Coyle, “Exploiting glottal formant parameters for glottal inverse filtering and parameterization,” in Eleventh annual conference of the international speech communication association, 2010.
[Bibtex]
@inproceedings{cinneide2010exploiting,
title={Exploiting glottal formant parameters for glottal inverse filtering and parameterization},
author={Cinn{\'e}ide, Alan O and Dorran, David and Gainza, Mikel and Coyle, Eugene},
booktitle={Eleventh Annual Conference of the International Speech Communication Association},
year={2010}
}

 

 

Sobre o Autor

Mestrando em Engenharia Elétrica e Bacharel em Engenharia Eletrônica pela Universidade Federal de Sergipe. Interessado nas áreas de Processamento Digital de Sinais, Processamento Digital da Fala e Reconhecimento de Padrões. Atualmente desenvolve pesquisa no campo de processamento digital de sinais de fala aplicados à fonoaudiologia e à saúde vocal.

Áreas de Pesquisa: Processamento Digital de Sinais, Reconhecimento de Padrões, Processamento de Sinais de Voz e Fala, Qualidade Vocal.

Sobre o Autor

Estudante de Graduação em Engenharia Eletrônica na Universidade Federal de Sergipe. Áreas de interesse são Processamento Digital de Sinais, Processamento Digital da Fala e Reconhecimento de Padrões.

Sobre o Autor

Estudante de Graduação em Engenharia Eletrônica na Universidade Federal de Sergipe. Interessado nas áreas de Processamento Digital de Sinais, Processamento Digital da Fala e Reconhecimento de Padrões

  1. O LF teve um desempenho muito melhor que o modelo de Rosenberg
  2. O que não acontece no modelo de Rosenberg

1 thought on “Sobre a Estimação de Pulso Glotal: Nova Abordagem e Próximos Passos

Deixe uma resposta

O seu endereço de e-mail não será publicado.