Купить СНПЧ А7 Архангельск, оперативня доставка

Sistema de Segmentação Automático Aplicado ao Sinal de Voz

DOI: http://dx.doi.org/10.12702/encom2013-a12

 

downloadpdf

Raissa B. Rocha1, Virginio V. Freire1, Francisco M. Bernadino Junior1 & Marcelo S. de Alencar1

 

Resumo: Um sistema de segmentação de fala tem o objetivo de determinar as fronteiras de transição entre os elementos de uma locução, como palavras, sílabas ou fonemas. São utilizados em sistemas de reconhecimento e síntese de fala, bem como nos codificadores de voz fonéticos. Este artigo propõe um método de segmentação de fala implícito, que utiliza a informação do pitch para obter as marcas de segmentação entre fonemas. Na avaliação de desempenho do sistema, foram realizados testes com 50 sílabas, obtendo 77,9% das fronteiras com erro menor que 20 ms.

Palavras-chave: segmentação fonética, sinal de voz, pitch

 

1 Universidade Federal de Campina Grande. Universidade Federal de Sergipe. Universidade de Pernambuco. Instituto de Estudos Avançados em Comunicações. E-mail: virginio.freire@ee.ufcg.edu.br, raissa@iecom.org.br, malencar@iecom.org.br, madeiro@poli.br

 

Literatura Citada

[1] E. D. S. Paranaguá. Segmentação Automática do Sinal de Voz para Sistemas Conversão Texto-Fala. Tese de doutorado, Universidade Federal do Rio de Janeiro, Rio de Janeiro, Brasil, Março de 2012.

[2] R. B. Rocha. Desenvolvimento de um Codificador de Voz Pessoal de Baixa Taxa Baseado em Modelos de Markov Escondidos. Dissertação de Mestrado, Universidade Federal de Campina Grande, Julho de 2012.

[3] A. M. Selmini. Sistema Baseado em Regras para o Refinamento da Segmentação Automática de Fala. Tese de doutorado, Universidade Estadual de Campinas, Campinas, Brasil, Agosto de 2008.

[4] D. L. Toledano. Neural Network Boundary Refining for Automatic Speech Segmentation. Proceedings of the International Conference on Acoustic Speech and Signal Processing, June 2000.

[5] S. Brognaux, S. Roekhaut, T. Drugman, and R. Beaufort. Automatic phone alignment: A comparison between speaker-independent models and models trained on the corpus to align. Springer Berlin Heidelberg, 7614:300-311, 2012.

[6] S.Harish, P.Vijayalakshmi, and T. Nagarajan. Significance of Segmentation in Phoneme Based Tamil Speech Recognition System . 2011.