Computational Methods Applied in Sound Recognition and Voice Biometrics

Authors

  • Sabrina Cristina da Silva Universidade do Oeste Paulista - Unoeste
  • Danillo Roberto Pereira Faculdade de Informática de Presidente Prudente (FIPP) – Unoeste
  • Francisco Assis da Silva Universidade do Oeste Paulista - Unoeste
  • Helton Molina Sapia Universidade do Oeste Paulista - Unoeste

Keywords:

Biometric voice; extract features; digital signal processing; speech recognition.

Abstract

This work presents the design, construction, development and analysis of the submission of databases to computational methods used in speech recognition. There are all the details of the methodology used, without development and data collection, as well as specifications of each database used. Weights and results obtained in the phases of treatment of voice signals, results of the applications of the extraction methods of characteristics used and the methods of machine learning. Finally, the potential of the authentication of each combined characteristic extraction method between the different machine learning methods used in the databases is evaluated.

Downloads

Download data is not yet available.

Author Biography

  • Danillo Roberto Pereira, Faculdade de Informática de Presidente Prudente (FIPP) – Unoeste

    Possui graduação em Ciência da Computação pela FCT-UNESP (2006) ; mestrado em Ciência da Computação pela UNICAMP (2009); e doutorado pela UNICAMP. Tem experiência na área de Ciência da Computação, com ênfase em Geometria Computacional, Computação Gráfica e Visão Computacional. lattes.cnpq.br/0122307432250869

References

ALBERTO, T.C; ALMEIDA, T.A. Aprendizado de Máquina Aplicado na Detecção Automática de Comentários Indesejados. Departamento de Computação (DComp). Campinas: Unicamp, 2013. Disponivel em: http://www.dt.fee.unicamp.br/~tiago/papers/ENIAC13.pdf.

ARAÚJO, K. M.; SILVA, E. M. Utilização do Algoritmo de Máquina de Vetores de Suporte (SVM) para Predição de Dados Climáticos. In: CONGRESSO DE COMPUTAÇÃO E SISTEMAS. 18., , 2015. p. 149

BLANZ, V. et al.. Comparision of view-based object recognition algorithms using realistic 3d models. 1996. In: C. VON DER MALSBURG, W.; VON SEELEN, J.C.; VORBRUGGEN, and B. Sendhoff, (ed)., Artificial Neural Networks – ICANN, , Berlin, 1996.Sringer Lecture Notes in Computer Science, v. 1112. pages 251 – 256https://doi.org/10.1007/3-540-61510-5_45

BRESOLIN, A.A. Estudo do reconhecimento de Voz para Acionamento de Equipamentos Elétricos via Comandos em Português. 2003. Tese (Doutorado) – Universidade do Estado de Santa Catarina – UDESC, Centro de Ciências Tecnológicas – CCT. Joinville, 2003.

CAMPOS, W.; MACIEL, A.; CARVALHO, E. Investigação de uma Arquitetura para Verificação e Reconhecimento de Locutor. In: SIMPÓSIO BRASILEIRO DE SISTEMAS MULTIMÍDIA E WEB, 2008, Vitória, ES. Anais [...]. Vitória., 2008, p. 17-20.

CARDOSO, S.A.; CASTANHO, J.E.C.; FRANCHIN, M.N.; FONTES, I.R. SESAME: Sistema de Reconhecimento de Comandos de Voz Utilizando PDS e RNA. In: CONGRESSO BRASILEIRO DE AUTOMÁTICA, 18. 2010, Bonito, MS. Anais [...] Bonito – MS, 2010.

CORTES, S.; VAPNIK, V. “Support Vector Machines”. 1995. Machine Learning, 20:273-297. https://doi.org/10.1007/BF00994018

CUADROS, C. D.; CATALDO, E., DA SILVA, D. G., ALCAIM, A., & APOLINÁRIO Jr, J. A. (2007). “Comparação entre as técnicas de MFCC e ZCPA para reconhecimento robusto de locutor em ambientes ruidosos”. Rio de Janeiro, RJ, 2007.

CUSTÓDIO, R.F. Análise Não-Linear no Reconhecimento de Padrões Sonoros: Estudo de Caso para Sons Pulmonares. 1999. Tese (Doutorado) – Universidade Federal do Rio Grande do Sul, Instituto de informática. Porto Alegre, 1999.

COSTA, W. C. A. et al. Classificação de sinais de vozes saudáveis e patológicas por meio da combinação entre medidas da análise dinâmica não linear e codificação preditiva linear. Revista Brasileira de Engenharia Biomédica, v. 29, n. 1, 2013. https://doi.org/10.4322/rbeb.2013.010

DE LA VEGA, A. S. “Apostila de Teoria para Processamento Digital de Sinais”. 2016. 290. Apostila de Teoria – Graduação, Engenharia de Telecomunicações, UFF/TCE/TET 2016.

LIMA, C. A. M. Comitê de Máquinas: uma abordagem unificada empregando máquinas de vetores-suporte. 2004. 342. Tese (Doutorado) - Universidade Estadual de Campinas. Campinas, 2004.

DIAS, M. F. R.; PASCUTTI, P. G.; DA SILVA, M. L. Aprendizado de Máquina e Suas Aplicações em Bioinformática. Semioses, v. 10, n. 1, p. 23-37, 2016. https://doi.org/10.15202/10.15202/1981-996X.2016v10n1p23

DOS SANTOS, C. N. “Aprendizado de máquina na identificação de sintagmas nominais: o caso do português brasileiro”. 2005. Tese (Doutorado) - Instituto Militar de Engenharia. Rio de Janeiro, 2005.

EINSENCRAFT, M. Processamento Digital de Sinais São Paulo: Universidade Presbiteriana Mackenzie, 2007.

FIGUEIREDO, L.H. Raycasting intervalar de superficies implícitas cp, aritmética afim. 1999. Dissertação (Mestrado) – Pontifícia universidade Católica do Rio de Janeiro, Departamento de Informática. Rio de Janeiro, RJ, 1999.

HAYKIN, S.; VAN VEEN, B., “Sinais e Sistemas”. Porto Alegre, RS: Bookman, 2001.

HAYKN, S. Redes Neurais: princípios e prática. Porto Alegre: Bookman, 2001. 900 p.

HÖLBIG, C. A.; PAVAN, W.; VENDRUSCULO, T.; CLAUDIO, D. M. Análise de Ferramentas Intervalares para Computação Gráfica. In: SIMPÓSIO DE INFORMÁTICA DO PLANALTO MÉDIO, 2., 2000, Passo Fundo. Anais [...]. Passo Fundo: UPF, 2000.

KOLOURI, S; PARK, S. R; ROHDE, G. K. The Radon cumulative distribution transform and its application to image classification. IEEE transactions on image processing, v. 25, n. 2, p. 920-934. 2016. https://doi.org/10.1109/TIP.2015.2509419

LATHI, B. P. Sinais e Sistemas Lineares. 2.ed. Porto Alegre, RS: Bookman, 2007.

LORENA, A.C.; DE CARVALHO, A.C.P.L.F. Uma introdução às support vector machines. Revista de Informática Teórica e Aplicada, v. 14, n. 2, p. 43-67, 2007.

LUXBURG, U.; SCHOLKOPF, B. “Statical Learning Theory: Models, Concepts, and Results”. 2008. E-print arXiv preprint arXiv:0810.4752.

MACHADO, A. F. Conversão de Voz Inter-Linguística. 2013. Tese (Doutorado) -. Instituto de Matemática e Estatística - Universidade de São Paulo. São Paulo,

MARANA, A.N; CHIACHIA, G; PAPA, J.P. Análise de Desempenho de Classificadores baseados em Redes Neurais, Máquinas de Vetores de Suporte e Floresta de Caminhos Ótimos Para o Reconhecimento de Dígitos Manuscritos. Bauru: UNESP, Faculdade de Ciências, Departamento de Computação, 2014.

MELO, D.B. Um Sistema de Reconhecimento de Comandos de Voz Utilizando a Rede Neural ELM. 2011. Monografia (Graduação) -Departamento de Engenharia de Teleinformática, Centro de Tecnologia, Universidade Federal do Ceará. Fortaleza, 2011.

MONTANHER, T.M. “Estimação de Modelos Markov Ocultos usando Aritmética intervalar”. 2015. Tese (Doutorado) – Instituto de Matemática e Estatística, Universidade de São Paulo. São Paulo, 2015.

MOORE, R. E. “Methods and Applications of Inteerval Analysis”. SIAM, Phifadelphia, 1979. https://doi.org/10.1137/1.9781611970906

MUNIZ, D. N., “Estudo Sobre Reconhecimento de Áudio Repetitivo: Desenvolvimento de um Protótipo”, 2009, São José, Instituto Federal de Santa Catarina. 2009.

NUNES, R.A.A; ALBUQUERQUE, M.P.; ALBUQUERQUE, M.P.; SEIXAS, J.M. “Introdução a Processadores de Sinais Digitais - DSP”. CBPF-NT-001/06. Fev., 2006.

PARK, S. R; KOLOURI, S; KUNDU, S; ROHDE, G. K. The cumulative distribution transform and linear pattern classification. Applied and Computational Harmonic Analysis, v. 45, n. 3, p. 616-64, Nov. 2018. . https://doi.org/10.1016/j.acha.2017.02.002

PETRY, A; ZANUZ A.; BARONE, D.A.C. Utilização de Técnicas de Processamento Digital de Sinais para a Identificação Automática pela Voz. In: SIMPÓSIO SOBRE SEGURANÇA EM INFORMÁTICA. 1999. Anais [...]. São José dos Campos, SP, 1999.

PICON, C.T; ROSSI, I; Jr. P.P.M. Análise da classificação de imagens por descritores de cor utilizando várias resoluções. São Carlos, SP.: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP), [2011].

SABANAL, S.; NAKAGAWA, M. The Fractal Properties of Vocal Sounds and Their Application in the Speech Recognition Model. Chaos, Solitons & Fractals, [S.l.], v.7, n.11, p. 1825-1843, 1996. https://doi.org/10.1016/S0960-0779(96)00043-4

SANTANA, F.T.; DÓRIA NETO A.D.; SANTIAGO, R.H.N.. 2012. Sinais de Sistemas Definidos sobre Aritmética Intervalar Complexa. TEMA Tend. Mat. Apl. Comput., v. 13, n. 1, p. 85-86, 2012. https://doi.org/10.5540/tema.2012.013.01.0085

SANTANA, F. T.; DÓRIA NETO, A. D.; SANTIAGO, R. H. N. Uma Proposta de Análise Intervalar para o Mapa Auto-Organizável de Kohonen. Learning and Nonlinear Models, Revista da Sociedade Brasileira de Redes Neurais (SBRN), v. 7, n. 1, p. 03-08, 2009. https://doi.org/10.21528/LNLM-vol7-no1-art1

SANTANA, F. T.; SANTIAGO, R. H. N., DÓRIA NETO, A.D.Fundamentação Intervalar Complexa para Sinais e Sistemas”. In: CONGRESSO NACIONAL DE MATEMÁTICA APLICADA E COMPUTACIONAL, 33., 2010, Águas de Lindóia. Anais [...]. 2009, São Carlos. Anais [...]. . São Carlos: SBMAC, 2009,p. 1-7.

SILVA DE NOVAIS, D. P. Um Modelo Intervalar para Reconhecimento de Fala por Computadores. 2012. . Dissertação (Mestrado) – Universidade Estadual do Sudoeste da Bahia. Vitória da Conquista, BA, 2012.

SOARES, F.A. “Aprendizado de Máquina”. 2008. 18. LES/PUC-Rio.

SOUZA, B. F. S.; TEIXEIRA, A. S.; SILVA, de A.T.F. Classificação de bioma caatinga usando Support Vector Machines (SVM)”. Anais XIV Simpósio Brasileiro de Sensoriamento Remoto, p. 7917-7924. Natal/RN, Abril de 2009.

SUNAGA, T. Theory of na Interval Algebra and its Applications to Numerical Analysis”. RAAG Memoirs v. 2 (1958), 29-46.

TOZADORE, D. C. Aplicação de um robô humanoide autônomo por meio de reconhecimento de imagem e voz em sessões pedagógicas interativas. 2016. Tese (Doutorado) - Universidade de São Paulo. São Carlos, 2016.

TRINDADE, R.M.P. Uma Fundamentação Matemática para Processamento Digital de Sinais Intervalares. 2009. Tese - Universidade Federal do Rio Grande do Norte – Centro de Tecnologia. Natal, RN, 2009. https://doi.org/10.5540/tema.2009.010.01.0087

TRINDADE, R.M.P; BEDREGAL, B.R.C; NETO, A.D.D. Princípios de Processamento Digital de Sinais Intervalares. In: CNMAC, 31., 2008, Belém, PA. Anais [...]. Belém, 2008. . https://doi.org/10.5540/tema.2009.010.01.0087

ZAMPIERI, C.E.A. Recuperação de Imagens Multiescala Intervalar. 2010. Dissertação (Mestrado) – Universidade Estadual de Campinas, Instituto de Computação. Campinas, 2010.

Published

2019-07-31

Issue

Section

Artigo Científico Original

How to Cite

Computational Methods Applied in Sound Recognition and Voice Biometrics. (2019). Colloquium Exactarum. ISSN: 2178-8332, 11(2), 78-90. https://journal.unoeste.br/index.php/ce/article/view/3165

Similar Articles

1-10 of 48

You may also start an advanced similarity search for this article.

Most read articles by the same author(s)

1 2 3 4 5 6 > >>