MÉTODOS COMPUTACIONAIS APLICADOS EM RECONHECIMENTO SONORO E BIOMETRIA POR VOZ
Palavras-chave:
Biometria por voz; extração de características; processamento digital de sinais; reconhecimento sonoroResumo
Este trabalho apresenta o projeto, construção, desenvolvimento e análise da submissão de bases de dados à métodos computacionais utilizados no reconhecimento sonoro. Estão descritos todos os detalhes da metodologia utilizada no desenvolvimento e na coleta de dados, bem como as especificações de cada base de dados utilizada. Ponderações e resultados obtidos nas fases de tratamento dos sinais de voz, resultados das aplicações dos métodos extratores de características utilizados e dos métodos de aprendizado de máquina. Por fim, é avaliado o potencial da autenticação de cada método extrator de características combinados entre os diferentes métodos de aprendizado de máquina utilizado nas determinadas bases de dados.
Downloads
Referências
ALBERTO, T.C; ALMEIDA, T.A. Aprendizado de Máquina Aplicado na Detecção Automática de Comentários Indesejados. Departamento de Computação (DComp). Campinas: Unicamp, 2013. Disponivel em: http://www.dt.fee.unicamp.br/~tiago/papers/ENIAC13.pdf.
ARAÚJO, K. M.; SILVA, E. M. Utilização do Algoritmo de Máquina de Vetores de Suporte (SVM) para Predição de Dados Climáticos. In: CONGRESSO DE COMPUTAÇÃO E SISTEMAS. 18., , 2015. p. 149
BLANZ, V. et al.. Comparision of view-based object recognition algorithms using realistic 3d models. 1996. In: C. VON DER MALSBURG, W.; VON SEELEN, J.C.; VORBRUGGEN, and B. Sendhoff, (ed)., Artificial Neural Networks – ICANN, , Berlin, 1996.Sringer Lecture Notes in Computer Science, v. 1112. pages 251 – 256https://doi.org/10.1007/3-540-61510-5_45
BRESOLIN, A.A. Estudo do reconhecimento de Voz para Acionamento de Equipamentos Elétricos via Comandos em Português. 2003. Tese (Doutorado) – Universidade do Estado de Santa Catarina – UDESC, Centro de Ciências Tecnológicas – CCT. Joinville, 2003.
CAMPOS, W.; MACIEL, A.; CARVALHO, E. Investigação de uma Arquitetura para Verificação e Reconhecimento de Locutor. In: SIMPÓSIO BRASILEIRO DE SISTEMAS MULTIMÍDIA E WEB, 2008, Vitória, ES. Anais [...]. Vitória., 2008, p. 17-20.
CARDOSO, S.A.; CASTANHO, J.E.C.; FRANCHIN, M.N.; FONTES, I.R. SESAME: Sistema de Reconhecimento de Comandos de Voz Utilizando PDS e RNA. In: CONGRESSO BRASILEIRO DE AUTOMÁTICA, 18. 2010, Bonito, MS. Anais [...] Bonito – MS, 2010.
CORTES, S.; VAPNIK, V. “Support Vector Machines”. 1995. Machine Learning, 20:273-297. https://doi.org/10.1007/BF00994018
CUADROS, C. D.; CATALDO, E., DA SILVA, D. G., ALCAIM, A., & APOLINÁRIO Jr, J. A. (2007). “Comparação entre as técnicas de MFCC e ZCPA para reconhecimento robusto de locutor em ambientes ruidosos”. Rio de Janeiro, RJ, 2007.
CUSTÓDIO, R.F. Análise Não-Linear no Reconhecimento de Padrões Sonoros: Estudo de Caso para Sons Pulmonares. 1999. Tese (Doutorado) – Universidade Federal do Rio Grande do Sul, Instituto de informática. Porto Alegre, 1999.
COSTA, W. C. A. et al. Classificação de sinais de vozes saudáveis e patológicas por meio da combinação entre medidas da análise dinâmica não linear e codificação preditiva linear. Revista Brasileira de Engenharia Biomédica, v. 29, n. 1, 2013. https://doi.org/10.4322/rbeb.2013.010
DE LA VEGA, A. S. “Apostila de Teoria para Processamento Digital de Sinais”. 2016. 290. Apostila de Teoria – Graduação, Engenharia de Telecomunicações, UFF/TCE/TET 2016.
LIMA, C. A. M. Comitê de Máquinas: uma abordagem unificada empregando máquinas de vetores-suporte. 2004. 342. Tese (Doutorado) - Universidade Estadual de Campinas. Campinas, 2004.
DIAS, M. F. R.; PASCUTTI, P. G.; DA SILVA, M. L. Aprendizado de Máquina e Suas Aplicações em Bioinformática. Semioses, v. 10, n. 1, p. 23-37, 2016. https://doi.org/10.15202/10.15202/1981-996X.2016v10n1p23
DOS SANTOS, C. N. “Aprendizado de máquina na identificação de sintagmas nominais: o caso do português brasileiro”. 2005. Tese (Doutorado) - Instituto Militar de Engenharia. Rio de Janeiro, 2005.
EINSENCRAFT, M. Processamento Digital de Sinais São Paulo: Universidade Presbiteriana Mackenzie, 2007.
FIGUEIREDO, L.H. Raycasting intervalar de superficies implícitas cp, aritmética afim. 1999. Dissertação (Mestrado) – Pontifícia universidade Católica do Rio de Janeiro, Departamento de Informática. Rio de Janeiro, RJ, 1999.
HAYKIN, S.; VAN VEEN, B., “Sinais e Sistemas”. Porto Alegre, RS: Bookman, 2001.
HAYKN, S. Redes Neurais: princípios e prática. Porto Alegre: Bookman, 2001. 900 p.
HÖLBIG, C. A.; PAVAN, W.; VENDRUSCULO, T.; CLAUDIO, D. M. Análise de Ferramentas Intervalares para Computação Gráfica. In: SIMPÓSIO DE INFORMÁTICA DO PLANALTO MÉDIO, 2., 2000, Passo Fundo. Anais [...]. Passo Fundo: UPF, 2000.
KOLOURI, S; PARK, S. R; ROHDE, G. K. The Radon cumulative distribution transform and its application to image classification. IEEE transactions on image processing, v. 25, n. 2, p. 920-934. 2016. https://doi.org/10.1109/TIP.2015.2509419
LATHI, B. P. Sinais e Sistemas Lineares. 2.ed. Porto Alegre, RS: Bookman, 2007.
LORENA, A.C.; DE CARVALHO, A.C.P.L.F. Uma introdução às support vector machines. Revista de Informática Teórica e Aplicada, v. 14, n. 2, p. 43-67, 2007.
LUXBURG, U.; SCHOLKOPF, B. “Statical Learning Theory: Models, Concepts, and Results”. 2008. E-print arXiv preprint arXiv:0810.4752.
MACHADO, A. F. Conversão de Voz Inter-Linguística. 2013. Tese (Doutorado) -. Instituto de Matemática e Estatística - Universidade de São Paulo. São Paulo,
MARANA, A.N; CHIACHIA, G; PAPA, J.P. Análise de Desempenho de Classificadores baseados em Redes Neurais, Máquinas de Vetores de Suporte e Floresta de Caminhos Ótimos Para o Reconhecimento de Dígitos Manuscritos. Bauru: UNESP, Faculdade de Ciências, Departamento de Computação, 2014.
MELO, D.B. Um Sistema de Reconhecimento de Comandos de Voz Utilizando a Rede Neural ELM. 2011. Monografia (Graduação) -Departamento de Engenharia de Teleinformática, Centro de Tecnologia, Universidade Federal do Ceará. Fortaleza, 2011.
MONTANHER, T.M. “Estimação de Modelos Markov Ocultos usando Aritmética intervalar”. 2015. Tese (Doutorado) – Instituto de Matemática e Estatística, Universidade de São Paulo. São Paulo, 2015.
MOORE, R. E. “Methods and Applications of Inteerval Analysis”. SIAM, Phifadelphia, 1979. https://doi.org/10.1137/1.9781611970906
MUNIZ, D. N., “Estudo Sobre Reconhecimento de Áudio Repetitivo: Desenvolvimento de um Protótipo”, 2009, São José, Instituto Federal de Santa Catarina. 2009.
NUNES, R.A.A; ALBUQUERQUE, M.P.; ALBUQUERQUE, M.P.; SEIXAS, J.M. “Introdução a Processadores de Sinais Digitais - DSP”. CBPF-NT-001/06. Fev., 2006.
PARK, S. R; KOLOURI, S; KUNDU, S; ROHDE, G. K. The cumulative distribution transform and linear pattern classification. Applied and Computational Harmonic Analysis, v. 45, n. 3, p. 616-64, Nov. 2018. . https://doi.org/10.1016/j.acha.2017.02.002
PETRY, A; ZANUZ A.; BARONE, D.A.C. Utilização de Técnicas de Processamento Digital de Sinais para a Identificação Automática pela Voz. In: SIMPÓSIO SOBRE SEGURANÇA EM INFORMÁTICA. 1999. Anais [...]. São José dos Campos, SP, 1999.
PICON, C.T; ROSSI, I; Jr. P.P.M. Análise da classificação de imagens por descritores de cor utilizando várias resoluções. São Carlos, SP.: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP), [2011].
SABANAL, S.; NAKAGAWA, M. The Fractal Properties of Vocal Sounds and Their Application in the Speech Recognition Model. Chaos, Solitons & Fractals, [S.l.], v.7, n.11, p. 1825-1843, 1996. https://doi.org/10.1016/S0960-0779(96)00043-4
SANTANA, F.T.; DÓRIA NETO A.D.; SANTIAGO, R.H.N.. 2012. Sinais de Sistemas Definidos sobre Aritmética Intervalar Complexa. TEMA Tend. Mat. Apl. Comput., v. 13, n. 1, p. 85-86, 2012. https://doi.org/10.5540/tema.2012.013.01.0085
SANTANA, F. T.; DÓRIA NETO, A. D.; SANTIAGO, R. H. N. Uma Proposta de Análise Intervalar para o Mapa Auto-Organizável de Kohonen. Learning and Nonlinear Models, Revista da Sociedade Brasileira de Redes Neurais (SBRN), v. 7, n. 1, p. 03-08, 2009. https://doi.org/10.21528/LNLM-vol7-no1-art1
SANTANA, F. T.; SANTIAGO, R. H. N., DÓRIA NETO, A.D.Fundamentação Intervalar Complexa para Sinais e Sistemas”. In: CONGRESSO NACIONAL DE MATEMÁTICA APLICADA E COMPUTACIONAL, 33., 2010, Águas de Lindóia. Anais [...]. 2009, São Carlos. Anais [...]. . São Carlos: SBMAC, 2009,p. 1-7.
SILVA DE NOVAIS, D. P. Um Modelo Intervalar para Reconhecimento de Fala por Computadores. 2012. . Dissertação (Mestrado) – Universidade Estadual do Sudoeste da Bahia. Vitória da Conquista, BA, 2012.
SOARES, F.A. “Aprendizado de Máquina”. 2008. 18. LES/PUC-Rio.
SOUZA, B. F. S.; TEIXEIRA, A. S.; SILVA, de A.T.F. Classificação de bioma caatinga usando Support Vector Machines (SVM)”. Anais XIV Simpósio Brasileiro de Sensoriamento Remoto, p. 7917-7924. Natal/RN, Abril de 2009.
SUNAGA, T. Theory of na Interval Algebra and its Applications to Numerical Analysis”. RAAG Memoirs v. 2 (1958), 29-46.
TOZADORE, D. C. Aplicação de um robô humanoide autônomo por meio de reconhecimento de imagem e voz em sessões pedagógicas interativas. 2016. Tese (Doutorado) - Universidade de São Paulo. São Carlos, 2016.
TRINDADE, R.M.P. Uma Fundamentação Matemática para Processamento Digital de Sinais Intervalares. 2009. Tese - Universidade Federal do Rio Grande do Norte – Centro de Tecnologia. Natal, RN, 2009. https://doi.org/10.5540/tema.2009.010.01.0087
TRINDADE, R.M.P; BEDREGAL, B.R.C; NETO, A.D.D. Princípios de Processamento Digital de Sinais Intervalares. In: CNMAC, 31., 2008, Belém, PA. Anais [...]. Belém, 2008. . https://doi.org/10.5540/tema.2009.010.01.0087
ZAMPIERI, C.E.A. Recuperação de Imagens Multiescala Intervalar. 2010. Dissertação (Mestrado) – Universidade Estadual de Campinas, Instituto de Computação. Campinas, 2010.