APLICAÇÃO DE REDES NEURAIS CONVOLUCIONAIS NO RECONHECIMENTO DE CARACTERES EM PLACAS INFORMATIVAS JAPONESAS
Palavras-chave:
CNN, OCR, Hiragana, processamento digital de imagens, visão computacionalResumo
Ao contrário da maioria dos países ocidentais, que possuem um alfabeto base derivado do Latim, o Japão possui dois alfabetos silabários denominados de Hiragana e Katakana, e um alfabeto derivado do chinês, denominado de Kanji. Por causa da grande diferença na forma de escrita desses alfabetos orientais em relação aos alfabetos ocidentais, os algoritmos de reconhecimento óptico de caracteres (OCR) baseados em alfabetos ocidentais tendem a não detectar eficientemente os caracteres japoneses. Este trabalho contribui com uma metodologia aplicando técnicas de processamento digital de imagens, como segmentação baseada em intervalos de cores, detecção de bordas e técnicas de morfologia matemática, para detectar placas informativas de trânsito japonesas, corrigir a perspectiva e segmentar os caracteres contidos nela. Foi utilizada uma rede neural convolucional para realizar a classificação de caracteres Hiragana contidos nas placas segmentadas, com uma taxa de acerto de 94,37%.
Downloads
Referências
ALBAWI, S.; MOHAMMED, T. A.; AL-ZAWI, S. Understanding of a convolutional neural network. In: INTERNATIONAL CONFERENCE ON ENGINEERING AND TECHNOLOGY (ICET). 2017. https://doi.org/10.1109/ICEngTechnol.2017.8308186
ANAGNOSTOPOULOS, C. N. E.; ANAGNOSTOPOULOS, I. E.; PSOROULAS, I. D; LOUMOS, V.; KAYAFAS, E. License Plate Recognition from Still Images and Video Sequences: A Survey. IEEE Transactions on Intelligent Transportation Systems, v. 9, n. 3, set. 2008. https://doi.org/10.1109/TITS.2008.922938
BUNCH, J. R.; HOPCROFT, J. E. Triangular factorization and inversion by fast matrix multiplication. Mathematic of Computation, v. 28, n. 125, p 231-236, 1974. https://doi.org/10.1090/S0025-5718-1974-0331751-8
CANDEIAS, A. L. B. Aplicação da Morfologia Matemática à análise de imagens de sensoriamento remoto. 1997. 187 f. Tese (Doutorado em Computação Aplicada) - Instituto Nacional de Pesquisas Aplicadas, São José dos Campos, SP, 1997.
CANNY, J. F. A Computational Approach to Edge Detection, IEEE Transactions on Pattern Analysis and Machine Intelligence, v. PAMI-8, n. 6, 1986, p. 679-698. https://doi.org/10.1109/TPAMI.1986.4767851
CHEN, L.; WANG, S.; FAN, W.; SUN, J.; NAOI, S. Beyond human recognition: A CNN-based framework for handwritten character recognition. In: 3ª IAPR ASIAN CONFERENCE ON PATTERN RECOGNITION, p. 695-699, 2015. https://doi.org/10.1109/ACPR.2015.7486592
DAS, S.; BANERJEE, S. An Algorithm for Japanese Character Recognition. I.J. Image, Graphics and Signal Processing, v. 1, p. 9-15. 2015. https://doi.org/10.5815/ijigsp.2015.01.02
ETL. Electrotechnical laboratory character database. Disponível em: http://etlcdb.db.aist.go.jp/. Acessado em: 12 jun. 2019.
GAO, X. W; PODLADCHIKOVA, L.; SHAPOSHNIKOV, D.; HONG, K.; SHEVTSOVA, N. Recognition of traffic signs based on their colour and shape features extracted using human vision models. Journal of Visual Communication and Image Representation. v. 17, n. 4, p. 675-685, 2006. https://doi.org/10.1016/j.jvcir.2005.10.003
GREENHALGH, J.; MIRMEHDI, M. Real-Time Detection and Recognition of Road Traffic Signs. IEEE Transactions on Intelligent Transportation Systems, v. 13, n. 4, 2012. https://doi.org/10.1109/TITS.2012.2208909
GREENHALGH, J.; MIRMEHDI, M. Recognizing Text-Based Traffic Signs. IEEE Transactions on Intelligent Transportation Systems, v. 16, n. 3, 2014. https://doi.org/10.1109/TITS.2014.2363167
HARRIS, P.; STEPHENS, M. A combined corner and edge detector. Plessey Research Roke Manor, Reino Unido. 1988. https://doi.org/10.5244/C.2.23
JSAA. Japan Safety Appliances Association, JIS Z 9101 revisado – Esboço e comentário do JIS Z 9130. Disponível em: http://jsaa.or.jp/wp/wp-content/uploads/2018/07/5adbd5ec14cec6c33b3c5534e9aa52c8.pdf. Acessado em: 10 março 2019.
JNTO. Japan National Tourism Organization. Número de clientes estrangeiros que visitam o Japão em 2017. Disponível em: www.jnto.go.jp/jpn/statistics/since2003_tourists.pdf. Acessado em: 22 fev. 2018.
KAW, A.K.; KALU, E.E.; NGUYEN, D. Numerical methods with applications: chapter 04.06 Gaussian Elimination. University of South Florida. 2018. Disponível em: http://mathforcollege.com/nm/mws/gen/04sle/mws_gen_sle_txt_gaussian.pdf. Acessado em: 13 jan 2019.
KINGMA, D. P; BA, J. L; Adam: A Method for Stochastic Optimization. In: INTERNATIONAL CONFERENCE ON LEARNING REPRESENTATIONS, 2014.
MANTAS, J. An Overview of Character Recognition Methodologies. Pattern Recognition, v. 19, n. 6, p. 425-430. 1986. https://doi.org/10.1016/0031-3203(86)90040-3
OLIVEIRA, L. A. Localização e reconhecimento de caracteres em placa de automóveis. Trabalho de conclusão de curso – Escola de engenharia de São Carlos, da Universidade de São Carlos. São Carlos, 2010.
OTSU, N. A Threshold Selection Method from Gray-Level Histograms. IEEE Transactions on Systems, Man and Cybernetics, v. 9, n. 1, 1979. https://doi.org/10.1109/TSMC.1979.4310076
REYES, S. V.; CISNEROS, J. L. V.; VILLAGRANA, J. E. A.; AMBRIZ, F. J. B.; SIGG, M. L.; RAMÍREZ, C. H. C. Mapeos Proyectivos: la base para el Funcionamiento del Pizarrón Interactivo Wiimote Whiteboard. Revista Ibérica de Sistemas e Tecnologias de Informação. 2015.
RODRIGUES, F. A. Localização e Reconhecimento de Placas de Sinalização Utilizando um Mecanismo de Atenção Visual e Redes Neurais Artificiais. 2012. 124 f. Dissertação de mestrado - Universidade Federal de Campina Grande. Campina Grande, 2012.
ROSA, M. S. Reconhecimento de placas de sinalização de trânsito via processamento digital de imagem e aprendizado de máquina. Trabalho de conclusão de curso – Instituto Federal de Santa Catarina. São José, 2017.
SHAIK, B. K.; GENESAN, P.; KALIST, V; SATHISH, B. S.; JENITHA, J. M. M. Comparative study of skin color detection and segmentation in HSV and YCbCr color space. Procedia Computer Science, v. 57, p. 41-48, 2015. https://doi.org/10.1016/j.procs.2015.07.362
SOLOMON, C.; BRECKON, T. Fundamentals of Digital Image Processing: A practical approach with examples in Matlab. John Wiley & Sons, 2011. https://doi.org/10.1002/9780470689776
SUZUKI, S.; ABE, K. Topological Structural Analysis of Digitized Binary Images by Border Following. COMPUTER VISION, GRAPHICS, AND IMAGE, Processing, v. 30, No. 1, 1985. https://doi.org/10.1016/0734-189X(85)90016-7
TSAI, C. Recognizing Handwritten Japanese Characters Using Deep ConvolutionalNeural Networks. University of Stanford, California, 2016. Disponível em: https://www.semanticscholar.org/paper/Recognizing-Handwritten-Japanese-Characters-Using-Tsai/f3ee6bfaec669a2c8d087e2f11fa48aa7b45d6ea. Acessado em: 15 maio 2018.