MAKEMESEE – AN AID TO HELP VISUAL IMPAIRMENT PEOPLE
Palavras-chave:
deep learning; visão computacional; deficiência visualResumo
Soluções envolvendo inteligência artificial e visão computacional têm se tornado cada vez mais comuns nos últimos anos, devido ao aumento do poder computacional e o desenvolvimento de novas tecnologias. Essas soluções abrangem boa parte das necessidades humanas, como carros autônomos, segmentação de imagens médicas ou previsões para o mercado financeiro. Visto que a acessibilidade também é uma área muito importante e que as técnicas de inteligência artificial e visão computacional podem proporcionar soluções que auxiliem pessoas com deficiência, neste trabalho é abordada uma solução que permite a detecção, cálculo e narração de obstáculos para auxiliar portadores de deficiência visual. Por meio de um hardware composto por duas webcams, capaz de fazer a captura de imagens diferentes de uma mesma cena, e de um software capaz de processar as imagens obtidas, classificando e detectando os obstáculos, a solução visa informar ao usuário o que está a sua frente.
Downloads
Referências
BESSA, J.; BESSA, R.; XAVIER, A. Sistema De Determinação De Coordenadas Cartesianas Baseado Em Visão Estéreo. 2016. Disponível em: https://www.researchgate.net/publication/304217514_SISTEMA_DE_DETERMINACAO_DE_COORDENADAS_CARTESIANAS_BASEADO_EM_VISAO_ESTEREO. Acesso em 14 Dez. 2020.
CASTRO, M. D. Alvisku : uso da visão computacional e sons 3D para auxílio a cegos. 2018.
CHOWDHURY, M.; GAO, J.; ISLAM, R. Distance Measurement of Objects using Stereo Vision. Proceedings of the 9th Hellenic Conference on Artificial Intelligence. Anais...: SETN ’16.Thessaloniki, Greece: Association for Computing Machinery, 18 maio 2016. Disponível em: <https://doi.org/10.1145/2903220.2903247>. Acesso em: 26 mar. 2020. https://doi.org/10.1145/2903220.2903247
CONDE, A. J. M. Definição de cegueira e baixa visão. 2016. Disponível em: http://www.ibc.gov.br/images/conteudo/AREAS_ESPECIAIS/CEGUEIRA_E_BAIXA_VISAO/ARTIGOS/Def-de-cegueira-e-baixa-viso.pdf. Acesso em 02 set. 2019.
COSTA, E. B. G; BARROS, I. O. R. Matraca – Ferramenta Computacional Para Auxílio A Deficientes Visuais No Uso Do Computador. In: ENAPET, 11, 2006, Florianópolis. Disponível em: http://www.enapet.ufsc.br/anais/MATRACA_FERRAMENTA_COMPUTACIONAL_PARA_AUXILIO_A_DEFICIENTES_VISUAIS_NO_USO_DO_COMPUTADOR.pdf. Acesso em 05 set. 2019.
DALAL, N. TRIGGS, B. Histograms of oriented gradients for human detection. 2005. IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR’05), San Diego, CA, USA, vol. 1, pp. 886-893.
DEEPAI. What is Computer Vision? 2019. Disponível em: https://deepai.org/machine-learning-glossary-and-terms/computer-vision. Acesso em 01 set. 2019.
DEEPAI. What is Deep Learning? 2019. Disponível em: https://deepai.org/machine-learning-glossary-and-terms/deep-learning. Acesso em 01 set. 2019.
DORINA, FUNDAÇÃO DORINA NOWILL PARA CEGOS. Estatísticas da deficiência visual. Disponível em: https://www.fundacaodorina.org.br/a-fundacao/deficiencia-visual/estatisticas-da-deficiencia-visual/. Acesso em 25 ago. 2019.
ELECTRIAL E-LIBRARY. O que são redes neurais convolucionais? 2018. Disponível em: <https://www.electricalelibrary.com/2018/11/20/o-que-sao-redes-neurais-convolucionais/>. Acesso em 14 dez. 2020.
ELMANNAI, W. M.; ELLEITHY, K. M. A Highly Accurate and Reliable Data Fusion Framework for Guiding the Visually Impaired. IEEE Access, v. 6, p. 33029–33054, 2018. https://doi.org/10.1109/ACCESS.2018.2817164
GHILARDI, M. C. et al. Real-Time Detection of Pedestrian Traffic Lights for Visually Impaired People. 2018 International Joint Conference on Neural Networks (IJCNN). Anais... In: 2018 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN). jul. 2018. https://doi.org/10.1109/IJCNN.2018.8489516
GIANANI, S. et al. JUVO - An Aid for the Visually Impaired. 2018 International Conference on Smart City and Emerging Technology (ICSCET). Anais... In: 2018 INTERNATIONAL CONFERENCE ON SMART CITY AND EMERGING TECHNOLOGY (ICSCET). jan. 2018. https://doi.org/10.1109/ICSCET.2018.8537270
HOWARD, A. G.; ZHU, M.; CHEN, B.; KALENICHENKO, D.; WANG, W.; WEYAND, T.; ANDREETTO, M.; ADAM, H. MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications. 2017. Disponível em https://arxiv.org/abs/1704.04861. Acesso em 05 Jul. 2021.
HUSSIAN M. S. e HAQUE, M. SwishNet: A Fast Convolutional Neural Network for Speech, Music and Noise Classification and Segmentation. 2018. Disponível em: https://www.researchgate.net/publication/328654938_SwishNet_A_Fast_Convolutional_Neural_Network_for_Speech_Music_and_Noise_Classification_and_Segmentation. Acesso em 05 Jul. 2021.
IBGE. Características gerais da população, religião e pessoas com deficiência. 2010. Disponível em: https://censo2010.ibge.gov.br/apps/mapa/. Acesso em 04 set. 2019.
IRIS. Instituto IRIS cão-guia. Disponível em: http://www.iris.org.br/. Acesso em 05 set. 2019.
KACORRI, H. et al. People with Visual Impairment Training Personal Object Recognizers: Feasibility and Challenges. Proceedings of the 2017 CHI Conference on Human Factors in Computing Systems. Anais...: CHI ’17.Denver, Colorado, USA: Association for Computing Machinery, 2 maio 2017. Disponível em: <https://doi.org/10.1145/3025453.3025899>. Acesso em: 26 mar. 2020. https://doi.org/10.1145/3025453.3025899
KARKAR, A.; PUTHREN, M.; AL-MAADEED, S. A Bilingual Scene-to-Speech Mobile Based Application. 2018 International Conference on Computer and Applications (ICCA). Anais... In: 2018 INTERNATIONAL CONFERENCE ON COMPUTER AND APPLICATIONS (ICCA). ago. 2018. https://doi.org/10.1109/COMAPP.2018.8460239
MEC. Alunos com Deficiência visual: Baixa visão e cegueira. 2010. Disponível em: http://portal.mec.gov.br/index.php?option=com_docman&view=download&alias=7105-fasciculo-3-pdf&Itemid=30192. Acesso em 04 set. 2019.
PAJDLA, T. et al. Incongruence detection for detecting, removing, and repairing incorrect functionality in low-level processing. 2009. Disponível em: <https://www.researchgate.net/publication/228982025_Incongruence_detection_for_detecting_removing_and_repairing_incorrect_functionality_in_low-level_processing>. Acesso em: 14 dez 2020.
PINHEIRO LIMA NETO, E. et al. Sensory Substitution of Vision: A Systematic Mapping and a Deep Learning Object Detection Proposition. 2019 IEEE 31st International Conference on Tools with Artificial Intelligence (ICTAI). Anais... In: 2019 IEEE 31ST INTERNATIONAL CONFERENCE ON TOOLS WITH ARTIFICIAL INTELLIGENCE (ICTAI). nov. 2019. https://doi.org/10.1109/ICTAI.2019.00274
POGGI, M.; MATTOCCIA, S. A wearable mobility aid for the visually impaired based on embedded 3D vision and deep learning. 2016 IEEE Symposium on Computers and Communication (ISCC). Anais... In: 2016 IEEE SYMPOSIUM ON COMPUTERS AND COMMUNICATION (ISCC). jun. 2016. Disponível em: <https://ieeexplore.ieee.org/document/7543741>. https://doi.org/10.1109/ISCC.2016.7543741
ROSENBLATT, F. The Perceptron: A Probabilistic Model for Information Storage and Organization in The Brain. 1958. Psychological Review, 65—386. https://doi.org/10.1037/h0042519
SEPEHRINOUR, M.; KASAEI, S. Perspective reconstruction of non-rigid surfaces from single-view videos. 2017 Iranian Conference on Electrical Engineering (ICEE). Anais... In: 2017 IRANIAN CONFERENCE ON ELECTRICAL ENGINEERING (ICEE). maio 2017. https://doi.org/10.1109/IranianCEE.2017.7985271
SHI, Q.; MA, L.; YANG, Y. Practical Method of Low-Light-Level Binocular Ranging Based on Triangulation and Error Correction. Proceedings of the 2017 International Conference on Computer Science and Artificial Intelligence. Anais...: CSAI 2017.Jakarta, Indonesia: Association for Computing Machinery, 5 dez. 2017. Disponível em: <https://doi.org/10.1145/3168390.3168417>. Acesso em: 26 mar. 2020. https://doi.org/10.1145/3168390.3168417
SOUSA, K. A. O. Uso de visão computacional em dispositivos móveis para auxílio à travessia de pedestres com deficiência visual. 2013. 85 f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Presbiteriana MACKENZIE, São Paulo, 2013. Disponível em: http://tede.mackenzie.br/jspui/handle/tede/1432. Acesso em 05 set. 2019.
TOMMASELLI, A. M. G. Fotogrametria Básica - Introdução. 2009. p. 144-175. Disponível em: http://www.faed.udesc.br/arquivos/id_submenu/891/introducao_a_fotogrametria.pdf. Acesso em 05 mai 2020.
WANG, H. S. et al. Enabling independent navigation for visually impaired people through a wearable vision-based feedback system. 2017. IEEE International Conference on Robotics and Automation, 2017. Disponível em: https://ieeexplore.ieee.org/abstract/document/7989772. Acesso em 05 set. 2019. https://doi.org/10.1109/ICRA.2017.7989772
WANG, Y.-X. et al. ThirdEye: a coaxial feature tracking system for stereoscopic video see-through augmented reality. ACM SIGGRAPH 2016 Posters. Anais...: SIGGRAPH ’16.Anaheim, California: Association for Computing Machinery, 24 jul. 2016. Disponível em: <https://doi.org/10.1145/2945078.2945100>. Acesso em: 26 mar. 2020. https://doi.org/10.1145/2945078.2945100
ZHANG, Y.; CASPI, A. Stereo Imagery Based Depth Sensing in Diverse Outdoor Environments: Practical Considerations. Proceedings of the 2nd ACM/EIGSCC Symposium on Smart Cities and Communities. Anais...: SCC ’19.Portland, OR, USA: Association for Computing Machinery, 10 set. 2019. Disponível em: <https://doi.org/10.1145/3357492.3358627>. Acesso em: 26 mar. 2020. https://doi.org/10.1145/3357492.3358627