Artigo
Inteligência Artificial e Redes Neurais
O uso da Inteligência Artificial considera enfoques teóricos e empíricos, criando perspectivas tanto de ações lógicas, incluindo capacidade de dedução, quanto de sistemas que pensem como seres humanos, podendo aprender com base em experiências
Publicado em 11/06/2020 - Última modificação em 23/12/2020 às 13h43
As aplicações comerciais práticas têm impulsionado a área de Inteligência Artificial (IA), cujos primeiros estudos acadêmicos sobre o tema datam da década de 1950. As definições de IA encontradas na literatura científica[1], enquanto disciplina do conhecimento humano, são categorizadas, sendo ou empiricamente com formulação de hipóteses e confirmações experimentais ou teoricamente envolvendo cálculos matemáticos. Na ótica da categoria empírica há perspectiva dos sistemas pensarem como seres humanos, possibilitando o aprendizado com experiências, enquanto no enfoque teórico esperam-se ações lógicas que incluem capacidade de dedução e inferência sobre novas relações.
No âmbito de IA usam-se algoritmos, conjuntos de instruções não dúbias que um computador pode executar. Uma gama de algoritmos de IA torna possível o aprendizado com dados e aprimoramento de novos conjuntos de regras e métodos (heurísticas), que podem conduzir à descoberta e à resolução de problemas por meio de estratégias e inferência, e são conhecidos como algoritmos de aprendizado.
A IA pode ser dividida em subáreas de acordo com suas aplicações. A Association for the Advancement of Artificial Intelligence (AAAI) é considerada uma associação de referência e na sua última chamada de trabalhos dividiu as aplicações em nove subáreas: Pesquisa; Machine Learning, Data Mining e Big Data; Planejamento Automatizado; Representação de Conhecimento; Raciocínio (Probabilístico ou não); Processamento de Linguagem Natural; Robótica; Sistema de Agente e Multi-Agente e Aplicações.
Produtos de IA têm seu uso incorporado ao dia-a-dia, por exemplo o reconhecimento de voz de aplicativos de smartphones é possível através do Processamento de Linguagem Natural. Os algoritmos de Machine Learning são utilizados por empresas como Netflix e Youtube, em recomendações de filmes e vídeos, Facebook, Instagram e Twitter, na apresentação de posts mais relevantes acompanhando histórico do usuário, e Google, no sistema de tradução automática.
A aplicação de IA para solucionar grandes problemas da área de ciência da computação tem sido possível a partir da produção de hardwares mais potentes. Nesse contexto, um ramo de Machine Learning tem se destacado, o Deep Learning, que possui métodos de natureza dinâmica com a promessa de concretização de sistemas preditivos, mostrando capacidade contínua de melhora e adaptação às mudanças de padrões, onde um modelo não é adaptado, mas treinado. O Deep Learning é a tecnologia por trás de sistemas como Siri®, Google Now, Google Translate e Cortana (assistente personalizado da Microsoft).
As Redes Neurais Artificiais (RNA) são métodos de Deep Learning com capacidade de reconhecimento de padrões complexos ou numerosos e com função de aprendizado dentro da própria rede. As RNA baseiam-se na arquitetura dos neurônios humanos e destinam-se a reproduzir o aprendizado por meio do desenvolvimento de sistemas que aprendem com exemplos de treinamento. As RNA são compostas por camada de entrada, saída e pelo menos uma camada oculta, que transforma os dados recebidos na entrada em algo que a saída possa usar. Essas camadas são compostas por neurônios.
O primeiro tipo de neurônio usado em uma RNA foi inspirado em um neurônio humano, criado por Frank Rosenblatt em 1958. Chamado de Perceptron, ele possui arquitetura simples e tornou-se obsoleto para a resolução dos problemas complexos pela sua inflexibilidade e falta de estabilidade de sua função de ativação, que é a função que decide se um neurônio será ativado ou não. Atualmente, dois tipos de neurônios são utilizados nas redes neurais: o Perceptron Multicamadas, que impulsionou o uso em larga escala do Deep Learning, e o Sigmóide, geralmente usado em classificadores. Na tabela a seguir encontram-se as principais informações sobre eles.
Para um bom desempenho de uma RNA, o treinamento é uma parte essencial. De acordo com Abu-Mostafa[2],[3], amostras existentes e utilizadas para o treinamento da rede precisam ser divididas em treino, teste e validação, sendo a proporção da divisão essencial para um treinamento com resultados satisfatórios. As características do treinamento de uma RNA dependem do tipo de aprendizado e do tipo de amostra e pode ser supervisionado, utilizado em problemas de biologia molecular[4]; semi-supervisionado, no qual não se possuem amostras com dados rotulados; não supervisionado, empregado em exemplos de mineração de texto[5]; off-line ou online.
As características do que se pretende ensinar a uma RNA definem o modelo de arquitetura usada. De acordo com Goodfellow[6], existem dez principais arquiteturas de RNA, entre elas as Redes Multilayer Perceptron (MLP), as Redes Neurais Convolucionais (RNC) e as Redes Neurais Recorrentes (RNR).
As RNC se destacam no reconhecimento óptico de caractere (OCR), classificação de imagens, agrupamento por similaridade e arquivos de áudio com representação visual de espectrograma. No artigo Environmental sound classification with convolutional neural networks[7], Piczak mostra que as RNC com aprendizado supervisionado apresentam desempenho consideravelmente melhor no reconhecimento de classes específicas de sons, quando comparadas com técnicas não supervisionadas geralmente usadas. O uso de RNC também é encontrado em estudos para suporte à detecção e classificação de câncer utilizando mamografias digitalizadas[8].
O MLP é normalmente usado em aprendizado supervisionado como, por exemplo, reconhecimento e classificação de idiomas em arquivos de áudios. Estudos sobre previsão de série temporal de poluição[9],[10] e evolução de preços de habitação[11] vêm comparando o aprendizado por MLP com modelos de previsões tradicionais de série atemporais.
As RNR se mostram eficientes para aprendizado com dados sequenciais, dados temporais e processamento de linguagem natural. Incluem um estado oculto, que é reciclado para produzir o próximo modificado, e seu funcionamento se assemelha ao das memórias humanas, que reciclam consciência de estados anteriores para interpretar corretamente novos dados. Pode-se ver aplicação de RNR em estudos sobre desagregação de energia[12], modelagem de linguagem[13] e reconhecimento de fala[14].
[1] Russell, S. J., & Norvig, P. (2016). Artificial intelligence: a modern approach. Malaysia; Pearson Education Limited.
[2] Yaser Abu-Mostafa é professor de Engenharia Elétrica e Ciência da Computação no Instituto de Tecnologia da Califórnia (Caltech) e presidente da Machine Learning Consultants LLC.
[3] Abu-Mostafa, Yaser S., Malik Magdon-Ismail, and Hsuan-Tien Lin. Learning from data. Vol. 4. New York, NY, USA:: AMLBook, 2012.
[4] de Souto, M. C. P., Lorena, A. C., Delbem, A. C. B., & de Carvalho, A. C. P. L. F. (2003). Técnicas de aprendizado de máquina para problemas de biologia molecular. Sociedade Brasileira de Computação.
[5] Rezende, S. O., Marcacini, R. M., & Moura, M. F. (2011). O uso da mineração de textos para extração e organização não supervisionada de conhecimento. Revista de Sistemas de Informação da FSMA, 7, 7-21.
[6] Goodfellow, Ian, et al. Deep learning. Vol. 1. Cambridge: MIT press, 2016.
[7] Piczak, Karol J. "Environmental sound classification with convolutional neural networks." Machine Learning for Signal Processing (MLSP), 2015 IEEE 25th International Workshop on. IEEE, 2015.
[8] DALVI, R. (2018). Detecção e Classificação de Câncer a partir de Mamografias Digitalizadas e Redes Neurais Convolucionais (Master's thesis, Universidade Federal do Espírito Santo).
[9] Niska, Harri, et al. "Evolving the neural network model for forecasting air pollution time series." Engineering Applications of Artificial Intelligence 17.2 (2004): 159-167.
[10] Feng, Xiao, et al. "Artificial neural networks forecasting of PM2. 5 pollution using air mass trajectory based geographic model and wavelet transformation." Atmospheric Environment107 (2015): 118-128.
[11] Lim, Wan Teng, et al. "Housing price prediction using neural networks." Natural Computation, Fuzzy Systems and Knowledge Discovery (ICNC-FSKD), 2016 12th International Conference on. IEEE, 2016.
[12] Kelly, Jack, and William Knottenbelt. "Neural nilm: Deep neural networks applied to energy disaggregation." Proceedings of the 2nd ACM International Conference on Embedded Systems for Energy-Efficient Built Environments. ACM, 2015.
[13] Sutskever, Ilya, James Martens, and Geoffrey E. Hinton. "Generating text with recurrent neural networks." Proceedings of the 28th International Conference on Machine Learning (ICML-11). 2011
[14] Graves, Alex, Abdel-rahman Mohamed, and Geoffrey Hinton. "Speech recognition with deep recurrent neural networks." Acoustics, speech and signal processing (icassp), 2013 ieee international conference on. IEEE, 2013.