Artigo

Inteligência Artificial e Redes Neurais

O uso da Inteligência Artificial considera enfoques teóricos e empíricos, criando perspectivas tanto de ações lógicas, incluindo capacidade de dedução, quanto de sistemas que pensem como seres humanos, podendo aprender com base em experiências

Priscila Mello Alves

As aplicações comerciais práticas têm impulsionado a área de Inteligência Artificial (IA), cujos primeiros estudos acadêmicos sobre o tema datam da década de 1950. As definições de IA encontradas na literatura científica[1], enquanto disciplina do conhecimento humano, são categorizadas, sendo ou empiricamente com formulação de hipóteses e confirmações experimentais ou teoricamente envolvendo cálculos matemáticos. Na ótica da categoria empírica há perspectiva dos sistemas pensarem como seres humanos, possibilitando o aprendizado com experiências, enquanto no enfoque teórico esperam-se ações lógicas que incluem capacidade de dedução e inferência sobre novas relações.

No âmbito de IA usam-se algoritmos, conjuntos de instruções não dúbias que um computador pode executar. Uma gama de algoritmos de IA torna possível o aprendizado com dados e aprimoramento de novos conjuntos de regras e métodos (heurísticas), que podem conduzir à descoberta e à resolução de problemas por meio de estratégias e inferência, e são conhecidos como algoritmos de aprendizado.

A IA pode ser dividida em subáreas de acordo com suas aplicações. A Association for the Advancement of Artificial Intelligence (AAAI) é considerada uma associação de referência e na sua última chamada de trabalhos dividiu as aplicações em nove subáreas: Pesquisa; Machine Learning, Data Mining e Big Data; Planejamento Automatizado; Representação de Conhecimento; Raciocínio (Probabilístico ou não); Processamento de Linguagem Natural; Robótica; Sistema de Agente e Multi-Agente e Aplicações.

Produtos de IA têm seu uso incorporado ao dia-a-dia, por exemplo o reconhecimento de voz de aplicativos de smartphones é possível através do Processamento de Linguagem Natural. Os algoritmos de Machine Learning são utilizados por empresas como Netflix e Youtube, em recomendações de filmes e vídeos, Facebook, Instagram e Twitter, na apresentação de posts mais relevantes acompanhando histórico do usuário, e Google, no sistema de tradução automática.

A aplicação de IA para solucionar grandes problemas da área de ciência da computação tem sido possível a partir da produção de hardwares mais potentes. Nesse contexto, um ramo de Machine Learning tem se destacado, o Deep Learning, que possui métodos de natureza dinâmica com a promessa de concretização de sistemas preditivos, mostrando capacidade contínua de melhora e adaptação às mudanças de padrões, onde um modelo não é adaptado, mas treinado. O Deep Learning é a tecnologia por trás de sistemas como Siri®, Google Now, Google Translate e Cortana (assistente personalizado da Microsoft).

As Redes Neurais Artificiais (RNA) são métodos de Deep Learning com capacidade de reconhecimento de padrões complexos ou numerosos e com função de aprendizado dentro da própria rede. As RNA baseiam-se na arquitetura dos neurônios humanos e destinam-se a reproduzir o aprendizado por meio do desenvolvimento de sistemas que aprendem com exemplos de treinamento. As RNA são compostas por camada de entrada, saída e pelo menos uma camada oculta, que transforma os dados recebidos na entrada em algo que a saída possa usar. Essas camadas são compostas por neurônios.

O primeiro tipo de neurônio usado em uma RNA foi inspirado em um neurônio humano, criado por Frank Rosenblatt em 1958. Chamado de Perceptron, ele possui arquitetura simples e tornou-se obsoleto para a resolução dos problemas complexos pela sua inflexibilidade e falta de estabilidade de sua função de ativação, que é a função que decide se um neurônio será ativado ou não. Atualmente, dois tipos de neurônios são utilizados nas redes neurais: o Perceptron Multicamadas, que impulsionou o uso em larga escala do Deep Learning, e o Sigmóide, geralmente usado em classificadores. Na tabela a seguir encontram-se as principais informações sobre eles.

Redes Neurais

Para um bom desempenho de uma RNA, o treinamento é uma parte essencial. De acordo com Abu-Mostafa[2],[3], amostras existentes e utilizadas para o treinamento da rede precisam ser divididas em treino, teste e validação, sendo a proporção da divisão essencial para um treinamento com resultados satisfatórios. As características do treinamento de uma RNA dependem do tipo de aprendizado e do tipo de amostra e pode ser supervisionado, utilizado em problemas de biologia molecular[4]; semi-supervisionado, no qual não se possuem amostras com dados rotulados; não supervisionado, empregado em exemplos de mineração de texto[5]; off-line ou online.

As características do que se pretende ensinar a uma RNA definem o modelo de arquitetura usada. De acordo com Goodfellow[6], existem dez principais arquiteturas de RNA, entre elas as Redes Multilayer Perceptron (MLP), as Redes Neurais Convolucionais (RNC) e as Redes Neurais Recorrentes (RNR).

As RNC se destacam no reconhecimento óptico de caractere (OCR), classificação de imagens, agrupamento por similaridade e arquivos de áudio com representação visual de espectrograma. No artigo Environmental sound classification with convolutional neural networks[7], Piczak mostra que as RNC com aprendizado supervisionado apresentam desempenho consideravelmente melhor no reconhecimento de classes específicas de sons, quando comparadas com técnicas não supervisionadas geralmente usadas. O uso de RNC também é encontrado em estudos para suporte à detecção e classificação de câncer utilizando mamografias digitalizadas[8].

O MLP é normalmente usado em aprendizado supervisionado como, por exemplo, reconhecimento e classificação de idiomas em arquivos de áudios. Estudos sobre previsão de série temporal de poluição[9],[10] e evolução de preços de habitação[11] vêm comparando o aprendizado por MLP com modelos de previsões tradicionais de série atemporais.

As RNR se mostram eficientes para aprendizado com dados sequenciais, dados temporais e processamento de linguagem natural. Incluem um estado oculto, que é reciclado para produzir o próximo modificado, e seu funcionamento se assemelha ao das memórias humanas, que reciclam consciência de estados anteriores para interpretar corretamente novos dados. Pode-se ver aplicação de RNR em estudos sobre desagregação de energia[12], modelagem de linguagem[13] e reconhecimento de fala[14].

 

[1] Russell, S. J., & Norvig, P. (2016). Artificial intelligence: a modern approach. Malaysia; Pearson Education Limited.

[2] Yaser Abu-Mostafa é professor de Engenharia Elétrica e Ciência da Computação no Instituto de Tecnologia da Califórnia (Caltech) e presidente da Machine Learning Consultants LLC.

[3] Abu-Mostafa, Yaser S., Malik Magdon-Ismail, and Hsuan-Tien Lin. Learning from data. Vol. 4. New York, NY, USA:: AMLBook, 2012.

[4] de Souto, M. C. P., Lorena, A. C., Delbem, A. C. B., & de Carvalho, A. C. P. L. F. (2003). Técnicas de aprendizado de máquina para problemas de biologia molecular. Sociedade Brasileira de Computação.

[5] Rezende, S. O., Marcacini, R. M., & Moura, M. F. (2011). O uso da mineração de textos para extração e organização não supervisionada de conhecimento. Revista de Sistemas de Informação da FSMA, 7, 7-21.

[6] Goodfellow, Ian, et al. Deep learning. Vol. 1. Cambridge: MIT press, 2016.

[7] Piczak, Karol J. "Environmental sound classification with convolutional neural networks." Machine Learning for Signal Processing (MLSP), 2015 IEEE 25th International Workshop on. IEEE, 2015.

[8] DALVI, R. (2018). Detecção e Classificação de Câncer a partir de Mamografias Digitalizadas e Redes Neurais Convolucionais (Master's thesis, Universidade Federal do Espírito Santo).

[9] Niska, Harri, et al. "Evolving the neural network model for forecasting air pollution time series." Engineering Applications of Artificial Intelligence 17.2 (2004): 159-167.

[10] Feng, Xiao, et al. "Artificial neural networks forecasting of PM2. 5 pollution using air mass trajectory based geographic model and wavelet transformation." Atmospheric Environment107 (2015): 118-128.

[11] Lim, Wan Teng, et al. "Housing price prediction using neural networks." Natural Computation, Fuzzy Systems and Knowledge Discovery (ICNC-FSKD), 2016 12th International Conference on. IEEE, 2016.

[12] Kelly, Jack, and William Knottenbelt. "Neural nilm: Deep neural networks applied to energy disaggregation." Proceedings of the 2nd ACM International Conference on Embedded Systems for Energy-Efficient Built Environments. ACM, 2015.

[13] Sutskever, Ilya, James Martens, and Geoffrey E. Hinton. "Generating text with recurrent neural networks." Proceedings of the 28th International Conference on Machine Learning (ICML-11). 2011

[14] Graves, Alex, Abdel-rahman Mohamed, and Geoffrey Hinton. "Speech recognition with deep recurrent neural networks." Acoustics, speech and signal processing (icassp), 2013 ieee international conference on. IEEE, 2013.