Inteligência Artificial

Algoritmo do Facebook é craque na matemática

Guillaume Lample e François Charton, do Facebook AI Research em Paris, dizem que desenvolveram um algoritmo que faz o trabalho com apenas um momento de reflexão.

Para redes neurais e humanas, uma das dificuldades das expressões matemáticas avançadas é a abreviação em que elas se baseiam. Por exemplo, a expressão x3 é uma forma abreviada de escrever x multiplicado por x multiplicado por x.

Entre Lample e Charton, que criaram uma maneira elegante de descompactar a abreviação matemática em suas unidades fundamentais.

A primeira parte desse processo é dividir as expressões matemáticas em suas partes componentes. Lample e Charton fazem isso representando expressões como estruturas semelhantes a árvores.

As folhas dessas árvores são números, constantes e variáveis ​​como x; os nós internos são operadores como adição, multiplicação, diferenciação com respeito e assim por diante.

As árvores são iguais quando são matematicamente equivalentes. Por exemplo,
2 + 3 = 5 = 12 – 7 = 1 x 5 são todos equivalentes; portanto, suas árvores também são equivalentes.

Muitas operações matemáticas são mais fáceis de lidar dessa maneira. “Por exemplo, a simplificação da expressão equivale a encontrar uma representação equivalente mais curta de uma árvore”, dizem Lample e Charton.

Essas árvores também podem ser escritas como sequências, ocupando cada nó consecutivamente. Nesse formulário, eles estão prontos para serem processados ​​por uma abordagem de rede neural chamada seq2seq.

Curiosamente, essa abordagem também costuma ser usada para tradução automática, onde uma sequência de palavras em um idioma deve ser traduzida para uma sequência de palavras em outro idioma.

De fato, Lample e Charton dizem que sua abordagem trata essencialmente a matemática como uma linguagem natural.

A próxima etapa é o processo de treinamento, e isso requer um enorme banco de dados de exemplos para aprender. Lample e Charton criam esse banco de dados reunindo aleatoriamente expressões matemáticas de uma biblioteca de operadores binários, como adição, multiplicação e assim por diante; operadores unários como cos, sin e exp; e um conjunto de variáveis, números inteiros e constantes, como π e e. Eles também limitam o número de nós internos para impedir que as equações se tornem muito grandes.

Mesmo com um número relativamente pequeno de nós e componentes matemáticos, o número de expressões possíveis é vasto.

Cada equação aleatória é então integrada e diferenciada usando um sistema de álgebra computacional. Qualquer expressão que não possa ser integrada é descartada.

Dessa maneira, os pesquisadores geram um conjunto massivo de dados de treinamento que consiste, por exemplo, em 80 milhões de exemplos de equações diferenciais de primeira e segunda ordem e 20 milhões de exemplos de expressões integradas por partes.

Ao agrupar esse conjunto de dados, a rede neural aprende como calcular a derivada ou integral de uma determinada expressão matemática.

Por fim, Lample e Charton colocam sua rede neural em movimento, alimentando 5.000 expressões nunca vistas antes e comparando os resultados que produzem em 500 casos com os de solucionadores disponíveis comercialmente, como Maple, Matlab e Mathematica.

Esses solucionadores usam uma abordagem algorítmica elaborada na década de 1960 pelo matemático americano Robert Risch. No entanto, o algoritmo de Risch é enorme, rodando a 100 páginas apenas para integração. Portanto, o software de álgebra simbólica geralmente usa versões reduzidas para acelerar as coisas.

Em muitos casos, os solucionadores convencionais não conseguem encontrar uma solução, levando 30 segundos para tentar. Em comparação, a rede neural leva cerca de um segundo para encontrar suas soluções. O exemplo no topo desta página é um deles.

Um resultado interessante é que a rede neural geralmente encontra várias soluções equivalentes para o mesmo problema. Isso ocorre porque as expressões matemáticas geralmente podem ser escritas de várias maneiras diferentes.

Essa capacidade é um mistério tentador para os pesquisadores. “A capacidade do modelo de recuperar expressões equivalentes, sem ter sido treinado para fazê-lo, é muito intrigante”, afirma Lample e Charton.

Essa é uma inovação significativa. “Até onde sabemos, nenhum estudo investigou a capacidade das redes neurais de detectar padrões em expressões matemáticas”, afirmam os dois.

Agora que eles têm, o resultado claramente tem um enorme potencial no mundo cada vez mais importante e complexo da matemática computacional.

Os pesquisadores não revelam os planos do Facebook para essa abordagem. Mas não é difícil ver como ele poderia oferecer seu próprio serviço de álgebra simbólica que supera os líderes de mercado.

No entanto, é improvável que os concorrentes fiquem parados. Espere uma poderosa batalha no mundo da matemática computacional.

Livros sobre I.A

livro redes neurais princípio e prática

Redes Neurais. Princípios e Prática

inteligencia-artificial-forte

Inteligência Artificial Forte: Como fazer ...

inteligencia artificial visa modelos algoritmos maquinas

Inteligência Artificial Livre: Uma visão d...

ceo-inteligencia-artificial

Exame Ceo. Inteligência Artificial

inteligencia-artificial-generica

Inteligência Artificial Genérica: Os desaf...

redes-neurais-artificiais

Redes Neurais Artificiais Para Engenharia ...

logia-fuzzy

A Inteligencia Artificial (Lógica Fuzzy) p...

inteligencia-artificial-seo-marketing

Inteligência Artificial, Seo e o Marketing...

Cursos de I.A

curso online robotica automacao residencial

Curso de Robótica e Automação Residencial

comandar-casa-por-voz-internet-das-coisas

Manual para Comandar sua Casa por Voz a Ba...

internet-das-coisas-curso

Internet das Coisas – Uma visão ampl...

336x280_profissionais-do-futuro_seq2

Profissional do Futuro – Inteligênci...

Tudo Sobre IoT curso online

Tudo Sobre IoT – Internet das Coisas

congresso-online-inteligencia-digital-futurismo

Congresso Online de Inteligência Digital &...

curso-inteligencia-artificial-avancada-assistentes-pessoais

Inteligência artificial avançada para assi...

curso robôs im inteligência artificial facebook

ROBOS.im – Plataforma para criação d...