Robótica

O robô da OpenAI aprendeu a resolver o cubo de Rubik com uma mão Dactyl

A organização de pesquisa de inteligência artificial OpenAI alcançou um novo marco em sua busca para criar robôs de auto-aprendizado de uso geral. A divisão de robótica do grupo diz que o Dactyl, sua mão robótica humanóide desenvolvida no ano passado, aprendeu a resolver o cubo de Rubik com uma mão.

A OpenAI vê o feito como um salto em frente, tanto pela destreza dos apêndices robóticos quanto pelo seu próprio software de IA, que permite ao Dactyl aprender novas tarefas usando simulações virtuais antes de apresentar um desafio físico real a ser superado.

Em um vídeo de demonstração que mostra o novo talento de Dactyl, podemos ver a mão robótica abrindo caminho em direção a um cubo completo resolvido com manobras desajeitadas, mas precisas. Demora muitos minutos, mas Dactyl é capaz de resolver o quebra-cabeça.

É um pouco perturbador ver em ação, mesmo que apenas porque os movimentos pareçam visivelmente menos fluidos que os humanos e especialmente desarticulados quando comparados à velocidade ofuscante e à destreza bruta em exibição quando um velocista humano resolve o cubo em questão de segundos.

Welinder está fazendo referência a uma série de robôs nos últimos anos que levaram a solução do cubo de Rubik muito além das limitações das mãos e mentes humanas. Em 2016, a fabricante de semicondutores Infineon desenvolveu um robô especificamente para resolver o cubo de Rubik em velocidades sobre-humanas, e o bot conseguiu fazê-lo em menos de um segundo.

Isso quebrou o recorde mundial de menos de cinco segundos na época. Dois anos depois, uma máquina desenvolvida pelo MIT resolveu um cubo em menos de 0,4 segundos. No final de 2018, um canal japonês do YouTube chamado Human Controller chegou a desenvolver seu próprio cubo de Rubik com resolução automática usando um núcleo impresso em 3D conectado a servo motores programáveis.

Em outras palavras, um robô criado para uma tarefa específica e programado para executá-la da maneira mais eficiente possível pode tipicamente ser um humano, e a solução do cubo de Rubik é algo que o software domina há muito tempo. Portanto, desenvolver um robô para resolver o cubo, mesmo humanóide, não é tão notável por si só, e menos ainda na velocidade lenta que Dactyl opera.

Mas o robô Dactyl da OpenAI e o software que o alimenta são muito diferentes em design e propósito do que uma máquina dedicada para solução de cubos. Como Welinder diz, o trabalho de robótica em andamento da OpenAI não visa alcançar resultados superiores em tarefas limitadas, pois isso exige apenas que você desenvolva um robô melhor e o programe de acordo. Isso pode ser feito sem a inteligência artificial moderna.

Em vez disso, o Dactyl é desenvolvido desde o início como uma mão robótica de auto-aprendizado que aborda novas tarefas da mesma forma que um humano faria. É treinado usando um software que tenta, de maneira rudimentar no momento, replicar os milhões de anos de evolução que nos ajudam a aprender a usar nossas mãos instintivamente quando crianças.

Isso poderia um dia, espera a OpenAI, ajudar a humanidade a desenvolver os tipos de robôs humanóides que conhecemos apenas da ficção científica, robôs que podem operar com segurança na sociedade sem nos comprometer e executar uma ampla variedade de tarefas em ambientes tão caóticos quanto ruas da cidade e fábricas .

Para aprender a resolver o cubo de Rubik com uma mão, a OpenAI não programou explicitamente o Dactyl para resolver o brinquedo; o software livre na internet pode fazer isso por você. Ele também optou por não programar movimentos individuais para a mão executar, pois queria discernir esses movimentos por conta própria.

Em vez disso, a equipe de robótica deu ao software subjacente da mão o objetivo final de resolver um cubo embaralhado e usou a IA moderna especificamente uma marca de aprendizado profundo baseado em incentivos chamado aprendizado por reforço – para ajudá-lo no caminho de descobrir sozinho. A mesma abordagem para o treinamento de agentes de IA é como a OpenAI desenvolveu seu Dota 2 bot de classe mundial.

Mas até recentemente, era muito mais fácil treinar um agente de IA para fazer algo virtualmente jogar um jogo de computador, por exemplo do que treiná-lo para executar uma tarefa do mundo real. Isso ocorre porque o software de treinamento para fazer algo no mundo virtual pode ser acelerado, para que a IA possa passar o equivalente a dezenas de milhares de anos treinando em apenas alguns meses do tempo real, graças a milhares de CPUs de ponta e ultra GPUs poderosas trabalhando em paralelo.

Não é possível realizar o mesmo nível de treinamento executando uma tarefa física com um robô físico. É por isso que a OpenAI está tentando ser pioneira em novos métodos de treinamento em robótica usando ambientes simulados no lugar do mundo real, algo que a indústria de robótica mal experimentou.

Dessa forma, o software pode praticar extensivamente em um ritmo acelerado em muitos computadores diferentes simultaneamente, com a esperança de reter esse conhecimento quando começar a controlar um robô real.

É também por isso que os robôs atuais são muito menos versáteis que os humanos. Requer grande quantidade de tempo, esforço e dinheiro para reprogramar um robô que monta, digamos, uma parte específica de um automóvel ou componente de computador para fazer outra coisa. Apresente um robô que não tenha sido treinado adequadamente com uma tarefa simples que envolva qualquer nível de destreza humana ou processamento visual e que falharia miseravelmente.

Com as técnicas modernas de IA, no entanto, os robôs podem ser modelados como seres humanos, para que possam usar o mesmo entendimento intuitivo do mundo para fazer tudo, desde abrir portas até fritar um ovo. Pelo menos, esse é o sonho.

Ainda estamos décadas longe desse nível de sofisticação, e os saltos que a comunidade de IA deu no lado do software – como carros autônomos, tradução automática e reconhecimento de imagens – não foram exatamente traduzidos para os robôs da próxima geração. No momento, a OpenAI está apenas tentando imitar a complexidade de uma parte do corpo humano e fazer com que esse análogo robótico opere de forma mais natural.

É por isso que Dactyl é uma mão robótica de 24 articulações modelada após uma mão humana, em vez das garras robóticas de garra ou pinça que você vê nas fábricas. E para o software que capacita Dactyl a aprender a utilizar todas essas articulações da maneira que um ser humano faria, a OpenAI passou por milhares de anos de treinamento em simulação antes de tentar resolver o cubo físico.

Quando recebeu um cubo real, o Dactyl utilizou seu treinamento e o resolveu por conta própria, e o fez sob uma variedade de condições para as quais nunca havia sido explicitamente treinado. Isso inclui resolver o cubo com uma mão com uma luva, com dois dedos colados, e enquanto os membros da OpenAI continuamente interferiam nele, cutucando-o com outros objetos e regando-o com bolhas e pedaços de papel parecido com confete.

É por isso que a OpenAI vê a habilidade recém-adquirida de Dactyl como igualmente importante para o avanço do hardware robótico e o treinamento em IA. Mesmo os robôs mais avançados do mundo, como os robôs humanóides e caninos desenvolvidos pelo líder da indústria Boston Dynamics, não podem operar de forma autônoma, e exigem extensa programação específica de tarefas e intervenção humana frequente para realizar ações básicas.

A OpenAI diz que o Dactyl é um passo pequeno, mas vital, para o tipo de robô que pode um dia executar tarefas manuais ou domésticas e até trabalhar ao lado de humanos, em vez de em ambientes fechados, sem nenhuma programação explícita que governe suas ações.

Nessa visão para o futuro, a capacidade dos robôs de aprenderem novas tarefas e se adaptarem às mudanças nos ambientes será tanto sobre a flexibilidade da IA ​​quanto sobre a robustez da máquina física. “Esses métodos estão realmente começando a demonstrar que essas são as soluções para lidar com toda a complicação inerente e a confusão do mundo físico em que vivemos”, diz Plappert.

Livros sobre I.A

redes-neurais-artificiais

Redes Neurais Artificiais Para Engenharia ...

ceo-inteligencia-artificial

Exame Ceo. Inteligência Artificial

maquinas-preditivas-economia-inteligencia-artificial

Máquinas Preditivas: a Simples Economia da...

inteligencia-artificial-seo-marketing

Inteligência Artificial, Seo e o Marketing...

inteligencia artificial

Inteligência Artificial. Diálogos Entre Me...

marketing-juridico-inteligencia-artificial

Marketing Jurídico. O Poder das Novas Mídi...

guia-rapido-robotica-inteligencia-artificial

Guia Rápido De Robótica E Inteligência Art...

data science do zero

Data Science do zero – Primeiras Reg...

Cursos de I.A

curso robôs im inteligência artificial facebook

ROBOS.im – Plataforma para criação d...

instarise

Instarise – Inteligência artificial ...

Tudo Sobre IoT curso online

Tudo Sobre IoT – Internet das Coisas

internet-das-coisas-curso

Internet das Coisas – Uma visão ampl...

comandar-casa-por-voz-internet-das-coisas

Manual para Comandar sua Casa por Voz a Ba...

talia sistema inteligencia artificial advogados

Talia – Inteligência Artificial para...

curso-inteligencia-artificial-avancada-assistentes-pessoais

Inteligência artificial avançada para assi...

curso online robotica automacao residencial

Curso de Robótica e Automação Residencial