Games Robótica

Treinar robôs militares com ondas cerebrais

O filme de 1984, The Last Starfighter, conta a história de um adolescente cujo chamado na vida parece nada mais do que jogar jogos de arcade. Felizmente, ele é espetacularmente bom nisso. O jogo em que ele é o melhor é um videogame chamado, como o título do filme, Starfighter . Nele, o jogador deve defender sua propriedade, The Frontier, dos perigos de Xur e da Ko-Dan Armada, por meio de uma série de batalhas a laser em estrutura de arame.

Mas há uma reviravolta. Acontece que Starfighter não é simplesmente um jogo; é realmente um tipo de teste. A guerra com Xur e a Ko-Dan Armada é real, e o jogo de arcade – com suas demandas por tempos de reação rápidos por parte dos jogadores – é uma ferramenta de recrutamento furtivo, destinada a procurar o melhor dos melhores para se tornar caças estelares genuínos.

Douglas Levere, Universidade de Buffalo

Mais de 35 anos depois que The Last Starfighter chegou aos cinemas, engenheiros da Universidade de Buffalo, Nova York, Instituto de Inteligência Artificial receberam financiamento da DARPA, Agência de Projetos de Pesquisa Avançada de Defesa dos EUA, para realizar pesquisas que… bem, digamos que é extremamente parecido.

Eles criaram um jogo de estratégia em tempo real, atualmente sem nome, que lembra os jogos existentes, como StarCraft ou Stellaris, em grande estilo. Neste jogo, os jogadores devem usar recursos para construir unidades e derrotar inimigos; manipular um grande número de agentes na tela para completar seus objetivos de missão.

Mas isso não é uma experiência de jogo comum. Quando as pessoas jogam na Universidade do novo jogo de estratégia de Buffalo, primeiro precisam concordar em se conectar à tecnologia do eletroencefalograma (EEG) para que os designers do jogo possam registrar sua atividade cerebral. Enquanto tocam, seus movimentos oculares também são rastreados por meio de câmeras especiais de ultra-alta velocidade para ver exatamente como elas respondem ao que estão fazendo.

Essas informações, que podem ser extraídas usando algoritmos de aprendizado de máquina , serão usadas para desenvolver novos algoritmos que podem ajudar a treinar um grande número de futuros robôs. Em particular, a esperança é que essas ideias sobre tomadas de decisão complexas possam melhorar a coordenação entre grandes equipes de robôs aéreos e terrestres autônomos. 

Patrik Stollarz / Stringer / Getty Images

Para quem cresceu em filmes como The Last Starfighter , isso parecerá estranhamente familiar. Embora haja uma reviravolta aqui também. Em The Last Starfighter (e em outras histórias de ficção científica que seguem caminhos semelhantes, como Ender’s Game , de Orson Scott Card, e Armada , de Ernest Cline ), o objetivo é treinar os seres humanos a ter o tipo de reflexo rápido que normalmente seria encontrado em um filme. máquina. Nesse caso, é diferente. O objetivo do novo projeto de jogos da Universidade de Buffalo não é tornar os jogadores mais parecidos com máquinas.

Exatamente o oposto, de fato. É tudo sobre tentar fazer máquinas que se pareçam mais com seres humanos.

Treinando os enxames

“Estamos tentando recrutar [participantes] que tenham forte experiência em jogos”, disse Souma Chowdhury , professora assistente de engenharia mecânica e aeroespacial da Escola de Engenharia e Ciências Aplicadas, à Digital Trends.

Chowdhury é um dos principais investigadores do projeto. Ele faz uma pausa e dá uma risada nervosa; a menor sugestão de um pedido de desculpas rastejando em sua voz. “Eu mesmo não tenho experiência em jogos”, disse ele. “Eu não sou um jogador de computador. Mas muitos de nossos alunos gostam de jogos como loucos. ”

“Estamos tentando recrutar [participantes] que tenham forte experiência em jogos.”

A área de interesse de Chowdhury é a inteligência enxame , um ramo da ciência da computação que remonta ao final dos anos 80. A inteligência enxame tem tudo a ver com o comportamento coletivo de sistemas descentralizados e auto-organizados, virtuais e robóticos. “É um tópico muito quente”, disse ele. “Está se tornando conhecido que existem muitas aplicações diferentes que podem ser feitas não usando um único robô de US $ 1 milhão, mas sim um grande número de robôs mais simples e baratos. Podem ser terrestres, aéreos ou uma combinação dessas duas abordagens. ”

Alguns pesquisadores em robótica de enxame tentam executar procedimentos complexos, elaborando manualmente as ações de todos os agentes envolvidos; da maneira que pode treinar cada membro de uma tropa de dança para que eles possam dominar uma rotina complexa. Junte todos eles e obterá algo que parece colaboração emergente, embora na verdade seja uma coleção de indivíduos fazendo suas próprias coisas. 

A ideia de usar a inteligência artificial moderna do aprendizado de máquina é que ela poderia dar aos enxames de robôs a capacidade de funcionar de forma mais autônoma como um coletivo significativo.

Douglas Levere, Universidade de Buffalo

Treinar um robô para fazer algo requer uma quantidade significativa de treinamento. Treinar um enxame, potencialmente com habilidades variadas, para concluir tarefas em ambientes complexos e incertos é muito mais complicado. Isso significa executar dezenas de milhares de simulações, tornando o processo extremamente demorado e caro. A ideia que impulsiona esse novo projeto é que assistir os seres humanos jogarem o jogo facilitará o aprendizado das máquinas.

“Imagine entrar em uma sala de aula onde não há professor e dizer ‘vamos aprender álgebra’”, disse Chowdhury. “Você pode aprender apenas usando exercícios e livros didáticos. Mas vai demorar muito mais tempo. Se você tem um professor, pode segui-lo, tornando-o mais rápido. Nesse caso, queremos ver como os humanos jogam esse jogo e depois usá-lo para acelerar significativamente a IA no aprendizado do comportamento.

Antes, seria necessário executar 10.000 simulações para aprender. Agora, precisamos apenas executar talvez 1.000 simulações e aumentar isso com dados de humanos. ”

Os pesquisadores acreditam que, observando o tipo de decisões táticas ou estratégicas que os humanos tomam quando jogam um jogo de estratégia, será possível descobrir quais recursos e eventos motivam essas ações.

Ensinando as máquinas

“O projeto está em andamento, em um ritmo bastante agressivo”, disse Chowdhury. “Estamos na metade do caminho.”

No momento, eles ainda não iniciaram a fase de coleta de dados do projeto, embora Chowdhury tenha uma boa idéia do formato que será adotado. O plano é realizar experimentos com cerca de 25 participantes. Cada participante jogará entre seis e sete jogos com diferentes configurações aleatórias e níveis de complexidade. Ao contrário de jogos como o StarCraft , que podem durar horas, nesse caso, cada jogo dura apenas entre cinco e dez minutos. Isso será suficiente para medir estratégias de tomada de decisão e para que esses recursos de interesse sejam extraídos usando algoritmos e scripts desenvolvidos pela equipe.

“Os humanos podem apresentar estratégias muito únicas que uma IA pode nunca aprender.”

“Neste momento, é difícil comentar a quantidade ou tamanho dos dados que serão coletados eventualmente”, disse Chowdhury. No entanto, o objetivo é escalar até 250 robôs aéreos e terrestres, trabalhando em situações altamente complexas. Um exemplo pode estar relacionado à perda repentina de visibilidade devido ao fumo. A equipe planeja desenvolver algoritmos, modelados no comportamento humano, que lhes permitam se adaptar a desafios como esse.

Os seres humanos podem apresentar estratégias muito únicas que uma IA pode nunca aprender”, continuou ele. “Muito do hype que vemos na IA está em aplicativos que são ambientes relativamente determinísticos, como xadrez ou Go. Esses são jogos muito complicados, mas o número de possibilidades ainda é contável. Talvez eles estejam na casa dos trilhões, mas são contáveis. Mas em termos de raciocínio contextual em um ambiente real para fazer as coisas? Ainda está em um estágio nascente.

Os seres humanos fazem as estratégias

No livro de Daniel Kahneman, 2011 , Thinking, Fast and Slow , o economista e psicólogo vencedor do Nobel descreve dois modos diferentes de pensamento. O primeiro sistema é rápido e instintivo, o tipo de coisa que poderíamos chamar de intuição. Isso pode estar localizando a fonte de um som específico, completando a frase “guerra e …” ou, sim, explodindo navios Ko-Dan no ar (ou na falta deles) no Starfighter. O segundo sistema é mais lento, mais deliberado, mais lógico. Está centrado no pensamento consciente – que neste caso pode muito bem se referir à formação de estratégias.

Chowdhury não cita o trabalho de Kahneman quando ele discute o projeto. Mas é difícil não ser lembrado disso. Como ele aponta, as máquinas já são capazes de um número impressionante de recursos autônomos. Um drone de US $ 10.000 possui uma inteligência impressionante quando se trata de navegar entre locais. O mesmo acontece com os agentes em um jogo de estratégia. 

As unidades são geralmente governadas por regras de baixo nível que lhes permitem reagir ao ambiente. Isso pode significar atacar ou defender se eles forem confrontados por um inimigo. Também pode significar ser capaz de manter formações à medida que elas se movem pelo mapa. Mas, em ambos os casos, o que falta é a estratégia abrangente necessária para executar tarefas.

“Você não precisa de um ser humano para controlar baixo nível, controlando cada agente”, disse Chowdhury. “Não é nisso que estamos interessados. Eles não estão controlando todos os robôs e para onde estão indo. O papel humano é mais o de um supervisor ou tático. Uma boa analogia seria que, em um ambiente de resposta a desastres, você tenha um supervisor.

Eles podem ter uma equipe de 100 robôs de resgate trabalhando sob eles. Há uma hierarquia, mas o supervisor não diz a cada um desses membros da equipe exatamente o que deve fazer. Os socorristas tomam muitas decisões independentes, mas o supervisor cria as táticas gerais. É isso que queremos construir. ”

Se Chowdhury e sua equipe conseguirem o que querem, o robô dos enxames de amanhã será muito mais inteligente. E eles terão jogadores para agradecer por isso.

Fonte: Digital Trends

Livros sobre I.A

inteligencia artificial teoria pratica

Inteligência Artificial – Teórica e ...

logia-fuzzy

A Inteligencia Artificial (Lógica Fuzzy) p...

data science do zero

Data Science do zero – Primeiras Reg...

o-algoritmo-mestre

O Algoritmo Mestre: Como a Busca Pelo Algo...

inteligencia-artificial-no-ensino

Inteligência Artificial no Ensino. Como Co...

Inteligencia Artificial Uma Introducao ao Raciocínio Baseado em Casos

Inteligência Artificial: Uma Introdução ao...

marketing-juridico-inteligencia-artificial

Marketing Jurídico. O Poder das Novas Mídi...

inteligencia-artificial-forte

Inteligência Artificial Forte: Como fazer ...

Cursos de I.A

internet-das-coisas-curso

Internet das Coisas – Uma visão ampl...

curso robôs im inteligência artificial facebook

ROBOS.im – Plataforma para criação d...

congresso-online-inteligencia-digital-futurismo

Congresso Online de Inteligência Digital &...

talia sistema inteligencia artificial advogados

Talia – Inteligência Artificial para...

336x280_profissionais-do-futuro_seq2

Profissional do Futuro – Inteligênci...

curso-inteligencia-artificial-avancada-assistentes-pessoais

Inteligência artificial avançada para assi...

curso online robotica automacao residencial

Curso de Robótica e Automação Residencial

instarise

Instarise – Inteligência artificial ...