Games

Medindo o avanço da IA por meio de jogos [atualização de 2021]

Quando falamos sobre o quão longe a Inteligência Artificial chegou, freqüentemente usamos números para mostrar nosso ponto de vista. Baseamo-nos no trabalho anterior e, se o fizermos bem, acabamos por dar um passo progressivo em direção ao futuro. Porém, o que realmente muda nossa percepção é ver o que nossos passos nos permitem realizar.

Esta semana, logo após o OpenAI de Elon Musk vencer um jogador humano profissional no Dota 2 – um jogo de computador de grande sucesso que também é jogado como um e-sport competitivo – trazemos a você duas décadas de avanços em Inteligência Artificial, e como ela é lenta, mas certamente conquistando jogos competitivos.

Chess

11 de maio de 1997. O mundo prende a respiração quando o supercomputador IBM Deep Blue, o computador projetado para ser o melhor jogador de xadrez do mundo, finalmente derrota o campeão mundial de xadrez, Garry Kasparov, em uma partida. Não tem precedentes. A notícia se espalhou como um incêndio. A máquina vence o homem.

Isso pode parecer muito exagero, mas uma máquina sendo capaz de vencer um humano em um jogo de estratégia não tinha precedentes. Olhando para trás, a principal força do Deep Blue era seu poder de computação. Usou uma abordagem de força bruta, calculando todos os futuros possíveis que poderia ter dado o limite de tempo e escolheu os movimentos que levariam às melhores posições de final de jogo. Ele podia pesquisar 200 milhões de posições por segundo, o que geralmente se traduz em 6 a 8 movimentos no futuro, e estava entre os 500 supercomputadores mais poderosos. Foi uma demonstração de força, um feito que nenhum humano poderia replicar. Hoje em dia, o Chess AI usa algoritmos mais sofisticados e não precisa de um supercomputador para funcionar.

Jeopardy

O jogo de perguntas e respostas da televisão, Jeopardy, foi o próximo jogo a coroar um campeão de máquinas. Em 2011, o supercomputador Watson da IBM derrotou dois ex-campeões do Jeopardy. O desenvolvimento nele foi iniciado em 2006 e, em 4 anos, o Watson era capaz de vencer os humanos de forma consistente.

De longe, a conquista mais significativa do Watson foi sua capacidade de pegar as pistas fornecidas pelo jogo, formuladas em inglês, e consultar sua base de conhecimento (também em inglês) para obter a resposta certa. Linguagens naturais como o inglês são, embora relativamente simples para nós, notoriamente difíceis para os computadores entenderem. Simplificando, os computadores não têm o bom senso necessário para dar sentido às frases que usamos. Por meio de sua vasta base de conhecimento, que inclui todas as páginas publicadas da Wikipedia, e por meio de algoritmos projetados para dar sentido às linguagens naturais, o Watson encontrou as respostas certas vezes suficientes para vencer seus concorrentes. Hoje em dia, Watson está trabalhando na área de saúde e outras áreas.

Atari

O aprendizado de máquina começou a aumentar na década de 2010, principalmente devido aos avanços na visão computacional. Em 2012, os principais pesquisadores em Aprendizado de Máquina demonstraram que os computadores podem classificar de forma confiável milhares de objetos diferentes em uma imagem. Dois curtos anos depois, em 2014, os pesquisadores do Google descobriram uma maneira de usar os pixels exibidos por uma máquina Atari para aprender a jogar mais de 40 jogos.

Os métodos de Inteligência Artificial usados pelos pesquisadores, chamados de Reinforcement Learning, mudaram o panorama do uso da inteligência da máquina para jogar. Os bots foram capazes de se aprimorar constantemente por tentativa e erro. É um tanto análogo a treinar seu cão para dar-lhe um high-five: se o cão fizer o que você quer corretamente, dê-lhe um petisco. Levará algum tempo para entender por que você às vezes dá guloseimas e por que às vezes não, mas com tentativas suficientes, ele vai aprender. Simplesmente dizendo aos bots o estado atual do jogo, sua pontuação e que eles deveriam melhorar suas pontuações, os cientistas ensinaram os bots a jogar.

Pacman

Embora a maioria dos jogos da Atari tenha sido conquistada por IA, Pacman provou ser evasivo devido à sua natureza imprevisível. Mas isso não durou muito. Os pesquisadores da Microsoft Maluuba desenvolveram um modelo de aprendizado por reforço multiagente para atingir a pontuação máxima no jogo, uma façanha nunca alcançada por humanos antes.

No modelo de aprendizagem de Maluuba, diferentes agentes rastreiam objetivos diferentes com pagamentos diferentes. Um agente rastreia apenas uma única pelota, fruta, fantasma ou fantasma comestível. Por exemplo, uma vez que fantasmas podem terminar o jogo pegando Pacman, a importância das recomendações do agente de rastreamento de fantasmas é mais importante do que outros agentes.

Go

Embora o Deep Blue tenha sido um marco, chega um ponto em que calcular todos os resultados possíveis se torna inviável. Esse era o caso do antigo jogo de tabuleiro Go, um jogo de estratégia que tem um pool de movimentos muito maior do que o xadrez. Até 2015, os melhores bots só conseguiam derrotar jogadores amadores, incapazes de usar estratégias viáveis de longo prazo. Isso foi, é claro, antes de todos os registros Go do computador serem quebrados pelo AlphaGo do Google DeepMind. Em março de 2016, ele venceu com folga Lee Sedol, um dos jogadores de Go mais bem classificados do mundo, e em maio de 2017, venceu o jogador de Go mais bem classificado do mundo, Ke Jie.

O sucesso da AlphaGo foi novamente possibilitado pelo Reinforcement Learning. Foi treinado por um vasto número de jogos, com os quais aprendeu os movimentos que mais frequentemente conduziam à vitória. Nesse ponto, AlphaGo já estava no calibre de um jogador profissional de baixo escalão. O segredo do seu sucesso, porém, foram as partidas que disputou contra si mesmo. Mudando seu estilo de jogo um pouco a cada iteração e escolhendo o estilo de jogo que resulta em uma vitória, ele se aprimorou para ser o melhor do planeta.

Texas Hold’em Poker

No início deste ano, uma IA construída pelos pesquisadores da Carnegie Mellon University, chamada Libratus, venceu quatro outros profissionais em um torneio competitivo de No-Limit Texas Hold’em. Esta é uma versão do Hold’em onde não há limite de apostas e é um dos jogos de cartas mais populares. AI já havia resolvido o Limit Hold’em em 2015.

Em jogos como Go e Chess, você tem total conhecimento do estado do jogo o tempo todo. Ao contrário desses, o Texas Hold’em é um jogo de informação imperfeita, onde você não conhece o estado completo do jogo. Isso torna as coisas muito mais difíceis para a IA, pois ela precisa entender quais cartas seu oponente tem em mãos e ser capaz de ver através do blefe. Libratus saiu com fichas (falsas) no valor de $ 1,8 milhões depois de derrotar todos os profissionais nas negativas. No entanto, ele só jogou com um único oponente de cada vez. Isso limita significativamente o número de possibilidades com as quais a IA tem que lidar, mas o Libratus ainda é uma grande conquista.

Dota 2

Durante suas últimas tentativas em 2018, o bot Dota da OpenAI foi capaz de derrotar jogadores humanos talentosos, mas perdeu para campeões humanos depois de competir em condições justas com humanos. Inicialmente, o bot e seus oponentes foram capazes de escolher apenas alguns de todos os personagens do jogo, tornando-o mais simples.

Em uma tentativa anterior, o sistema de IA desenvolvido pela OpenAI experimentou o Dota 2 (embora seja uma forma simples dele) e foi capaz de derrotar muitos dos jogadores profissionais contra os quais competiu. Dota 2 é tradicionalmente um jogo 5v5 com muitas variáveis diferentes, e o bot só competia em uma pequena parte dele. Devemos também notar que, ao contrário dos exemplos anteriores, o bot foi derrotado ao longo do dia.

O que a OpenAI alcançou ainda é uma grande conquista, porque o ambiente no qual a IA deve funcionar é muito diferente dos jogos anteriores. Os jogos mencionados anteriormente eram todos baseados em turnos, onde os movimentos são feitos um de cada vez e o resultado de um movimento é imediatamente visível. O Dota 2, entretanto, é em tempo real.

Super Mário

Jogar é uma coisa, criar jogos é outra. Uma equipe do Georgia Institute of Technology publicou um artigo de pesquisa descrevendo seu sistema de IA que pode recriar títulos clássicos como Super Mario apenas assistindo ao jogo, sem acessar seu código.

Um jogo popular ainda a ser conquistado: Bridge

De acordo com a wikipedia, Bridge é um dos jogos de cartas mais populares, principalmente entre os idosos. Dado o fascínio de Warren Buffet e Bill Gates pelo esporte, podemos dizer que ele também é popular entre os ultra-ricos.

Apesar dos avanços no campo, nenhum jogo de bridge com IA já derrotou campeões mundiais repetidamente. Isso possivelmente se deve ao fato de que o bridge é um jogo baseado em informações incompletas e que o bridge atraiu relativamente menos interesse de pesquisa em comparação com jogos mais populares como xadrez ou go. Uma característica interessante do bridge é que a pergunta “O problema de decidir o vencedor no bridge duplo falso é difícil em alguma classe de complexidade?” é um problema não resolvido na ciência da computação.

Fonte: AI Multiple

Livros sobre I.A

inteligencia artificial por ben coppin

Inteligência Artificial – Técnicas, ...

inteligencia artificial como ler filosofia

Inteligência artificial – A associaç...

skyward-conquiste-as-estrelas

Skyward: Conquiste as estrelas

biologia-artificial

Biologia Artificial: A evolução da Intelig...

robos-hft-inteligencia-artificial

Robôs HFT: Estudos de operação em alta fre...

o cerebro e o robo inteligencia artificial

O cérebro e o robô: Inteligência artificia...

inteligencia-artificial-seo-marketing

Inteligência Artificial, Seo e o Marketing...

inteligencia-artificial-artificial

Inteligência Artificial Artificial: Como o...

Cursos de I.A

curso online robotica automacao residencial

Curso de Robótica e Automação Residencial

congresso-online-inteligencia-digital-futurismo

Congresso Online de Inteligência Digital &...

instarise

Instarise – Inteligência artificial ...

curso-inteligencia-artificial-avancada-assistentes-pessoais

Inteligência artificial avançada para assi...

internet-das-coisas-curso

Internet das Coisas – Uma visão ampl...

talia sistema inteligencia artificial advogados

Talia – Inteligência Artificial para...

Tudo Sobre IoT curso online

Tudo Sobre IoT – Internet das Coisas

curso robôs im inteligência artificial facebook

ROBOS.im – Plataforma para criação d...