MuZero, the new DeepMind's toy/MuZero, el nuevo juguete de DeepMind

in Project HOPE4 months ago


Source

In 2016 DeepMind, the company owned by google with its computer AlphaGo manages to beat the best experts in Go, a strategy board game generally of 19 x 19 squares, with more possible movements than atoms there are in the visible universe, very popular in Asian countries like China, Japan or Korea.

En el año 2016 DeepMind, la compañía propiedad de google con su computadora AlphaGo consigue batir a los mejores expertos en Go, un juego de tablero de estrategia generalmente de 19 x 19 casillas, con más movimientos posibles que átomos hay en el universo visible, muy popular en países asiáticos como China, Japón o Corea.

For this first version, in addition to introducing the rules of the game into the computer, thousands of previously recorded games were introduced and multiple online games of AlphaGo were developed with the best experts in the world until AlphaGo was made the best player in the world of Go.

Para esta primera versión, además de introducir en la computadora las reglas del juego, se introdujeron miles de partidas previamente grabadas y se desarrollaron múltiples partidas online de AlphaGo com los mejores expertos del mundo hasta conseguir hacer de AlphaGo el mejor jugador del mundo de Go.

As if this were not enough, in 2017 they created AlphaZero that was able to win by 100 games to 0 to its predecessor AlphaGo but, this time, the machine only received the instructions of the game and was able to learn without any human training, playing games against itself.

Por si esto fuera poco, en 2017 crean AlphaZero que fue capaz de ganar por 100 partidas a 0 a su predecesor AlphaGo pero, esta vez, la máquina solo recibió las instrucciones del juego y fue capaz de aprender sin ningún entrenamiento humano, jugando partidas contra sí mismo.


Source

By 2018 AlphaZero, in addition to mastering Go, also became the best chess and shogi player, a kind of Japanese chess, and all this just with the instructions of the game and playing millions and millions of games against himself. until you have mastered the games completely.

Para el año 2018 AlphaZero, además de dominar el Go llegó también a ser el mejor jugador de ajedrez y de shogi, una especie de ajedrez japonés, y todo esto tan solo con las instrucciones del juego y jugando millones y millones de partidas contra sí mismo hasta dominar los juegos por completo.

This would already be enough to have us amazed for a season but DeepMind does not rest and this year it has launched MuZero, a system capable of surpassing its predecessor AlphaZero but this time it has not even been provided with the instructions of the games.

Esto ya sería suficiente para tenernos alucinados durante una temporada pero DeepMind no descansa y este año ha lanzado MuZero, un sistema capaz de superar a su predecesor AlphaZero pero esta vez ni siquiera se le han proporcionado las instrucciones de los juegos.


Source

In addition to chess, go and shogi like its cousin AlphaZero this new model has also learned to dominate the benchmark with Atari games and all this, as I mentioned, without having a clue how to play, just observing the surrounding scenarios and drawing conclusions.

Además de ajedrez, go y shogi como su primo AlphaZero este nuevo modelo también ha aprendido a dominar el banco de pruebas con los juegos de Atari y todo esto, como he mencionado, sin tener ni idea de como jugar, solo observando los escenarios circundantes y sacando conclusiones.

Unlike its amazing predecessors that have little use in real life, MuZero uses a different approach and instead of modeling its entire environment it only models aspects that may be important to the decision-making process, which would allow it to act in scenarios and problems of everyday life.

Al contrario que sus predecesores que a pesar de ser alucinantes tienen poco uso en la vida real, MuZero utiliza un enfoque diferente y en lugar de modelar todo su entorno solo modela aspectos que puedan ser importantes para el proceso de toma de decisiones lo que le permitiría poder actuar en escenarios y problemas de la vida cotidiana.

More information/Más información
https://deepmind.com/blog/article/muzero-mastering-go-chess-shogi-and-atari-without-rules

Sort:  

Hola @mauromar, esta publicación me recordó que tengo entre mis libros un manual de Go y casi cumple un año hay guardado, me voy a sentar aprender a ver si le gano a este juguetico de DeepMind. ;-)
Go+.jpg

Saludos @mauromar, es un avance extraordinario… Solo hay que establecer para quien para las maquinas o para nosotros.

This post has been manually curated by @bala41288 from Indiaunited community. Join us on our Discord Server.

Do you know that you can earn a passive income by delegating to @indiaunited. We share 80 % of the curation rewards with the delegators.

Here are some handy links for delegations: 100HP, 250HP, 500HP, 1000HP.

Read our latest announcement post to get more information.

image.png

Please contribute to the community by upvoting this comment and posts made by @indiaunited.

Hello @mauromar
It's impressive how far this goes. It is because of this kind of thing that it is thought that in many labor fields the human being will be left out of the game.
However, it seems that there is no turning back in this respect.

AI is going to remove every single job existing now but it will create new ones.