L’intelligence artificielle de Google DeepMind possède désormais une mémoire

Depuis 2014, DeepMind joue aux jeux vidéo Atari. Initialement, ses systèmes de machine learning (apprentissage machine) pouvaient apprendre à gagner des jeux et à battre les scores humains, mais ils ne pouvaient pas se rappeler de comment ils ont réussi à le faire. Par conséquent, pour chaque jeu, un nouveau réseau neuronal a été créé. DeepMind n’a jamais profité de sa propre expérience, jusqu’à maintenant.

Imiter le cerveau humain

Une équipe de chercheurs de DeepMind et Imperial College London a créé un algorithme qui confère une mémoire au système, lui permettant d’apprendre et de conserver les connaissances ainsi que de les réutiliser. Le système utilise des tests d’apprentissage supervisés et des essais de renforcement pour apprendre en séquence.

Dans le cerveau humain, la consolidation synaptique est la base de l’apprentissage continu. Économiser des connaissances savantes et les transférer d’une tâche à une autre est essentiel à la façon dont les humains apprennent. L’incapacité de le faire a été un échec clé dans le machine learning. L’algorithme, appelé “consolidation de poids élastique” (EWC), choisit les parties les plus utiles de ce qui a aidé la machine à jouer et à gagner des jeux dans le passé, puis ne transfère que ces parties en les mettant  en avant.

Applications de haut niveau

Le système est impressionnant, mais n’est pas encore parfait. DeepMind peut maintenant conserver les informations les plus importantes de ses expériences antérieures pour apprendre, mais malgré cette énorme banque d’expériences, elle ne peut toujours pas fonctionner aussi bien qu’un réseau de neurones qui complète un seul jeu. L’efficacité de l’apprentissage est la prochaine étape si l’apprentissage automatique consiste à faire correspondre ou éventuellement à éclipser l’apprentissage réel.

La consolidation du poids élastique est un élément essentiel de toute intelligence qu’elle soit biologique ou artificielle car elle permet au penseur d’apprendre des tâches successives sans oublier. Le nouvel algorithme DeepMind prend en charge l’apprentissage continu, tout comme la consolidation synaptique du cerveau humain, qui est la prochaine étape pour l’IA en termes de maîtrise des tâches plus difficiles et des contextes d’apprentissage. En d’autres termes, cela signifie que les systèmes d’IA sont mieux en mesure de relever des défis créatifs et intellectuels alors que c’était considéré comme une aptitude exclusivement humaine.

Ce site utilise des cookies afin de pouvoir vous fournir la meilleure expérience utilisateur possible. En continuant à naviguer sur ce site, vous acceptez l'utilisation de cookies.
En savoir plus

NEWSLETTER

Abonnez-vous à notre newsletter pour recevoir des mises à jour intéressantes!

Remplissez votre adresse e-mail et restez informé!

ABONNEZ-VOUS