Machine Learning : L'apprentissage par renforcement

Machine Learning

 

Définition

Le Machine Learning, ou encore l’apprentissage automatique en français, fait partie de l’une des approches de l’intelligence artificielle.

Le Machine Learning est donc une discipline scientifique centrée sur le développement, l’analyse et l’implémentation de méthodes automatisables, qui offrent la possibilité à une machine d’évoluer grâce a un processus d’apprentissage.

Et ainsi d’accomplir des tâches qui auraient été difficiles, voire impossibles, de réaliser avec des algorithmiques plus classiques.

Type d'apprentissage

Le Machine Learning est composé de plusieurs types d’apprentissage qui sont :

L’apprentissage supervisé :

Lorsque le système apprend à classer selon un modèle de classement prédéterminé ainsi que des exemples connus.

L’apprentissage supervisé se découpe en deux parties :

- La première correspond à déterminer un modèle de données étiquetées.
- La deuxième consiste à prédire l'étiquette d'une nouvelle donnée, connaissant le modèle préalablement appris.

Par exemple : L'analyse discriminante est un exemple typique. Il s’agit d’expliquer et de prédire l’appartenance d’un individu à une classe prédéfinie à partir de ses caractéristiques, mesurées à l’aide de variables prédictives.

L’apprentissage non supervisé :

C’est quand le système ne dispose que d'exemples, et que le nombre de classes et leur nature n’ont pas été prédéterminés. On parle d'apprentissage non supervisé ou clustering. Aucun exemple n'est requis. L'algorithme doit découvrir par lui-même la structure en fonction des données.

Par exemple : pour un épidémiologiste qui étudie les victimes du cancer du foie et veut tenter de faire émerger des hypothèses explicatives. L'ordinateur pourrait différencier plusieurs groupes, pour ensuite les associer à divers facteurs explicatifs.

L’apprentissage semi-supervisé

Il utilise un ensemble de données étiquetées et non-étiquetées. Il se situe ainsi entre l'apprentissage supervisé qui n'utilise que des données étiquetées et l'apprentissage non-supervisé qui n'utilise que des données non-étiquetées. Il a été démontré que l'utilisation de données non-étiquetées, en combinaison avec des données étiquetées, permet d'améliorer significativement la qualité de l'apprentissage. Un autre intérêt provient du fait que l'étiquetage de données nécessite l'intervention d'un utilisateur humain. Lorsque les jeux de données deviennent très grands, cette opération peut s'avérer fastidieuse. Dans ce cas, l'apprentissage semi-supervisé, qui ne nécessite que quelques étiquettes, revêt un intérêt pratique évident.

L’apprentissage par renforcement :

L’apprentissage par renforcement correspond au cas où l'algorithme apprend un comportement étant donnée une observation. L'action de l'algorithme sur l'environnement produit une valeur de retour qui guide l'algorithme d'apprentissage.

Mon exposé se centrera essentiellement sur ce dernier type d'apprentissage “L'apprentissage par renforcement", que je vais détailler par la suite.