Machine Learning : L'apprentissage par renforcement

Comparaison

 

Différence entre les differents types d'apprentisage

Que ce soit l'apprentissage supervisé, non-supervisé ou encore par renforcement, ils font tous partie du Machine Learning, mais la différence est que :

L'apprentissage supervisé

L'apprentissage supervisé consiste à apprendre à partir d'exemples fournis par un superviseur externe compétent.

- Un exemple d'apprentissage supervisé est un étudiant passant un examen. L'ayant marqué, on lui montre les questions auxquelles il a répondu de manière incorrecte. Une fois qu’il a vu les bonnes réponses, l'étudiant doit alors apprendre à répondre à ces questions avec succès.

L'apprentissage non supervisé

- Un exemple d'apprentissage non supervisé est quelqu'un qui doit apprendre à jongler par lui-même. La personne va commencer par lancer les boules et tenter de les rattraper. Après avoir fait tomber la plupart des balles, il va progressivement ajuster sa technique et va commencer à ne plus faire tomber les balles.

Ce sont des catégories importantes de l'apprentissage, mais seules, elles ne suffisent pas. Car, il est souvent impossible d'obtenir des exemples de comportements souhaités, à la fois pertinents, et représentatifs de toutes les situations dans lesquelles l'agent doit agir.

- Par exemple, on se trouve en territoire inconnu – tout en voulant être le plus efficace - on doit être en mesure d'apprendre de sa propre expérience. Ce qui serait possible grâce a l'apprentissage par renforcement