Petit guide du machine learning — partie 1
Customer Experience 2 février 2018L’objectif premier du machine learning (ou apprentissage automatique) est d’automatiser les tâches courantes à l’aide des ordinateurs. Pour cela, les algorithmes de machine learning tentent de reproduire l’apprentissage humain en se basant sur un modèle mathématique.
Des tâches qui nous semblent banales (comme reconnaître un visage, ou lacer ses chaussures) représentent, en réalité, un ensemble de tâches très complexes pour une machine. Le machine learning repose sur l’idée que des événements qui se sont produits/ont coïncidé régulièrement par le passé devraient à nouveau se produire/coïncider dans le futur. Par exemple, si l’événement B se produit toujours après l’événement A, vous pouvez vous attendre à ce que l’événement B survienne peu après l’événement A.
Mais alors le machine learning peut-il battre l’intelligence humaine ?
Bien sûr, les humains ont de nombreux avantages par rapport aux machines. Nous pouvons, par exemple, demander l’avis d’un expert, utiliser la connaissance acquise au cours d’expériences précédentes et interagir avec notre environnement afin de collecter davantage d’informations. Mais nos capacités présentent également des limites : il nous arrive d’oublier des choses ou d’avoir du mal à faire preuve d’impartialité au moment de prendre une décision. Pour pouvoir imiter la réflexion humaine, le machine learning a donc besoin de l’expertise humaine pour le guider et le surveiller ; faute de quoi, les fondements du modèle (données, règles logiques, etc.) pourraient être totalement aléatoires et le modèle n’en tirerait aucun enseignement.
Dans la plupart des cas, le machine learning n’a pas pour but de surpasser l’humain. Il doit surtout permettre de traiter une question de manière satisfaisante à grande échelle. Autrement dit, les machines doivent être capables de répondre à des questions en collectant et en traitant d’importants volumes d’informations bien plus rapidement qu’un humain, et éventuellement de reproduire cette action plusieurs milliers ou millions de fois à la suite. C’est ce volume qui constitue la principale différence entre les statistiques traditionnelles (pensez à cette bonne vieille régression linéaire sous Excel, par exemple) et le machine learning. C’est à la fois la « longueur » (le nombre d’observations) et la « largeur » (le nombre de descripteurs par observation) des données qui ont modifié les algorithmes, ces derniers existant uniquement car nous disposons désormais de la puissance de calcul nécessaire. Par exemple, un algorithme d’apprentissage automatique peut classer un produit d’après son apparence extérieure en une fraction de seconde, quand un humain aura besoin de plusieurs secondes par produit et ne pourra pas traiter les centaines de catégories possibles. Andrej Karpathy, expert en deep learning (ou apprentissage profond) et directeur de l’IA chez Tesla, s’est essayé à cette tâche face à la machine. Il s’est entraîné pendant des mois et, au début, il passait près d’une minute par image. Il a obtenu un taux d’erreur de 5,1 % quand GoogLeNet, la solution de machine learning utilisée pour mener l’expérience, a obtenu un score de 6,67 % en donnant une réponse immédiate à chaque fois. La solution de machine learning s’avère donc plus adaptée pour la production et l’application à grande échelle. Aujourd’hui, les solutions algorithmiques atteignent un taux d’erreur de 3,46 % et sont à la fois plus rapides et plus précises que les humains.
Quelles sont les différences entre l’intelligence artificielle, le machine learning et le deep learning ?
L’ intelligence artificielle a pour but de parvenir à automatiser des tâches complexes. Pour cela, elle a recours à différentes méthodes dont le machine learning. Lorsqu’il traite des entrées abstraites comme du texte, des images ou de l’audio, le machine learning peut se baser sur un type d’algorithmes spécifique appelé algorithme de « deep learning ». Un aspirateur intelligent, par exemple, qui détecte les murs au moyen de capteurs correspond à une intelligence artificielle sans machine learning, tandis qu’un aspirateur qui apprend à quel moment nettoyer et où il est nécessaire de passer plus souvent, en se basant sur l’historique de nettoyage, est une IA qui utilise le machine learning (mais sans deep learning). Enfin, si l’aspirateur est équipé d’une caméra lui permettant de détecter votre bébé ou votre chien, on est alors en présence d’une IA avec utilisation de deep learning.
Les solutions de machine learning peuvent être classées en 3 catégories, qui seront présentées plus en détails dans de prochains articles :
- L’apprentissage supervisé (supervised learning), qui consiste à « prédire » un comportement futur en se basant sur les données passées ;
- L’apprentissage non supervisé (unsupervised learning), qui consiste à regrouper des observations similaires ;
- et l’apprentissage par renforcement ( reinforcement learning), qui consiste à interagir avec l’environnement en vue d’atteindre un objectif prédéterminé.
À bientôt pour la suite !