23 Sous le capot des algorithmes de Machine Learning I: Modèles - Blog Nexeo
Technologies/IT

Sous le capot des algorithmes de Machine Learning I: Modèles

1 octobre 2019

Machine Learning, Intelligence Artificielle, Algorithmes prédictifs sont des mots récurrents dans les articles et les nouvelles. Mais que signifient ces termes et quel sens réel derrière?

 

Les applications sont nombreuses:

La détection de fraudes, de spams, la prédiction de la consommation d’énergie, la reconnaissance d’objets complexes dans les images, la voiture autonome, les jeux de stratégie tels que le go, les échecs et même des jeux vidéos comme Starcraft 2, Dota 2…

En plus d’automatiser ces tâches, les “machines” finissent même par surpasser l’Homme!

Quelle est la raison de leur efficacité déconcertante?

Le but de cette série d’articles est de présenter de manière vulgarisée les concepts de base du Machine Learning, au travers d’un exemple et de convaincre que ce n’est certainement pas de la magie, mais des mathématiques!

 

On agrémentera la série d’articles de quelques devises shadoks bien choisies:

 

Le Machine Learning est un modèle   

En gros, on peut voir un modèle de Machine Learning comme une machine (une fonction en mathématiques) qui va, à partir de données, renvoyer une prédiction. En règle générale, ce sont des labels:

Dans le cadre du tri des mails par exemple, le modèle prend les mots contenus dans le mail et renvoie spam ou non-spam.

Dans le cadre de la détection de fraude, le modèle pourrait prendre par exemple des caractéristiques d’une transaction tels que le montant, la fréquence etc… et renvoie fraude ou non fraude.

Les caractéristiques que l’on donne au Modèle (à gauche) sont regroupées sous le nom de vecteur d’observations et la prédiction associée est appelée le label ou étiquette.

 

Un modèle simple: la droite (SVM)

(Ceci est une sur-simplification de la SVM)

Imaginons que l’on puisse représenter nos caractéristiques dans un plan, chaque mail ou chaque adresse est donc un couple de coordonnées selon deux axes, x et y.

 

On souhaite séparer ces points, c’est-à-dire établir deux régions concrétisées par une frontière de telle sorte à ce que les points fraudes / spam soient dans une même région et les points non-frauduleux / non-spam dans une autre.

La fonction la plus simple qu’on connaît c’est la fonction affine, elle ressemble à une ligne. Elle a le bon goût d’être facile à déterminer, en effet:

Avec une “ pente “ et une “ ordonnée à l’origine “ on peut décrire toutes les droites qui existent ! Un tel modèle est qualifié de modèle paramétrique.

L’idée étant de trouver la “ meilleure droite “ celle qui sépare bien les points labellisés + des points labellisés – (Schéma ci-dessus).

Déterminer la meilleure droite, revient donc à déterminer les deux paramètres optimaux de cette droite.

 

Comment va-t-on faire? Avec les données pardi !

C’est ce que nous verrons dans le prochain article !

Ajouter un commentaire


Votre commentaire sera modifié par le site si besoin.

À lire également

On a précédemment vu un modèle simple de neurone, permettant de reconnaître des chiffres. À présent, plutôt…

“En essayant continuellement on finit par réussir. Donc: plus ça rate, plus on a de chance que…

“Quand on ne sait pas où l’on va, il faut y aller… Et le plus vite possible.”…