La semaine dernière, j’ai été invité à CogX UK, un événement axé sur les nouvelles technologies, comme l’intelligence artificielle, l’innovation, etc. Evidemment, des centaines de présentations extraordinaires ont eu lieu que je n’ai malheureusement pas pu voir. En revanche, certains points ont attiré mon attention à cause de ma déformation professionnelle.
Notamment, Stuart Russell a beaucoup parlé du fait que la programmation probabiliste (statistique) est en phase de croissance exponentielle ces derniers temps (nous avons déjà rapidement parlé de PP avant).
Des raisons expliquant une telle croissance ?
- capacité à utiliser les « petites données » (« small data »);
- capacité à obtenir les modèles plus sensibles (son exemple : données sismiques) ;
- capacité à inclure dans les modèles les connaissances que nous avons concernant le monde qui nous entoure ;
- c’est relativement facile de construite un modèle PP.
En même temps, il y a des publications qui montrent qu’il y a un « bug » dans les systèmes de deep learning. En effet, souvent, SI DL ne cherchent pas du tout ce que nous voulons – parfois ils se repèrent avec des indicateurs secondaires (exemple : classification d’image comme « image de chien » à cause de fait qu’il y a un coussin sur l’image). De plus, certaines choses ne sont pas si faciles à changer/améliorer/modifier dans DL.
Conclusion : il y a un nombre de cas où l’approche DL n’est pas adaptée.
Stuart Russell n’est pas un « puriste » de la théorie de probabilités. Ainsi, il prévoit l’utilisation de PP combinée avec les systèmes de DL (son exemple : les voitures autonomes où le système de perception peut se baser sur DL et le système de conduite – sur PP). Une autre direction très intéressante qui a été presque abandonnée avec l’arrivée des RNNs et transformers – NLP – là où les systèmes PP peuvent regagner sa place.
Les résultats d’une telle ouverture – la croissance de langages et de modules spécialisés : Edward (http://edwardlib.org/), Pyro (https://pyro.ai/), Infer.Net (https://dotnet.github.io/infer/default.html), Tabular et plein d’autres. Evidemment, pour les systèmes spécifiques, il faudra construire des modèles spécialisés avec prise d’intégrales (car PP « classique » basée sur MCMC et sur les variations d’algorithmes de Metropolis / Gibbs / … est généralement assez lente), mais pour plein d’autres tâches PP peut être suffisant.
Une autre bonne raison qui peut nous orienter vers la PP, c’est notre capacité à expliquer son fonctionnement (ou obtenir le fonctionnement souhaité « par construction »). Pourquoi ? Sur CogX il y avait plusieurs présentations autour de systèmes explicables et le droit à l’explication – visiblement, ça semble être un sujet préoccupant.
Que veut-il bien dire ?
Si vous construisez un algorithme DL pour les jeux vidéo ou pour traiter les « petits bobos » d’une entreprise : aide à la classification des produits, aide à la gestion de doublons – très probablement cela vous concerne peu. Par contre, si votre algorithme est utilisé pour le scoring de crédits, dans l’évaluation RH – partout où cela peut avoir un impact sur la vie d’homme – vous pouvez être tenus responsables pour le fonctionnement de votre système et des résultats induits. Vous allez vous retrouver face à des questions du type et on a le droit de vous poser la question « pourquoi l’algorithme a pris telle décision ». C’est déjà (presque) vrai pour l’UE et ça sera vrai bientôt sur la territoire d’UK (si je ne me trompe pas, il y a une période de transition d’autour de 2 ans).
Le cas le plus cité c’est celui d’Uber qui a un système automatique qui détecte les « mauvais » chauffeurs sur l’ensemble de critères. En utilisant ce système Uber croyait pouvoir licencier ses chauffeurs sans explication de raisons… Visiblement ces pratiques vont prendre fin, en tout cas sur la territoire européen – les systèmes futurs vont devoir donner des explications et les raisons d’actions afin qu’ils puissent être contrôlés par les humains, qui eux seront tenus responsables.
Je ne pratique pas la voyance, mais je suppose que ces raisons vont pousser la PP – et bientôt on entendra les débats qui citent le théorème de Cox-Jaynes. N’est ce pas le bon moment pour se lancer ?
Bonne santé à vous et à vos systèmes.