Nous entendons depuis plusieurs années, ce terme revenir dans l’actualité ou nos discussions, avec une promesse de révolution à venir.

Qu’est-ce que ce terme d’IA signifie vraiment ? Il est souvent associé à d’autres expressions plus ou moins absconses telles que machine learning, big data, web sémantique, réseau de neurones…

Contrairement à ce que nous pourrions penser, la plupart des progrès que nous voyons apparaitre dans ce domaine, sont basés sur des algorithmes, qui pour certains, datent de plus de 30 ans ! Ce qui a changé : Internet et son volume de données illimité ainsi que la puissance des processeurs et donc de calculs qui permettent d’avoir des résultats dans un délai acceptable.

Le Groupe Achat Solutions investit dans la mise en œuvre de ces nouvelles techniques notamment dans sa plateforme d’E-sourcing Sélénée. Nous n’en sommes qu’au début mais des exemples concrets de mise en application existent déjà dans Sélénée et d’autres sont à venir prochainement.

En 2019, grâce à l’expertise de datascientist, nous avons structuré notre 1er projet d’analyse de données.

1# Cas concret basé sur du prédictif : Construction d’un score indiquant la probabilité qu’une entreprise remporte un marché public

Ce scoring est basé sur plusieurs point d’entrées utilisant les informations issues des données ouvertes (OPEN DATA) :

  • Le premier point d’entrée est la base OPEN SIRENE qui contient des informations telles que l’ancienneté, le nombre de salariés et la taille de l’entreprise qui permet de savoir s’il vaut mieux être une petite, moyenne ou grande entreprise. Cette base OPEN SIRENE est directement alimentée par les données de l’INSEE.
  • Le second point d’entrée provient des DONNEES ESSENTIELLES qui nous fournissent des informations telles que le montant d’un marché remporté, le titulaire de ce marché, la durée et l’objet du marché. Ces données sont également en libre accès et accessibles à tous depuis la publication des articles L. 2196-2 et L. 3131-1 du code de la commande publique

Le modèle algorithmique s’est entrainé sur ce couple OPEN SIRENE – DONNEES ESSENTIELLES grâce à un réseau de neurones qui compile ces données et nous retourne un résultat sous forme de scoring (note sur 20) ou de pourcentage. Sa finalisation sera effectuée en 2020.

A savoir que le réseau de neurones fait partie d’une architecture de calculs parmi d’autres architectures de calculs. Il fait partie de la famille du machine learning. Notre projet s’entraine grâce à son « alimentation positive » par des exemples de marchés remportés et une « alimentation négative » par des fournisseurs n’ayant pas remporté de marchés (offres électroniques déposées mais non titulaires du marché) – C’est grâce à cet entrainement que le système pourra ensuite nous prédire les chances pour une entreprise de remporter ou non un appel d’offres.

2# Projet basé sur le Traitement Automatique du Langage Naturel (TALN) ou Natural Langage Processing (NLP) – Utilisation de mots clés ou de métiers en lieu et place d’une codification CPV

L’utilisation du traitement automatique du langage naturel prend toute sa place dans Sélénée à différents niveaux. Lors du paramétrage du compte et du choix du domaine d’activité ou beaucoup plus important, dans l’annuaire, sous forme de recherche sémantique. L’idée étant de s’approcher d’une recherche type Google.

Le TALN est une branche importante du machine learning.

Différentes techniques vont permettre de nous approcher de ce « Graal ».

Par exemple la lemmatisation est un procédé lexical qui nous permet de regrouper les mots d’une même famille. Un exemple simple est avec l’adjectif grand, grande, grandes. Un autre exemple un peu plus complexe, en tout cas informatiquement parlant, est le verbe être : est, sois, fut, était…

Beaucoup d’autres solutions sont utilisées, comme le fuzziness qui permet de prendre en compte les mots même lors de fautes d’orthographe, inversion de lettre, lettre manquante (contat au lieu de contrat), les stop words permettant d’exclure les mots qui ne sont pas porteurs (de, en, à…), la synonymie grâce à la mise en place d’un dictionnaire de correspondance (scolaire, école)

La recherche et l’analyse sémantique sont un vaste sujet que nous allons travailler sur l’année 2020. Nous souhaitons amener plus d’intelligence et permettre à Sélénée de comprendre le sens d’une phrase et non faire une simple analyse par mots-clés.

3# Projet permettant de répondre aux demandes des utilisateurs de sélénée.fr – Chatbot conversationnel

Nous allons rapidement mettre en place un ChatLive, qui permettra aux utilisateurs d’échanger par écrit et en direct avec les équipes de Sélénée.

Notre objectif est d’ensuite basculer sur un ChatBot. Dans ce cas, les utilisateurs seront amenés à échanger avec un assistant virtuel qui répondra aux demandes des utilisateurs, grâce à l’intelligence artificielle. Ce ChatBot sera basé également sur l’analyse sémantique que nous avons abordée ci-dessus.

Il ne remplace pas un humain mais se positionne comme un assistant qui sera disponible 24h/24h et 7J/7j.

L’avis de l’expert

« En ce début d’année 2020, l’IA devient incontournable. Vous en entendrez forcement parler dans votre cadre professionnel ou dans les médias. La valeur n’est pas dans la donnée brute, mais dans l’intelligence que nous mettons dans son analyse.

En tant que Groupe leader sur le marché de l’achat public, nous allons développer l’usage de l’IA pour offrir à nos clients des solutions à forte valeur ajoutée. »

Didier LOUISIN, Chef produit SÉLÉNÉE