Copie du premier mètre étalon, scellé dans les colonnes d’un batiment, 36 rue de Vaugirard, Paris (source wikipedia, auteur Ken Eckert)

Data : quels référentiels à l’ère de l’IA ?

Millionroads
8 min readMay 7, 2020

Les référentiels métiers se sont construits dans le temps comme des objets repères relativement figés. L’avènement de la data dans un contexte où la forte évolution des métiers et des compétences impose de se former toute au long de la vie, interroge cette logique documentaliste de description de la réalité. À l’ère de l’Intelligence Artificielle, la richesse de la data permet de renouveler l’approche, voire de la renverser, car elle répond à l’ambition d’exhaustivité et de lisibilité inédite.

Par Benoit Bonte — Co-fondateur et CEO -Millionroads

L’aporie des référentiels ou la fin de l’encyclopédie

Le rêve inaccessible du documentaliste ou l’impossible encyclopédie

De la nécessité d’organiser la connaissance de notre monde est née l’encyclopédie de Diderot et d’Alembert. Quelques individus pouvaient alors rêver de circonscrire scientifiquement le monde en quelques volumes. Ouvrage majeur du XVIIIe siècle, composé de 17 volumes de textes et 11 volumes de planches, “l’Encyclopédie ou Dictionnaire raisonné des sciences, des arts et des métiers” fut éditée de 1751 à 1772 sous la direction de Diderot et d’Alembert. Cette première encyclopédie française fut conçue comme un vaste système de classement, de hiérarchisation et d’appréhension des connaissances humaines.
Aujourd’hui consultable en grande partie sur Gallica, elle est composée de volumes d’articles, classés par ordre alphabétique, et de volumes de gravures, établis par thématique.

Lien vers l’Encyclopédie sur Gallica

Pour ma génération, Encyclopédie rimait avec Universalis. Ces vingt ou trente volumes ont été achetés au fur et à mesure par nos parents à des vendeurs en porte-à-porte. Nous les avons certes consultés occasionnellement mais l’arrivée de l’Internet pendant notre adolescence a eu vite fait de les rendre obsolètes.

Jusqu’à aujourd’hui la même démarche a conduit nombre de scientifiques et de documentalistes à élaborer thésaurus et référentiels, le plus souvent sous forme d’arbres regroupant sous de grandes catégories des réalités de plus en plus spécifiques.

Dans le monde de l’emploi et de la formation, l’idée de décrire les activités professionnelles pour pouvoir en parler et apprendre à mieux les connaître s’est faite jour notamment avec la massification de l’enseignement (lire notre série d’articles Data et formation : la révolution copernicienne).

Ce référentiel est devenu une nécessité et une boussole pour les individus, les institutions, les établissements de formation qui plus que jamais sont dans une logique professionnalisante. Ils sont donc en réflexion constante sur l’adéquation entre les besoins des entreprises et les compétences transmises. Il est donc essentiel d’adopter un langage commun sur ce que revêt tel ou tel métier, leur contexte d’exercice et d’identifier les compétences professionnelles attendues, notamment dans le cadre de la VAE.

Voici une définition du référentiel donnée par Stéphane Balas dans sa thèse :

Un référentiel est un document textuel qui cherche à décrire une réalité, souvent complexe, pour qu’elle fasse « référence » et qu’ainsi, elle devienne discutable pour chacun. Il existe des référentiels de diplômes professionnels, des référentiels de compétences utilisés dans l’entreprise, des référentiels d’évaluation, de formation…
Cependant, la conception de référentiels pose question sur deux plans : aux problèmes méthodologiques souvent mis en avant, s’ajoutent de vrais enjeux théoriques. La question est de parvenir à saisir, dans un document par nature inerte et généralisant, une activité de travail dynamique et singulière.

Ces référentiels métiers sont réalisés par des équipes de documentalistes dont l’ambition est de faire entrer le monde des métiers dans une description statique à un instant T. De la même manière l’Encyclopédie du 18ème siècle prétendait réunir tous les savoir en un seul et même ouvrage. Au fil du temps les volumes encyclopédiques se sont accumulés, ils ont dû être réactualisés à un rythme toujours plus soutenu, et l’accélération des mutations à l’ère du digital leur a donné un coup de grâce. Si on pouvait encore trouver au début des années 2000 des personnes pour prétendre que Wikipédia ne remplacerait jamais Universalis ou Britannica, cela n’est plus vraiment le cas.

Le cas du référentiel métier

Dans le cas des référentiels de métiers, ceux qui font référence sont notamment ceux de l’Onisep et du Répertoire Opérationnel des Métiers et des Emplois (ROME). Celui de l’Onisep contient plus de 700+ fiches métiers et connaît une évolution dont on discerne de plus en plus les limites du “temps de travail homme” évoqué précédemment. On trouvera par exemple une entrée BIM Manager mais pas d’entrée data scientist. Et on ne parle même pas du métier de youtuber ou de pilote de drône.

Quant au ROME il est sans doute encore utilisé mais il n’est plus actualisé et, de l’aveu même de Pôle emploi, il est progressivement abandonné au profit d’une approche par les compétences.

Ces référentiels font face à quatre difficultés majeures :

  • la nécessaire généralisation d’un métier aux réalités terrain bien différentes rend l’exercice de standardisation difficile. Par exemple, Technicien de maintenance au sein de grands groupes industriels requiert des compétences en Intelligence Artificielle et en logique prédictive, là où ce même travail au sein d’une PME exigera le suivi d’une maintenance plus classique
  • la gestion de nombreux intitulés métiers proches et parfois synonymes. Ajoutons à cela les nombreux anglicismes qui transforment petit à petit le paysage de ces intitulés.
  • la mise à jour rapide des nouveaux métiers : pilote de drone, youtubeur ou youtubeuse, BIM manager pour n’en citer que quelques uns. Et de ceux qui disparaissent, et donnent même lieu à des publication : https://www.vieuxmetiers.org/
  • l’actualisation des référentiels existants qui doivent évoluer en même temps que la réalité des métiers au fil du temps

Et pour celui qui cherche à s’orienter ?

Plus perdu que le documentaliste, il y a l’individu qui cherche à s’orienter et consulte des informations souvent pas assez actualisées (les vidéos montrent encore régulièrement des matériels informatiques ou autres équipements obsolètes). Les conséquences du manque d’actualisation ne sont pas négligeables car l’individu risque de passer à côté d’opportunités professionnelles. On en revient à l’aporie de ce travail de documentation, à l’impossibilité de circonscrire la réalité vivante.

Comme le disait l’anthropologue Georges Devereux en 1967 :

« Par malheur, même la meilleure méthodologie peut être inconsciemment et abusivement utilisée d’abord comme un ataraxique, un artifice atténuant l’angoisse ; elle donne alors des « résultats » […] qui sentent la morgue et n’ont pratiquement plus de pertinence en termes de la réalité vivante ».

Autre conséquence dommageable, l’effort réalisé pour s’emparer d’une réalité dont on ne peut faire le tour donne lieu à des centaines de descriptions indigestes : une seule fiche demande beaucoup de lecture et l’on sait bien que les nouvelles générations sont de moins en moins enclines à l’exercice. Les professionnels de l’orientation n’ont de cesse de chercher de nouvelles manières d’appréhender les métiers : par exemple, depuis plusieurs années de nouvelles plateformes proposent des mises en relation directes avec des professionnels.
Pascal Chaumette, fondateur de la start-up d’État Diagoriente partage les résultats des tests que ses équipes ont réalisés auprès de milliers de jeunes qu’ils accompagnent : “Lorsque la première information communiquée sur un métier prend la forme d’un texte, ils décrochent à la troisième phrase et ce même lorsque l’environnement est ergonomique et épuré. Une enquête vers les jeunes utilisateurs montre que plus de 49% souhaitent d’abord un premier contact avec un professionnel pour une première information métier.”

Une partie de la question centrale est donc : comment refléter et documenter la transformation digitale en temps réel ?

Le référentiel de demain, un commun à co-construire ?

Les algorithmes et le langage naturel

Ce qu’on appelle l’IA, l’intelligence artificielle, appliquée au traitement du langage naturel, apporte toute une série d’algorithmes permettant d’organiser et de faire parler la donnée afin de :

  • repérer automatiquement de nouveaux concepts. Par exemple en faisant ressortir les termes les plus populaires dans un corpus de mots. Ainsi en analysant les intitulés de poste présents dans des millions de CVs décrits par les professionnels eux-mêmes, on va se retrouver devant une liste de termes que l’on pourra classifier a posteriori, sans avoir à mener d’enquête. La pertinence de ces termes n’est pas en question car c’est l’usage qui les valide de fait.
  • caractériser la fréquence des concepts et évolution dans le temps : cela permet de faire émerger des signaux faibles. Si l’occurrence du concept “Pilote” associé au concept “Drone” apparaît de plus en plus souvent sur les derniers mois ou les dernières années alors il y a de forte chances qu’il faille s’y intéresser pour comprendre qu’il ne s’agit pas d’un nouveau métier.
  • analyser les CVs : par exemple, l’association automatique des compétences à des métiers est possible en repérant celles qui sont le plus souvent déclarées par les professionnels exerçant ce métier.
  • réaliser une étude de similarité : il existe en effet toute une série d’algorithmes qui permettent d’étudier et de rapprocher les terminologies : soit sur la base de l’analyse des parcours et des compétences, soit sur l’analyse de la sémantique elle-même. Cette similarité peut être décrite de manière plus complexe grâce aux nouvelles bases de données appelées “graphs”. Exemple : le référentiel de compétences, impossible à cartographier dans une arborescence de type thésaurus classique, mais que l’on peut représenter grâce à une visualisation en trois dimensions. La datavisualisation quant à elle, jusqu’ici trop peu intuitive, s’est récemment rendue accessible au plus grand nombre, grâce notamment aux solutions développées chez Millionroads.
https://www.clustree.com/competences-nouvelle-monnaie-travail/

Le Data story telling

Organiser des millions de parcours au sein d’une classification qui cherche en permanence à gérer la complexité permet de raconter la réalité du métier à partir des trajectoires types, riches car documentées par des exemples réels.

C’est ce que propose le GPS Millionroads, véritable simulateur de carrières basé sur un discours de preuve. Ce GPS permet de vulgariser le graph 3D ci-dessus. Mieux, après l’avoir simplifié, il le personnalise en prenant compte de la situation de l’utilisateur. Il accède à des histoires types qui lui parlent au travers de la réalité des trajectoires possibles pour lui.

Parcours utilisateur sur le GPS de l’Université d’Angers
après une Licence de Droit

L’observatoire des métiers de la solution Analyser référence quant à lui plus de 10.000 intitulés de métiers. Il permet de comprendre leurs relations et donne du sens aux directions des trajectoires des professionnels avant, pendant et après le passage dans l’établissement de formation, à travers plus de cinquante indicateurs. Il analyse également les tendances sur les dernières années et permet l’étude de sujets spécifiques tels la représentativité internationale, la féminisation, l’intelligence artificielle ou encore l’émergence de nouvelles compétences.

Analyse des trajectoires professionnelles et des signaux faibles
sur Analyser

Ces deux solutions numériques, fruit de cinq années de R&D contribuent aux premiers pas vers un nouveau référentiel basé sur l’analyse de la donnée en temps réel. Pour aller plus loin celui-ci devrait pouvoir impliquer aussi bien les branches professionnelles (qui possèdent souvent leur propre observatoire) et les actifs eux-mêmes. Tous seraient alors impliqués dans un “commun”, entendons par là le fait que personne n’en détiendrait la totalité mais chacun, en apportant sa connaissance (à commencer par son propre parcours), accéderait à un référentiel d’une richesse inégalée et mise à jour en temps réel.

--

--