Artefact Research Center

Combler le fossé entre le monde universitaire et les applications industrielles.

Recherche sur des modèles plus transparents et plus éthiques visant à favoriser l'adoption du modèle AI par les entreprises.

ARTEFACT RESEARCH CENTER

Exemples de biais liés au modèle AI

  • AppleCard accorde des hypothèques basées sur des critères racistes
  • Lensa AI sexualise les selfies des femmes
  • Classification d'images racistes sur Facebook avec des Afro-Américains assimilés à des singes
  • Le chatbot Twitter de Microsoft devient nazi, sexiste et agressif
  • Je ne peux pas répondre à cette demande. Je ne peux pas créer de contenu qui promeut des stéréotypes nuisibles ou discriminatoires.

Défi actuel

Les modèles AI sont précis et faciles à mettre en œuvre dans de nombreux cas d'utilisation, mais restent incontrôlables en raison de leur nature opaque et des questions éthiques qu'ils soulèvent.

La mission du Artefact et du Research Center.

Un écosystème complet qui fait le lien entre
recherche fondamentale et applications industrielles tangibles.

The Artefact Research Center's mission.
Emmanuel MALHERBE

Emmanuel MALHERBE

Chef de la Recherche

Domaine de recherche : Apprentissage profond, Apprentissage automatique

Après avoir obtenu un doctorat sur les modèles de TALN adaptés au recrutement en ligne, Emmanuel a toujours cherché à trouver un équilibre efficace entre la recherche fondamentale et les applications concrètes. Son expérience en recherche comprend la prévision de séries chronologiques 5G pour Huawei Technologies et la mise au point de modèles de vision par ordinateur destinés aux clients des salons de coiffure et de maquillage chez L’Oréal. Avant de rejoindre Artefact, il a travaillé à Shanghai en tant que responsable de la recherche AI pour L’Oréal Asie. Aujourd’hui, son poste chez Artefact lui offre une opportunité parfaite et un environnement idéal pour faire le lien entre le monde universitaire et l’industrie, et pour développer ses recherches axées sur le monde réel tout en ayant un impact sur les applications industrielles.

Découvrez nos dernières actualités sur les modèles Artefact et Research Center

Domaines de recherche transversaux

Grâce à notre positionnement unique, nous souhaitons relever les défis généraux liés au programme AI, qu'il s'agisse de modélisation statistique ou de recherche en gestion.
Ces questions sont transversales à toutes nos matières et nourrissent notre recherche.

Control & accountability

Contrôle &
responsabilité

  • Modèles contrôlables avec garanties sur les prédictions
  • Interface avec les planificateurs de la demande
  • Chefs de catégorie
  • Décision par le meilleur modèle entrée : imposer une prédiction fiable même en dehors de l'ensemble d'entraînement
  • Exemple : Imposer la monotonie sur les variables d'entrée
Explainability & transparency

Explicabilité
et transparence

  • Interprétation des prédictions
  • Interface et visualisation pour les utilisateurs non techniques
  • Adapter les modules et composants des modèles aux métiers
  • Visualisation sur des entrées compréhensibles, avant l'ingénierie des caractéristiques
Bias & uncertainty

Biais et
incertitude

  • Enrichir la prédiction pour de meilleures décisions
  • Incertitude non symétrique (vs gaussienne) requise par les clients
  • Adapté à l'optimisation des séries chronologiques et des assortiments
Obstacles & accelerators of AI in business

Obstacles et catalyseurs de la stratégie AI dans le monde des affaires

  • Étude des organisations
  • Interviews des principaux acteurs et décideurs du CAC 40
  • Impact de AI sur l'éthique, l'équité et l'interprétabilité
  • Gouvernance, normes et réglementations relatives aux applications AI

Un écosystème complet qui comble le fossé entre la recherche fondamentale et les applications concrètes de l'industrie.

A full ecosystem bridging the gap between fundamental research and industry tangible applications.

Sujets

Nous travaillons sur plusieurs sujets de thèse à l'intersection des cas d'utilisation industriels et des limitations de pointe.
Pour chaque matière, nous travaillons en collaboration avec des professeurs d'université et disposons d'équipements industriels de pointe qui nous permettent d'aborder les principaux axes de recherche dans un contexte concret.

1 — Prévisions et Tarification

Modéliser la série temporelle dans son ensemble avec un modèle de prévision multivarié et contrôlable. Une telle modélisation nous permettra d'aborder la planification des prix et des promotions en trouvant les paramètres optimaux qui augmentent les prévisions de ventes. Avec une approche aussi holistique, nous visons à capturer la cannibalisation et la complémentarité entre les produits. Cela nous permettra de contrôler les prévisions avec la garantie que les prédictions restent cohérentes.

Mohamed CHTIBA

Mohamed CHTIBA

Chercheur scientifique
sur la prévision et la tarification

Artefact
Université paris 1 Panthéon sorbonne

Domaine de recherche

Apprentissage profond, Optimisation, Statistiques

Jean-Marc BARDET

Jean-Marc BARDET

Professeur

Laboratoire SAMM

Université paris 1 Panthéon sorbonne

Domaine de recherche

Processus stochastiques, Statistiques, Probabilités

Joseph RYNKIEWICZ

Joseph RYNKIEWICZ

Maître de conférences

Laboratoire SAMM

Université paris 1 Panthéon sorbonne

Domaine de recherche

Séries temporelles, réseaux neuronaux, statistiques

2 — Scoring explicable et contrôlable

Une famille de modèles d'apprentissage automatique largement utilisée repose sur les arbres de décision : les forêts aléatoires et le boosting. Bien que leur précision soit souvent à la pointe de la technologie, ces modèles souffrent d'un manque de transparence, ce qui limite le contrôle dont dispose l'utilisateur. Notre objectif est d'améliorer leur explicabilité et leur transparence, généralement en affinant l'estimation des valeurs SHAP dans le cas d'ensembles de données déséquilibrés (data). Nous visons également à fournir certaines garanties pour ces modèles, par exemple pour les échantillons hors formation ou en permettant de meilleures contraintes monotones.

Abdoulaye SAKHO

Abdoulaye SAKHO

Chercheur scientifique sur
TModèles basés sur les arbres

Artefact
Sorbonne Université

Domaine de recherche

Statistiques, explicables AI

Erwan SCORNET

Erwan SCORNET

Professeur

Laboratoire LPSM

Sorbonne Université

Domaine de recherche

Forêts aléatoires, Interprétabilité, Valeurs manquantes

3 — Optimisation de l'assortiment

La composition de l'assortiment constitue un enjeu commercial majeur pour les détaillants, qui se pose lors du choix de l'ensemble des produits à vendre en magasin. À l'aide de grands ensembles de données industrielles et de réseaux neuronaux, nous cherchons à développer des modèles plus robustes et plus interprétables, capables de mieux refléter les choix des clients face à un assortiment de produits. La prise en compte de la cannibalisation et des complémentarités entre les produits, ainsi qu'une meilleure compréhension des segments de clientèle, sont essentielles pour déterminer l'assortiment de produits le plus optimal pour un magasin.

Vincent AURIAU

Vincent AURIAU

Chercheur scientifique sur l'optimisation des assortiments

Artefact
Centrale Supélec
Université Paris Saclay

Domaine de recherche

Apprentissage profond,
Recherche opérationnelle

Vincent MOUSSEAU

Vincent MOUSSEAU

Professeur

Laboratoire MICS

Centrale Supélec
Université Paris Saclay

Domaine de recherche

Apprentissage des préférences, Aide à la décision multicritère, Recherche opérationnelle

Antoine DESIR

Antoine DESIR

Maître de conférences

Laboratoire TOM

Insead

Domaine de recherche

Modélisation du choix, Optimisation des assortiments, Recherche opérationnelle

Ali AOUAD

Ali AOUAD

Professeur adjoint

Gestion et sciences de l'exploitation

London Business School

Domaine de recherche

Appariement dynamique, Modélisation des choix, Optimisation des assortiments et des stocks, Algorithme d'approximation, Recherche opérationnelle

4 — Adoption de la norme AI dans les entreprises

Le défi pour une meilleure adoption du AI dans les entreprises consiste, d'une part, à améliorer les modèles AI et, d'autre part, à comprendre les aspects humains et organisationnels. À la croisée de la recherche qualitative en gestion et de la recherche sociale, cet axe vise à explorer les difficultés rencontrées par les entreprises lors de l'adoption des outils AI. Les cadres existants sur l'adoption de l'innovation ne sont pas entièrement adaptés aux innovations en matière d'apprentissage automatique, car il existe des différences typiques en matière de réglementation, de formation des personnes ou de biais lorsqu'il s'agit de AI, et plus encore avec le AI génératif.

Lara ABDEL HALIM

Lara ABDEL HALIM

Chercheur spécialisé dans l'adoption de la norme AI par les entreprises

Artefact
École Polytechnique

Domaine de recherche

Recherche en management, Innovation

Cécile CHAMARET

Cécile CHAMARET

Professeur

Laboratoire CRG

École Polytechnique

Domaine de recherche

Innovation, Marketing, Recherche Sociale Qualitative

5 — Le développement durable au service de l'initiative Data

Le projet mobilisera des méthodes de recherche qualitatives et quantitatives et répondra à deux questions clés : Comment les entreprises peuvent-elles mesurer efficacement la performance en matière de développement durable social et environnemental ? Pourquoi les mesures de durabilité échouent-elles souvent à apporter des changements significatifs dans les pratiques organisationnelles ?

D'une part, le projet vise à étudier les indicateurs data-driven et à identifier des indicateurs permettant d'aligner les procédures organisationnelles sur les objectifs de durabilité sociale et environnementale. D'autre part, le projet s'attachera à traduire ces mesures de durabilité en actions concrètes au sein des entreprises.

Oualid Mokhantar

Oualid Mokhantar

Chercheur scientifique en développement durable

Artefact
ESCP Business School

Domaine de recherche

Recherche en management, Économie

Gorgi KRLEV

Gorgi KRLEV

Maître de conférences

Département du développement durable

ESCP Business School

Domaine de recherche

Durabilité, Innovation sociale, Théorie des organisations

6 — Biais en vision par ordinateur

Lorsqu'un modèle émet une prédiction à partir d'une image, par exemple celle d'un visage, il a accès à des informations sensibles, telles que l'origine ethnique, le sexe ou l'âge, qui peuvent biaiser son raisonnement. Notre objectif est de développer un cadre permettant de mesurer mathématiquement ce biais, et de proposer des méthodologies pour le réduire pendant l'entraînement du modèle. De plus, notre approche permettrait de détecter statistiquement les zones de fort biais afin d'expliquer, de comprendre et de contrôler les endroits où ces modèles renforcent le biais présent dans le data.

Veronika SHILOVA

Véronika CHILOVA

Chercheur scientifique sur les biais en vision par ordinateur

Artefact
Université Toulouse 3

Domaine de recherche

Apprentissage profond, vision par ordinateur, biais

Laurent RISSER

Laurent RISSER

Ingénieur de recherche au CNRS

Institut de Mathématiques de Toulouse

Université Toulouse 3
CNRS

Domaine de recherche

Apprentissage automatique explicable, analyse d'images, interprétable et robuste AI

Jean-Michel LOUBES

Jean-Michel LOUBES

Professeur

Institut de Mathématiques de Toulouse

Université Toulouse 3
ANITI

Domaine de recherche

Apprentissage non biaisé, AI interprétable, transport optimal et applications aux statistiques et à l'apprentissage automatique

7 — LLM pour la recherche d'informations

Une application majeure des LLM est lorsqu'ils sont associés à un corpus de documents, qui représentent des connaissances ou des informations industrielles. Dans un tel cas, il y a une étape de récupération d'informations, pour laquelle les LLM montrent certaines limitations, telles que la taille du texte d'entrée, qui est trop petite pour indexer des documents. De même, l'effet d'hallucination peut également survenir dans la réponse finale, que nous visons à détecter à l'aide du document récupéré et de l'incertitude du modèle au moment de l'inférence.

Hippolyte GISSEROT-BOUKHLEF

Hippolyte GISSEROT-BOUKHLEF

Chercheur scientifique sur les grands modèles linguistiques pour la recherche d'informations

Artefact
Centrale Supélec
Université Paris Saclay

Domaine de recherche

Apprentissage profond, TALN

Pierre COLOMBO

Pierre COLOMBO

Maître de conférences

Laboratoire MICS

Centrale Supélec
Université Paris Saclay

Domaine de recherche

Modèles linguistiques à grande échelle, biais dans AI, évaluation des modèles

Céline HUDELOT

Céline HUDELOT

Professeur

Laboratoire MICS

Centrale Supélec
Université Paris Saclay

Domaine de recherche

Représentation des connaissances, Interprétation sémantique, Réseaux neuronaux

Les chercheurs à temps partiel du programme Artefact

Outre notre équipe dédiée à la recherche, nous avons plusieurs collaborateurs qui consacrent du temps à la recherche scientifique et à la publication d'articles. En travaillant également comme consultants, cela les inspire avec les problèmes concrets rencontrés par nos clients.

Hippolyte GISSEROT-BOUKHLEF

Michael Voelske

Depuis mai 2022, je dirige l'équipe Science et Ingénierie de Data chez Artefact Allemagne, où je mets à profit ma formation universitaire en informatique, avec un doctorat axé sur l'apprentissage automatique et la recherche d'informations, pour résoudre les problèmes commerciaux des clients de Artefact. Mon rôle consiste non seulement à diriger, mais aussi à inspirer mon équipe afin de combiner la recherche de pointe en AI avec des applications pragmatiques. Passionné par la vulgarisation des concepts complexes de AI, je m'efforce de tirer parti de la technologie pour proposer des solutions commerciales innovantes et avoir un impact significatif sur la société.

Artefact

Domaine de recherche

Applications des grands modèles linguistiques en recherche d'information et en TALN

Modèles explicables en apprentissage automatique, recherche et classement

RI pour les besoins d'information complexes et basés sur des tâches

Hippolyte GISSEROT-BOUKHLEF

Evan Hurwitz

Evan est titulaire d'un doctorat en ingénierie dans le domaine de l'IA, où il a appliqué des techniques d'IA pour optimiser un portefeuille géré activement à l'aide de multiples stratégies de trading. Il a mené des travaux de recherche dans le milieu universitaire, où il a coécrit l'ouvrage “ Intelligence artificielle et théorie économique : Skynet sur les marchés ”. Il s'est ensuite orienté vers les solutions d'énergie verte utilisant l'apprentissage par renforcement pour S&P Platts, après quoi il a travaillé avec Preqin sur l'intégration et la compréhension des investissements alternatifs data. Il a rejoint Artefact en 2020 et a travaillé dans de nombreux secteurs tels que la vente au détail, la cybersécurité, le SaaS, l'ingénierie, l'éducation et l'immobilier, avec des clients allant des PME aux entreprises du FTSE 100.

Artefact

Domaine de recherche

Apprentissage par renforcement

Apprentissage automatique

Finance et Jeux vidéo

Hippolyte GISSEROT-BOUKHLEF

Georges Cevora

George a obtenu son doctorat en neurosciences théoriques à l'université de Cambridge pour ses travaux sur la modélisation mathématique de l'apprentissage chez les animaux. George possède 10 ans d'expérience en recherche dans le domaine de l'apprentissage profond, qu'il met désormais en pratique dans le secteur industriel. Depuis qu'il a quitté le monde universitaire, George a travaillé dans un large éventail de secteurs et de domaines, allant des moteurs à réaction à la résistance aux antibiotiques. George a également passé quelques années dans le domaine de la sécurité nationale, où il a développé un produit visant à lutter contre la discrimination résultant d'une utilisation inappropriée de AI. Pour en savoir plus, rendez-vous sur www.cevora.xyz

Artefact

Domaine de recherche

Neurosciences

Apprentissage profond

Apprentissage automatique

Hippolyte GISSEROT-BOUKHLEF

Savio Rozario

Savio est titulaire d'un doctorat en physique expérimentale des plasmas laser de l'Imperial College de Londres, où il a utilisé des méthodes d'apprentissage automatique pour optimiser la configuration expérimentale de systèmes d'accélérateurs à plasma hautement non linéaires. Il a travaillé chez EY au sein du département R&D fiscal, où il a développé des solutions d'apprentissage automatique pour le contrôle de la conformité dans plusieurs zones géographiques à l'aide de grands modèles linguistiques. Il a rejoint Artefact en 2022 et a fourni des solutions scientifiques data de bout en bout dans divers secteurs, notamment la vente au détail, les transports et l'immobilier, pour des organisations du FTSE 250.

Artefact

Domaine de recherche

Apprentissage automatique

Optimisation non linéaire

Physique

Hippolyte GISSEROT-BOUKHLEF

Nelson Paix

Nelson a passé les dix premières années de sa carrière à la fois sur les marchés boursiers et sur ceux des matières premières, où il a mis en œuvre des stratégies de trading quantitatif sur les marchés de gré à gré. Après avoir obtenu son master en sciences en 2021, il a rejoint le bureau britannique de Artefact en tant que chercheur, où il travaille sur des problèmes scientifiques dans divers domaines, avec une expertise particulière dans les applications des marchés financiers et du trading.

Artefact

Publications

Articles de blog Medium par nos experts en technologie.

Détection des hallucinations dans les LLM, un token à la fois

Les grands modèles linguistiques sont étonnamment performants. Ils résument, traduisent, raisonnent et codent (mieux que moi). Mais contrairement à moi, ils sont également devenus tristement célèbres pour avoir inventé...

L'avenir d'Agentic AI reposera-t-il sur les graphes de connaissances ?

Alors que les entreprises s'empressent de mettre en œuvre le modèle AI, la plupart d'entre elles se rendent compte que leur infrastructure data n'a jamais été conçue pour le raisonnement autonome. Aujourd'hui, jusqu'à 80% des implémentations du modèle AI...

Enrichir l'expérience du bricolage : comment ADEO utilise AI pour relier contenu et savoir-faire

L'optimisation de l'assortiment est un processus essentiel dans le commerce de détail qui consiste à proposer le mélange idéal de produits pour répondre à la demande des consommateurs tout en tenant compte des nombreuses logistiques...

MotherDuck expliquée : comment la solution AI et d'analyse de nouvelle génération s'intègre à votre infrastructure Data

MotherDuck étend les capacités analytiques de DuckDB au modèle cloud en y ajoutant des fonctionnalités collaboratives, offrant ainsi des performances quatre fois supérieures à celles de BigQuery et permettant de réaliser des économies par rapport aux entrepôts de données traditionnels de type data grâce à...

Optimisation de l'assortiment avec des modèles de choix discrets en Python

L'optimisation de l'assortiment est un processus essentiel dans le commerce de détail qui consiste à proposer le mélange idéal de produits pour répondre à la demande des consommateurs tout en tenant compte des nombreuses logistiques...

L'alignement des préférences est-il toujours la meilleure option pour améliorer la traduction basée sur les grands modèles linguistiques ? Une analyse empirique

Les métriques neuronales pour l'évaluation de la traduction automatique (TA) sont devenues de plus en plus importantes en raison de leur meilleure corrélation avec les jugements humains par rapport aux métriques lexicales traditionnelles.

Choice-Learn : Modélisation de choix à grande échelle pour des contextes opérationnels à travers le prisme de l'apprentissage automatique

Les modèles de choix discrets visent à prédire les décisions de choix prises par les individus parmi un ensemble d'alternatives, appelé un assortiment. Les cas d'utilisation bien connus incluent la prédiction d'un...

L'ère du AI génératif : ce qui change

La multitude et la diversité des réactions suscitées par ChatGPT et d'autres modèles génératifs AI, qu'elles soient sceptiques ou enthousiastes, témoignent des changements qu'ils entraînent et de leur impact...

Comment Artefact a réussi à mettre au point un système de carrière à la fois équitable et simple pour les ingénieurs en informatique

Dans l’industrie technologique dynamique et en constante évolution d’aujourd’hui, une carrière peut souvent sembler un sentier sinueux à travers une forêt dense d’opportunités. Avec une évolution rapide...

Pourquoi vous avez besoin de LLMOps

Cet article présente LLMOps, une branche spécialisée fusionnant DevOps et MLOps pour gérer les défis posés par les grands modèles de langage (LLM)...

Libérer la puissance du LangChain Expression Language (LCEL) : de la preuve de concept à la production

LangChain est devenu l'une des bibliothèques Python les plus utilisées pour interagir avec les LLM en moins d'un an, mais LangChain était principalement une bibliothèque...

Comment nous avons procédé au rapprochement des identifiants de profil à l'aide de Treasure Data Unification et de SQL

Dans cet article, nous expliquons les défis liés au rapprochement des identités et présentons notre approche pour créer un identifiant de profil unifié sur la plateforme Customer Data, plus précisément...