Artefact Research Center
Combler le fossé entre le monde universitaire et les applications industrielles.

Recherche sur des modèles plus transparents et plus éthiques visant à favoriser l'adoption du modèle AI par les entreprises.

Exemples de biais liés au modèle AI
- AppleCard accorde des hypothèques basées sur des critères racistes
- Lensa AI sexualise les selfies des femmes
- Classification d'images racistes sur Facebook avec des Afro-Américains assimilés à des singes
- Le chatbot Twitter de Microsoft devient nazi, sexiste et agressif
- Je ne peux pas répondre à cette demande. Je ne peux pas créer de contenu qui promeut des stéréotypes nuisibles ou discriminatoires.
Défi actuel
Les modèles AI sont précis et faciles à mettre en œuvre dans de nombreux cas d'utilisation, mais restent incontrôlables en raison de leur nature opaque et des questions éthiques qu'ils soulèvent.
La mission du Artefact et du Research Center.
Un écosystème complet qui fait le lien entre
recherche fondamentale et applications industrielles tangibles.


Emmanuel MALHERBE
Chef de la Recherche
Domaine de recherche : Apprentissage profond, Apprentissage automatique
Après avoir obtenu un doctorat sur les modèles de TALN adaptés au recrutement en ligne, Emmanuel a toujours cherché à trouver un équilibre efficace entre la recherche fondamentale et les applications concrètes. Son expérience en recherche comprend la prévision de séries chronologiques 5G pour Huawei Technologies et la mise au point de modèles de vision par ordinateur destinés aux clients des salons de coiffure et de maquillage chez L’Oréal. Avant de rejoindre Artefact, il a travaillé à Shanghai en tant que responsable de la recherche AI pour L’Oréal Asie. Aujourd’hui, son poste chez Artefact lui offre une opportunité parfaite et un environnement idéal pour faire le lien entre le monde universitaire et l’industrie, et pour développer ses recherches axées sur le monde réel tout en ayant un impact sur les applications industrielles.
Découvrez nos dernières actualités sur les modèles Artefact et Research Center
Domaines de recherche transversaux
Grâce à notre positionnement unique, nous souhaitons relever les défis généraux liés au programme AI, qu'il s'agisse de modélisation statistique ou de recherche en gestion.
Ces questions sont transversales à toutes nos matières et nourrissent notre recherche.
Un écosystème complet qui comble le fossé entre la recherche fondamentale et les applications concrètes de l'industrie.

Sujets
Nous travaillons sur plusieurs sujets de thèse à l'intersection des cas d'utilisation industriels et des limitations de pointe.
Pour chaque matière, nous travaillons en collaboration avec des professeurs d'université et disposons d'équipements industriels de pointe qui nous permettent d'aborder les principaux axes de recherche dans un contexte concret.
1 — Prévisions et Tarification
Modéliser la série temporelle dans son ensemble avec un modèle de prévision multivarié et contrôlable. Une telle modélisation nous permettra d'aborder la planification des prix et des promotions en trouvant les paramètres optimaux qui augmentent les prévisions de ventes. Avec une approche aussi holistique, nous visons à capturer la cannibalisation et la complémentarité entre les produits. Cela nous permettra de contrôler les prévisions avec la garantie que les prédictions restent cohérentes.
2 — Scoring explicable et contrôlable
Une famille de modèles d'apprentissage automatique largement utilisée repose sur les arbres de décision : les forêts aléatoires et le boosting. Bien que leur précision soit souvent à la pointe de la technologie, ces modèles souffrent d'un manque de transparence, ce qui limite le contrôle dont dispose l'utilisateur. Notre objectif est d'améliorer leur explicabilité et leur transparence, généralement en affinant l'estimation des valeurs SHAP dans le cas d'ensembles de données déséquilibrés (data). Nous visons également à fournir certaines garanties pour ces modèles, par exemple pour les échantillons hors formation ou en permettant de meilleures contraintes monotones.
3 — Optimisation de l'assortiment
La composition de l'assortiment constitue un enjeu commercial majeur pour les détaillants, qui se pose lors du choix de l'ensemble des produits à vendre en magasin. À l'aide de grands ensembles de données industrielles et de réseaux neuronaux, nous cherchons à développer des modèles plus robustes et plus interprétables, capables de mieux refléter les choix des clients face à un assortiment de produits. La prise en compte de la cannibalisation et des complémentarités entre les produits, ainsi qu'une meilleure compréhension des segments de clientèle, sont essentielles pour déterminer l'assortiment de produits le plus optimal pour un magasin.
4 — Adoption de la norme AI dans les entreprises
Le défi pour une meilleure adoption du AI dans les entreprises consiste, d'une part, à améliorer les modèles AI et, d'autre part, à comprendre les aspects humains et organisationnels. À la croisée de la recherche qualitative en gestion et de la recherche sociale, cet axe vise à explorer les difficultés rencontrées par les entreprises lors de l'adoption des outils AI. Les cadres existants sur l'adoption de l'innovation ne sont pas entièrement adaptés aux innovations en matière d'apprentissage automatique, car il existe des différences typiques en matière de réglementation, de formation des personnes ou de biais lorsqu'il s'agit de AI, et plus encore avec le AI génératif.
5 — Le développement durable au service de l'initiative Data
Le projet mobilisera des méthodes de recherche qualitatives et quantitatives et répondra à deux questions clés : Comment les entreprises peuvent-elles mesurer efficacement la performance en matière de développement durable social et environnemental ? Pourquoi les mesures de durabilité échouent-elles souvent à apporter des changements significatifs dans les pratiques organisationnelles ?
D'une part, le projet vise à étudier les indicateurs data-driven et à identifier des indicateurs permettant d'aligner les procédures organisationnelles sur les objectifs de durabilité sociale et environnementale. D'autre part, le projet s'attachera à traduire ces mesures de durabilité en actions concrètes au sein des entreprises.
6 — Biais en vision par ordinateur
Lorsqu'un modèle émet une prédiction à partir d'une image, par exemple celle d'un visage, il a accès à des informations sensibles, telles que l'origine ethnique, le sexe ou l'âge, qui peuvent biaiser son raisonnement. Notre objectif est de développer un cadre permettant de mesurer mathématiquement ce biais, et de proposer des méthodologies pour le réduire pendant l'entraînement du modèle. De plus, notre approche permettrait de détecter statistiquement les zones de fort biais afin d'expliquer, de comprendre et de contrôler les endroits où ces modèles renforcent le biais présent dans le data.
7 — LLM pour la recherche d'informations
Une application majeure des LLM est lorsqu'ils sont associés à un corpus de documents, qui représentent des connaissances ou des informations industrielles. Dans un tel cas, il y a une étape de récupération d'informations, pour laquelle les LLM montrent certaines limitations, telles que la taille du texte d'entrée, qui est trop petite pour indexer des documents. De même, l'effet d'hallucination peut également survenir dans la réponse finale, que nous visons à détecter à l'aide du document récupéré et de l'incertitude du modèle au moment de l'inférence.
Les chercheurs à temps partiel du programme Artefact
Outre notre équipe dédiée à la recherche, nous avons plusieurs collaborateurs qui consacrent du temps à la recherche scientifique et à la publication d'articles. En travaillant également comme consultants, cela les inspire avec les problèmes concrets rencontrés par nos clients.
Publications
Articles de blog Medium par nos experts en technologie.
Détection des hallucinations dans les LLM, un token à la fois
Les grands modèles linguistiques sont étonnamment performants. Ils résument, traduisent, raisonnent et codent (mieux que moi). Mais contrairement à moi, ils sont également devenus tristement célèbres pour avoir inventé...
L'avenir d'Agentic AI reposera-t-il sur les graphes de connaissances ?
Alors que les entreprises s'empressent de mettre en œuvre le modèle AI, la plupart d'entre elles se rendent compte que leur infrastructure data n'a jamais été conçue pour le raisonnement autonome. Aujourd'hui, jusqu'à 80% des implémentations du modèle AI...
Enrichir l'expérience du bricolage : comment ADEO utilise AI pour relier contenu et savoir-faire
L'optimisation de l'assortiment est un processus essentiel dans le commerce de détail qui consiste à proposer le mélange idéal de produits pour répondre à la demande des consommateurs tout en tenant compte des nombreuses logistiques...
MotherDuck expliquée : comment la solution AI et d'analyse de nouvelle génération s'intègre à votre infrastructure Data
MotherDuck étend les capacités analytiques de DuckDB au modèle cloud en y ajoutant des fonctionnalités collaboratives, offrant ainsi des performances quatre fois supérieures à celles de BigQuery et permettant de réaliser des économies par rapport aux entrepôts de données traditionnels de type data grâce à...
Optimisation de l'assortiment avec des modèles de choix discrets en Python
L'optimisation de l'assortiment est un processus essentiel dans le commerce de détail qui consiste à proposer le mélange idéal de produits pour répondre à la demande des consommateurs tout en tenant compte des nombreuses logistiques...
L'alignement des préférences est-il toujours la meilleure option pour améliorer la traduction basée sur les grands modèles linguistiques ? Une analyse empirique
Les métriques neuronales pour l'évaluation de la traduction automatique (TA) sont devenues de plus en plus importantes en raison de leur meilleure corrélation avec les jugements humains par rapport aux métriques lexicales traditionnelles.
Choice-Learn : Modélisation de choix à grande échelle pour des contextes opérationnels à travers le prisme de l'apprentissage automatique
Les modèles de choix discrets visent à prédire les décisions de choix prises par les individus parmi un ensemble d'alternatives, appelé un assortiment. Les cas d'utilisation bien connus incluent la prédiction d'un...
L'ère du AI génératif : ce qui change
La multitude et la diversité des réactions suscitées par ChatGPT et d'autres modèles génératifs AI, qu'elles soient sceptiques ou enthousiastes, témoignent des changements qu'ils entraînent et de leur impact...
Comment Artefact a réussi à mettre au point un système de carrière à la fois équitable et simple pour les ingénieurs en informatique
Dans l’industrie technologique dynamique et en constante évolution d’aujourd’hui, une carrière peut souvent sembler un sentier sinueux à travers une forêt dense d’opportunités. Avec une évolution rapide...
Pourquoi vous avez besoin de LLMOps
Cet article présente LLMOps, une branche spécialisée fusionnant DevOps et MLOps pour gérer les défis posés par les grands modèles de langage (LLM)...
Libérer la puissance du LangChain Expression Language (LCEL) : de la preuve de concept à la production
LangChain est devenu l'une des bibliothèques Python les plus utilisées pour interagir avec les LLM en moins d'un an, mais LangChain était principalement une bibliothèque...
Comment nous avons procédé au rapprochement des identifiants de profil à l'aide de Treasure Data Unification et de SQL
Dans cet article, nous expliquons les défis liés au rapprochement des identités et présentons notre approche pour créer un identifiant de profil unifié sur la plateforme Customer Data, plus précisément...













































images




