Artefact Research Center

Combler le fossé entre le monde universitaire et les applications industrielles.

Recherche sur des modèles plus transparents et plus éthiques visant à favoriser l'adoption du modèle AI par les entreprises.

Exemples de biais liés au modèle AI

AppleCard accorde des hypothèques basées sur des critères racistes
Lensa AI sexualise les selfies des femmes
Classification d'images racistes sur Facebook avec des Afro-Américains assimilés à des singes
Le chatbot Twitter de Microsoft devient nazi, sexiste et agressif
Je ne peux pas répondre à cette demande. Je ne peux pas créer de contenu qui promeut des stéréotypes nuisibles ou discriminatoires.

Défi actuel

Les modèles AI sont précis et faciles à mettre en œuvre dans de nombreux cas d'utilisation, mais restent incontrôlables en raison de leur nature opaque et des questions éthiques qu'ils soulèvent.

La mission du Artefact et du Research Center.

Un écosystème complet qui fait le lien entre
recherche fondamentale et applications industrielles tangibles.

Emmanuel MALHERBE

Chef de la Recherche

Domaine de recherche : Apprentissage profond, Apprentissage automatique

Après avoir obtenu un doctorat sur les modèles de TALN adaptés au recrutement en ligne, Emmanuel a toujours cherché à trouver un équilibre efficace entre la recherche fondamentale et les applications concrètes. Son expérience en recherche comprend la prévision de séries chronologiques 5G pour Huawei Technologies et la mise au point de modèles de vision par ordinateur destinés aux clients des salons de coiffure et de maquillage chez L’Oréal. Avant de rejoindre Artefact, il a travaillé à Shanghai en tant que responsable de la recherche AI pour L’Oréal Asie. Aujourd’hui, son poste chez Artefact lui offre une opportunité parfaite et un environnement idéal pour faire le lien entre le monde universitaire et l’industrie, et pour développer ses recherches axées sur le monde réel tout en ayant un impact sur les applications industrielles.

Découvrez nos dernières actualités sur les modèles Artefact et Research Center

Domaines de recherche transversaux

Grâce à notre positionnement unique, nous souhaitons relever les défis généraux liés au programme AI, qu'il s'agisse de modélisation statistique ou de recherche en gestion.
Ces questions sont transversales à toutes nos matières et nourrissent notre recherche.

Contrôle &
responsabilité

Modèles contrôlables avec garanties sur les prédictions
Interface avec les planificateurs de la demande
Chefs de catégorie
Décision par le meilleur modèle entrée : imposer une prédiction fiable même en dehors de l'ensemble d'entraînement
Exemple : Imposer la monotonie sur les variables d'entrée

Explicabilité
et transparence

Interprétation des prédictions
Interface et visualisation pour les utilisateurs non techniques
Adapter les modules et composants des modèles aux métiers
Visualisation sur des entrées compréhensibles, avant l'ingénierie des caractéristiques

Biais et
incertitude

Enrichir la prédiction pour de meilleures décisions
Incertitude non symétrique (vs gaussienne) requise par les clients
Adapté à l'optimisation des séries chronologiques et des assortiments

Obstacles & accelerators of AI in business

Obstacles et catalyseurs de la stratégie AI dans le monde des affaires

Étude des organisations
Interviews des principaux acteurs et décideurs du CAC 40
Impact de AI sur l'éthique, l'équité et l'interprétabilité
Gouvernance, normes et réglementations relatives aux applications AI

Un écosystème complet qui comble le fossé entre la recherche fondamentale et les applications concrètes de l'industrie.

A full ecosystem bridging the gap between fundamental research and industry tangible applications.

Sujets

Nous travaillons sur plusieurs sujets de thèse à l'intersection des cas d'utilisation industriels et des limitations de pointe.
Pour chaque matière, nous travaillons en collaboration avec des professeurs d'université et disposons d'équipements industriels de pointe qui nous permettent d'aborder les principaux axes de recherche dans un contexte concret.

1 — Prévisions et Tarification

Modéliser la série temporelle dans son ensemble avec un modèle de prévision multivarié et contrôlable. Une telle modélisation nous permettra d'aborder la planification des prix et des promotions en trouvant les paramètres optimaux qui augmentent les prévisions de ventes. Avec une approche aussi holistique, nous visons à capturer la cannibalisation et la complémentarité entre les produits. Cela nous permettra de contrôler les prévisions avec la garantie que les prédictions restent cohérentes.

Mohamed CHTIBA

Chercheur scientifique
sur la prévision et la tarification

Domaine de recherche
—
Apprentissage profond, Optimisation, Statistiques

Jean-Marc BARDET

Professeur

Laboratoire SAMM

Page du chercheur

Domaine de recherche
—
Processus stochastiques, Statistiques, Probabilités

Joseph RYNKIEWICZ

Maître de conférences

Laboratoire SAMM

Page du chercheur

Domaine de recherche
—
Séries temporelles, réseaux neuronaux, statistiques

2 — Scoring explicable et contrôlable

Une famille de modèles d'apprentissage automatique largement utilisée repose sur les arbres de décision : les forêts aléatoires et le boosting. Bien que leur précision soit souvent à la pointe de la technologie, ces modèles souffrent d'un manque de transparence, ce qui limite le contrôle dont dispose l'utilisateur. Notre objectif est d'améliorer leur explicabilité et leur transparence, généralement en affinant l'estimation des valeurs SHAP dans le cas d'ensembles de données déséquilibrés (data). Nous visons également à fournir certaines garanties pour ces modèles, par exemple pour les échantillons hors formation ou en permettant de meilleures contraintes monotones.

Abdoulaye SAKHO

Chercheur scientifique sur
TModèles basés sur les arbres

Domaine de recherche
—
Statistiques, explicables AI

Erwan SCORNET

Professeur

Laboratoire LPSM

Page savante

Domaine de recherche
—
Forêts aléatoires, Interprétabilité, Valeurs manquantes

3 — Optimisation de l'assortiment

La composition de l'assortiment constitue un enjeu commercial majeur pour les détaillants, qui se pose lors du choix de l'ensemble des produits à vendre en magasin. À l'aide de grands ensembles de données industrielles et de réseaux neuronaux, nous cherchons à développer des modèles plus robustes et plus interprétables, capables de mieux refléter les choix des clients face à un assortiment de produits. La prise en compte de la cannibalisation et des complémentarités entre les produits, ainsi qu'une meilleure compréhension des segments de clientèle, sont essentielles pour déterminer l'assortiment de produits le plus optimal pour un magasin.

Vincent AURIAU

Chercheur scientifique sur l'optimisation des assortiments

Domaine de recherche
—
Apprentissage profond,
Recherche opérationnelle

Vincent MOUSSEAU

Professeur

Laboratoire MICS

Érudit Page

Domaine de recherche
—
Apprentissage des préférences, Aide à la décision multicritère, Recherche opérationnelle

Antoine DESIR

Maître de conférences

Laboratoire TOM

Page savante

Domaine de recherche
—
Modélisation du choix, Optimisation des assortiments, Recherche opérationnelle

Ali AOUAD

Professeur adjoint

Gestion et sciences de l'exploitation

Page DBLP

Domaine de recherche
—
Appariement dynamique, Modélisation des choix, Optimisation des assortiments et des stocks, Algorithme d'approximation, Recherche opérationnelle

4 — Adoption de la norme AI dans les entreprises

Le défi pour une meilleure adoption du AI dans les entreprises consiste, d'une part, à améliorer les modèles AI et, d'autre part, à comprendre les aspects humains et organisationnels. À la croisée de la recherche qualitative en gestion et de la recherche sociale, cet axe vise à explorer les difficultés rencontrées par les entreprises lors de l'adoption des outils AI. Les cadres existants sur l'adoption de l'innovation ne sont pas entièrement adaptés aux innovations en matière d'apprentissage automatique, car il existe des différences typiques en matière de réglementation, de formation des personnes ou de biais lorsqu'il s'agit de AI, et plus encore avec le AI génératif.

Lara ABDEL HALIM

Chercheur spécialisé dans l'adoption de la norme AI par les entreprises

Domaine de recherche
—
Recherche en management, Innovation

Cécile CHAMARET

Professeur

Laboratoire CRG

Page savante

Domaine de recherche
—
Innovation, Marketing, Recherche Sociale Qualitative

5 — Le développement durable au service de l'initiative Data

Le projet mobilisera des méthodes de recherche qualitatives et quantitatives et répondra à deux questions clés : Comment les entreprises peuvent-elles mesurer efficacement la performance en matière de développement durable social et environnemental ? Pourquoi les mesures de durabilité échouent-elles souvent à apporter des changements significatifs dans les pratiques organisationnelles ?

D'une part, le projet vise à étudier les indicateurs data-driven et à identifier des indicateurs permettant d'aligner les procédures organisationnelles sur les objectifs de durabilité sociale et environnementale. D'autre part, le projet s'attachera à traduire ces mesures de durabilité en actions concrètes au sein des entreprises.

Oualid Mokhantar

Chercheur scientifique en développement durable

Domaine de recherche
—
Recherche en management, Économie

Gorgi KRLEV

Maître de conférences

Département du développement durable

Page savante

Domaine de recherche
—
Durabilité, Innovation sociale, Théorie des organisations

6 — Biais en vision par ordinateur

Lorsqu'un modèle émet une prédiction à partir d'une image, par exemple celle d'un visage, il a accès à des informations sensibles, telles que l'origine ethnique, le sexe ou l'âge, qui peuvent biaiser son raisonnement. Notre objectif est de développer un cadre permettant de mesurer mathématiquement ce biais, et de proposer des méthodologies pour le réduire pendant l'entraînement du modèle. De plus, notre approche permettrait de détecter statistiquement les zones de fort biais afin d'expliquer, de comprendre et de contrôler les endroits où ces modèles renforcent le biais présent dans le data.

Véronika CHILOVA

Chercheur scientifique sur les biais en vision par ordinateur

Domaine de recherche
—
Apprentissage profond, vision par ordinateur, biais

Laurent RISSER

Ingénieur de recherche au CNRS

Institut de Mathématiques de Toulouse

Page savante

Domaine de recherche
—
Apprentissage automatique explicable, analyse d'images, interprétable et robuste AI

Jean-Michel LOUBES

Professeur

Institut de Mathématiques de Toulouse

Page savante

Domaine de recherche
—
Apprentissage non biaisé, AI interprétable, transport optimal et applications aux statistiques et à l'apprentissage automatique

7 — LLM pour la recherche d'informations

Une application majeure des LLM est lorsqu'ils sont associés à un corpus de documents, qui représentent des connaissances ou des informations industrielles. Dans un tel cas, il y a une étape de récupération d'informations, pour laquelle les LLM montrent certaines limitations, telles que la taille du texte d'entrée, qui est trop petite pour indexer des documents. De même, l'effet d'hallucination peut également survenir dans la réponse finale, que nous visons à détecter à l'aide du document récupéré et de l'incertitude du modèle au moment de l'inférence.

Hippolyte GISSEROT-BOUKHLEF

Chercheur scientifique sur les grands modèles linguistiques pour la recherche d'informations

Domaine de recherche
—
Apprentissage profond, TALN

Pierre COLOMBO

Maître de conférences

Laboratoire MICS

Page savante

Domaine de recherche
—
Modèles linguistiques à grande échelle, biais dans AI, évaluation des modèles

Céline HUDELOT

Professeur

Laboratoire MICS

Page savante

Domaine de recherche
—
Représentation des connaissances, Interprétation sémantique, Réseaux neuronaux

Les chercheurs à temps partiel du programme Artefact

Outre notre équipe dédiée à la recherche, nous avons plusieurs collaborateurs qui consacrent du temps à la recherche scientifique et à la publication d'articles. En travaillant également comme consultants, cela les inspire avec les problèmes concrets rencontrés par nos clients.

Michael Voelske

Depuis mai 2022, je dirige l'équipe Science et Ingénierie de Data chez Artefact Allemagne, où je mets à profit ma formation universitaire en informatique, avec un doctorat axé sur l'apprentissage automatique et la recherche d'informations, pour résoudre les problèmes commerciaux des clients de Artefact. Mon rôle consiste non seulement à diriger, mais aussi à inspirer mon équipe afin de combiner la recherche de pointe en AI avec des applications pragmatiques. Passionné par la vulgarisation des concepts complexes de AI, je m'efforce de tirer parti de la technologie pour proposer des solutions commerciales innovantes et avoir un impact significatif sur la société.

Domaine de recherche
—
Applications des grands modèles linguistiques en recherche d'information et en TALN
—
Modèles explicables en apprentissage automatique, recherche et classement
—
RI pour les besoins d'information complexes et basés sur des tâches

Evan Hurwitz

Evan est titulaire d'un doctorat en ingénierie dans le domaine de l'IA, où il a appliqué des techniques d'IA pour optimiser un portefeuille géré activement à l'aide de multiples stratégies de trading. Il a mené des travaux de recherche dans le milieu universitaire, où il a coécrit l'ouvrage “ Intelligence artificielle et théorie économique : Skynet sur les marchés ”. Il s'est ensuite orienté vers les solutions d'énergie verte utilisant l'apprentissage par renforcement pour S&P Platts, après quoi il a travaillé avec Preqin sur l'intégration et la compréhension des investissements alternatifs data. Il a rejoint Artefact en 2020 et a travaillé dans de nombreux secteurs tels que la vente au détail, la cybersécurité, le SaaS, l'ingénierie, l'éducation et l'immobilier, avec des clients allant des PME aux entreprises du FTSE 100.

Domaine de recherche
—
Apprentissage par renforcement
—
Apprentissage automatique
—
Finance et Jeux vidéo

Georges Cevora

George a obtenu son doctorat en neurosciences théoriques à l'université de Cambridge pour ses travaux sur la modélisation mathématique de l'apprentissage chez les animaux. George possède 10 ans d'expérience en recherche dans le domaine de l'apprentissage profond, qu'il met désormais en pratique dans le secteur industriel. Depuis qu'il a quitté le monde universitaire, George a travaillé dans un large éventail de secteurs et de domaines, allant des moteurs à réaction à la résistance aux antibiotiques. George a également passé quelques années dans le domaine de la sécurité nationale, où il a développé un produit visant à lutter contre la discrimination résultant d'une utilisation inappropriée de AI. Pour en savoir plus, rendez-vous sur www.cevora.xyz

Domaine de recherche
—
Neurosciences
—
Apprentissage profond
—
Apprentissage automatique

Savio Rozario

Savio est titulaire d'un doctorat en physique expérimentale des plasmas laser de l'Imperial College de Londres, où il a utilisé des méthodes d'apprentissage automatique pour optimiser la configuration expérimentale de systèmes d'accélérateurs à plasma hautement non linéaires. Il a travaillé chez EY au sein du département R&D fiscal, où il a développé des solutions d'apprentissage automatique pour le contrôle de la conformité dans plusieurs zones géographiques à l'aide de grands modèles linguistiques. Il a rejoint Artefact en 2022 et a fourni des solutions scientifiques data de bout en bout dans divers secteurs, notamment la vente au détail, les transports et l'immobilier, pour des organisations du FTSE 250.

Domaine de recherche
—
Apprentissage automatique
—
Optimisation non linéaire
—
Physique

Nelson Paix

Nelson a passé les dix premières années de sa carrière à la fois sur les marchés boursiers et sur ceux des matières premières, où il a mis en œuvre des stratégies de trading quantitatif sur les marchés de gré à gré. Après avoir obtenu son master en sciences en 2021, il a rejoint le bureau britannique de Artefact en tant que chercheur, où il travaille sur des problèmes scientifiques dans divers domaines, avec une expertise particulière dans les applications des marchés financiers et du trading.

Publications

- Khalid Al Khatib, Michael Voelske, Anh Le, Shahbaz Syed, Martin Potthast et Benno Stein.“Un nouvel ensemble Data pour l'identification des relations de causalité dans les textes argumentatifs” Dans Proceedings of the 24th Meeting of the Special Interest Group on Discourse and Dialogue (SIGDIAL), ACL (2023).
- Glen Hopkins et Kristjan Kalm. “Classification de Documents Complexes : Comparaison des Solutions sur Mesure aux Grands Modèles Linguistiques”Prépublication arXiv arXiv:2312.07182 (2023)
- Olivier Turnbull et George Cevora. “L'instabilité des modèles de vision par ordinateur est un résultat nécessaire de la tâche elle-même”prépublication arXiv arXiv:2310.17559 (2023).
- Marcel Marais, Máté Hartstein et George Čevora, “Utilisation de l'initialisation linéaire pour améliorer la rapidité de convergence et l'erreur finale dans les auto-encodeurs”arXiv preprint arXiv:2311.10699 (2023).
- Evan Hurwitz, Nelson Peace et George Cevora. “Obtenir un entraînement stable des agents d'apprentissage par renforcement dans des environnements bimodaux grâce à l'apprentissage par lots.”Prépublication arXiv arXiv:2307.00923 (2023).
- Savio Rozario et George Čevora.“Le modèle AI n'apporte pas les explications que les utilisateurs finaux attendent.”pré-publication arXiv arXiv:2302.11577 (2023).
- Vincent Auriau, Emmanuel Malherbe et Matthieu Perrot. “GAN guidé par segmentation faible pour l'édition de couleurs réaliste.”Dans la Conférence Internationale sur l'Analyse et le Traitement d'Images, Springer Nature Switzerland, (2023).
- Maté Hartstein et George Čevora.“Méthode basée sur le Data pour naviguer sur l'Atlantique lors d'une course d'aviron”.
- Evan Hurwitz et George Čevora. “Prévision de la performance des programmes de reconversion professionnelle.”pré-tirage arXiv arXiv:2107.10001 (2021).

Articles de blog Medium par nos experts en technologie.

Détection des hallucinations dans les LLM, un token à la fois

Les grands modèles linguistiques sont étonnamment performants. Ils résument, traduisent, raisonnent et codent (mieux que moi). Mais contrairement à moi, ils sont également devenus tristement célèbres pour avoir inventé...

L'avenir d'Agentic AI reposera-t-il sur les graphes de connaissances ?

Alors que les entreprises s'empressent de mettre en œuvre le modèle AI, la plupart d'entre elles se rendent compte que leur infrastructure data n'a jamais été conçue pour le raisonnement autonome. Aujourd'hui, jusqu'à 80% des implémentations du modèle AI...

Enrichir l'expérience du bricolage : comment ADEO utilise AI pour relier contenu et savoir-faire

L'optimisation de l'assortiment est un processus essentiel dans le commerce de détail qui consiste à proposer le mélange idéal de produits pour répondre à la demande des consommateurs tout en tenant compte des nombreuses logistiques...

MotherDuck expliquée : comment la solution AI et d'analyse de nouvelle génération s'intègre à votre infrastructure Data

MotherDuck étend les capacités analytiques de DuckDB au modèle cloud en y ajoutant des fonctionnalités collaboratives, offrant ainsi des performances quatre fois supérieures à celles de BigQuery et permettant de réaliser des économies par rapport aux entrepôts de données traditionnels de type data grâce à...

Optimisation de l'assortiment avec des modèles de choix discrets en Python

L'alignement des préférences est-il toujours la meilleure option pour améliorer la traduction basée sur les grands modèles linguistiques ? Une analyse empirique

Les métriques neuronales pour l'évaluation de la traduction automatique (TA) sont devenues de plus en plus importantes en raison de leur meilleure corrélation avec les jugements humains par rapport aux métriques lexicales traditionnelles.

Choice-Learn : Modélisation de choix à grande échelle pour des contextes opérationnels à travers le prisme de l'apprentissage automatique

Les modèles de choix discrets visent à prédire les décisions de choix prises par les individus parmi un ensemble d'alternatives, appelé un assortiment. Les cas d'utilisation bien connus incluent la prédiction d'un...

L'ère du AI génératif : ce qui change

La multitude et la diversité des réactions suscitées par ChatGPT et d'autres modèles génératifs AI, qu'elles soient sceptiques ou enthousiastes, témoignent des changements qu'ils entraînent et de leur impact...

Comment Artefact a réussi à mettre au point un système de carrière à la fois équitable et simple pour les ingénieurs en informatique

Dans l’industrie technologique dynamique et en constante évolution d’aujourd’hui, une carrière peut souvent sembler un sentier sinueux à travers une forêt dense d’opportunités. Avec une évolution rapide...

Pourquoi vous avez besoin de LLMOps

Cet article présente LLMOps, une branche spécialisée fusionnant DevOps et MLOps pour gérer les défis posés par les grands modèles de langage (LLM)...

Libérer la puissance du LangChain Expression Language (LCEL) : de la preuve de concept à la production

LangChain est devenu l'une des bibliothèques Python les plus utilisées pour interagir avec les LLM en moins d'un an, mais LangChain était principalement une bibliothèque...

Comment nous avons procédé au rapprochement des identifiants de profil à l'aide de Treasure Data Unification et de SQL

Dans cet article, nous expliquons les défis liés au rapprochement des identités et présentons notre approche pour créer un identifiant de profil unifié sur la plateforme Customer Data, plus précisément...

Artefact Research Center

Combler le fossé entre le monde universitaire et les applications industrielles.

Recherche sur des modèles plus transparents et plus éthiques visant à favoriser l'adoption du modèle AI par les entreprises.

Exemples de biais liés au modèle AI

Défi actuel

La mission du Artefact et du Research Center.

Découvrez nos dernières actualités sur les modèles Artefact et Research Center

Domaines de recherche transversaux

Contrôle & responsabilité

Explicabilité et transparence

Biais et incertitude

Obstacles et catalyseurs de la stratégie AI dans le monde des affaires

Un écosystème complet qui comble le fossé entre la recherche fondamentale et les applications concrètes de l'industrie.

Sujets

1 — Prévisions et Tarification

2 — Scoring explicable et contrôlable

3 — Optimisation de l'assortiment

4 — Adoption de la norme AI dans les entreprises

5 — Le développement durable au service de l'initiative Data

6 — Biais en vision par ordinateur

7 — LLM pour la recherche d'informations

Les chercheurs à temps partiel du programme Artefact

Publications

Articles de blog Medium par nos experts en technologie.

Contrôle &
responsabilité

Explicabilité
et transparence

Biais et
incertitude