Artefact Research Center

De kloof tussen academische en industriële toepassingen overbruggen.

Onderzoek naar transparantere en ethischere modellen om de adoptie van AI bedrijven te stimuleren.

Voorbeelden van AI vertekeningen

AppleCard verstrekt hypotheken op basis van racistische criteria
Lensa AI sexualiseert selfies van women
Racistische Facebook Afbeelding Classificatie Met afro-amerikanen als apen
Twitter chatbot van Microsoft wordt nazistisch, seksistisch en agressief
ChatGPT die een code schrijft waarin staat dat goede wetenschappers blanke mannen zijn

Huidige uitdaging

AI modellen zijn nauwkeurig en gemakkelijk in te zetten in veel gebruikssituaties, maar blijven oncontroleerbaar vanwege black boxes & ethische kwesties.

De missie van de Artefact Research Center.

Een compleet ecosysteem dat de kloof overbrugt tussen
fundamenteel onderzoek en tastbare industriële toepassingen.

Emmanuel MALHERBE

Hoofd Onderzoek

Onderzoeksgebied: Diep Leren, Machine Leren

Emmanuel begon met een PhD over NLP-modellen aangepast aan e-werving en heeft altijd gezocht naar een efficiënte balans tussen puur onderzoek en impactvolle toepassingen. Zijn onderzoekservaring omvat het voorspellen van 5G-tijdreeksen voor Huawei Technologies en computervisiemodellen voor kappers- en make-upklanten bij l'Oréal. Voordat hij bij Artefact kwam, werkte hij in Shanghai als hoofd van AI onderzoek voor L'Oréal Azië. Vandaag de dag is zijn positie bij Artefact een perfecte gelegenheid en een ideale omgeving om de kloof tussen de academische wereld en de industrie te overbruggen, en om zijn onderzoek in de echte wereld te stimuleren terwijl het invloed heeft op industriële toepassingen.

Lees ons laatste Artefact Research Center Nieuws

Transversale onderzoeksgebieden

Met onze unieke positionering richten wij ons op algemene uitdagingen van AI, of het nu gaat om statistische modellering of managementonderzoek.
Deze vragen hebben betrekking op al onze onderwerpen en voeden ons onderzoek.

Controle &
verantwoording

Controleerbare modellen met garanties op voorspellingen
Interface met planners voor de vraag
Categorie managers
Beslissing door beste modelinput: betrouwbare voorspelling afdwingen, zelfs uit treinset
Bijvoorbeeld: Monotonie op invoervariabelen afdwingen

Verklaarbaarheid
& transparantie

Interpretatie van voorspellingen
Interface en visualisatie voor niet-technische gebruikers
De modules en onderdelen van de modellen aanpassen aan metiers
Visualisatie op begrijpelijke invoer, vóór feature engineering

Vooroordelen &
onzekerheid

Verrijk voorspellingen voor betere beslissingen
Niet-symmetrische onzekerheid (vs Gaussisch) vereist door klanten
Aangepast aan tijdreeksen en assortimentsoptimalisatie

Obstacles & accelerators of AI in business

Obstakels & versnellers van AI in het bedrijfsleven

Studie van organisaties
Top CAC 40 belanghebbenden en besluitvormers interviews
Impact van AI ethiek, eerlijkheid, interpreteerbaarheid
Governance, normen en voorschriften voor AI-toepassingen

Een volledig ecosysteem dat de kloof overbrugt tussen fundamenteel onderzoek en tastbare industriële toepassingen.

A full ecosystem bridging the gap between fundamental research and industry tangible applications.

Onderwerpen

Wij werken aan verschillende PhD-onderwerpen op het snijvlak van industriële gebruikssituaties en state-of-the-art beperkingen.
Voor elk onderwerp werken we samen met universiteitsprofessoren en hebben we toegang tot industriële data waarmee we de belangrijkste onderzoeksgebieden in een gegeven scenario in de echte wereld kunnen aanpakken.

1 - Prognose & prijsstelling

Modelleer tijdreeksen als geheel met een controleerbaar, multivariaat voorspellingsmodel. Met een dergelijk model kunnen we de prijs- en promotieplanning aanpakken door de optimale parameters te vinden die de verkoopprognose verhogen. Met zo'n holistische aanpak willen we kannibalisatie en complementariteit tussen producten in kaart brengen. Dit zal ons in staat stellen om de voorspelling te controleren met de garantie dat de voorspellingen consistent blijven.

Mohamed CHTIBA

Onderzoekswetenschapper
over prognose en prijsstelling

Onderzoeksgebied
—
Diep Leren, Optimalisatie, Statistiek

Jean-Marc BARDET

Professor

Laboratorium SAMM

Scholar pagina

Onderzoeksgebied
—
Stochastische processen, statistiek, waarschijnlijkheid

Joseph RYNKIEWICZ

Universitair hoofddocent

Laboratorium SAMM

Scholar pagina

Onderzoeksgebied
—
Tijdreeksen, Neurale netwerken, Statistiek

2 - Verklaarbare en controleerbare scores

Een veelgebruikte familie van modellen voor machinaal leren is gebaseerd op beslisbomen: random forests, boosting. Hoewel hun nauwkeurigheid vaak state of the art is, lijden dergelijke modellen aan een black-box gevoel, waardoor de gebruiker beperkte controle heeft. Wij streven ernaar om de verklaarbaarheid en transparantie ervan te verbeteren, met name door de schatting van SHAP-waarden in het geval van onevenwichtige datasets te verbeteren. We streven er ook naar om enkele garanties te bieden voor dergelijke modellen, bijv. voor out-of-training samples of door betere monotone beperkingen mogelijk te maken.

Abdoulaye SAKHO

Onderzoekswetenschapper op
Top ree gebaseerde modellen

Onderzoeksgebied
—
Statistieken, verklaarbaar AI

Erwan SCORNET

Professor

Laboratorium LPSM

Studentenpagina

Onderzoeksgebied
—
Random forests, Interpretabiliteit, Ontbrekende waarden

3 - Assortimentoptimalisatie

Assortiment is een belangrijk bedrijfsprobleem voor detailhandelaars dat zich voordoet bij het selecteren van de set producten die in winkels verkocht worden. Met behulp van grote industriële datasets en neurale netwerken willen wij robuustere en beter interpreteerbare modellen bouwen die de keuze van de klant beter weergeven wanneer deze geconfronteerd wordt met een assortiment van producten. Omgaan met kannibalisatie en complementariteit tussen producten, en een beter begrip van klantenclusters, zijn de sleutel tot het vinden van een meer optimale set producten in een winkel.

Vincent AURIAU

Onderzoekswetenschapper voor assortimentsoptimalisatie

Onderzoeksgebied
—
Diep leren,
Operationeel onderzoek

Vincent MOUSSEAU

Professor

Laboratorium MICS

Scholar Pagina

Onderzoeksgebied
—
Leren van voorkeuren, Multicriteria Beslissingsanalyse, Operationeel Onderzoek

Antoine DESIR

Universitair hoofddocent

Laboratorium TOM

Studentenpagina

Onderzoeksgebied
—
Keuzemodellering, Assortimentsoptimalisering, Operationeel onderzoek

Ali AOUAD

Assistent Professor

Managementwetenschappen en bedrijfsvoering

DBLP Pagina

Onderzoeksgebied
—
Dynamische matching, keuzemodellering, assortiments- en voorraadoptimalisering, algoritme voor benaderingen, operationeel onderzoek

4 - AI-adoptie in bedrijven

De uitdaging van een betere toepassing van AI in bedrijven bestaat enerzijds uit het verbeteren van de AI-modellen en anderzijds uit het begrijpen van de menselijke en organisatorische aspecten. Op het kruispunt van kwalitatief managementonderzoek en sociaal onderzoek probeert deze as te onderzoeken waar bedrijven moeilijkheden ondervinden bij de adoptie van AI tools. De bestaande kaders voor de adoptie van innovaties zijn niet helemaal geschikt voor innovaties op basis van machinaal leren, omdat er typische verschillen zijn met regelgeving, opleiding van mensen of vooroordelen als het gaat om AI, en meer nog met generatieve AI.

Lara ABDEL HALIM

Wetenschappelijk onderzoek naar AI adoptie in bedrijven

Onderzoeksgebied
—
Managementonderzoek, Innovatie

Cécile CHAMARET

Professor

Laboratorium CRG

Studentenpagina

Onderzoeksgebied
—
Innovatie, Marketing, Kwalitatief Sociaal Onderzoek

5 - Data-gedreven duurzaamheid

Het project maakt gebruik van kwalitatieve en kwantitatieve onderzoeksmethoden en richt zich op twee belangrijke vragen: Hoe kunnen bedrijven effectief sociale en ecologische duurzaamheidsprestaties meten? Waarom leiden duurzaamheidsmaatregelen vaak niet tot significante veranderingen in de praktijken van organisaties?

Enerzijds wil het project data-driven metrics onderzoeken en indicatoren identificeren om organisatorische procedures af te stemmen op sociale en milieuduurzaamheidsdoelstellingen. Anderzijds richt het project zich op het omzetten van deze duurzaamheidsmaatregelen in concrete acties binnen bedrijven.

Oualid Mokhantar

Onderzoekswetenschapper Duurzaamheid

Onderzoeksgebied
—
Management Onderzoek, Economie

Gorgi KRLEV

Universitair hoofddocent

Afdeling Duurzaamheid

Studentenpagina

Onderzoeksgebied
—
Duurzaamheid, Sociale innovatie, Organisatietheorie

6 - Vertekening in computervisie

Wanneer een model een voorspelling doet op basis van een afbeelding, bijvoorbeeld van een gezicht, heeft het toegang tot gevoelige informatie, zoals de etniciteit, het geslacht of de leeftijd, die zijn redenering kan beïnvloeden. Wij willen een raamwerk ontwikkelen om een dergelijke vertekening wiskundig te meten, en methodes voorstellen om deze vertekening tijdens de modeltraining te verminderen. Bovendien zou onze aanpak zones met een sterke vertekening statistisch detecteren om te verklaren en te begrijpen en te controleren waar dergelijke modellen de vertekening in de data versterken.

Veronika SJILOVA

Onderzoekswetenschapper naar vooroordelen in computer vision

Onderzoeksgebied
—
Diep leren, computervisie, vooroordelen

Laurent RISSER

CNRS Onderzoeksingenieur

Instituut voor wiskunde van Toulouse

Studentenpagina

Onderzoeksgebied
—
Uitlegbaar machinaal leren, beeldanalyse, interpreteerbaar en robuust AI

Jean-Michel LOUBES

Professor

Instituut voor wiskunde van Toulouse

Studentenpagina

Onderzoeksgebied
—
Onbevooroordeeld leren, interpreteerbaar AI, optimaal transport en toepassingen voor statistiek, machinaal leren

7 - LLM voor het opzoeken van informatie

Een belangrijke toepassing van LLM's is wanneer ze gekoppeld worden aan een corpus van documenten die bepaalde industriële kennis of informatie vertegenwoordigen. In zo'n geval is er een stap van het ophalen van informatie, waarvoor LLM's enkele beperkingen hebben, zoals de grootte van de invoertekst, die te klein is om documenten te indexeren. Op dezelfde manier kan het hallucinatie-effect ook optreden in het uiteindelijke antwoord, dat wij willen detecteren met behulp van het opgehaalde document en de modelonzekerheid tijdens de inferentie.

Hippolyte GISSEROT-BOUKHLEF

Onderzoekswetenschapper naar grote taalmodellen voor informatieherwinning

Onderzoeksgebied
—
Diep Leren, NLP

Pierre COLOMBO

Universitair hoofddocent

Laboratorium MICS

Studentenpagina

Onderzoeksgebied
—
Grote taalmodellen, Vertekening in AI, Modelevaluatie

Céline HUDELOT

Professor

Laboratorium MICS

Studentenpagina

Onderzoeksgebied
—
Kennisrepresentatie, Semantische interpretatie, Neurale netwerken

Artefact's deeltijdse onderzoekers

Naast ons team dat zich bezighoudt met onderzoek, hebben we verschillende medewerkers die enige tijd besteden aan wetenschappelijk onderzoek en het publiceren van artikelen. Door ook als consultants te werken, inspireren we hen met problemen die onze klanten in de praktijk tegenkomen.

Michael Voelske

Sinds mei 2022 sta ik aan het roer van het Data Science and Engineering team bij Artefact Duitsland, waar ik mijn academische achtergrond in computerwetenschappen, met een PhD gericht op machine learning en information retrieval, toepas op het oplossen van de zakelijke problemen van de klanten van Artefact. Mijn rol bestaat niet alleen uit het leiden maar ook het inspireren van mijn team om geavanceerd AI onderzoek te combineren met pragmatische toepassingen. Gepassioneerd over het toegankelijk maken van complexe AI concepten, streef ik ernaar om technologie te gebruiken voor zowel innovatieve zakelijke oplossingen als zinvolle maatschappelijke impact.

Onderzoeksgebied
—
Grote taalmodellen toepassingen in informatieherwinning en NLP
—
Verklaarbare modellen in machinaal leren, ophalen en rangschikken
—
IR voor complexe, taakgebaseerde informatiebehoeften

Evan Hurwitz

Evan heeft een PhD Engineering in artificial intelligence waar hij AI technieken toepaste op het optimaliseren van een actief beheerde portefeuille met behulp van meerdere handelsstrategieën. Hij heeft onderzoekswerk verricht in de academische wereld, waar hij co-auteur was van “Artificial Intelligence and Economic Theory: Skynet in de Markt”. Later werkte hij aan groene energieoplossingen met behulp van reinforcement learning voor S&P Platts, waarna hij bij Preqin werkte aan het opnemen en begrijpen van alternatieve investeringen data. In 2020 trad hij in dienst bij Artefact en werkte hij in verschillende sectoren, zoals detailhandel, cyberbeveiliging, SaaS, techniek, onderwijs en vastgoed, met klanten variërend van KMO's tot FTSE100-bedrijven.

Onderzoeksgebied
—
Versterking leren
—
Machinaal leren
—
Financiën en kansspelen

George Cevora

George behaalde zijn Ph.D. in Theoretische Neurowetenschappen aan de Universiteit van Cambridge voor zijn werk aan de wiskundige modellering van het leren van dieren. George heeft 10 jaar onderzoekservaring in deep learning, die hij nu toepast in industriële omgevingen. Sinds hij de academische wereld heeft verlaten, heeft George in een groot aantal industrieën en probleemdomeinen gewerkt, van straalmotoren tot antibioticaresistentie. George heeft ook een paar jaar gewerkt op het gebied van nationale veiligheid, waar hij een product heeft ontwikkeld om discriminatie als gevolg van het onjuiste gebruik van AI tegen te gaan. Meer informatie op www.cevora.xyz

Onderzoeksgebied
—
Neurowetenschappen
—
Diep leren
—
Machinaal leren

Savio Rozario

Savio heeft een Ph.D. in experimentele laserplasmafysica van het Imperial College in Londen, waar hij machine-learningmethoden gebruikte om de experimentele configuratie van sterk niet-lineaire plasmaversnellersystemen te optimaliseren. Hij werkte bij EY op hun fiscale R&D-afdeling, waar hij machine learning-oplossingen ontwikkelde voor compliance-monitoring in meerdere regio's met behulp van grote taalmodellen. Hij kwam in 2022 bij Artefact en heeft end-to-end data wetenschappelijke oplossingen geleverd in verschillende sectoren, waaronder retail, transport en vastgoed voor FTSE250-organisaties.

Onderzoeksgebied
—
Machinaal leren
—
Niet-lineaire optimalisatie
—
Natuurkunde

Nelson Vrede

Nelson bracht het eerste decennium van zijn carrière door in een combinatie van aandelen- en grondstoffenmarkten, waar hij kwantitatieve handelsstrategieën inzette in OTC-markten. Na het afronden van zijn MSc in Data Science in 2021, trad hij in dienst bij Artefact's Britse kantoor als een data wetenschapper, waar hij werkt aan data wetenschappelijke problemen in verschillende domeinen, met expertise in AI toepassingen in financiële markten en handel.

Publicaties

- Khalid Al Khatib, Michael Voelske, Anh Le, Shahbaz Syed, Martin Potthast en Benno Stein.“Een nieuwe Dataset voor causaliteitsidentificatie in argumentatieve teksten”, In Proceedings of the 24th Meeting of the Special Interest Group on Discourse and Dialogue (SIGDIAL), ACL (2023).
- Glen Hopkins en Kristjan Kalm. “Classificeren van complexe documenten: Vergelijking van oplossingen op maat met grote taalmodellen” arXiv preprint arXiv:2312.07182 (2023)
- Olivier Turnbull en George Cevora. “Instabiliteit van computervisiemodellen is een noodzakelijk gevolg van de taak zelf” arXiv preprint arXiv:2310.17559 (2023).
- Marcel Marais, Máté Hartstein en George Čevora, “Gebruik van lineaire initialisatie om de convergentiesnelheid en volledig getrainde fout in auto-encoders te verbeteren” arXiv preprint arXiv:2311.10699 (2023).
- Evan Hurwitz, Nelson Peace en George Cevora. “Stabiele training van versterkingslerende agenten in bimodale omgevingen door middel van batch-leren.” arXiv preprint arXiv:2307.00923 (2023).
- Savio Rozario en George Čevora. “Uitlegbaar AI biedt niet de uitleg waar eindgebruikers om vragen.” arXiv preprint arXiv:2302.11577 (2023).
- Vincent Auriau, Emmanuel Malherbe en Matthieu Perrot. “Zwakke segmentatie-geleide GAN voor realistische kleureneditie.” In Internationale Conferentie over Beeldanalyse en -verwerking, Springer Nature Switzerland, (2023).
- Maté Hartstein en George Čevora. “Data-gestuurde methode voor het navigeren over de Atlantische Oceaan in een roeiwedstrijd”.
- Evan Hurwitz en George Čevora. “Prestatieprognoses van herscholingsprogramma's voor werknemers.” arXiv preprint arXiv:2107.10001 (2021).

Medium blogartikelen van onze technische experts.

Hallucinaties detecteren bij LLM's, één teken per keer

Grote Taalmodellen zijn verbazingwekkend vaardig. Ze vatten samen, vertalen, redeneren en coderen (beter dan ik). Maar in tegenstelling tot mij, zijn ze ook berucht geworden voor het uitvinden van...

Zal de toekomst van Agentic AI gebaseerd zijn op kennisgrafieken?

Terwijl bedrijven zich haasten om AI operationeel te maken, ontdekken de meesten dat hun data infrastructuur nooit ontworpen was voor autonoom redeneren. Vandaag de dag is tot 80% van de AI implementatie...

De doe-het-zelf-ervaring verrijken: Hoe ADEO AI gebruikt om inhoud en kennis te verbinden

Assortimentoptimalisatie is een cruciaal proces in de detailhandel waarbij de ideale mix van producten wordt samengesteld om aan de vraag van de consument te voldoen, terwijl er rekening wordt gehouden met de vele logistieke...

MotherDuck uitgelegd: Hoe de Next-Gen AI & Analytics-oplossing past in uw Data-stack

MotherDuck breidt de analytische prestaties van DuckDB uit naar de cloud met samenwerkingsfuncties, levert 4x snellere prestaties dan BigQuery en kostenbesparingen ten opzichte van traditionele data...

Assortimentoptimalisatie met discrete keuzemodellen in Python

Is Preference Alignment altijd de beste optie om LLM-gebaseerd vertalen te verbeteren? Een empirische analyse

Neurale meetmethoden voor de evaluatie van machinevertalingen (MT) zijn steeds prominenter geworden vanwege hun superieure correlatie met menselijke beoordelingen in vergelijking met traditionele lexicale meetmethoden.

Keuze-leren: Grootschalige keuzemodellering voor operationele contexten door de lens van machinaal leren

Discrete keuzemodellen zijn gericht op het voorspellen van keuzebeslissingen die individuen maken uit een menu van alternatieven, een zogenaamd assortiment. Bekende toepassingen zijn onder andere het voorspellen...

Het tijdperk van generatieve AI: Wat verandert er?

De overvloed en diversiteit van reacties op ChatGPT en andere generatieve AI's, of ze nu sceptisch of enthousiast zijn, tonen de veranderingen die ze teweegbrengen en de impact...

Hoe Artefact erin slaagde een eerlijk en toch eenvoudig loopbaansysteem voor software-ingenieurs te ontwikkelen

In de dynamische en steeds veranderende technologiesector van vandaag kan een carrièrepad vaak aanvoelen als een kronkelend pad door een dicht woud van mogelijkheden. Met snelle...

Waarom u LLMOps nodig hebt

Dit artikel introduceert LLMOps, een gespecialiseerde tak waarin DevOps en MLOps worden samengevoegd voor het beheer van de uitdagingen die grote taalmodellen (LLM's) met zich meebrengen...

De kracht van LangChain Expression Language (LCEL) ontketenen: van proof of concept naar productie

LangChain is in minder dan een jaar uitgegroeid tot een van de meest gebruikte Python-bibliotheken voor interactie met LLM's, maar LangChain was vooral een bibliotheek...

Hoe we de reconciliatie van profiel-ID's hebben afgehandeld met behulp van Treasure Data Unification en SQL

In dit artikel leggen we de uitdagingen van ID-conciliatie uit en demonstreren we onze aanpak om een eenduidig profiel-ID te maken in het Data platform van de klant,...

Artefact Research Center

De kloof tussen academische en industriële toepassingen overbruggen.

Onderzoek naar transparantere en ethischere modellen om de adoptie van AI bedrijven te stimuleren.

Voorbeelden van AI vertekeningen

Huidige uitdaging

De missie van de Artefact Research Center.

Lees ons laatste Artefact Research Center Nieuws

Transversale onderzoeksgebieden

Controle & verantwoording

Verklaarbaarheid & transparantie

Vooroordelen & onzekerheid

Obstakels & versnellers van AI in het bedrijfsleven

Een volledig ecosysteem dat de kloof overbrugt tussen fundamenteel onderzoek en tastbare industriële toepassingen.

Onderwerpen

1 - Prognose & prijsstelling

2 - Verklaarbare en controleerbare scores

3 - Assortimentoptimalisatie

4 - AI-adoptie in bedrijven

5 - Data-gedreven duurzaamheid

6 - Vertekening in computervisie

7 - LLM voor het opzoeken van informatie

Artefact's deeltijdse onderzoekers

Publicaties

Medium blogartikelen van onze technische experts.

Controle &
verantwoording

Verklaarbaarheid
& transparantie

Vooroordelen &
onzekerheid