Artefact Research Center
De kloof tussen academische en industriële toepassingen overbruggen.

Onderzoek naar transparantere en ethischere modellen om de adoptie van AI bedrijven te stimuleren.

Voorbeelden van AI vertekeningen
- AppleCard verstrekt hypotheken op basis van racistische criteria
- Lensa AI sexualiseert selfies van women
- Racistische Facebook Afbeelding Classificatie Met afro-amerikanen als apen
- Twitter chatbot van Microsoft wordt nazistisch, seksistisch en agressief
- ChatGPT die een code schrijft waarin staat dat goede wetenschappers blanke mannen zijn
Huidige uitdaging
AI modellen zijn nauwkeurig en gemakkelijk in te zetten in veel gebruikssituaties, maar blijven oncontroleerbaar vanwege black boxes & ethische kwesties.
De missie van de Artefact Research Center.
Een compleet ecosysteem dat de kloof overbrugt tussen
fundamenteel onderzoek en tastbare industriële toepassingen.


Emmanuel MALHERBE
Hoofd Onderzoek
Onderzoeksgebied: Diep Leren, Machine Leren
Emmanuel begon met een PhD over NLP-modellen aangepast aan e-werving en heeft altijd gezocht naar een efficiënte balans tussen puur onderzoek en impactvolle toepassingen. Zijn onderzoekservaring omvat het voorspellen van 5G-tijdreeksen voor Huawei Technologies en computervisiemodellen voor kappers- en make-upklanten bij l'Oréal. Voordat hij bij Artefact kwam, werkte hij in Shanghai als hoofd van AI onderzoek voor L'Oréal Azië. Vandaag de dag is zijn positie bij Artefact een perfecte gelegenheid en een ideale omgeving om de kloof tussen de academische wereld en de industrie te overbruggen, en om zijn onderzoek in de echte wereld te stimuleren terwijl het invloed heeft op industriële toepassingen.
Lees ons laatste Artefact Research Center Nieuws
Transversale onderzoeksgebieden
Met onze unieke positionering richten wij ons op algemene uitdagingen van AI, of het nu gaat om statistische modellering of managementonderzoek.
Deze vragen hebben betrekking op al onze onderwerpen en voeden ons onderzoek.
Een volledig ecosysteem dat de kloof overbrugt tussen fundamenteel onderzoek en tastbare industriële toepassingen.

Onderwerpen
Wij werken aan verschillende PhD-onderwerpen op het snijvlak van industriële gebruikssituaties en state-of-the-art beperkingen.
Voor elk onderwerp werken we samen met universiteitsprofessoren en hebben we toegang tot industriële data waarmee we de belangrijkste onderzoeksgebieden in een gegeven scenario in de echte wereld kunnen aanpakken.
1 - Prognose & prijsstelling
Modelleer tijdreeksen als geheel met een controleerbaar, multivariaat voorspellingsmodel. Met een dergelijk model kunnen we de prijs- en promotieplanning aanpakken door de optimale parameters te vinden die de verkoopprognose verhogen. Met zo'n holistische aanpak willen we kannibalisatie en complementariteit tussen producten in kaart brengen. Dit zal ons in staat stellen om de voorspelling te controleren met de garantie dat de voorspellingen consistent blijven.
2 - Verklaarbare en controleerbare scores
Een veelgebruikte familie van modellen voor machinaal leren is gebaseerd op beslisbomen: random forests, boosting. Hoewel hun nauwkeurigheid vaak state of the art is, lijden dergelijke modellen aan een black-box gevoel, waardoor de gebruiker beperkte controle heeft. Wij streven ernaar om de verklaarbaarheid en transparantie ervan te verbeteren, met name door de schatting van SHAP-waarden in het geval van onevenwichtige datasets te verbeteren. We streven er ook naar om enkele garanties te bieden voor dergelijke modellen, bijv. voor out-of-training samples of door betere monotone beperkingen mogelijk te maken.
3 - Assortimentoptimalisatie
Assortiment is een belangrijk bedrijfsprobleem voor detailhandelaars dat zich voordoet bij het selecteren van de set producten die in winkels verkocht worden. Met behulp van grote industriële datasets en neurale netwerken willen wij robuustere en beter interpreteerbare modellen bouwen die de keuze van de klant beter weergeven wanneer deze geconfronteerd wordt met een assortiment van producten. Omgaan met kannibalisatie en complementariteit tussen producten, en een beter begrip van klantenclusters, zijn de sleutel tot het vinden van een meer optimale set producten in een winkel.
4 - AI-adoptie in bedrijven
De uitdaging van een betere toepassing van AI in bedrijven bestaat enerzijds uit het verbeteren van de AI-modellen en anderzijds uit het begrijpen van de menselijke en organisatorische aspecten. Op het kruispunt van kwalitatief managementonderzoek en sociaal onderzoek probeert deze as te onderzoeken waar bedrijven moeilijkheden ondervinden bij de adoptie van AI tools. De bestaande kaders voor de adoptie van innovaties zijn niet helemaal geschikt voor innovaties op basis van machinaal leren, omdat er typische verschillen zijn met regelgeving, opleiding van mensen of vooroordelen als het gaat om AI, en meer nog met generatieve AI.
5 - Data-gedreven duurzaamheid
Het project maakt gebruik van kwalitatieve en kwantitatieve onderzoeksmethoden en richt zich op twee belangrijke vragen: Hoe kunnen bedrijven effectief sociale en ecologische duurzaamheidsprestaties meten? Waarom leiden duurzaamheidsmaatregelen vaak niet tot significante veranderingen in de praktijken van organisaties?
Enerzijds wil het project data-driven metrics onderzoeken en indicatoren identificeren om organisatorische procedures af te stemmen op sociale en milieuduurzaamheidsdoelstellingen. Anderzijds richt het project zich op het omzetten van deze duurzaamheidsmaatregelen in concrete acties binnen bedrijven.
6 - Vertekening in computervisie
Wanneer een model een voorspelling doet op basis van een afbeelding, bijvoorbeeld van een gezicht, heeft het toegang tot gevoelige informatie, zoals de etniciteit, het geslacht of de leeftijd, die zijn redenering kan beïnvloeden. Wij willen een raamwerk ontwikkelen om een dergelijke vertekening wiskundig te meten, en methodes voorstellen om deze vertekening tijdens de modeltraining te verminderen. Bovendien zou onze aanpak zones met een sterke vertekening statistisch detecteren om te verklaren en te begrijpen en te controleren waar dergelijke modellen de vertekening in de data versterken.
7 - LLM voor het opzoeken van informatie
Een belangrijke toepassing van LLM's is wanneer ze gekoppeld worden aan een corpus van documenten die bepaalde industriële kennis of informatie vertegenwoordigen. In zo'n geval is er een stap van het ophalen van informatie, waarvoor LLM's enkele beperkingen hebben, zoals de grootte van de invoertekst, die te klein is om documenten te indexeren. Op dezelfde manier kan het hallucinatie-effect ook optreden in het uiteindelijke antwoord, dat wij willen detecteren met behulp van het opgehaalde document en de modelonzekerheid tijdens de inferentie.
Artefact's deeltijdse onderzoekers
Naast ons team dat zich bezighoudt met onderzoek, hebben we verschillende medewerkers die enige tijd besteden aan wetenschappelijk onderzoek en het publiceren van artikelen. Door ook als consultants te werken, inspireren we hen met problemen die onze klanten in de praktijk tegenkomen.
Publicaties
Medium blogartikelen van onze technische experts.
Hallucinaties detecteren bij LLM's, één teken per keer
Grote Taalmodellen zijn verbazingwekkend vaardig. Ze vatten samen, vertalen, redeneren en coderen (beter dan ik). Maar in tegenstelling tot mij, zijn ze ook berucht geworden voor het uitvinden van...
Zal de toekomst van Agentic AI gebaseerd zijn op kennisgrafieken?
Terwijl bedrijven zich haasten om AI operationeel te maken, ontdekken de meesten dat hun data infrastructuur nooit ontworpen was voor autonoom redeneren. Vandaag de dag is tot 80% van de AI implementatie...
De doe-het-zelf-ervaring verrijken: Hoe ADEO AI gebruikt om inhoud en kennis te verbinden
Assortimentoptimalisatie is een cruciaal proces in de detailhandel waarbij de ideale mix van producten wordt samengesteld om aan de vraag van de consument te voldoen, terwijl er rekening wordt gehouden met de vele logistieke...
MotherDuck uitgelegd: Hoe de Next-Gen AI & Analytics-oplossing past in uw Data-stack
MotherDuck breidt de analytische prestaties van DuckDB uit naar de cloud met samenwerkingsfuncties, levert 4x snellere prestaties dan BigQuery en kostenbesparingen ten opzichte van traditionele data...
Assortimentoptimalisatie met discrete keuzemodellen in Python
Assortimentoptimalisatie is een cruciaal proces in de detailhandel waarbij de ideale mix van producten wordt samengesteld om aan de vraag van de consument te voldoen, terwijl er rekening wordt gehouden met de vele logistieke...
Is Preference Alignment altijd de beste optie om LLM-gebaseerd vertalen te verbeteren? Een empirische analyse
Neurale meetmethoden voor de evaluatie van machinevertalingen (MT) zijn steeds prominenter geworden vanwege hun superieure correlatie met menselijke beoordelingen in vergelijking met traditionele lexicale meetmethoden.
Keuze-leren: Grootschalige keuzemodellering voor operationele contexten door de lens van machinaal leren
Discrete keuzemodellen zijn gericht op het voorspellen van keuzebeslissingen die individuen maken uit een menu van alternatieven, een zogenaamd assortiment. Bekende toepassingen zijn onder andere het voorspellen...
Het tijdperk van generatieve AI: Wat verandert er?
De overvloed en diversiteit van reacties op ChatGPT en andere generatieve AI's, of ze nu sceptisch of enthousiast zijn, tonen de veranderingen die ze teweegbrengen en de impact...
Hoe Artefact erin slaagde een eerlijk en toch eenvoudig loopbaansysteem voor software-ingenieurs te ontwikkelen
In de dynamische en steeds veranderende technologiesector van vandaag kan een carrièrepad vaak aanvoelen als een kronkelend pad door een dicht woud van mogelijkheden. Met snelle...
Waarom u LLMOps nodig hebt
Dit artikel introduceert LLMOps, een gespecialiseerde tak waarin DevOps en MLOps worden samengevoegd voor het beheer van de uitdagingen die grote taalmodellen (LLM's) met zich meebrengen...
De kracht van LangChain Expression Language (LCEL) ontketenen: van proof of concept naar productie
LangChain is in minder dan een jaar uitgegroeid tot een van de meest gebruikte Python-bibliotheken voor interactie met LLM's, maar LangChain was vooral een bibliotheek...
Hoe we de reconciliatie van profiel-ID's hebben afgehandeld met behulp van Treasure Data Unification en SQL
In dit artikel leggen we de uitdagingen van ID-conciliatie uit en demonstreren we onze aanpak om een eenduidig profiel-ID te maken in het Data platform van de klant,...



















































