Artefact Research Center

Acortando la brecha entre la academia y las aplicaciones industriales.

Investigación sobre modelos más transparentes y éticos para fomentar la adopción del modelo AI por parte de las empresas.

Ejemplos de sesgos AI

AppleCard otorga hipotecas basadas en criterios racistas
Lensa AI sexualiza los selfies de women
Clasificación racista de imágenes de Facebook con afroamericanos como monos
El chatbot de Twitter de Microsoft se volvió nazi, sexista y agresivo
Los buenos científicos son hombres blancos

Desafío actual

Los modelos AI son precisos y fáciles de implementar en muchos casos de uso, pero siguen siendo incontrolables debido a las «cajas negras» y a cuestiones éticas.

La misión del Artefact y el Research Center.

Un ecosistema completo que une la brecha entre
investigación fundamental y aplicaciones industriales tangibles.

Emmanuel MALHERBE

Jefe de Investigación

Campo de investigación: Aprendizaje Profundo, Aprendizaje Automático

Desde que comenzó su doctorado sobre modelos de PLN adaptados a la selección de personal online, Emmanuel siempre ha buscado un equilibrio eficaz entre la investigación pura y las aplicaciones de gran impacto. Su experiencia en investigación incluye la predicción de series temporales en 5G para Huawei Technologies y modelos de visión artificial para clientes de peluquería y maquillaje en L’Oréal. Antes de incorporarse a Artefact, trabajó en Shanghái como director de investigación de AI para L’Oréal Asia. Hoy en día, su puesto en Artefact es una oportunidad perfecta y un entorno ideal para tender puentes entre el mundo académico y la industria, y para fomentar su investigación aplicada al mundo real al tiempo que influye en las aplicaciones industriales.

Lee nuestras últimas noticias sobre el Artefact y el Research Center

Campos de investigación transversales

Gracias a nuestro posicionamiento único, nuestro objetivo es abordar los retos generales del programa AI, ya sea en el ámbito de la modelización estadística o de la investigación en gestión.
Esas preguntas son transversales a todas nuestras asignaturas y nutren nuestra investigación.

Control
responsabilidad

Modelos controlables con garantías en las predicciones
Interactuar con planificadores de demanda
Gerentes de categoría
Decisión del mejor modelo de entrada: garantizar predicciones fiables incluso fuera del conjunto de entrenamiento
Por ejemplo: Forzar monotonía en las variables de entrada

Explicabilidad
Y transparencia

Interpretación de predicciones
Interfaz y visualización para usuarios no técnicos
Adaptar los módulos y componentes de los modelos a los oficios
Visualización sobre entradas comprensibles, antes de la ingeniería de características

Sesgo y
incertidumbre

Enriquecer la predicción para mejores decisiones
Incertidumbre no simétrica (vs Gaussiana) necesaria para los clientes
Adaptado a la optimización de series temporales y surtido

Obstacles & accelerators of AI in business

Obstáculos y factores que impulsan la iniciativa AI en el ámbito empresarial

Estudio de las Organizaciones
Entrevistas a los principales accionistas y tomadores de decisiones del CAC 40
Repercusiones de AI en materia de ética, equidad e interpretabilidad
Gobernanza, normas y reglamentos para las aplicaciones AI

Un ecosistema completo que une la brecha entre la investigación fundamental y las aplicaciones tangibles de la industria.

A full ecosystem bridging the gap between fundamental research and industry tangible applications.

Asignaturas

Trabajamos en varios temas de doctorado en la intersección de casos de uso industrial y limitaciones de última generación.
Para cada asignatura, colaboramos con profesores universitarios y contamos con acceso a la infraestructura industrial data, lo que nos permite abordar las principales áreas de investigación en un contexto real concreto.

1 — Pronóstico y precios

Modele la serie temporal en su conjunto con un modelo de pronóstico multivariado y controlable. Dicho modelado nos permitirá abordar la planificación de precios y promociones encontrando los parámetros óptimos que aumenten la previsión de ventas. Con un enfoque tan holístico, nuestro objetivo es capturar la canibalización y la complementariedad entre productos. Nos permitirá controlar la previsión con garantías de que las predicciones se mantendrán consistentes.

Mohamed CHTIBA

Científico Investigador
sobre Pronósticos y Precios

Campo de investigación
—
Aprendizaje Profundo, Optimización, Estadística

Jean-Marc BARDET

Profesora

Laboratorio SAMM

Página de académico

Campo de investigación
—
Procesos estocásticos, Estadística, Probabilidad

Joseph RYNKIEWICZ

Profesor Asociado

Laboratorio SAMM

Página de académico

Campo de investigación
—
Series temporales, Redes neuronales, Estadística

2 — Puntuación explicable y controlable

Una familia de modelos de aprendizaje automático muy utilizada se basa en los árboles de decisión: los bosques aleatorios y el boosting. Aunque su precisión suele ser de vanguardia, estos modelos adolecen de una sensación de «caja negra», lo que limita el control del usuario. Nuestro objetivo es aumentar su explicabilidad y transparencia, normalmente mejorando la estimación de los valores SHAP en el caso de conjuntos de datos desequilibrados data. También pretendemos ofrecer ciertas garantías para estos modelos, por ejemplo, para muestras ajenas al entrenamiento o mediante la aplicación de mejores restricciones monótonas.

Abdoulaye SAKHO

Científico de investigación en
TModelos basados en árboles

Campo de investigación
—
Estadística explicable AI

Erwan SCORNET

Profesora

Laboratorio LPSM

Página del Erudito

Campo de investigación
—
Bosques aleatorios, Interpretabilidad, Valores faltantes

3 — Optimización del surtido

La gestión del surtido es un problema empresarial fundamental para los minoristas que surge a la hora de seleccionar el conjunto de productos que se venderán en las tiendas. Mediante el uso de grandes conjuntos de datos industriales y redes neuronales, nuestro objetivo es crear modelos más sólidos e interpretables que reflejen mejor las decisiones de los clientes ante una variedad de productos. Abordar la canibalización y las complementariedades entre productos, así como comprender mejor los grupos de clientes, es clave para encontrar un conjunto de productos más óptimo en una tienda.

Vincent AURIAU

Investigador Científico en Optimización de Surtido

Campo de investigación
—
Aprendizaje profundo,
Investigación de Operaciones

Vincent MOUSSEAU

Profesora

Laboratorio MICS

Académico Página

Campo de investigación
—
Aprendizaje de Preferencias, Análisis de Decisión Multicriterio, Investigación de Operaciones

Antoine DESIR

Profesor Asociado

Laboratorio TOM

Página del Erudito

Campo de investigación
—
Modelado de Elección, Optimización de Surtido, Investigación de Operaciones

Ali AOUAD

Profesor Asistente

Ciencia de la Administración y Operaciones

Página DBLP

Campo de investigación
—
Coincidencia Dinámica, Modelado de Elección, Optimización de Surtido e Inventario, Algoritmo de Aproximación, Investigación de Operaciones

4 — Adopción de AI en las empresas

El reto para lograr una mejor adopción de AI en las empresas consiste, por un lado, en mejorar los modelos AI y, por otro, en comprender los aspectos humanos y organizativos. En la encrucijada entre la investigación cualitativa en gestión y la investigación social, este eje pretende explorar dónde encuentran dificultades las empresas a la hora de adoptar herramientas de AI. Los marcos existentes sobre la adopción de innovaciones no son del todo adecuados para las innovaciones en aprendizaje automático, ya que existen diferencias típicas en materia de regulación, formación del personal o sesgos en lo que respecta a AI, y más aún con el AI generativo.

Lara ABDEL HALIM

Investigador científico sobre la implantación de AI en las empresas

Campo de investigación
—
Investigación de la gestión, Innovación

Cécile CHAMARET

Profesora

Laboratorio CRG

Página del Erudito

Campo de investigación
—
Innovación, Marketing, Investigación Social Cualitativa

5 — Sostenibilidad impulsada por Data

El proyecto movilizará métodos de investigación cualitativa y cuantitativa y abordará dos preguntas clave: ¿Cómo pueden las empresas medir eficazmente el desempeño en sostenibilidad social y ambiental? ¿Por qué las medidas de sostenibilidad a menudo no logran generar cambios significativos en las prácticas organizacionales?

Por un lado, el proyecto tiene como objetivo analizar los parámetros data-driven e identificar indicadores que permitan armonizar los procedimientos organizativos con los objetivos de sostenibilidad social y medioambiental. Por otro lado, el proyecto se centrará en convertir estas medidas de sostenibilidad en acciones concretas dentro de las empresas.

Oualid Mokhantar

Científico investigador en sostenibilidad

Campo de investigación
—
Investigación de Gestión, Economía

Gorgi KRLEV

Profesor Asociado

Departamento de Sostenibilidad

Página del Erudito

Campo de investigación
—
Sostenibilidad, Innovación social, Teoría de las organizaciones

6 — Sesgo en visión por computadora

Cuando un modelo realiza una predicción basándose en una imagen —por ejemplo, en la que aparece un rostro—, tiene acceso a información sensible, como el origen étnico, el género o la edad, que puede sesgar su razonamiento. Nuestro objetivo es desarrollar un marco para medir matemáticamente ese sesgo y proponer metodologías para reducirlo durante el entrenamiento del modelo. Además, nuestro enfoque detectaría estadísticamente las zonas de mayor sesgo para explicar, comprender y controlar en qué puntos dichos modelos refuerzan el sesgo presente en el data.

Veronika SHILOVA

Investigador Científico en Sesgos en Visión por Computadora

Campo de investigación
—
Aprendizaje profundo, visión por computadora, sesgos

Laurent RISSER

Ingeniero de Investigación del CNRS

Instituto Matemáticas de Toulouse

Página del Erudito

Campo de investigación
—
Aprendizaje automático explicable, análisis de imágenes, interpretable y robusto AI

Jean-Michel LOUBES

Profesora

Instituto Matemáticas de Toulouse

Página del Erudito

Campo de investigación
—
Aprendizaje imparcial, AI interpretable, transporte óptimo y aplicaciones a la estadística y el aprendizaje automático

7 — LLM para recuperación de información

Una aplicación importante de los LLM es cuando se combinan con un corpus de documentos, que representan algún conocimiento o información industrial. En tal caso, hay un paso de recuperación de información, para el cual los LLM muestran algunas limitaciones, como el tamaño del texto de entrada, que es demasiado pequeño para indexar documentos. De manera similar, el efecto de alucinación también puede ocurrir en la respuesta final, que pretendemos detectar utilizando el documento recuperado y la incertidumbre del modelo en el momento de la inferencia.

Hippolyte GISSEROT-BOUKHLEF

Científico de Investigación en Modelos de Lenguaje Grandes para Recuperación de Información

Campo de investigación
—
Aprendizaje profundo, PLN

Pierre COLOMBO

Profesor Asociado

Laboratorio MICS

Página del Erudito

Campo de investigación
—
Modelos de lenguaje a gran escala, sesgos en AI, evaluación de modelos

Céline HUDELOT

Profesora

Laboratorio MICS

Página del Erudito

Campo de investigación
—
Representación del conocimiento, Interpretación semántica, Redes neuronales

Investigadores a tiempo parcial de Artefact

Además de nuestro equipo dedicado a la investigación, tenemos varios colaboradores que dedican tiempo a la investigación científica y a la publicación de artículos. Al trabajar también como consultores, los inspiramos con problemas del mundo real encontrados con nuestros clientes.

Michael Voelske

Desde mayo de 2022, estoy al frente del equipo de Ciencia e Ingeniería de Data en Artefact Alemania, donde aplico mi formación académica en informática —con un doctorado centrado en el aprendizaje automático y la recuperación de información— para resolver los problemas empresariales de los clientes de Artefact. Mi función no solo consiste en liderar, sino también en inspirar a mi equipo para que combine la investigación de vanguardia en AI con aplicaciones pragmáticas. Apasionado por hacer accesibles los complejos conceptos de AI, me esfuerzo por aprovechar la tecnología tanto para crear soluciones empresariales innovadoras como para generar un impacto social significativo.

Campo de investigación
—
Aplicaciones de Modelos Grandes de Lenguaje en Recuperación de Información y PLN
—
Modelos explicables en aprendizaje automático, recuperación y clasificación
—
RI para necesidades de información complejas basadas en tareas

Evan Hurwitz

Evan es doctor en Ingeniería en artificial intelligence, donde aplicó técnicas de AI para optimizar una cartera gestionada de forma activa utilizando múltiples estrategias de negociación. Ha desarrollado su labor investigadora en el ámbito académico, donde fue coautor de “Inteligencia artificial y teoría económica: Skynet en el mercado”. Posteriormente, pasó a trabajar en soluciones de energía verde utilizando el aprendizaje por refuerzo para S&P Platts, tras lo cual colaboró con Preqin en la incorporación y comprensión de inversiones alternativas data. Se incorporó a Artefact en 2020 y ha trabajado en múltiples sectores, como el comercio minorista, la ciberseguridad, el SaaS, la ingeniería, la educación y el sector inmobiliario, con una cartera de clientes que abarca desde pymes hasta empresas del FTSE 100.

Campo de investigación
—
Aprendizaje por refuerzo
—
Aprendizaje automático
—
Finanzas y Juegos

Jorge Cevora

George obtuvo su doctorado en Neurociencia Teórica por la Universidad de Cambridge gracias a su trabajo sobre la modelización matemática del aprendizaje animal. George cuenta con 10 años de experiencia en investigación en aprendizaje profundo, que ahora aplica en entornos industriales. Desde que dejó el mundo académico, George ha trabajado en una amplia gama de sectores y ámbitos problemáticos, desde motores a reacción hasta la resistencia a los antibióticos. George también ha dedicado varios años al ámbito de la seguridad nacional, desarrollando un producto para combatir la discriminación derivada del uso inadecuado de AI. Más información en www.cevora.xyz

Campo de investigación
—
Neurociencia
—
Aprendizaje profundo
—
aprendizaje automático

Savio Rozario

Savio es doctor en Física Experimental de Láser y Plasma por el Imperial College de Londres, donde utilizó métodos de aprendizaje automático para optimizar la configuración experimental de sistemas de aceleradores de plasma altamente no lineales. Trabajó en EY, en su departamento de I+D fiscal, desarrollando soluciones de aprendizaje automático para la supervisión del cumplimiento normativo en múltiples geografías mediante el uso de modelos de lenguaje a gran escala. Se incorporó a Artefact en 2022 y ha proporcionado soluciones científicas integrales de data en diversos sectores, entre ellos el comercio minorista, el transporte y el sector inmobiliario, para organizaciones del FTSE 250.

Campo de investigación
—
aprendizaje automático
—
Optimización no lineal
—
Física

Nelson Paz

Nelson pasó la primera década de su carrera trabajando tanto en los mercados de valores como en los de materias primas, donde aplicó estrategias de negociación cuantitativa en los mercados extrabursátiles. Tras completar su máster en Ciencias en 2021, se incorporó a la oficina de Artefact en el Reino Unido como científico de data, donde trabaja en problemas científicos de data en diversos ámbitos, con especialización en aplicaciones de AI en los mercados financieros y el trading.

Publicaciones

- Jalid Al Jatib, Michael Voelske, Anh Le, Shahbaz Syed, Martín Potthast y Benno Stein.“Un nuevo conjunto Data para la identificación de la causalidad en textos argumentativos”, En Proceedings of the 24th Meeting of the Special Interest Group on Discourse and Dialogue (SIGDIAL), ACL (2023).
- Glen Hopkins y Kristjan Kalm. “Clasificación de documentos complejos: Comparación de soluciones personalizadas con modelos de lenguaje grandes” arXiv preprint arXiv:2312.07182 (2023)
- Olivier Turnbull y George Cevora. “La inestabilidad de los modelos de visión por computadora es un resultado necesario de la tarea en sí.” Preimpresión de arXiv arXiv:2310.17559 (2023).
- Marcel Marais, Máté Hartstein y George Čevora, “Usando inicialización lineal para mejorar la velocidad de convergencia y el error de entrenamiento completo en Autoencoders”Preimpresión de arXiv arXiv:2311.10699 (2023).
- Evan Hurwitz, Nelson Peace y George Cevora. “Lograr un Entrenamiento Estable de Agentes de Aprendizaje por Refuerzo en Entornos Bimodales a través del Aprendizaje por Lotes.”arXiv preprint arXiv:2307.00923 (2023).
- Savio Rozario y George Čevora.“El modelo explicable AI no ofrece las explicaciones que buscan los usuarios finales.”Preimpresión de arXiv arXiv:2302.11577 (2023).
- Vincent Auriau, Emmanuel Malherbe y Matthieu Perrot. “GAN Guiado por Segmentación Débil para Edición Realista de Color.”En Conferencia Internacional sobre Análisis y Procesamiento de Imágenes, Springer Nature Switzerland, (2023).
- Maté Hartstein y George Čevora.“Método basado en el Data para navegar por el Atlántico en una regata de remo”.
- Evan Hurwitz y George Čevora. “Previsión del rendimiento de los programas de recualificación de la fuerza laboral.”arXiv preprint arXiv:2107.10001 (2021).

Artículos de Medium de nuestros expertos en tecnología.

Detectando alucinaciones en LLMs, un token a la vez

Los modelos de lenguaje grandes son asombrosamente capaces. Resumen, traducen, razonan y codifican (mejor que yo). Pero a diferencia de mí, también se han hecho notorios por inventar...

¿Dependerá el futuro de Agentic AI de los grafos de conocimiento?

A medida que las empresas se apresuran a poner en práctica el modelo AI, la mayoría descubre que su infraestructura data nunca se diseñó para el razonamiento autónomo. Hoy en día, hasta el 80% de las implementaciones de AI...

Enriquecer la experiencia del bricolaje: cómo ADEO utiliza AI para conectar contenidos y conocimientos

La optimización del surtido es un proceso crítico en el comercio minorista que implica la curación de la combinación ideal de productos para satisfacer la demanda del consumidor teniendo en cuenta la logística...

MotherDuck al detalle: cómo encaja la solución de análisis y AI de última generación en tu entorno Data

MotherDuck amplía el rendimiento analítico de DuckDB al modelo cloud con funciones colaborativas, ofreciendo un rendimiento cuatro veces superior al de BigQuery y un ahorro de costes respecto a los almacenes de datos tradicionales data gracias a...

Optimización de surtido con modelos de elección discreta en Python

¿Es la Alineación de Preferencias Siempre la Mejor Opción para Mejorar la Traducción Basada en LLM? Un Análisis Empírico

Las métricas neuronales para la evaluación de la traducción automática (TA) se han vuelto cada vez más prominentes debido a su superior correlación con el juicio humano en comparación con las métricas léxicas tradicionales.

Choice-Learn: Modelado de elección a gran escala para contextos operativos a través de la lente del aprendizaje automático

Los modelos de elección discreta tienen como objetivo predecir las decisiones de elección tomadas por los individuos a partir de un menú de alternativas, llamado surtido. Los casos de uso conocidos incluyen la predicción de un...

La era de la IA generativa AI: qué está cambiando

La abundancia y diversidad de las reacciones ante ChatGPT y otros modelos generativos de IA, ya sean escépticas o entusiastas, ponen de manifiesto los cambios que están provocando y el impacto...

Cómo Artefact logró desarrollar un sistema de desarrollo profesional justo y sencillo para los ingenieros de software

En la dinámica y siempre cambiante industria tecnológica de hoy, una trayectoria profesional a menudo puede sentirse como un camino sinuoso a través de un denso bosque de oportunidades. Con el rápido...

¿Por qué necesitas LLMOps?

Este artículo presenta LLMOps, una rama especializada que fusiona DevOps y MLOps para gestionar los desafíos que plantean los Modelos de Lenguaje Grandes (LLM)...

Desatando el poder del LangChain Expression Language (LCEL): de la prueba de concepto a la producción

LangChain se ha convertido en una de las bibliotecas de Python más utilizadas para interactuar con LLMs en menos de un año, pero LangChain fue principalmente una biblioteca...

Cómo gestionamos la conciliación de ID de perfiles utilizando Treasure Data Unification y SQL

En este artículo explicamos los retos que plantea la conciliación de identificadores y mostramos nuestro enfoque para crear un identificador de perfil unificado en la plataforma Customer Data, concretamente...

Artefact Research Center

Acortando la brecha entre la academia y las aplicaciones industriales.

Investigación sobre modelos más transparentes y éticos para fomentar la adopción del modelo AI por parte de las empresas.

Ejemplos de sesgos AI

Desafío actual

La misión del Artefact y el Research Center.

Lee nuestras últimas noticias sobre el Artefact y el Research Center

Campos de investigación transversales

Control responsabilidad

Explicabilidad Y transparencia

Sesgo y incertidumbre

Obstáculos y factores que impulsan la iniciativa AI en el ámbito empresarial

Un ecosistema completo que une la brecha entre la investigación fundamental y las aplicaciones tangibles de la industria.

Asignaturas

1 — Pronóstico y precios

2 — Puntuación explicable y controlable

3 — Optimización del surtido

4 — Adopción de AI en las empresas

5 — Sostenibilidad impulsada por Data

6 — Sesgo en visión por computadora

7 — LLM para recuperación de información

Investigadores a tiempo parcial de Artefact

Publicaciones

Artículos de Medium de nuestros expertos en tecnología.

Control
responsabilidad

Explicabilidad
Y transparencia

Sesgo y
incertidumbre