Artefact Research Center

缩小学术界与工业应用之间的差距。.

研究更加透明和道德的模式，促进 AI 业务的采用。.

AI 偏差示例

AppleCard 根据种族主义标准发放抵押贷款
Lensa AI 将 women 的自拍照性化
种族主义 Facebook 图片分类，非洲裔美国人是猴子
微软推特聊天机器人变得纳粹、性别歧视和咄咄逼人
编写代码说明优秀科学家都是白人男性的 ChatGPT

当前的挑战

AI 模型准确且易于在许多使用案例中部署，但由于黑盒和道德问题，仍然无法控制。.

Artefact Research Center 的任务。.

一个完整的生态系统，在以下方面架起了桥梁
基础研究和实际工业应用。.

埃马纽埃尔-马勒贝

研究负责人

研究领域：深度学习、机器学习

埃马纽埃尔从攻读适用于电子招聘的 NLP 模型的博士学位开始，一直在纯粹的研究和有影响力的应用之间寻求有效的平衡。他的研究经验包括为华为技术公司提供 5G 时间序列预测，以及为欧莱雅公司的美发和化妆客户提供计算机视觉模型。加入 Artefact 之前，他在上海担任欧莱雅亚洲 AI 研究负责人。如今，他在 Artefact 的职位是一个绝佳的机会和理想的环境，可以在学术界和工业界之间架起一座桥梁，促进他的实际研究，同时影响工业应用。.

阅读我们最新的 Artefact Research Center 新闻

横向研究领域

凭借独特的定位，我们的目标是应对 AI 的普遍挑战，无论是统计建模还是管理研究。.
这些问题贯穿于我们所有的课题，并促进我们的研究。.

控制与
问责制

保证预测的可控模型
与需求规划人员对接
类别经理
根据最佳模型输入做出决定：即使在训练集之外也能执行可靠的预测
例如确保输入变量的单调性

可解释性
透明度

预测的解释
面向非技术用户的界面和可视化
根据行业调整模型模块和组件
在特征工程之前，对可理解的输入进行可视化处理

偏见与
不确定

丰富预测内容，做出更好的决策
客户需要的非对称不确定性（与高斯不确定性相比
适用于时间序列和分类优化

Obstacles & accelerators of AI in business

AI 在企业中的障碍和促进因素

组织研究
最高级别的 CAC 40 利益相关者和决策者访谈
AI 道德、公平和可解释性的影响
AI 应用的管理、标准和法规

一个完整的生态系统，在基础研究和工业实际应用之间架起了一座桥梁。.

A full ecosystem bridging the gap between fundamental research and industry tangible applications.

主题

我们的几个博士课题涉及工业用例和最先进限制的交叉点。.
对于每个课题，我们都与大学教授合作，并可使用工业 data，使我们能够在给定的现实世界场景中解决主要研究领域的问题。.

1 - 预测与定价

用可控的多元预测模型对时间序列进行整体建模。通过这种建模，我们可以找到提高销售预测的最佳参数，从而解决定价和促销规划问题。通过这种整体方法，我们的目标是捕捉产品之间的蚕食和互补。这将使我们能够控制预测，并保证预测保持一致。.

穆罕默德-奇蒂巴

研究科学家
关于预测和定价

研究领域
—
深度学习、优化、统计

让-马克-巴代

教授

萨姆姆实验室

学者页面

研究领域
—
随机过程、统计学、概率论

约瑟夫-雷恩基维茨

副教授

萨姆姆实验室

学者页面

研究领域
—
时间序列、神经网络、统计学

2 - 可解释和可控制的评分

广泛使用的机器学习模型系列以决策树为基础：随机森林、提升。虽然这些模型的准确性往往达到了最先进的水平，但却给人一种黑箱的感觉，用户的控制能力有限。我们的目标是提高这些模型的可解释性和透明度，特别是在 datasets 不平衡的情况下改进 SHAP 值的估计。我们还致力于为此类模型提供一些保证，例如，针对训练外样本或通过更好的单调性约束。.

阿卜杜拉耶-萨科

研究科学家
T基于模型

研究领域
—
统计，可解释 AI

Erwan SCORNET

教授

LPSM 实验室

学者页面

研究领域
—
随机森林、可解释性、缺失值

3 - 组合优化

对于零售商来说，商品分类是一个主要的商业问题，它是在选择商店销售的商品集合时出现的。利用大型工业 datasets 和神经网络，我们的目标是建立更稳健、更可解释的模型，以更好地捕捉顾客在面对琳琅满目的产品时的选择。处理产品之间的蚕食和互补问题，以及更好地了解客户集群，是在商店中找到更优化的产品集的关键。.

文森特-奥里奥

分类优化研究科学家

研究领域
—
深度学习,
运筹学

文森特-穆索

教授

多指标类集调查实验室

学者页次

研究领域
—
偏好学习、多标准决策分析、运筹学

安托万-代斯尔

副教授

TOM 实验室

学者页面

研究领域
—
选择建模、分类优化、运营研究

阿里-奥亚德

助理教授

管理科学与运作

DBLP 网页

研究领域
—
动态匹配、选择建模、分类和库存优化、近似算法、运筹学

4 - 企业采用 AI

在企业中更好地采用 AI 的挑战在于，一方面要改进 AI 模型，另一方面要了解人和组织方面的情况。在定性管理研究和社会研究的交叉点上，本研究轴试图探讨企业在采用 AI 工具时面临的困难。现有的创新采用框架并不完全适用于机器学习创新，因为在涉及 AI 时，存在着监管、人员培训或偏见方面的典型差异，而对于生成式 AI 而言更是如此。.

拉拉-阿卜杜勒-哈利姆

关于企业采用 AI 的研究科学家

研究领域
—
管理研究、创新

Cécile CHAMARET

教授

CRG 实验室

学者页面

研究领域
—
创新、营销、定性社会研究

5 - Data 驱动的可持续性

该项目将采用定性和定量研究方法，解决两个关键问题：公司如何有效衡量社会和环境可持续性绩效？为什么可持续发展措施往往不能给组织实践带来重大变化？

一方面，该项目旨在探索 data-driven 指标并确定指标，使组织程序与社会和环境可持续发展目标保持一致。另一方面，该项目将侧重于把这些可持续发展措施转化为公司内部的具体行动。.

Oualid Mokhantar

可持续性研究科学家

研究领域
—
管理研究、经济学

戈尔吉-克列夫

副教授

可持续发展部

学者页面

研究领域
—
可持续性、社会创新、组织理论

6 - 计算机视觉中的偏差

当模型根据图像（例如显示人脸的图像）进行预测时，它可以获取敏感信息，例如种族、性别或年龄，这些信息可能会使其推理产生偏差。我们的目标是开发一个框架来从数学角度衡量这种偏差，并提出在模型训练过程中减少这种偏差的方法。此外，我们的方法将从统计学角度检测出强烈偏差的区域，以解释、理解和控制这些模型在哪些方面强化了 data 中存在的偏差。.

韦罗妮卡-希洛娃

计算机视觉偏差研究科学家

研究领域
—
深度学习、计算机视觉、偏差

洛朗-里瑟

法国国家科学研究中心研究工程师

图卢兹数学研究所

学者页面

研究领域
—
可解释的机器学习、图像分析、可解释的鲁棒性 AI

让-米歇尔-卢贝

教授

图卢兹数学研究所

学者页面

研究领域
—
无偏学习、可解释的 AI、最优传输以及在统计、机器学习中的应用

7 - 用于信息检索的 LLM

LLMs 的一个主要应用是与代表某些行业知识或信息的文档语料库相结合。在这种情况下，需要进行信息检索，而 LLMs 在这方面有一些局限性，例如输入文本的大小太小，无法为文档编制索引。同样，幻觉效应也可能发生在最终答案中，我们的目标是在推理时利用检索到的文档和模型的不确定性来检测幻觉效应。.

伊波利特-吉塞洛-布克雷夫

信息检索大型语言模型研究科学家

研究领域
—
深度学习、NLP

皮埃尔-克伦博

副教授

多指标类集调查实验室

学者页面

研究领域
—
大型语言模型、AI 中的偏差、模型评估

席琳-胡德罗

教授

多指标类集调查实验室

学者页面

研究领域
—
知识表示、语义解释、神经网络

Artefact 的兼职研究员

除了专门从事研究的团队，我们还有几位合作者，他们花了一些时间从事科学研究并发表论文。通过顾问工作，他们也能从客户遇到的实际问题中得到启发。.

迈克尔-沃尔斯克

自2022年5月以来，我一直是德国Artefact公司Data科学与工程团队的负责人。在这里，我将自己的计算机科学学术背景（拥有机器学习和信息检索方面的博士学位）应用于解决Artefact公司客户的业务问题。我的工作不仅包括领导团队，还包括激励团队将 AI 的前沿研究与实际应用相结合。我热衷于将复杂的 AI 概念变得通俗易懂，并努力利用技术实现创新的业务解决方案和有意义的社会影响。.

研究领域
—
大型语言模型在信息检索和 NLP 中的应用
—
机器学习、检索和排名中的可解释模型
—
满足复杂的任务型信息需求的 IR

埃文-赫尔维茨

埃文拥有 artificial intelligence 工程博士学位，他将 AI 技术应用于利用多种交易策略优化主动管理的投资组合。他曾在学术界从事研究工作，与人合著了《人工智能与经济理论》一书：市场中的天网》。后来，他在标准普尔普氏能源资讯公司（S&P Platts）从事利用强化学习的绿色能源解决方案的研究工作，之后又在 Preqin 公司从事摄取和理解另类投资的工作 data。他于 2020 年加入 Artefact，曾在零售、网络安全、SaaS、工程、教育和房地产等多个行业工作，客户包括中小企业和富时 100 指数公司。.

研究领域
—
强化学习
—
机器学习
—
金融与博彩

乔治-塞沃拉

George 因动物学习数学建模研究获得剑桥大学理论神经科学博士学位。乔治在深度学习方面拥有 10 年的研究经验，目前他正在将这些经验应用于工业领域。离开学术界后，乔治在从喷气发动机到抗生素耐药性等多个行业和问题领域工作过。乔治还在国家安全领域工作过几年，开发了一种产品，用于消除因不适当使用 AI 而产生的歧视。了解更多信息，请访问 www.cevora.xyz

研究领域
—
神经科学
—
深度学习
—
机器学习

萨维奥-罗扎里奥

Savio 拥有伦敦帝国学院激光等离子体物理实验博士学位，他在该校利用机器学习方法优化了高度非线性等离子体加速器系统的实验配置。他曾在安永会计师事务所的税务研发部门工作，利用大型语言模型为多个地区的合规性监控开发机器学习解决方案。他于 2022 年加入 Artefact，曾为富时 250 指数企业提供端到端 data 科学解决方案，涉及零售、运输和房地产等多个领域。.

研究领域
—
机器学习
—
非线性优化
—
物理学

纳尔逊-和平

纳尔逊职业生涯的前十年是在股票和商品市场中度过的，他在场外交易市场中部署了量化交易策略。2021 年完成 Data 科学硕士学位后，他加入了 Artefact 的英国办事处，成为一名 data 科学家，从事跨领域的 data 科学问题研究，擅长金融市场和交易中的 AI 应用。.

出版物

- 哈立德-哈提卜, 迈克尔-沃尔斯克, Anh Le, 沙赫巴兹-赛义德, 马丁-波特萨斯特和本诺-斯坦因.“用于论证文本因果关系识别的新 Dataset”，《论述与对话特别兴趣小组（SIGDIAL）第 24 次会议论文集》，ACL（2023 年）。.
- 格伦-霍普金斯和克里斯蒂安-卡尔姆。“复杂文档的分类：比较定制解决方案和大型语言模型” arXiv 预印本 arXiv:2312.07182 (2023)
- 奥利维尔-特恩布尔和乔治-塞沃拉。“计算机视觉模型的不稳定性是任务本身的必然结果” arXiv preprint arXiv:2310.17559 (2023).
- 马塞尔-马莱斯、马特-哈特斯坦和乔治-切沃拉，“利用线性初始化提高自动编码器的收敛速度和完全训练误差” arXiv preprint arXiv:2311.10699 (2023).
- Evan Hurwitz、Nelson Peace 和 George Cevora。“通过批量学习实现双模环境中强化学习代理的稳定训练.” arXiv preprint arXiv:2307.00923 (2023).
- 萨维奥-罗扎里奥和乔治-切沃拉“可解释的 AI 无法提供最终用户所要求的解释.” arXiv preprint arXiv:2302.11577 (2023).
- Vincent Auriau、Emmanuel Malherbe 和 Matthieu Perrot。“针对真实色彩版的弱分割引导 GAN。.”国际图像分析与处理会议，瑞士 Springer Nature，（2023 年）。.
- Maté Hartstein 和 George Čevora.“Data 驱动的在赛艇比赛中航行大西洋的方法”.
- Evan Hurwitz 和 George Čevora.“预测劳动力再培训计划的绩效。.” arXiv preprint arXiv:2107.10001 (2021).

我们的技术专家撰写的 Medium 博客文章。.

一次一个令牌地检测 LLM 中的幻觉

大型语言模型的能力令人惊叹。它们总结、翻译、推理和编码（比我做得更好）。但与我不同的是，它们也因发明...

未来的代理 AI 是否会依赖于知识图谱？

随着企业急于将 AI 投入运行，大多数企业发现他们的 data 基础设施根本不是为自主推理而设计的。如今，多达 80% 的 AI 实施...

丰富 DIY 体验：ADEO 如何使用 AI 连接内容和知识

分类优化是零售业的一个关键流程，它涉及到策划理想的产品组合以满足消费者需求，同时考虑到许多物流因素。.

MotherDuck 解读：新一代 AI 和分析解决方案如何融入您的 Data 堆栈

MotherDuck 通过协作功能将 DuckDB 的分析性能扩展到 cloud，提供比 BigQuery 快 4 倍的性能，并通过...

利用 Python 中的离散选择模型进行分类优化

分类优化是零售业的一个关键流程，它涉及到策划理想的产品组合以满足消费者需求，同时考虑到许多物流因素。.

偏好对齐总是增强基于 LLM 翻译的最佳选择吗？实证分析

用于机器翻译（MT）评估的神经指标因其与人类判断的相关性优于传统词汇指标而日益突出。

选择-学习：从机器学习的角度为业务环境建立大规模选择模型

离散选择模型的目的是预测个人从被称为 "品种 "的备选方案中做出的选择决定。著名的应用案例包括预测...

生成式 AI 时代：正在发生的变化

对 ChatGPT 和其他生成性 AI 的大量和多样化回应，无论是怀疑还是热情，都表明了它们正在带来的变化和影响。.

Artefact 如何为软件工程师开发公平而简单的职业系统

在当今充满活力、不断发展的科技行业中，职业道路往往会让人感觉像在机会密林中蜿蜒曲折。随着科技行业的快速发展，我们的职业生涯也在不断变化。.

为什么需要 LLMOps

本文介绍了 LLMOps，这是一个融合了 DevOps 和 MLOps 的专业分支，用于管理大型语言模型（LLM）带来的挑战...

释放 LangChain Expression Language (LCEL) 的力量：从概念验证到产品化

在不到一年的时间里，LangChain 已成为与 LLM 交互的最常用 Python 库之一，但 LangChain 主要是一个库...

我们如何使用 Treasure Data Unification 和 SQL 处理配置文件 ID 调节

在本文中，我们将解释 ID 协调所面临的挑战，并展示我们在客户 Data 平台中创建统一配置文件 ID 的方法，特别是...

Artefact Research Center

缩小学术界与工业应用之间的差距。.

研究更加透明和道德的模式，促进 AI 业务的采用。.

AI 偏差示例

当前的挑战

Artefact Research Center 的任务。.

阅读我们最新的 Artefact Research Center 新闻

横向研究领域

控制与 问责制

可解释性 透明度

偏见与 不确定

AI 在企业中的障碍和促进因素

一个完整的生态系统，在基础研究和工业实际应用之间架起了一座桥梁。.

主题

1 - 预测与定价

2 - 可解释和可控制的评分

3 - 组合优化

4 - 企业采用 AI

5 - Data 驱动的可持续性

6 - 计算机视觉中的偏差

7 - 用于信息检索的 LLM

Artefact 的兼职研究员

出版物

我们的技术专家撰写的 Medium 博客文章。.

控制与
问责制

可解释性
透明度

偏见与
不确定