Artefact Research Center
Preenchendo a lacuna entre a academia e os aplicativos do setor.

Pesquisa sobre modelos mais transparentes e éticos para estimular a adoção de negócios AI.

Exemplos de tendências do AI
- AppleCard concede hipotecas com base em critérios racistas
- Lensa AI sexualiza selfies do women
- Classificação de imagens racistas do Facebook com afro-americanos como macacos
- O chatbot da Microsoft no Twitter está se tornando nazista, sexista e agressivo
- ChatGPT que escreve um código afirmando que bons cientistas são homens brancos
Desafio atual
Os modelos AI são precisos e fáceis de implementar em muitos casos de uso, mas permanecem incontroláveis devido a caixas pretas e questões éticas.
A missão do Artefact Research Center.
Um ecossistema completo que preenche a lacuna entre
pesquisa fundamental e aplicações industriais tangíveis.


Emmanuel MALHERBE
Chefe de Pesquisa
Área de pesquisa: Aprendizado profundo, aprendizado de máquina
Começando com um doutorado em modelos de PNL adaptados ao recrutamento eletrônico, Emmanuel sempre buscou um equilíbrio eficiente entre pesquisa pura e aplicações impactantes. Sua experiência em pesquisa inclui previsão de séries temporais 5G para a Huawei Technologies e modelos de visão computacional para clientes de cabeleireiro e maquiagem na L'Oréal. Antes de ingressar na Artefact, ele trabalhou em Xangai como chefe de pesquisa da AI para a L'Oréal Ásia. Hoje, seu cargo no Artefact é uma oportunidade perfeita e um ambiente ideal para preencher a lacuna entre a academia e o setor, e para promover sua pesquisa no mundo real e, ao mesmo tempo, impactar as aplicações industriais.
Leia nossas últimas notícias sobre o Artefact Research Center
Campos de pesquisa transversais
Com nosso posicionamento exclusivo, nosso objetivo é enfrentar os desafios gerais do AI, seja em modelagem estatística ou pesquisa de gerenciamento.
Essas perguntas são transversais a todos os nossos assuntos e alimentam nossa pesquisa.
Um ecossistema completo que preenche a lacuna entre a pesquisa fundamental e os aplicativos tangíveis do setor.

Assuntos
Trabalhamos em vários tópicos de doutorado na interseção de casos de uso industrial e limitações do estado da arte.
Para cada assunto, trabalhamos em colaboração com professores universitários e temos acesso ao data industrial que nos permite abordar as principais áreas de pesquisa em um determinado cenário do mundo real.
1 - Previsão e preços
Modelar séries temporais como um todo com um modelo de previsão controlável e multivariado. Essa modelagem nos permitirá abordar o planejamento de preços e promoções, encontrando os parâmetros ideais que aumentam a previsão de vendas. Com essa abordagem holística, pretendemos capturar a canibalização e a complementaridade entre os produtos. Isso nos permitirá controlar a previsão com garantias de que as previsões sejam mantidas consistentes.
2 - Pontuação explicável e controlável
Uma família de modelos de aprendizado de máquina amplamente utilizada é baseada em árvores de decisão: florestas aleatórias, boosting. Embora sua precisão seja muitas vezes a mais avançada, esses modelos sofrem de uma sensação de caixa preta, oferecendo controle limitado ao usuário. Nosso objetivo é aumentar sua explicabilidade e transparência, geralmente melhorando a estimativa dos valores de SHAP no caso de conjuntos data desequilibrados. Também pretendemos oferecer algumas garantias para esses modelos, por exemplo, para amostras fora do treinamento ou permitindo melhores restrições monotônicas.
3 - Otimização do sortimento
O sortimento é um importante problema comercial para os varejistas que surge ao selecionar o conjunto de produtos a serem vendidos nas lojas. Usando grandes conjuntos industriais de data e redes neurais, pretendemos criar modelos mais robustos e interpretáveis que capturem melhor a escolha do cliente diante de uma variedade de produtos. Lidar com a canibalização e as complementaridades entre os produtos, bem como compreender melhor os grupos de clientes, é fundamental para encontrar um conjunto mais ideal de produtos em uma loja.
4 - AI Adoção em empresas
O desafio de uma melhor adoção de AI nas empresas é, por um lado, aprimorar os modelos de AI e, por outro, entender os aspectos humanos e organizacionais. No cruzamento da pesquisa de gestão qualitativa e da pesquisa social, este eixo procura explorar onde as empresas enfrentam dificuldades ao adotar as ferramentas de AI. As estruturas existentes sobre a adoção de inovações não são totalmente adequadas para inovações de aprendizado de máquina, pois há diferenças típicas com regulamentação, treinamento de pessoas ou preconceitos quando se trata de AI e, mais ainda, com AI generativo.
5 - Sustentabilidade orientada pelo Data
O projeto mobilizará métodos de pesquisa qualitativos e quantitativos e abordará duas questões-chave: Como as empresas podem medir com eficácia o desempenho da sustentabilidade social e ambiental? Por que as medidas de sustentabilidade muitas vezes não provocam mudanças significativas nas práticas organizacionais?
Por um lado, o projeto visa explorar as métricas do data-driven e identificar indicadores para alinhar os procedimentos organizacionais aos objetivos de sustentabilidade social e ambiental. Por outro lado, o projeto se concentrará na transformação dessas medidas de sustentabilidade em ações concretas dentro das empresas.
6 - Viés na visão computacional
Quando um modelo faz uma previsão com base em uma imagem, por exemplo, mostrando um rosto, ele tem acesso a informações confidenciais, como etnia, gênero ou idade, que podem influenciar seu raciocínio. Nosso objetivo é desenvolver uma estrutura para medir matematicamente esse viés e propor metodologias para reduzir esse viés durante o treinamento do modelo. Além disso, nossa abordagem detectaria estatisticamente zonas de forte viés para explicar, compreender e controlar onde esses modelos reforçam o viés presente no data.
7 - LLM para recuperação de informações
Uma das principais aplicações dos LLMs é quando associados a um corpus de documentos, que representam algum conhecimento ou informação industrial. Nesse caso, há uma etapa de recuperação de informações, para a qual os LLMs apresentam algumas limitações, como o tamanho do texto de entrada, que é muito pequeno para indexar documentos. Da mesma forma, o efeito de alucinação também pode ocorrer na resposta final, que pretendemos detectar usando o documento recuperado e modelar a incerteza no momento da inferência.
Pesquisadores de meio período do Artefact
Além da nossa equipe dedicada à pesquisa, temos vários colaboradores que dedicam algum tempo à pesquisa científica e à publicação de artigos. O fato de trabalharem também como consultores os inspira com problemas do mundo real encontrados por nossos clientes.
Publicações
Artigos de blog da mídia escritos por nossos especialistas em tecnologia.
Detectando Alucinações em LLMs, Um Token de Cada Vez
Os modelos de linguagem grandes são surpreendentemente capazes. Eles resumem, traduzem, raciocinam e codificam (melhor do que eu). Mas, ao contrário de mim, eles também se tornaram famosos por inventar...
O futuro do AI autêntico dependerá de gráficos de conhecimento?
À medida que as empresas correm para operacionalizar o AI, a maioria descobre que sua infraestrutura data nunca foi projetada para raciocínio autônomo. Atualmente, até 80% da implementação do AI...
Enriquecendo a experiência DIY: Como a ADEO usa o AI para conectar conteúdo e conhecimento
A otimização do sortimento é um processo crítico no varejo que envolve a seleção do mix ideal de produtos para atender à demanda do consumidor, levando em conta os diversos aspectos logísticos...
Explicação sobre o MotherDuck: Como a solução AI & Analytics de última geração se encaixa em sua pilha Data
O MotherDuck amplia o desempenho analítico do DuckDB para o cloud com recursos colaborativos, oferecendo desempenho 4x mais rápido do que o BigQuery e economia de custos em relação aos armazéns data tradicionais por meio de...
Otimização de sortimento com modelos de escolha discreta em Python
A otimização do sortimento é um processo crítico no varejo que envolve a seleção do mix ideal de produtos para atender à demanda do consumidor, levando em conta os diversos aspectos logísticos...
O alinhamento de preferências é sempre a melhor opção para aprimorar a tradução baseada em LLM? Uma análise empírica
As métricas neurais para avaliação de tradução automática (MT) têm se tornado cada vez mais proeminentes devido à sua correlação superior com julgamentos humanos em comparação com as métricas lexicais tradicionais
Choice-Learn: Modelagem de escolha em larga escala para contextos operacionais através das lentes do aprendizado de máquina
Os modelos de escolha discreta têm como objetivo prever as decisões de escolha tomadas por indivíduos em um menu de alternativas, chamado de variedade. Casos de uso bem conhecidos incluem a previsão de uma...
A era do AI generativo: o que está mudando
A abundância e a diversidade de respostas ao ChatGPT e a outros AIs generativos, sejam elas céticas ou entusiásticas, demonstram as mudanças que eles estão provocando e o impacto...
Como o Artefact conseguiu desenvolver um sistema de carreira justo e simples para engenheiros de software
No atual setor de tecnologia, dinâmico e em constante evolução, uma carreira pode parecer um caminho sinuoso em meio a uma densa floresta de oportunidades. Com a rápida...
Por que você precisa de LLMOps
Este artigo apresenta o LLMOps, um ramo especializado que mescla DevOps e MLOps para gerenciar os desafios apresentados pelos modelos de linguagem grandes (LLMs)...
Liberando o poder da LangChain Expression Language (LCEL): da prova de conceito à produção
A LangChain se tornou uma das bibliotecas Python mais usadas para interagir com LLMs em menos de um ano, mas a LangChain era principalmente uma biblioteca...
Como lidamos com a reconciliação de ID de perfil usando o Treasure Data Unification e o SQL
Neste artigo, explicamos os desafios da reconciliação de ID e demonstramos nossa abordagem para criar um ID de perfil unificado na plataforma Data do cliente, especificamente...



















































