
Benchmark de agentes de voz bilíngues mostra onde a IA de atendimento ainda precisa amadurecer
A avaliação de ASR em fala com alternância de idiomas aponta um gargalo prático para empresas globais.
Papers, arquiteturas, métodos de treinamento e a ciência que está construindo a próxima geração de modelos. Cobre avanços em modelos de fronteira, agentes, alinhamento, multimodalidade e IA aplicada à descoberta científica. Só entra pesquisa com implicação prática visível — o paper precisa habilitar algo que antes não era possível. Paper puramente teórico, benchmark marginal e release de produto disfarçado de pesquisa ficam de fora.

A avaliação de ASR em fala com alternância de idiomas aponta um gargalo prático para empresas globais.

A iniciativa apoiada pela comunidade open source tenta criar uma camada de protocolo para reinforcement learning agentic.

Atualização da OpenAI combina GPT-5.5, uso de ferramentas e benchmarks especializados para pesquisa em biologia, química medicinal e genômica.