Os funcionários da OpenAI criticaram publicamente os resultados enganosos dos testes de Referência do novo modelo de IA Grok3 da xAI

2025-02-23 09:44:47

Geração do resumo em andamento

A ChainCatcher reporta que um funcionário da OpenAI acusou publicamente a empresa xAI, pertencente a Musk, de lançar resultados enganosos nos testes de Referência do seu mais recente modelo de IA, Grok3. Igor Babushkin, co-fundador da xAI, insistiu que a empresa não agiu de forma inadequada. O gráfico da XAI mostra que as duas versões do Grok3 - Grok3 Reasoning Beta e Grok3 mini Reasoning - superaram o modelo atualmente mais poderoso da OpenAI, o o3-mini-high, na AIME 2025. No entanto, os funcionários da OpenAI logo apontaram na plataforma X que o gráfico da XAI não incluía a pontuação AIME 2025 do o3-mini-high sob a condição 'cons@64'. Bobushkin afirmou na plataforma X que a OpenAI também publicou gráficos de teste Referência enganosos no passado, embora esses gráficos fossem utilizados para comparar o desempenho dos seus próprios modelos.

XAI2.33%

GROK2.81%

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

1 Curtidas

Recompensa
1
Comentário
Compartilhar

Comentário

0/400

Sem comentários

Tema
Gate 2025 Q2 Report Released
28k Popularidade
CPI Data Incoming
58k Popularidade
Altcoin Season Update
8k Popularidade
4Gate Derivatives Volume Hits New High
16k Popularidade
5Join Gate VIP to Win MacBook
30k Popularidade
6MicroStrategy Buys More Bitcoin
2k Popularidade
7BTC Hits New High
95k Popularidade
8My Gate Moments
27k Popularidade
9VIP Exclusive Airdrop Carnival
26k Popularidade
10Fed June Meeting Minutes
7k Popularidade

Marcar

sitemap