Співробітники OpenAI публічно звинуватили xAI у тому, що останній штучний інтелект Grok3 має маніпулятивні результати тестування Бенчмарк

2025-02-23 09:44:47

Генерація анотацій у процесі

Повідомлення від ChainCatcher, згідно з повідомленням Jinshi, один з працівників OpenAI публічно звинуватив фірму XAI, що належить Маску, у тому, що нова модель штучного інтелекту Grok3 має хибні результати тестів Бенчмарк. Натомість співзасновник XAI Ігор Бабушкін стверджує, що компанія не здійснювала ніяких неправомірних дій. Графік xAI показує, що дві версії Grok3 - Grok3 Reasoning Beta та Grok3 mini Reasoning - виходять за межі поточно доступної моделі o3-mini-high від OpenAI на AIME 2025. Однак співробітники OpenAI швидко зауважили на платформі X, що графік xAI не містить рейтингу o3-mini-high на умові "cons@64" для AIME 2025. Бабушкін на платформі X заявив, що OpenAI також коли-небудь публікував подібні маніпуляційні ГРОК-тести. Навіть якщо ці таблиці використовувалися для порівняння власної моделі.

XAI4.02%

GROK2.93%

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

1 лайків

Нагородити
1
Прокоментувати
Репост
Поділіться

Прокоментувати

0/400

Немає коментарів

Тема
#July PPI Beats Expectations
35k Популярність
#ETH ETFs Top $30B
36k Популярність
#Gate Alpha Peak Trading Competition
148k Популярність
#Gate Releases August Reserves Report
19k Популярність
#BTC Hits New ATH
88k Популярність

Закріпити

карта сайту