OpenAIが大規模モデルの悪意ある行動を阻止するCoTモニタリングをリリース

2025-03-10 22:48:31

概要作成中

Golden Financeは、OpenAIが最新の研究を発表したと報じており、CoT(Chain of Thought)モニタリングを使用して、大規模なモデルがナンセンスを話したり、真意を隠したりするなどの悪意のある行動を防ぐことができ、スーパーモデルを監視するための効果的なツールの1つでもあります。 OpenAIは、新たにリリースされた最先端モデルのo3-miniを監視対象物として、より弱いGPT-4oモデルをモニターとして使用します。テスト環境は、単体テストに合格するために AI がコードベースに機能を実装する必要があるコーディングタスクです。その結果、CoTモニターは体系的な「報酬ハッキング」行動の検出に優れたパフォーマンスを発揮し、再現率は最大95%で、監視のみの行動の60%をはるかに上回っていることが示されました。

GPT3.42%

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

報酬
いいね
コメント
リポスト
共有

0/400

コメントなし

トピック
#Crypto Market Pullback
256273 人気度
#Jackson Hole Meeting
2672 人気度
#Gate Alpha ESPORTS Points Airdrop
2454 人気度
#Institutions Hold 10M+ ETH
22665 人気度
#MicroStrategy Loosens Stock Rules
17981 人気度

ピン

サイトマップ