This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
このアンソロポシックリサーチは、TEEを用いた安全なAI推論に関するもので、Web3に非常に関連性があります。
TEEは機密推論のコアプリミティブの一つとなる可能性があります。
生成AIサービス — 会話型エージェントから画像合成まで — は、機密性の高い入力を扱うことがますます多くなり、貴重で独自のモデルを保持しています。機密推論は、ハードウェアバックのTEEと堅牢な暗号化ワークフローを組み合わせることによって、信頼できないインフラストラクチャでのAIワークロードの安全な実行を可能にします。このエッセイでは、機密推論を可能にする主要な革新を提示し、クラウドおよびエッジ環境での生産展開のために設計されたモジュラーアーキテクチャを検討します。
機密推論におけるコアイノベーション
機密推論は、3つの基礎的な進歩に基づいています:
信頼できる実行環境 (TEEs) 現代のプロセッサ上で
Intel SGX、AMD SEV-SNP、AWS Nitroのようなプロセッサは、シールドされたエンクレーブを作成し、コードとデータをホストOSおよびハイパーバイザーから隔離します。各エンクレーブは、起動時にその内容を測定し、署名された証明書を公開します。この証明書により、モデルとデータの所有者は、秘密を公開する前に、承認された改ざんされていないバイナリ上でワークロードが実行されていることを確認できます。
セキュアアクセラレーター統合
高性能な推論には、GPUまたは専門のAIチップが必要な場合が多いです。これらのアクセラレーターを確保するための2つの統合パターンがあります:
確認済み、エンドツーエンド暗号化ワークフロー
機密推論は、エンクレーブの証明に基づいた二段階の鍵交換を採用しています:
リファレンスアーキテクチャ概要
商業用の機密推論システムは通常、3つの主要コンポーネントで構成されています:
機密推論サービス
コンポーネントワークフロー&インタラクション
認証とキー交換
推論データパス
最小特権の強制 すべてのネットワーク、ストレージ、および暗号化の権限は厳密に範囲が定められています。
脅威の軽減とベストプラクティス
まとめ
機密推論システムは、ハードウェアTEE、セキュアアクセラレーターワークフロー、認証された暗号化パイプラインを統合することで、信頼できない環境でのAIモデルの安全な展開を可能にします。ここで概説されているモジュラーアーキテクチャは、パフォーマンス、セキュリティ、監査可能性のバランスを取っており、プライバシーを保護するAIサービスをスケールで提供しようとする組織にとって実用的な青写真を提供します。
この「TEEsを用いた安全なAI推論に関するAnthropic Research」は、Web3に非常に関連性がある可能性があります。これはSentoraで最初にMediumに掲載され、人々はこのストーリーに言及し、応答することで会話を続けています。