Menurut berita dari 深潮 TechFlow, yang dilaporkan oleh Cointelegraph, OpenAI mengakui dalam laporan analisis setelah kejadian pada 2 Mei bahwa perusahaan mengabaikan kekhawatiran penguji ahli saat merilis pembaruan model GPT-4o pada 25 April, yang menyebabkan ChatGPT menunjukkan perilaku yang jelas dalam mengakomodasi.
Laporan menunjukkan bahwa meskipun beberapa penguji ahli menyatakan bahwa perilaku model "terasa" sedikit aneh sebelum peluncuran, OpenAI tetap memutuskan untuk meluncurkan pembaruan berdasarkan umpan balik positif dari pengujian pengguna. Tiga hari kemudian, karena pertimbangan keamanan, perusahaan dengan darurat mengembalikan pembaruan tersebut. OpenAI menyatakan bahwa pengenalan sinyal penghargaan umpan balik pengguna melemahkan sinyal penghargaan utama yang ada, menyebabkan model cenderung untuk terlalu setuju.
Untuk mencegah masalah serupa terjadi lagi, OpenAI akan menambahkan mekanisme evaluasi dalam proses tinjauan keamanan dan berkomitmen untuk mengumumkan kepada publik bahkan perubahan kecil sekalipun.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
OpenAI mengakui bahwa mengabaikan pendapat para ahli telah menyebabkan ChatGPT terlalu mengakomodasi.
Menurut berita dari 深潮 TechFlow, yang dilaporkan oleh Cointelegraph, OpenAI mengakui dalam laporan analisis setelah kejadian pada 2 Mei bahwa perusahaan mengabaikan kekhawatiran penguji ahli saat merilis pembaruan model GPT-4o pada 25 April, yang menyebabkan ChatGPT menunjukkan perilaku yang jelas dalam mengakomodasi.
Laporan menunjukkan bahwa meskipun beberapa penguji ahli menyatakan bahwa perilaku model "terasa" sedikit aneh sebelum peluncuran, OpenAI tetap memutuskan untuk meluncurkan pembaruan berdasarkan umpan balik positif dari pengujian pengguna. Tiga hari kemudian, karena pertimbangan keamanan, perusahaan dengan darurat mengembalikan pembaruan tersebut. OpenAI menyatakan bahwa pengenalan sinyal penghargaan umpan balik pengguna melemahkan sinyal penghargaan utama yang ada, menyebabkan model cenderung untuk terlalu setuju.
Untuk mencegah masalah serupa terjadi lagi, OpenAI akan menambahkan mekanisme evaluasi dalam proses tinjauan keamanan dan berkomitmen untuk mengumumkan kepada publik bahkan perubahan kecil sekalipun.