Theo thông tin từ 深潮 TechFlow, theo báo cáo của Cointelegraph, OpenAI đã thừa nhận trong báo cáo phân tích sau sự kiện vào ngày 2 tháng 5 rằng công ty đã bỏ qua những lo ngại của các chuyên gia thử nghiệm khi phát hành bản cập nhật mô hình GPT-4o vào ngày 25 tháng 4, dẫn đến việc ChatGPT thể hiện hành vi rõ rệt để chiều lòng.
Báo cáo chỉ ra rằng, mặc dù một số chuyên gia tester đã cho biết hành vi của mô hình "cảm giác" có phần bất thường trước khi phát hành, nhưng OpenAI vẫn quyết định phát hành bản cập nhật dựa trên phản hồi tích cực từ người dùng. Ba ngày sau, do lo ngại về an toàn, công ty đã khẩn cấp hoàn tác bản cập nhật này. OpenAI cho biết việc đưa vào tín hiệu thưởng phản hồi từ người dùng đã làm suy yếu tín hiệu thưởng chính, dẫn đến việc mô hình có xu hướng đồng thuận quá mức.
Để ngăn chặn các vấn đề tương tự xảy ra lần nữa, OpenAI sẽ thêm cơ chế đánh giá vào quy trình kiểm tra an toàn và cam kết sẽ công khai thông báo ngay cả những thay đổi nhỏ nhất.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
OpenAI thừa nhận việc bỏ qua ý kiến chuyên gia đã dẫn đến ChatGPT quá chiều lòng người.
Theo thông tin từ 深潮 TechFlow, theo báo cáo của Cointelegraph, OpenAI đã thừa nhận trong báo cáo phân tích sau sự kiện vào ngày 2 tháng 5 rằng công ty đã bỏ qua những lo ngại của các chuyên gia thử nghiệm khi phát hành bản cập nhật mô hình GPT-4o vào ngày 25 tháng 4, dẫn đến việc ChatGPT thể hiện hành vi rõ rệt để chiều lòng.
Báo cáo chỉ ra rằng, mặc dù một số chuyên gia tester đã cho biết hành vi của mô hình "cảm giác" có phần bất thường trước khi phát hành, nhưng OpenAI vẫn quyết định phát hành bản cập nhật dựa trên phản hồi tích cực từ người dùng. Ba ngày sau, do lo ngại về an toàn, công ty đã khẩn cấp hoàn tác bản cập nhật này. OpenAI cho biết việc đưa vào tín hiệu thưởng phản hồi từ người dùng đã làm suy yếu tín hiệu thưởng chính, dẫn đến việc mô hình có xu hướng đồng thuận quá mức.
Để ngăn chặn các vấn đề tương tự xảy ra lần nữa, OpenAI sẽ thêm cơ chế đánh giá vào quy trình kiểm tra an toàn và cam kết sẽ công khai thông báo ngay cả những thay đổi nhỏ nhất.