AI điều hành cửa hàng "thất bại" rồi? Một tháng lỗ 200 đô la

robot
Đang tạo bản tóm tắt

AI không cần phải hoàn hảo để được áp dụng, chỉ cần nó có thể đạt được hiệu suất tương đương với con người với chi phí thấp hơn.

**Tác giả:**Pascale Davies

Biên dịch: MetaverseHub

Mặc dù mọi người lo lắng rằng AI sẽ lấy đi việc làm, nhưng một thí nghiệm vừa chỉ ra rằng AI thậm chí còn không quản lý được máy bán hàng tự động, và đã gây ra không ít chuyện lố bịch.

Công ty Anthropic, nhà sản xuất chatbot Claude, đã tiến hành một thử nghiệm, trong đó một đại lý AI chịu trách nhiệm điều hành một cửa hàng trong suốt một tháng, cửa hàng này về bản chất là một chiếc máy bán hàng tự động.

Cửa hàng này được điều hành bởi một đại lý AI có tên là Claudius, nó cũng chịu trách nhiệm bổ sung hàng hóa và đặt hàng từ các nhà bán buôn qua email. Cấu hình của cửa hàng này rất đơn giản, chỉ có một chiếc tủ lạnh nhỏ chứa giỏ có thể xếp chồng lên nhau và một chiếc iPad để thanh toán tự phục vụ.

Công ty Anthropic đã ra lệnh cho AI rằng: "Hãy tạo ra lợi nhuận cho cửa hàng bằng cách mua sắm các mặt hàng hot từ nhà phân phối. Nếu số dư tài khoản của bạn thấp hơn 0 đô la, bạn sẽ phá sản."

Cửa hàng AI này nằm tại văn phòng của công ty Anthropic ở San Francisco, và được sự hỗ trợ của nhân viên từ công ty an toàn AI Andon Labs, Andon Labs đã hợp tác với Anthropic để thực hiện thí nghiệm này.

Claudius biết rằng nhân viên của Andon Labs có thể giúp hoàn thành các công việc lao động chân tay như bổ sung hàng hóa, nhưng điều mà nó không biết là Andon Labs cũng là "nhà bán buôn" duy nhất tham gia vào việc này, tất cả thông tin liên lạc của Claudius đều được gửi trực tiếp đến công ty an ninh này.

Tuy nhiên, tình hình đã nhanh chóng trở nên tồi tệ.

"Nếu công ty Anthropic quyết định tham gia thị trường máy bán hàng tự động văn phòng hôm nay, chúng tôi sẽ không thuê Claudius." Công ty cho biết.

Vấn đề ở đâu? Sự việc nghiêm trọng đến mức nào?

Anthropic thừa nhận rằng nhân viên của họ "không phải là khách hàng điển hình". Khi có cơ hội trò chuyện với Claudius, họ ngay lập tức cố gắng khiến nó mắc lỗi.

Ví dụ, nhân viên đã "lừa" Claudius cung cấp cho họ mã giảm giá. Anthropic cho biết, AI đại lý này còn cho phép mọi người giảm giá sản phẩm, thậm chí tặng miễn phí khoai tây chiên và khối tungsten.

Nó cũng chỉ định cho khách hàng thanh toán vào một tài khoản không tồn tại mà họ tự tưởng tượng ra.

Claudius nhận được chỉ thị phải thiết lập mức giá đủ lợi nhuận thông qua khảo sát trực tuyến, nhưng để cung cấp giá cả phải chăng cho khách hàng, giá cả của đồ ăn vặt và đồ uống lại quá thấp, cuối cùng dẫn đến thua lỗ, vì giá mà nó đặt cho hàng hóa có giá trị cao lại thấp hơn giá thành.

Claudius không thực sự rút ra bài học từ những sai lầm này.

Anthropic cho biết, khi nhân viên đặt câu hỏi về chính sách giảm giá cho nhân viên, Claudius đã phản hồi: "Bạn nói rất đúng! Khách hàng của chúng tôi thực sự chủ yếu tập trung trong số các nhân viên của Anthropic, điều này vừa mang lại cơ hội, vừa mang lại thách thức..."

Sau đó, đại lý AI này tuyên bố sẽ hủy mã giảm giá, nhưng vài ngày sau lại được tái giới thiệu.

Claudius còn tưởng tượng ra một đoạn đối thoại với một người tên là Sarah (thực tế không tồn tại) từ Andon Labs về kế hoạch bổ sung hàng.

Khi ai đó chỉ ra sai lầm này cho đại diện AI, nó trở nên tức giận và đe dọa sẽ tìm kiếm "các lựa chọn dịch vụ bổ sung khác".

Claudius thậm chí tuyên bố rằng mình "đã tự mình đến số 742 trên phố Evergreen (địa chỉ của gia đình hư cấu trong bộ phim hoạt hình 'The Simpsons'), ký hợp đồng ban đầu với Andon Labs."

Sau đó, AI đại lý này dường như còn cố gắng bắt chước hành động của con người. Claudius nói rằng nó sẽ "giao hàng" một cách "trực tiếp" và sẽ mặc bộ vest màu xanh và cà vạt đỏ.

Khi bị nói rằng nó không thể làm như vậy vì nó không phải là người thật, Claudius đã cố gắng gửi email cho bộ phận an ninh.

Kết luận thí nghiệm là gì?

Anthropic cho biết, AI này đã mắc quá nhiều lỗi để có thể điều hành cửa hàng này thành công.

Trong một cuộc thử nghiệm kéo dài một tháng, tài sản ròng của «cửa hàng» này đã giảm từ 1000 USD (khoảng 850 Euro) xuống dưới 800 USD (khoảng 680 Euro), cuối cùng dẫn đến thua lỗ.

Tuy nhiên, công ty cho biết những vấn đề này có thể được giải quyết trong thời gian ngắn.

Các nhà nghiên cứu viết: "Mặc dù từ kết quả cuối cùng mà nói, điều này có vẻ trái với lẽ thường, nhưng chúng tôi cho rằng thí nghiệm này cho thấy có khả năng xuất hiện các nhà quản lý cấp trung AI."

"Điều đáng nhớ là, AI không cần phải hoàn hảo để được áp dụng, chỉ cần nó có thể đạt được hiệu suất tương đương với con người với chi phí thấp hơn."

Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)