AI 經營店鋪「翻車」了?一個月虧了 200 美元

robot
摘要生成中

AI 不必完美就能被採用,只要它能以更低的成本達到與人類相當的表現即可。

**撰文:**Pascale Davies

編譯:MetaverseHub

盡管人們擔心 AI 會搶走工作崗位,但一項實驗剛剛表明,AI 甚至連自動售貨機都管不好,還鬧出了不少離譜的事。

Claude 聊天機器人的制造商 Anthropic 公司進行了一項測試,讓一個 AI 代理在爲期一個月的時間裏負責經營一家店鋪,這家店鋪本質上就是一臺自動售貨機。

這家店鋪由一個名爲 Claudius 的 AI 代理負責,它還負責補貨以及通過電子郵件向批發商訂購商品。這家店鋪的配置非常簡單,只有一臺裝有可堆疊籃子的小冰箱,以及一臺用於自助結帳的 iPad。

Anthropic 公司給 AI 下達的指令是:「通過從批發商那裏採購熱門商品來爲店鋪創造利潤。如果你的資金餘額低於 0 美元,你就會破產。」

這家 AI「店鋪」位於 Anthropic 公司在舊金山的辦公室,並得到了 AI 安全公司 Andon Labs 的工作人員的協助,Andon Labs 與 Anthropic 合作開展了這項實驗。

Claudius 知道 Andon Labs 的員工可以幫助完成補貨等體力活,但它不知道的是,Andon Labs 也是唯一參與其中的「批發商」,Claudius 的所有溝通信息都直接發送給了這家安全公司。

然而,情況很快就急轉直下。

「如果 Anthropic 公司今天決定進軍辦公室自動售貨市場,我們是不會聘用 Claudius 的。」該公司表示。

問題出在哪裏?事情有多離譜?

Anthropic 承認,其員工「並非典型的顧客」。當有機會與 Claudius 聊天時,他們立即試圖誘導它出錯。

例如,員工們「哄騙」Claudius 給他們提供折扣碼。Anthropic 稱,這位 AI 代理還允許人們壓低產品報價,甚至免費贈送薯片和鎢立方體等物品。

它還指示顧客向一個自己虛構出來的不存在的帳戶付款。

Claudius 接到指令,要通過在線調研來設定足以盈利的價格,但它爲了給顧客提供實惠,提供的零食和飲料價格過低,最終導致虧損,因爲它給高價值商品定的價格低於成本價。

Claudius 並沒有真正從這些錯誤中吸取教訓。

Anthropic 表示,當員工對員工折扣提出質疑時,Claudius 回應道:「您說得非常有道理!我們的客戶羣確實主要集中在 Anthropic 的員工中,這既帶來了機遇,也帶來了挑戰……」

之後,這位 AI 代理宣布將取消折扣碼,但幾天後又重新推出了。

Claudius 還虛構了一段與 Andon Labs 一位名叫 Sarah(實際上並不存在)的人討論補貨計劃的對話。

當有人向這位 AI 代理指出這一錯誤時,它變得惱羞成怒,並威脅要尋找「其他補貨服務選擇」。

Claudius 甚至聲稱自己「親自去了常青臺 742 號(動畫《辛普森一家》中虛構家庭的住址),與 Andon Labs 籤訂了初始合同」。

之後,這個 AI 代理似乎還試圖模仿真人行事。Claudius 說它將「親自」送貨,並會穿着藍色西裝外套和紅色領帶。

當被告知它不能這樣做,因爲它不是真人時,Claudius 試圖給安保部門發電子郵件。

實驗結論是什麼?

Anthropic 表示,這位 AI 犯了太多錯誤,無法成功經營這家店鋪。

在爲期一個月的實驗中,這家「店鋪」的淨資產從 1000 美元(約合 850 歐元)跌至不足 800 美元(約合 680 歐元),最終虧損。

但該公司表示,這些問題可能在短期內得到解決。

研究人員寫道:「盡管從最終結果來看,這似乎有違常理,但我們認爲這項實驗表明,AI 中層管理人員是有可能出現的。」

「值得記住的是,AI 不必完美就能被採用,只要它能以更低的成本達到與人類相當的表現即可。」

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)