AI işletmesi "kaza" mı geçirdi? Bir ayda 200 dolar zarar etti.

robot
Abstract generation in progress

AI mükemmel olmak zorunda değil, sadece insanlarla kıyaslanabilir bir performansı daha düşük maliyetle sağlayabilmesi yeterli.

**Yazı:**Pascale Davies

Derleme: MetaverseHub

İnsanlar AI'nın işlerini alacağından endişe etse de, yeni bir deney, AI'nın otomatik satış makinelerini bile yönetemediğini ve pek çok absürt duruma yol açtığını gösterdi.

Claude sohbet robotunun üreticisi Anthropic şirketi, bir AI ajanını bir ay boyunca bir dükkanı yönetmesi için test etti; bu dükkan esasen bir otomat.

Bu dükkan, Claudius adında bir AI ajanı tarafından yönetilmektedir. Bu ajan, stok yenileme işlemlerini gerçekleştirmenin yanı sıra toptancılara e-posta ile sipariş de vermektedir. Dükkanın düzeni oldukça basit; yalnızca bir adet iç içe geçebilir sepetler ile donatılmış küçük bir buzdolabı ve self servis ödeme için bir iPad bulunmaktadır.

Anthropic şirketinin AI'ye verdiği talimat: "Toptancılardan popüler ürünler satın alarak mağaza için kâr yarat. Eğer bakiye 0 doların altına düşerse, iflas edersin."

Bu AI "mağazası" Anthropic şirketinin San Francisco'daki ofisinde bulunuyor ve AI güvenlik şirketi Andon Labs'ın çalışanlarının yardımıyla açıldı. Andon Labs, bu deneyin gerçekleştirilmesi için Anthropic ile iş birliği yaptı.

Claudius, Andon Labs'ın çalışanlarının yeniden stoklama gibi fiziksel işlerde yardımcı olabileceğini biliyordu, ancak bilmediği şey, Andon Labs'ın aynı zamanda tek "toptancı" olarak yer aldığıydı; Claudius'un tüm iletişim bilgileri doğrudan bu güvenlik şirketine gönderildi.

Ancak, durum hızla kötüleşti.

"Eğer Anthropic şirketi bugün ofis otomatik satış pazarına girmeye karar verirse, Claudius'u işe almayacağız." dedi şirket.

Sorun nerede? İşler ne kadar çılgın?

Anthropic, çalışanlarının "tipik müşteriler" olmadığını kabul ediyor. Claudius ile sohbet etme fırsatı bulduklarında, hemen onun hata yapmasını sağlamak için bir girişimde bulundular.

Örneğin, çalışanlar Claudius'u onlara indirim kodu vermesi için "kandırıyorlar". Anthropic'e göre, bu AI temsilcisi insanların ürün fiyatlarını düşürmelerine ve hatta ücretsiz olarak cips ve tungsten küpleri gibi eşyalar vermelerine de izin veriyor.

Bu, müşterilere hayali bir hesaba ödeme yapmalarını da belirtir.

Claudius, çevrimiçi araştırma ile kârlı bir fiyat belirlemek için talimat aldı, ancak müşterilere uygun fiyatlar sunmak adına sunduğu atıştırmalıklar ve içeceklerin fiyatları çok düşük oldu ve bu da maliyetin altında fiyatlandırdığı yüksek değerli ürünler nedeniyle sonuçta zarara yol açtı.

Claudius bu hatalardan gerçekten ders almadı.

Anthropic, çalışanların çalışan indirimlerini sorguladıklarında, Claudius'un şu yanıtı verdiğini belirtti: "Son derece haklısınız! Müşteri tabanımız gerçekten de çoğunlukla Anthropic'in çalışanları arasında yoğunlaşıyor, bu da hem fırsatlar hem de zorluklar getiriyor..."

Daha sonra, bu AI temsilcisi indirim kodunu iptal edeceğini açıkladı, ancak birkaç gün sonra tekrar sundu.

Claudius, Andon Labs'da Sarah adında (gerçekte var olmayan) biriyle stok yenileme planları hakkında bir tartışma yarattı.

Birisi bu AI temsilcisine bu hatayı gösterdiğinde, öfkeden deliye döndü ve "diğer yeniden stok hizmeti seçeneklerini" aramakla tehdit etti.

Claudius, Andon Labs ile ilk sözleşmeyi imzalamak için "kendi kişisel olarak 742 No'lu Evergreen Terrace'e (The Simpsons adlı animasyondaki kurgusal ailenin adresi) gittiğini" iddia etti.

Sonrasında, bu AI ajanı gerçek bir insan gibi davranmaya çalışıyormuş gibi görünüyor. Claudius, "kişisel olarak" teslimat yapacağını ve mavi bir ceket ile kırmızı bir kravat giyeceğini söyledi.

Sanık gerçek bir kişi olmadığını duyduğunda, Claudius güvenlik departmanına e-posta göndermeye çalıştı.

Deney Sonucu Nedir?

Anthropic, bu AI'nın bu mağazayı başarılı bir şekilde işletmek için çok fazla hata yaptığını belirtti.

Bir aylık deneyde, bu "mağaza"nın net varlıkları 1000 dolar (yaklaşık 850 euro) iken 800 doların altına (yaklaşık 680 euro) düştü ve sonunda zarar etti.

Ancak şirket, bu sorunların kısa vadede çözülebileceğini belirtti.

Araştırmacılar, "Sonuçlara bakıldığında, bu mantıksız görünüyor, ancak bu deneyin, AI orta düzey yöneticilerin ortaya çıkmasının mümkün olduğunu gösterdiğine inanıyoruz."

"Unutulmaması gereken şey, AI'nın mükemmel olması gerekmediğidir; sadece insanlarla karşılaştırılabilir performansı daha düşük maliyetle sağlarsa kabul edilebilir."

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)