ساحة المعركة الجديدة في مجال الذكاء الاصطناعي: أصبحت تسمية البيانات في دائرة الضوء
في الآونة الأخيرة، انتقل التركيز في مجال الذكاء الاصطناعي من أداء النماذج إلى جودة البيانات. قامت شركة تكنولوجيا عملاقة بشراء حوالي نصف أسهم شركة لتدقيق البيانات بسعر مذهل قدره 14.8 مليار دولار، مما أثار اهتمام الصناعة بأسرها. في الوقت نفسه، لا تزال بعض المشاريع الجديدة في مجال Web3 AI تكافح لإثبات قيمتها. ما هي الاتجاهات السوقية التي تعكس هذا التباين الكبير؟
تظهر قيمة التوصيف البيانات، كأحد المجالات التي تتطلب الحكمة البشرية والحكم المهني، بشكل متزايد. على عكس قوة الحوسبة القياسية، يتطلب التوصيف عالي الجودة معرفة متخصصة فريدة، وخلفية ثقافية، وتجربة إدراكية. على سبيل المثال، يتطلب التوصيف الدقيق لتشخيص صور السرطان حدساً مهنياً من أطباء الأورام ذوي الخبرة، بينما لا يمكن تحليل مشاعر سوق المال بشكل دقيق بدون خبرة المتداولين في وول ستريت. هذه الندرة وعدم القابلية للاستبدال تعطي التوصيف البيانات ميزة تنافسية لا يمكن مقارنتها بقوة الحوسبة.
في الآونة الأخيرة، استحوذت شركة تكنولوجيا عملاقة على 49% من أسهم شركة لتوسيم البيانات بمبلغ 14.8 مليار دولار، وهي أكبر استثمار منفرد في مجال الذكاء الاصطناعي هذا العام. تأسست شركة توسييم البيانات هذه في عام 2016، وقد بلغت قيمتها السوقية 30 مليار دولار، وعملائها يشملون العديد من شركات الذكاء الاصطناعي المعروفة، وعملاق التكنولوجيا، والدوائر الحكومية. تقدم الشركة خدمات توسييم بيانات عالية الجودة لتدريب نماذج الذكاء الاصطناعي، ولديها أكثر من 300,000 مُوسِّم مدرب بشكل احترافي.
تكشف هذه الصفقة عن حقيقة تم تجاهلها: في ظل عدم ندرة القدرة الحاسوبية وتوجه نماذج الهيكل نحو التماثل، فإن ما يحدد حقًا الحد الأقصى للذكاء الاصطناعي هو البيانات المعالجة بعناية. هذه العملاقة التكنولوجية في الواقع تشتري "حقوق استخراج النفط" في عصر الذكاء الاصطناعي.
ومع ذلك، فإن نماذج وضع العلامات التقليدية للبيانات تعاني أيضًا من عيوب قاتلة، تتركز بشكل رئيسي في تصميم الحوافز. على سبيل المثال، قد يقضي طبيب عدة ساعات في وضع علامات على الصور الطبية، لكنه قد يحصل فقط على بضع عشرات من الدولارات كأجر، في حين أن قيمة نموذج الذكاء الاصطناعي الذي تم تدريبه باستخدام هذه البيانات قد تصل إلى عدة مليارات من الدولارات، ولا يستطيع الطبيب المشاركة في هذه العائدات. إن توزيع القيمة غير العادل هذا يثبط بشكل خطير من رغبة توفير بيانات عالية الجودة.
في هذا السياق، تحاول بعض مشاريع Web3 AI إعادة كتابة قواعد توزيع قيمة وضع العلامات على البيانات باستخدام تقنية blockchain. من خلال إدخال آلية تحفيز رمزية، تهدف هذه المشاريع إلى تحويل واضعي العلامات على البيانات من "عمال البيانات الرخيصة" إلى "مساهمين" حقيقيين في شبكة الذكاء الاصطناعي. من المتوقع أن يحفز هذا النموذج توفير المزيد من البيانات عالية الجودة.
سواء كانت شركات التكنولوجيا التقليدية الكبرى أو المشاريع الناشئة في Web3، فقد أدركت جميعها أهمية جودة البيانات. بينما تستخدم الشركات الكبرى التقليدية المال لبناء حواجز البيانات، تحاول Web3 بناء نظام بيئي للبيانات أكثر انفتاحًا وديمقراطية من خلال اقتصاد الرموز. لقد بدأت "الحرب السرية" حول السيطرة على مستقبل الذكاء الاصطناعي بالفعل، وتعد ترميز البيانات ساحة المعركة الأساسية في هذه الحرب.
شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
تسجيلات الإعجاب 13
أعجبني
13
5
مشاركة
تعليق
0/400
LeekCutter
· منذ 6 س
هل التوصيف هو كسب المال بسهولة؟ من يفهم البيانات قد صعد إلى السماء.
شاهد النسخة الأصليةرد0
MetaDreamer
· منذ 8 س
فهم البيانات الأساسية للذكاء الاصطناعي هو الأساس.
شاهد النسخة الأصليةرد0
Rekt_Recovery
· منذ 8 س
هههه وسيلة أخرى للتعرض للخسارة... البيانات هي الرافعة الجديدة
تسليط الضوء على البيانات المدعومة بالذكاء الاصطناعي أصبح ساحة جديدة، الاستحواذ بقيمة 148 مليار دولار يثير ضجة في الصناعة
ساحة المعركة الجديدة في مجال الذكاء الاصطناعي: أصبحت تسمية البيانات في دائرة الضوء
في الآونة الأخيرة، انتقل التركيز في مجال الذكاء الاصطناعي من أداء النماذج إلى جودة البيانات. قامت شركة تكنولوجيا عملاقة بشراء حوالي نصف أسهم شركة لتدقيق البيانات بسعر مذهل قدره 14.8 مليار دولار، مما أثار اهتمام الصناعة بأسرها. في الوقت نفسه، لا تزال بعض المشاريع الجديدة في مجال Web3 AI تكافح لإثبات قيمتها. ما هي الاتجاهات السوقية التي تعكس هذا التباين الكبير؟
تظهر قيمة التوصيف البيانات، كأحد المجالات التي تتطلب الحكمة البشرية والحكم المهني، بشكل متزايد. على عكس قوة الحوسبة القياسية، يتطلب التوصيف عالي الجودة معرفة متخصصة فريدة، وخلفية ثقافية، وتجربة إدراكية. على سبيل المثال، يتطلب التوصيف الدقيق لتشخيص صور السرطان حدساً مهنياً من أطباء الأورام ذوي الخبرة، بينما لا يمكن تحليل مشاعر سوق المال بشكل دقيق بدون خبرة المتداولين في وول ستريت. هذه الندرة وعدم القابلية للاستبدال تعطي التوصيف البيانات ميزة تنافسية لا يمكن مقارنتها بقوة الحوسبة.
في الآونة الأخيرة، استحوذت شركة تكنولوجيا عملاقة على 49% من أسهم شركة لتوسيم البيانات بمبلغ 14.8 مليار دولار، وهي أكبر استثمار منفرد في مجال الذكاء الاصطناعي هذا العام. تأسست شركة توسييم البيانات هذه في عام 2016، وقد بلغت قيمتها السوقية 30 مليار دولار، وعملائها يشملون العديد من شركات الذكاء الاصطناعي المعروفة، وعملاق التكنولوجيا، والدوائر الحكومية. تقدم الشركة خدمات توسييم بيانات عالية الجودة لتدريب نماذج الذكاء الاصطناعي، ولديها أكثر من 300,000 مُوسِّم مدرب بشكل احترافي.
تكشف هذه الصفقة عن حقيقة تم تجاهلها: في ظل عدم ندرة القدرة الحاسوبية وتوجه نماذج الهيكل نحو التماثل، فإن ما يحدد حقًا الحد الأقصى للذكاء الاصطناعي هو البيانات المعالجة بعناية. هذه العملاقة التكنولوجية في الواقع تشتري "حقوق استخراج النفط" في عصر الذكاء الاصطناعي.
ومع ذلك، فإن نماذج وضع العلامات التقليدية للبيانات تعاني أيضًا من عيوب قاتلة، تتركز بشكل رئيسي في تصميم الحوافز. على سبيل المثال، قد يقضي طبيب عدة ساعات في وضع علامات على الصور الطبية، لكنه قد يحصل فقط على بضع عشرات من الدولارات كأجر، في حين أن قيمة نموذج الذكاء الاصطناعي الذي تم تدريبه باستخدام هذه البيانات قد تصل إلى عدة مليارات من الدولارات، ولا يستطيع الطبيب المشاركة في هذه العائدات. إن توزيع القيمة غير العادل هذا يثبط بشكل خطير من رغبة توفير بيانات عالية الجودة.
في هذا السياق، تحاول بعض مشاريع Web3 AI إعادة كتابة قواعد توزيع قيمة وضع العلامات على البيانات باستخدام تقنية blockchain. من خلال إدخال آلية تحفيز رمزية، تهدف هذه المشاريع إلى تحويل واضعي العلامات على البيانات من "عمال البيانات الرخيصة" إلى "مساهمين" حقيقيين في شبكة الذكاء الاصطناعي. من المتوقع أن يحفز هذا النموذج توفير المزيد من البيانات عالية الجودة.
سواء كانت شركات التكنولوجيا التقليدية الكبرى أو المشاريع الناشئة في Web3، فقد أدركت جميعها أهمية جودة البيانات. بينما تستخدم الشركات الكبرى التقليدية المال لبناء حواجز البيانات، تحاول Web3 بناء نظام بيئي للبيانات أكثر انفتاحًا وديمقراطية من خلال اقتصاد الرموز. لقد بدأت "الحرب السرية" حول السيطرة على مستقبل الذكاء الاصطناعي بالفعل، وتعد ترميز البيانات ساحة المعركة الأساسية في هذه الحرب.