لماذا يقال إن عصر الوكلاء الذكيين سيشهد المعركة الثالثة للمتصفحات؟

بواسطة جيت فنتشرز

ليرة تركية ؛ د

تدور الحرب الثالثة للمتصفحات بهدوء. عند مراجعة التاريخ، من Netscape في التسعينيات، وIE من مايكروسوفت، إلى Firefox بروح المصدر المفتوح وChrome من Google، كانت المنافسة في المتصفحات تعكس بشكل مركزي السيطرة على المنصات وتحولات النماذج التقنية. حصل Chrome على مكانته الرائدة بفضل سرعة التحديث والتكامل البيئي، بينما شكلت Google من خلال هيكل «الثنائي القوي» بين البحث والمتصفح حلقة مغلقة لمدخل المعلومات.

لكن اليوم، هذا النمط بدأ يتزعزع. إن ظهور نماذج اللغة الكبيرة (LLM) جعل المزيد من المستخدمين يكملون المهام في صفحة نتائج البحث "بدون نقر"، مما أدى إلى انخفاض السلوك التقليدي للنقر على الصفحات. في الوقت نفسه، فإن الشائعات حول نية Apple استبدال محرك البحث الافتراضي في Safari تهدد أساس أرباح شركة Alphabet ( Google الأم )، وقد بدأت السوق تظهر قلقها حيال "الشرعية في البحث".

تواجه المتصفحات نفسها إعادة تشكيل الأدوار. لم تعد مجرد أدوات لعرض صفحات الويب، بل أصبحت حاويات تجمع بين قدرات متعددة مثل إدخال البيانات وسلوك المستخدم والهوية الخصوصية. على الرغم من قوة وكيل الذكاء الاصطناعي، إلا أنه لإنجاز تفاعلات الصفحات المعقدة، واستدعاء بيانات الهوية المحلية، والتحكم في عناصر صفحات الويب، لا يزال يتعين الاعتماد على حدود الثقة وبيئة التشغيل للمتصفح. المتصفح يتحول من واجهة بشرية إلى منصة استدعاء نظام لوكلاء الذكاء الاصطناعي.

في هذه المقالة، نستعرض ما إذا كان لا يزال هناك ضرورة لوجود المتصفح، وفي الوقت نفسه نعتقد أن ما يمكنه فعلاً كسر هيمنة سوق المتصفحات الحالي ليس "كروم" آخر "أفضل"، بل هي بنية تفاعلية جديدة: ليست مجرد عرض للمعلومات، بل استدعاء للمهام. يجب أن يتم تصميم المتصفحات المستقبلية لوكلاء الذكاء الاصطناعي - ليس فقط للقراءة، بل للكتابة والتنفيذ أيضًا. المشاريع مثل Browser Use تحاول تحويل هيكل الصفحة إلى بنية دلالية، وتحويل الواجهة المرئية إلى نصوص هيكلية يمكن لوكلاء LLM استدعاؤها، مما يقلل بشكل كبير من تكلفة التفاعل.

بدأت المشاريع الرئيسية في السوق بتجربة: قامت Perplexity ببناء متصفح أصلي Comet، باستخدام الذكاء الاصطناعي بدلاً من نتائج البحث التقليدية؛ قامت Brave بدمج حماية الخصوصية مع الاستدلال المحلي، معززةً البحث وميزات الحجب باستخدام LLM؛ بينما تستهدف المشاريع الأصلية في مجال Crypto مثل Donut، مدخلاً جديداً للتفاعل بين الذكاء الاصطناعي والأصول على السلسلة. السمة المشتركة لهذه المشاريع هي: محاولة إعادة بناء واجهة إدخال المتصفح بدلاً من تزيين طبقة الإخراج.

بالنسبة لرواد الأعمال، تكمن الفرص في العلاقة الثلاثية بين الإدخال، الهيكل والوكيل. يُعتبر المتصفح كواجهة لاستدعاء الوكلاء في العالم المستقبلي، مما يعني أن من يمكنه توفير "كتل القدرة" القابلة للبناء، القابلة للاستدعاء، والموثوقة، هو من يمكنه أن يصبح جزءًا من المنصة الجديدة. من تحسين محركات البحث إلى تحسين محركات الوكلاء (AEO)، من حركة مرور الصفحة إلى استدعاء سلسلة المهام، يتم إعادة تشكيل أشكال المنتجات وأفكار التصميم. تحدث الحرب الثالثة للمتصفحات في "الإدخال" وليس في "العرض"؛ ما يحدد الفوز أو الخسارة لم يعد هو من يجذب انتباه المستخدمين، بل من يكسب ثقة الوكيل، ويحصل على مدخل الاستدعاء.

تاريخ تطور المتصفحات

في أوائل التسعينيات، عندما لم يكن الإنترنت قد أصبح جزءًا من الحياة اليومية بعد، ظهرت Netscape Navigator كما لو كانت سفينة تفتح أرضًا جديدة، حيث فتحت أمام ملايين المستخدمين أبواب العالم الرقمي. لم يكن هذا المتصفح هو الأول، لكنه كان الأول حقًا الذي توجه نحو الجمهور وشكل تجربة الإنترنت. في ذلك الوقت، كان بإمكان الناس لأول مرة تصفح صفحات الويب بسهولة من خلال واجهة رسومية، كما لو أن العالم بأسره قد أصبح فجأة في متناول اليد.

ومع ذلك، فإن المجد غالبًا ما يكون قصير الأمد. سرعان ما أدركت مايكروسوفت أهمية المتصفح، وقررت فرض دمج Internet Explorer في نظام تشغيل Windows، ليصبح المتصفح الافتراضي. يمكن اعتبار هذه الاستراتيجية "سلاح المنصة القاتل"، حيث أدت مباشرة إلى تفكيك الهيمنة السوقية لـ Netscape. لم يكن العديد من المستخدمين يختارون IE بنشاط، بل قبلوا به لأنه كان الخيار الافتراضي للنظام. بفضل قدرة توزيع Windows، سرعان ما أصبح IE رائد الصناعة، بينما انزلقت Netscape إلى مسار الانهيار.

في خضم الأزمة، اختار مهندسو Netscape طريقًا جريئًا ومثاليًا - حيث قاموا بفتح شفرة متصفحهم ودعوا مجتمع المصدر المفتوح. كانت هذه الخطوة وكأنها "تخلي مكيدوني" في عالم التكنولوجيا، مما ينذر بنهاية عصر قديم وصعود قوى جديدة. أصبحت هذه الشفرة لاحقًا أساس مشروع متصفح Mozilla، الذي سُمي في البداية بـ Phoenix (بمعنى البعث من الرماد) ولكنه واجه عدة تغييرات في الاسم بسبب مشكلات العلامة التجارية، وأخيرًا تم تسميته بـ Firefox.

فايرفوكس ليست مجرد نسخة بسيطة من نيتسكيب، بل حققت العديد من الاختراقات في تجربة المستخدم، وبيئة الإضافات، والأمان. إن ولادتها تمثل انتصار الروح المفتوحة المصدر، كما أنها ضخت حيوية جديدة في الصناعة بأكملها. وصفها البعض بأنها "وريث الروح" لنيتسكيب، تمامًا كما ورثت الإمبراطورية العثمانية باقي بقايا بيزنطة. وعلى الرغم من أن هذا التشبيه مبالغ فيه، إلا أنه يحمل دلالة كبيرة.

لكن قبل بضع سنوات من إصدار فايرفوكس الرسمي، كانت مايكروسوفت قد أصدرت بالفعل ستة إصدارات من IE، مما جعل فايرفوكس في وضع المطاردة منذ البداية بفضل ميزة الوقت واستراتيجية حزمة النظام، مما أدى إلى أن هذه المنافسة ليست تنافسًا عادلًا على خط البداية.

في الوقت نفسه، ظهر لاعب مبكر آخر بهدوء. في عام 1994، تم إصدار متصفح أوبرا، الذي جاء من النرويج، وكان في البداية مجرد مشروع تجريبي. ولكن منذ إصدار النسخة 7.0 في عام 2003، قدم محرك Presto الذي تم تطويره داخليًا، ليكون أول من يدعم تقنيات مثل CSS، والتخطيط المتجاوب، والتحكم الصوتي، وترميز Unicode وغيرها من التقنيات المتقدمة. على الرغم من أن عدد المستخدمين كان محدوداً، إلا أن التكنولوجيا ظلت دائماً في طليعة الصناعة، مما جعلها "المفضلة لدى المهووسين".

في نفس العام، أطلقت أبل متصفح سفاري. كانت هذه نقطة تحول ذات مغزى. في ذلك الوقت، كانت مايكروسوفت قد استثمرت 150 مليون دولار في أبل التي كانت على حافة الإفلاس، للحفاظ على واجهة المنافسة وتجنب مراجعة مكافحة الاحتكار. على الرغم من أن محرك البحث الافتراضي لسفاري منذ نشأته هو جوجل، إلا أن هذه العلاقة التاريخية مع مايكروسوفت ترمز إلى العلاقة المعقدة والدقيقة بين عمالقة الإنترنت: التعاون والمنافسة، دائمًا ما يسيران جنبًا إلى جنب.

في عام 2007، تم إصدار IE7 مع نظام Windows Vista، لكن ردود الفعل في السوق كانت متوسطة. من ناحية أخرى، حقق Firefox، بفضل وتيرة التحديث الأسرع وآلية التمديد الأكثر ودية والجاذبية الطبيعية للمطورين، زيادة مطردة في حصته السوقية لتصل إلى حوالي 20%. بدأت هيمنة IE بالتراجع، والاتجاهات تتغير.

جوجل لديها أسلوب آخر. على الرغم من أنها بدأت في التفكير في إنشاء متصفح خاص بها منذ عام 2001، إلا أنها استغرقت ست سنوات لإقناع المدير التنفيذي إريك شmidt بالموافقة على هذا المشروع. تم إصدار Chrome في عام 2008، وتم بناؤه على مشروع Chromium مفتوح المصدر ومحرك WebKit المستخدم في Safari. وقد أطلق عليه لقب "المتصفح الضخم"، ولكنه سرعان ما ارتفع بفضل مهارات جوجل العميقة في الإعلانات وبناء العلامات التجارية.

السلاح الرئيسي لـ Chrome ليس الوظائف، بل هو وتيرة التحديثات المتكررة (كل ستة أسابيع) وتجربة موحدة عبر جميع المنصات. في نوفمبر 2011، تجاوز Chrome لأول مرة Firefox، حيث وصلت حصته في السوق إلى 27٪؛ بعد ستة أشهر، تجاوز IE مرة أخرى، مما أكمل التحول من منافس إلى مسيطر.

في الوقت نفسه، بدأ الإنترنت المحمول في الصين في تشكيل نظامه البيئي الخاص. حقق متصفح UC التابع لمجموعة علي بابا نجاحًا سريعًا في أوائل العقد الأول من القرن الحادي والعشرين، خاصة في الأسواق الناشئة مثل الهند وإندونيسيا والصين، حيث اعتمد على تصميم خفيف وخصائص ضغط البيانات لتوفير حركة البيانات، مما جعله مفضلًا لمستخدمي الأجهزة المنخفضة التكلفة. في عام 2015، تجاوزت حصة المتصفح المحمول العالمي 17%، وفي الهند وصلت إلى 46% في مرحلة ما. لكن هذا النصر لم يكن دائمًا. مع تعزيز الحكومة الهندية لمراجعة أمان التطبيقات الصينية، اضطر متصفح UC للخروج من السوق الرئيسية، مما أدى إلى فقدانه تدريجياً مجده السابق.

مع دخول العقد 2020، تم تأكيد هيمنة Chrome، حيث استقر حصته في السوق العالمية حول 65%. من الجدير بالذكر أن محرك بحث Google ومتصفح Chrome، على الرغم من انتمائهما إلى Alphabet، إلا أنهما يمثلان نظامين هيمنيين مستقلين من منظور السوق - حيث يتحكم الأول في حوالي 90% من نقاط دخول البحث العالمية، بينما يمتلك الثاني "نافذة الدخول الأولى" التي يستخدمها معظم المستخدمين للوصول إلى الإنترنت.

للحفاظ على هذا الهيكل المزدوج الاحتكاري، لم تتردد جوجل في استثمار أموال طائلة. في عام 2022، دفعت ألفابت حوالي 20 مليار دولار لأبل فقط للحفاظ على وضعية جوجل كخيار البحث الافتراضي في سفاري. وقد أشار بعض المحللين إلى أن هذه النفقات تعادل 36% من الإيرادات التي تجنيها جوجل من إعلانات البحث الناتجة عن حركة المرور من سفاري. بعبارة أخرى، جوجل تدفع "رسوم حماية" لسياجها.

لكن اتجاه الرياح تغير مرة أخرى. مع صعود نماذج اللغة الكبيرة (LLM)، بدأت عمليات البحث التقليدية تتعرض للضغوط. في عام 2024، تراجع حصة سوق البحث في Google من 93% إلى 89%، ورغم أنه لا يزال مهيمنًا، إلا أن الشقوق بدأت تظهر. الأكثر ثورية، هي الشائعات حول أن آبل قد تطلق محرك بحث AI خاص بها - إذا تم تغيير محرك البحث الافتراضي في Safari إلى阵营ها الخاص، فإن ذلك لن يغير فقط الهيكل البيئي، بل قد يهز أيضًا أعمدة أرباح Alphabet. تفاعلت السوق بسرعة، حيث انخفض سعر سهم Alphabet من 170 دولارًا إلى 140 دولارًا، مما يعكس ليس فقط ذعر المستثمرين، بل أيضًا عدم الراحة العميقة تجاه اتجاه مستقبل عصر البحث.

من Navigator إلى Chrome، من المثل العليا مفتوحة المصدر إلى الإعلانات التجارية، من المتصفح الخفيف إلى مساعد البحث AI، كانت حرب المتصفحات دائمًا صراعًا حول التقنية، المنصة، المحتوى والسيطرة. ساحة المعركة تتنقل باستمرار، لكن الجوهر لم يتغير أبدًا: من يمتلك المدخل، هو من يحدد المستقبل.

في نظر رأس المال المغامر، وبالاعتماد على الطلب الجديد للناس على محركات البحث في عصر LLM و AI، بدأت الحرب الثالثة على المتصفحات في التوسع تدريجياً. فيما يلي بعض معلومات التمويل لمشاريع متصفحات الذكاء الاصطناعي المعروفة.

بنية متصفح حديث قديم

عند الحديث عن هيكل المتصفح، فإن الهيكل التقليدي الكلاسيكي كما هو موضح في الشكل أدناه:

العميل - واجهة الدخول الأمامية

استعلام عن الوصول إلى Google Front End الأقرب عبر HTTPS، وإكمال فك تشفير TLS، وعينة QoS، والتوجيه الجغرافي. إذا تم اكتشاف حركة مرور غير طبيعية (DDoS، أو الزحف التلقائي)، يمكن تطبيق حد أو تحدي في هذه الطبقة.

استعلام الفهم

يجب على الواجهة الأمامية فهم معنى الكلمات التي يدخلها المستخدم، وهناك ثلاث خطوات: تصحيح الإملاء العصبي، تصحيح "recpie" إلى "recipe"؛ توسيع المرادفات، توسيع "how to fix bike" إلى "repair bicycle". تحليل النية، تحديد ما إذا كان الاستعلام هو معلومات، توجيه، أو نية تداول، وتخصيص طلبات Vertical.

استرجاع المرشحين

تُعرف تقنية الاستعلام المستخدمة من قبل Google باسم: الفهرس العكسي. في الفهرس المباشر، يُمكننا ببساطة استخدام معرف للوصول إلى الملف. لكن المستخدمين لا يمكنهم معرفة رقم المحتوى الذي يرغبون في الوصول إليه من بين مئات المليارات من الملفات، لذلك تم استخدام الفهرس العكسي التقليدي جداً، للبحث عن الملفات التي تحتوي على الكلمات الرئيسية ذات الصلة بالمحتوى. بعد ذلك، تستخدم Google الفهرس المتجه لمعالجة البحث الدلالي، أي العثور على محتوى مشابه للمعنى للاستعلام. يتم تحويل النصوص والصور والمحتويات الأخرى إلى متجهات عالية الأبعاد (embedding)، ويتم البحث بناءً على التشابه بين هذه المتجهات. على سبيل المثال، حتى لو بحث المستخدم عن "كيفية صنع عجينة البيتزا"، يمكن لمحرك البحث إرجاع نتائج ذات صلة بـ "دليل صنع عجينة البيتزا"، لأنها مشابهة من الناحية الدلالية. بعد استخدام الفهرس العكسي والفهرس المتجه، سيتم تصفية حوالي مئة ألف صفحة ويب بشكل أولي.

الترتيب المتعدد المستويات

تقوم الأنظمة عادةً باستخدام BM25 و TF-IDF ودرجات جودة الصفحة وغيرها من الميزات الخفيفة التي تتكون من آلاف الأبعاد، لتصفية صفحات المرشحين من نطاق مكون من مئة ألف صفحة إلى حوالي 1000 صفحة، مما يشكل مجموعة المرشحين الأولية. تُعرف هذه الأنظمة بشكل جماعي بمحركات التوصية. تعتمد على مجموعة كبيرة من الميزات التي تم إنشاؤها بواسطة كيانات متعددة، بما في ذلك سلوك المستخدم وخصائص الصفحة ونوايا الاستعلام وإشارات السياق. على سبيل المثال، تأخذ Google في الاعتبار تاريخ المستخدم، وتغذية سلوك المستخدمين الآخرين، ودلالات الصفحة، ومعاني الاستعلام، بالإضافة إلى العناصر السياقية، مثل الوقت (الفترة الزمنية خلال اليوم، والأيام المحددة في الأسبوع) والأحداث الخارجية مثل الأخبار العاجلة.

تعلم عميق للترتيب الرئيسي

في مرحلة البحث الأولي، تستخدم Google تقنيات مثل RankBrain و Neural Matching لفهم معنى الاستعلامات، وتصفية النتائج ذات الصلة الأولية من بين كمية هائلة من الوثائق. تم إدخال RankBrain من قبل Google في عام 2015 كنظام تعلم آلي، يهدف إلى فهم معنى استعلامات المستخدمين بشكل أفضل، وخاصة الاستعلامات الجديدة. يقوم بتحويل الاستعلامات والوثائق إلى تمثيلات متجهية، ويحسب مدى تشابهها للعثور على النتائج الأكثر ارتباطًا. على سبيل المثال، بالنسبة للاستعلام "كيف تصنع عجينة البيتزا"، حتى لو لم تحتوي الوثائق على كلمات رئيسية مطابقة تمامًا، يمكن لـ RankBrain التعرف على المحتويات المتعلقة بـ "أساسيات البيتزا" أو "صنع العجين".

التطابق العصبي هو تقنية أخرى أطلقتها Google في عام 2018 تهدف إلى فهم أعمق للعلاقة الدلالية بين الاستفسارات والمستندات. تستخدم نموذج الشبكة العصبية لالتقاط العلاقات الغامضة بين الكلمات، مما يساعد Google على مطابقة الاستفسارات ومحتوى الويب بشكل أفضل. على سبيل المثال، بالنسبة للاستفسار "لماذا يكون صوت مروحة الكمبيوتر المحمول لدي مرتفعًا جدًا"، يمكن للتطابق العصبي فهم أن المستخدم قد يبحث عن معلومات استكشاف الأخطاء وإصلاحها تتعلق بالارتفاع في درجة الحرارة أو تراكم الغبار أو استخدام وحدة المعالجة المركزية المرتفع، حتى لو لم تظهر هذه الكلمات بشكل مباشر في الاستفسار.

إعادة ترتيب عميقة: تطبيق نموذج BERT

بعد تصفية الوثائق ذات الصلة بشكل أولي، استخدمت Google نموذج BERT (تمثيلات الترميز ثنائية الاتجاه من المحولات) لترتيب هذه الوثائق بشكل أكثر دقة، لضمان ظهور النتائج الأكثر صلة في المقدمة. BERT هو نموذج لغة مسبق التدريب يعتمد على المحولات، قادر على فهم العلاقات السياقية للكلمات ضمن الجمل. في البحث، يُستخدم BERT لإعادة ترتيب الوثائق التي تم استردادها أولياً. يقوم ذلك من خلال تشفير مشترك للاستعلام والوثائق، وحساب درجة الصلة بينها، مما يؤدي إلى إعادة ترتيب الوثائق. على سبيل المثال، بالنسبة للاستعلام "ركن السيارة على منحدر بدون رصيف"، يمكن لـ BERT فهم معنى "بدون رصيف"، وإرجاع اقتراح للسائقين بتوجيه العجلات نحو جانب الطريق، بدلاً من سوء الفهم باعتباره وجود رصيف. وبالنسبة لمهندسي SEO، يتطلب الأمر دراسة دقيقة لترتيب Google وخوارزميات التوصية المدعومة بالذكاء الاصطناعي، من أجل تحسين محتوى صفحات الويب بشكل مستهدف لتحقيق مرتبة أعلى في العرض.

هذه هي العملية النموذجية لمحرك بحث Google. ولكن في عصر الانفجار الحالي للذكاء الاصطناعي والبيانات الضخمة، أصبح لدى المستخدمين متطلبات جديدة للتفاعل مع المتصفح.

لماذا ستعيد الذكاء الاصطناعي تشكيل المتصفح

أولاً، نحتاج إلى توضيح لماذا لا يزال هذا الشكل من المتصفح موجودًا؟ هل هناك شكل ثالث، بخلاف وكلاء الذكاء الاصطناعي والمتصفحات، للاختيار؟

نعتقد أن الوجود لا يمكن استبداله. لماذا يمكن للذكاء الاصطناعي استخدام المتصفح، لكنه لا يمكنه أن يحل محل المتصفح بالكامل؟ لأن المتصفح هو منصة عامة، ليس فقط مدخلًا لقراءة البيانات، بل هو أيضًا مدخل عام لإدخال البيانات. هذا العالم لا يمكن أن يحتوي فقط على إدخال المعلومات، بل يجب أيضًا إنتاج البيانات والتفاعل مع المواقع، لذلك سيظل المتصفح الذي يدمج معلومات المستخدمين المخصصة موجودًا على نطاق واسع.

نحن نلتقط هذه النقطة: المتصفح كمدخل عام، لا يُستخدم فقط لقراءة البيانات، بل غالبًا ما يحتاج المستخدمون أيضًا إلى التفاعل مع البيانات. المتصفح نفسه هو مكان ممتاز لتخزين بصمات الأصابع الخاصة بالمستخدمين. يجب أن تكون السلوكيات الأكثر تعقيدًا والسلوكيات الآلية محمولة عبر المتصفح. يمكن للمتصفح تخزين جميع بصمات سلوك المستخدم، وكلمات المرور، وغيرها من المعلومات الشخصية، مما يتيح استدعاءً غير موثوق به في العملية الآلية. بينما يمكن أن تتطور الإجراءات المتعلقة بالتفاعل مع البيانات إلى:

المستخدم → استدعاء وكيل الذكاء الاصطناعي → المتصفح.

بمعنى آخر، الجزء الوحيد الذي يمكن استبداله هو الاتجاه الذي يتماشى مع اتجاهات تطور العالم - - مزيد من الذكاء، مزيد من التخصيص، ومزيد من الأتمتة. ومن المؤكد أن هذا الجزء يمكن أن يتولى AI Agent معالجته، ولكن AI Agent نفسه ليس المكان المناسب لاستيعاب محتوى المستخدم المخصص، نظرًا لأنه يواجه تحديات متعددة في جوانب أمان البيانات والملاءمة. بشكل أكثر تحديدًا:

المتصفح هو مكان لتخزين المحتوى المخصص:

  • معظم النماذج الكبيرة مستضافة في السحابة، وتعتمد سياقات الجلسة على حفظ الخادم، مما يجعل من الصعب استدعاء البيانات الحساسة مثل كلمات المرور، والمحافظ، وملفات تعريف الارتباط مباشرة من الجهاز المحلي.
  • يجب إرسال جميع بيانات التصفح والدفع إلى نموذج طرف ثالث، ويجب الحصول على إذن جديد من المستخدم؛ تتطلب كل من لائحة الاتحاد الأوروبي "DMA" وقوانين الخصوصية على مستوى الولايات المتحدة الحد من تصدير البيانات.
  • يجب إكمال ملء رمز التحقق المزدوج تلقائيًا، واستدعاء الكاميرا أو استخدام GPU لإجراء استدلال WebGPU داخل صندوق الرمل الخاص بالمتصفح.
  • تعتمد سياقات البيانات بشكل كبير على المتصفح، بما في ذلك علامات التبويب وملفات تعريف الارتباط وIndexedDB وذاكرة التخزين المؤقت لخدمة العامل وبيانات الاعتماد Passkey بالإضافة إلى بيانات الإضافات، كل ذلك متجذر في المتصفح.

تحول عميق في أشكال التفاعل

عد إلى الموضوع الذي بدأنا به، يمكن تقسيم سلوكنا في استخدام المتصفح بشكل عام إلى ثلاثة أشكال: قراءة البيانات، إدخال البيانات، التفاعل مع البيانات. لقد غير نموذج الذكاء الاصطناعي الكبير (LLM) بشكل عميق كفاءة وطريقة قراءة البيانات لدينا، حيث أصبح سلوك المستخدمين في البحث عن صفحات الويب استنادًا إلى الكلمات الرئيسية يبدو قديمًا وغير فعال جدًا.

تطور سلوك البحث لدى المستخدمين - هل هو الحصول على إجابات ملخصة أم النقر على صفحات الويب، لقد تم تحليل ذلك في العديد من الدراسات.

فيما يتعلق بأنماط سلوك المستخدمين، أظهرت الأبحاث في عام 2024 أنه من بين كل 1,000 استعلام على Google في الولايات المتحدة، يتم النقر على صفحات الويب المفتوحة في 374 مرة فقط. بعبارة أخرى، فإن حوالي 63% من السلوكيات تنتمي إلى "السلوكيات بدون نقر". يعتاد المستخدمون على الحصول على معلومات مثل الطقس، أسعار الصرف، وبطاقات المعرفة مباشرة من صفحة نتائج البحث.

فيما يتعلق بعقلية المستخدمين، أظهرت دراسة أجريت في عام 2023 أن 44% من المشاركين يعتبرون النتائج الطبيعية العادية أكثر موثوقية من الملخصات المميزة (featured snippet). كما وجدت الأبحاث الأكاديمية أنه في القضايا المثيرة للجدل أو التي لا توجد فيها حقيقة موحدة، يفضل المستخدمون صفحات النتائج التي تحتوي على روابط متعددة المصادر.

هذا يعني أن هناك بالفعل جزءًا من المستخدمين الذين لا يثقون كثيرًا في ملخصات الذكاء الاصطناعي، ولكن هناك أيضًا نسبة كبيرة من سلوك المستخدمين قد تحولت إلى "نقر صفري". لذلك، لا يزال يتعين على متصفح الذكاء الاصطناعي استكشاف شكل تفاعل مناسب - خاصة في جزء قراءة البيانات، لأن مشكلة "الوهم" (hallucination) في النماذج الكبيرة لم يتم القضاء عليها بعد، ولا يزال العديد من المستخدمين يجدون صعوبة في الثقة تمامًا في محتوى الملخصات التي تم إنشاؤها تلقائيًا. في هذا الصدد، إذا تم تضمين النماذج الكبيرة في المتصفح، فلا يتطلب الأمر في الواقع إجراء تغييرات جذرية على المتصفح، بل يتعين حل دقة النموذج وقابليته للتحكم بشكل تدريجي، وهذا التحسين لا يزال مستمرًا.

وما قد يؤدي حقًا إلى تغيير كبير في المتصفح هو طبقة التفاعل مع البيانات. في الماضي، كان الناس يتفاعلون من خلال إدخال كلمات رئيسية - - وهذا هو الحد الأقصى لفهم المتصفح. أما الآن، فإن المستخدمين يميلون بشكل متزايد إلى استخدام فقرة كاملة من اللغة الطبيعية لوصف المهام المعقدة، مثل:

  • "البحث عن تذاكر الطيران المباشرة من نيويورك إلى لوس أنجلوس في فترة زمنية معينة"
  • "البحث عن تذاكر الطيران من نيويورك إلى شانغهاي ثم إلى لوس أنجلوس"

تحتاج هذه الأفعال، حتى للبشر، إلى استهلاك وقت كبير للوصول إلى مواقع متعددة، وجمع البيانات ومقارنتها. لكن هذه المهام الوكيلة (Agentic Tasks) يتم الاستحواذ عليها تدريجياً بواسطة وكلاء الذكاء الاصطناعي.

هذا يتماشى أيضًا مع اتجاه التطور التاريخي: الأتمتة والذكاء. يرغب الناس في تحرير أيديهم، وسيكون من المؤكد أن وكيل الذكاء الاصطناعي سيتم دمجه بعمق في المتصفح. يجب أن يتم تصميم المتصفح في المستقبل ليكون مخصصًا للأتمتة الكاملة، مع الأخذ في الاعتبار بشكل خاص:

  • كيف يمكن تحقيق التوازن بين تجربة قراءة الإنسان وقدرة AI Agent على التحليل ،
  • كيفية خدمة المستخدمين ونموذج الوكيل في نفس الصفحة.

فقط من خلال تصميم يلبي هذين الشرطين، يمكن للمتصفح أن يصبح حقًا وسيلة مستقرة لتنفيذ المهام كوكيل ذكاء اصطناعي.

بعد ذلك، سنركز على خمسة مشاريع تحظى باهتمام كبير، بما في ذلك Browser Use و Arc (شركة المتصفح) و Perplexity و Brave و Donut. تمثل هذه المشاريع اتجاهات التطور المستقبلية لمتصفحات الذكاء الاصطناعي وإمكاناتها الأصلية في دمجها مع مشهد Web3 و Crypto.

استخدام المتصفح

هذه هي المنطق الأساسي وراء حصول Perplexity و Browser Use على تمويل كبير. خاصةً Browser Use، هو ثاني فرص الابتكار الأكثر تأكيدًا وإمكانيات النمو التي ظهرت في النصف الأول من عام 2025.

Browser هو بناء طبقة دلالية حقيقية ، حيث يتمثل جوهره في إنشاء بنية التعرف الدلالي للجيل القادم من المتصفحات.

استخدام المتصفح يعيد فك تشفير "DOM التقليدي = شجرة العقد التي تُعرض للناس" إلى "DOM الدلالي = شجرة التعليمات التي تُعرض لـ LLM"، مما يسمح للوكيل بالنقر بدقة، والتعبئة، والرفع دون الحاجة إلى "إحداثيات نقاط العرض"؛ هذه المسار يستبدل "النص الهيكلي → استدعاء الدوال" بدلاً من OCR البصري أو Selenium بالإحداثيات، لذا فإن التنفيذ أسرع، وتوفير التوكنات أكبر، وأخطاء أقل. وصفت TechCrunch ذلك بأنه "الطبقة اللاصقة التي تجعل الذكاء الاصطناعي يفهم صفحات الويب حقًا"، بينما كانت جولة التمويل الأولية التي اكتملت في مارس بقيمة 17 مليون دولار تراهن على هذا الابتكار الأساسي.

يتم تشكيل شجرة DOM القياسية بعد عرض HTML؛ ثم يقوم المتصفح بتوليد شجرة إمكانية الوصول لتوفير "أدوار" و"حالات" أكثر ثراءً لقراءة الشاشة.

  • قم بتجريد كل عنصر تفاعلي (مثل ، إلخ) إلى مقطع JSON، مع إضافة بيانات وصفية مثل الدور، الرؤية، الإحداثيات، والإجراءات القابلة للتنفيذ؛
  • تحويل الصفحة بأكملها إلى «قائمة نقاط دلالية مسطحة» لتكون متاحة لـ LLM للقراءة مرة واحدة في النظام.
  • استلام التعليمات العليا من LLM (مثل click(node_id="btn-Checkout")) ، وإعادة تشغيلها في المتصفح الحقيقي. تسمي المدونة الرسمية هذه العملية "تحويل واجهات المواقع إلى نص منظم يمكن لـ LLM تفسيره".

في نفس الوقت، بمجرد إدخال هذه المعايير في W3C، سيتمكن ذلك إلى حد كبير من حل مشاكل إدخال المتصفح. سنستخدم الرسالة المفتوحة من The Browser Company والحالات لتوضيح لماذا كانت أفكار The Browser Company خاطئة.

** ARC **

أعلنت شركة Arc الأم ( في رسالتها العامة أن متصفح ARC سيدخل مرحلة الصيانة العادية، وأن الفريق ستركز جهوده على المتصفح DIA الموجه بالكامل نحو الذكاء الاصطناعي. كما اعترفت الرسالة أنه لم يتم بعد تحديد مسار التنفيذ المحدد لـ DIA. في الوقت نفسه، قدم الفريق في الرسالة عددًا من التوقعات لسوق المتصفحات المستقبلية. بناءً على هذه التوقعات، نعتقد أنه إذا كان هناك رغبة حقيقية في تغيير شكل المتصفحات الحالية، فإن المفتاح يكمن في تغيير المخرجات من ناحية التفاعل.

فيما يلي ثلاثة من توقعاتنا لسوق المتصفحات المستقبلية من فريق ARC.

أولاً، يعتبر أن صفحات الويب لم تعد هي الواجهة التفاعلية الرئيسية. لا يمكن إنكار أن هذه حُكم مُتحدٍ، وهذا بالضبط هو السبب الذي يجعلنا نُحافظ على موقف حذر تجاه نتائج التأمل التي توصل إليها مؤسسوه. في رأينا، هذه وجهة نظر تقدر دور المتصفح تقديرًا منخفضًا، وهي القضية الرئيسية التي تم تجاهلها عندما تم استكشاف مسار متصفح الذكاء الاصطناعي.

تتميز النماذج الكبيرة بأداء ممتاز في التقاط النوايا، مثل فهم تعليمات مثل "ساعدني في حجز تذكرة طيران". ومع ذلك، فإنها لا تزال تعاني من نقص في القدرة على تحمل كثافة المعلومات. عندما يحتاج المستخدم إلى مذكرة بأسلوب لوحة المعلومات أو محطة بلومبرغ، أو قماش مرئي مشابه لـ Figma، فلا شيء يتفوق على صفحات الويب المخصصة التي تمتاز بدقة بكسل. كل منتج مصمم هندسيًا حسب الطلب - الرسوم البيانية، وظيفة السحب والإفلات، الاختصارات - ليست زينة زخرفية، بل هي إمكانية ضغط الإدراك. هذه القدرات لا يمكن أن تتحملها التفاعلات الحوارية البسيطة. على سبيل المثال، إذا أراد المستخدم إجراء عمليات استثمارية على Gate.com، فإن الاعتماد فقط على محادثة الذكاء الاصطناعي لا يكفي، لأن المستخدم يعتمد بشكل كبير على إدخال المعلومات والدقة والعرض المنظم.

توجد انحرافات جوهرية في تصور فريق RC لمساره، وهي عدم القدرة على التمييز بوضوح بين "التفاعل" الذي يتكون من بعدين هما المدخلات والمخرجات. من جانب المدخلات، فإن وجهة نظره في بعض السيناريوهات لها بعض المعقولية، حيث يمكن للذكاء الاصطناعي تحسين كفاءة التفاعلات التي تعتمد على التعليمات؛ ولكن من جانب المخرجات، فإن هذا الحكم يبدو غير متوازن بشكل واضح، حيث يتجاهل الدور الأساسي للمتصفح في عرض المعلومات وتجربة المستخدم الشخصية. على سبيل المثال، يتمتع Reddit بتخطيط فريد وبنية معلومات خاصة به، بينما تتمتع AAVE بواجهة وهياكل مختلفة تمامًا. يعمل المتصفح كمنصة تستوعب بيانات عالية الخصوصية، وفي نفس الوقت يمكنها عرض واجهات منتجات متعددة، لذلك فإن البدائل على مستوى المدخلات تكون محدودة بطبيعتها، بينما على مستوى المخرجات، فإن تعقيدها وخصائصها غير القياسية تجعل من الصعب تغييرها. بالمقارنة، تركز المتصفحات الذكية الحالية في السوق بشكل أكبر على مستوى "تلخيص المخرجات": تلخيص صفحات الويب، استخراج المعلومات، توليد النتائج، وهذا لا يكفي ليشكل تحديًا جوهريًا للمستعرضات الشائعة مثل Google أو نظم البحث، بل إن الحصة السوقية التي يتم تقاسمها هي مجرد حصة من سوق تلخيص البحث.

لذلك، فإن الشيء الذي يمكنه حقًا هزيمة حصة سوق تصل إلى 66% من Chrome، من المؤكد أنه لن يكون "Chrome التالي". لتحقيق هذا التحول، يجب إعادة تشكيل نمط عرض المتصفح بشكل جذري، ليتمكن من التكيف مع احتياجات التفاعل التي تهيمن عليها وكالات الذكاء الاصطناعي في عصر الذكاء، خاصة في تصميم الهيكل على جانب الإدخال. لهذا السبب، نحن نؤيد بشكل أكبر المسار التكنولوجي الذي تتبعه Browser Use - حيث تركز على التحول الهيكلي للآلية الأساسية للمتصفح. بمجرد أن يتمكن أي نظام من تحقيق "التفكيك الذري" أو "التجزئة"، فإن القابلية للبرمجة والتركيب الناتجة عن ذلك ستجلب إمكانيات تحوليّة مدمرة، وهذا هو الاتجاه الذي تتبعه Browser Use حاليًا.

بشكل عام، يعتمد تشغيل وكيل الذكاء الاصطناعي بشكل كبير على وجود المتصفح. المتصفح ليس فقط المكان الرئيسي لتخزين البيانات الشخصية المعقدة، ولكنه أيضًا واجهة عرض عالمية لتطبيقات متنوعة، لذا سيظل يعمل كمدخل تفاعلي أساسي في المستقبل. مع تعمق وكيل الذكاء الاصطناعي في المتصفح لإكمال المهام الثابتة، سيتفاعل من خلال استدعاء بيانات المستخدم مع تطبيقات معينة، أي أنه سيعمل بشكل رئيسي على جانب الإدخال. لهذا السبب، يجب تجديد نمط العرض الحالي للمتصفح لتحقيق أكبر قدر من التوافق والتكيف مع وكيل الذكاء الاصطناعي، مما سيؤدي إلى التقاط التطبيقات بشكل أكثر فعالية.

)# ** الحيرة **

Perplexity هو محرك بحث ذكاء اصطناعي معروف بنظام التوصيات الخاص به، وقد بلغت قيمته السوقية الأخيرة 14 مليار دولار، مما يمثل نمواً يقارب 5 مرات مقارنة بـ 3 مليارات دولار في يونيو 2024. يتعامل مع أكثر من 400 مليون استعلام بحث شهريًا، حيث تم معالجة حوالي 250 مليون استعلام في سبتمبر 2024، وزادت استعلامات المستخدمين بنسبة 8 مرات على أساس سنوي، مع وجود أكثر من 30 مليون مستخدم نشط شهريًا.

تتمثل ميزته الرئيسية في القدرة على تلخيص الصفحات في الوقت الحقيقي، مما يمنحه ميزة في الحصول على المعلومات الفورية. في بداية هذا العام، بدأ في بناء متصفحه الأصلي Comet. وصفت Perplexity Comet الذي سيتم إطلاقه قريبًا بأنه متصفح لا يكتفي بـ "عرض" صفحات الويب، بل "يفكر" في صفحات الويب أيضًا. وتقول الشركة إنه سيتم تضمين محرك الإجابات الخاص بـ Perplexity بعمق داخل المتصفح، وهي فكرة تشبه فكرة "الجهاز الكامل" لستيف جوبز: دفن مهام الذكاء الاصطناعي في أسفل المتصفح، بدلاً من أن تكون مجرد مكون إضافي في الشريط الجانبي. واستبدال الإجابات المختصرة مع الاقتباسات بالروابط الزرقاء التقليدية العشر، للتنافس مباشرة مع Chrome.

لكن لا يزال يتعين عليها حل مشكلتين رئيسيتين: ارتفاع تكاليف البحث وانخفاض هوامش الربح من المستخدمين الهامشيين. على الرغم من أن Perplexity في موقع ريادي في مجال البحث الذكي، إلا أن Google أعلنت أيضًا في مؤتمر I/O لعام 2025 عن إعادة تشكيل كبيرة لمنتجاتها الأساسية بالذكاء الاصطناعي. فيما يتعلق بإعادة تشكيل المتصفح، أطلقت Google تجربة جديدة لعلامة تبويب المتصفح، تُسمى AI Model، والتي تتضمن ميزات Overview وDeep Research وAgentic في المستقبل، ويطلق على المشروع بالكامل اسم "Project Mariner".

تقوم Google بنشاط بإعادة تشكيل الذكاء الاصطناعي، ولذلك فإن تقليد الوظائف السطحية مثل Overview وDeepResearch أو Agentics، سيكون من الصعب حقًا أن يشكل تهديدًا لها. ما قد يكون قادرًا حقًا على إقامة نظام جديد في الفوضى هو إعادة بناء بنية المتصفح من الأسفل، ودمج النماذج اللغوية الكبيرة (LLM) بعمق في نواة المتصفح، وتحقيق تغييرات جذرية في أساليب التفاعل.

** شجاع **

Brave هو أحد أوائل المتصفحات في صناعة Crypto وأحد أنجحها، وهو مبني على هيكل Chromium، مما يجعله متوافقًا مع الإضافات الموجودة على متجر Google. يعتمد Brave على نموذج كسب Tokens من خلال الخصوصية والتصفح لجذب المستخدمين. مسار تطوير Brave يعكس إلى حد ما إمكانيات نموه. ومع ذلك، من منظور المنتج، تعتبر الخصوصية مهمة بلا شك، لكن الطلب عليها لا يزال مركزًا بشكل رئيسي على مجموعة معينة من المستخدمين، بينما لا تزال الوعي بالخصوصية لم يصبح العامل الحاسم بالنسبة للجمهور العام. لذلك، فإن احتمالية الإطاحة بالعمالقة الحاليين من خلال هذه الميزة منخفضة.

حتى الآن، بلغ عدد المستخدمين النشطين شهريًا لـ Brave 82.7 مليون، وعدد المستخدمين النشطين يوميًا 35.6 مليون، وحصة السوق حوالي 1%–1.5%. يستمر عدد المستخدمين في الزيادة: من 6 ملايين في يوليو 2019، إلى 25 مليون في يناير 2021، وبلغ 57 مليون في يناير 2023، ومن المتوقع أن يتجاوز 82 مليون بحلول فبراير 2025، مع الحفاظ على معدل نمو مركب سنوي في خانة العشرات. يبلغ متوسط عدد عمليات البحث الشهرية حوالي 1.34 مليار، أي حوالي 0.3% من Google.

إليك خارطة طريق Brave التكرارية.

تخطط Brave لترقية متصفحها ليكون موجهًا نحو الخصوصية. ومع ذلك، فإن قلة البيانات التي تجمعها عن المستخدمين تؤدي إلى انخفاض درجة تخصيص النموذج الكبير، مما يعوق تحقيق تكرارات سريعة ودقيقة للمنتجات. في عصر متصفح Agentic القادم، قد تحتفظ Brave بحصة مستقرة بين مجموعة المستخدمين الذين يركزون على الخصوصية، لكنها من الصعب أن تصبح لاعبًا رئيسيًا. مساعدها الذكي Leo يشبه أكثر الإضافات، حيث يعزز فقط الوظائف على أساس المنتجات الحالية، ويمتلك قدرة معينة على تلخيص المحتوى، ولكن لا توجد استراتيجية واضحة للتحول الشامل إلى وكيل الذكاء الاصطناعي، ولا تزال الابتكارات على مستوى التفاعل غير كافية.

دونات

مؤخراً، حقق قطاع التشفير تقدماً أيضاً في مجال متصفح Agentic. حصل المشروع الناشئ Donut على تمويل بقيمة 7 ملايين دولار في جولة Pre-seed، بقيادة Redpoint China (Hongshan) وHackVC وBitkraft Ventures. لا يزال المشروع في مرحلة التصور المبكر، ورؤيته تهدف إلى تحقيق القدرة المتكاملة على "الاكتشاف - اتخاذ القرار - التنفيذ الأصلي للتشفير" (Discovery, Decision-making, and Crypto-native Execution).

تتمثل جوهر هذا الاتجاه في دمج مسارات التنفيذ الآلي الأصلية للعملات المشفرة. كما تنبأت a16z، من المتوقع أن تحل الوكلاء محل محركات البحث لتصبح المدخل الرئيسي لحركة المرور، حيث لن يتنافس رواد الأعمال بعد الآن حول خوارزمية تصنيف Google، بل سيتنافسون على الزيارات وحركة التحويل الناتجة عن تنفيذ الوكلاء. لقد أطلق على هذا الاتجاه في الصناعة اسم "AEO" (تحسين محرك الإجابات / الوكلاء)، أو حتى "ATF" (إتمام المهام الوكيلة)، مما يعني عدم تحسين تصنيفات البحث، وإنما تقديم خدمة مباشرة لنماذج الذكاء الاصطناعي القادرة على إتمام مهام مثل الطلب، وحجز التذاكر، وكتابة الرسائل بالنيابة عن المستخدم.

للمؤسسين

أولاً، يجب الاعتراف: إن المتصفح نفسه لا يزال أكبر "مدخل" غير معاد هيكلته في عالم الإنترنت. ويبلغ عدد مستخدمي سطح المكتب في جميع أنحاء العالم حوالي 2.1 مليار، وعدد مستخدمي الهواتف المحمولة أكثر من 4.3 مليار، وهو بمثابة الناقل المشترك لإدخال البيانات، وسلوك التفاعل، وتخزين بصمات الأصابع الشخصية. إن استمرار هذا الشكل ليس بسبب القصور، ولكن لأن المتصفح يمتلك خصائص ثنائية بشكل طبيعي: فهو "مدخل قراءة" للبيانات، وأيضًا "مخرج كتابة" للسلوك.

لذلك، بالنسبة لرواد الأعمال، فإن ما يمتلك حقًا إمكانيات التحول ليس تحسين "مخرجات الصفحات" في المقام الأول. حتى وإن استطاعوا تحقيق وظائف نظرة عامة مشابهة لـ Google AI في علامة تبويب جديدة، فإن ذلك في جوهره لا يزال ينتمي إلى تكرار مستوى ملحقات المتصفح، ولم يشكل بعد تغييرًا جذريًا في النموذج. إن نقطة الاختراق الحقيقية تكمن في "جانب الإدخال" - أي كيفية جعل وكيل الذكاء الاصطناعي يستدعي منتجات رواد الأعمال بنشاط لإكمال المهام المحددة. سيكون هذا هو المفتاح لما إذا كانت المنتجات المستقبلية ستتمكن من الاندماج في نظام وكيل، والحصول على حركة المرور وتوزيع القيمة.

عصر البحث يُكتب "نقر"؛ عصر الوكالة يُكتب "استدعاء".

إذا كنت رائد أعمال، فلا تتردد في إعادة تخيل منتجك كمكون API - بحيث يمكن للوكيل أن "يفهمه" فحسب، بل "يستدعيه" أيضًا. وهذا يتطلب منك التفكير في ثلاثة أبعاد منذ البداية في تصميم المنتج:

أولاً، معيار هيكل الواجهة: هل منتجك "قابل للاستدعاء"؟

تعتمد قدرة المنتج على استدعائه بواسطة الذكاء الاصطناعي على ما إذا كان يمكن هيكلة معلوماته بشكل قياسي وتجريدها إلى مخطط واضح. على سبيل المثال، هل يمكن وصف العمليات الأساسية مثل تسجيل المستخدم، زر الطلب، تقديم التعليقات، من خلال هيكل DOM معنوي أو عبر رسم خرائط JSON؟ هل يوفر النظام آلة حالة تتيح للوكيل إعادة إنتاج تدفق سلوك المستخدم بشكل مستقر؟ هل تدعم التفاعلات الخاصة بالمستخدم على الصفحة استعادة النص البرمجي؟ هل توجد واجهة ويب أو نقطة نهاية API للوصول المستقر؟

هذا هو السبب الجوهري وراء نجاح تمويل Browser Use — — حيث حول المتصفح من HTML المعروض بشكل مسطح إلى شجرة دلالية يمكن استدعاؤها بواسطة LLM. بالنسبة لرواد الأعمال، فإن إدخال مفاهيم تصميم مماثلة في منتجات الويب هو بمثابة التكيف الهيكلي لعصر وكلاء الذكاء الاصطناعي.

ثانياً، الهوية والعبور: هل يمكنك مساعدة العميل في "تجاوز حواجز الثقة"؟

يحتاج وكيل الذكاء الاصطناعي لإنجاز الصفقة أو استدعاء الدفع أو الأصول إلى نوع من الطبقة الوسيطة الموثوقة - هل يمكنك أن تكون ذلك؟ المتصفح يمكنه بشكل طبيعي قراءة التخزين المحلي، واستدعاء المحفظة، والتعرف على رموز التحقق، والوصول إلى التحقق الثنائي، وهذا هو السبب في أنه أكثر ملاءمة للتنفيذ مقارنة بالنماذج الكبيرة السحابية. وهذا ينطبق بشكل خاص على سيناريوهات Web3: معايير واجهات استدعاء الأصول على السلسلة ليست موحدة، وإذا لم يكن لدى الوكيل "هوية" أو "قدرة على التوقيع"، فلن يتمكن من التحرك قيد أنملة.

لذا، بالنسبة لرواد الأعمال في مجال التشفير، هناك منطقة فارغة تتمتع بخيال واسع: "MCP (منصة متعددة القدرات) في عالم blockchain". يمكن أن تكون هذه إما طبقة تعليمات عامة (تسمح لوكلاء باستدعاء Dapp)، أو مجموعة واجهات عقود موحدة، أو حتى نوع من المحفظة الخفيفة + منصة الهوية التي تعمل محليًا.

ثالثًا، إعادة فهم آلية التدفق: المستقبل ليس تحسين محركات البحث، بل هو AEO / ATF

في الماضي، كان عليك أن تسعى لجذب خوارزمية Google؛ الآن يجب أن يتم دمجك في سلسلة المهام بواسطة AI Agent. وهذا يعني أن المنتج يجب أن يكون له وضوح في حجم المهمة: ليس "صفحة"، بل سلسلة من "وحدات القدرة القابلة للاستدعاء"؛ يعني أنه يجب عليك البدء في تحسين الوكيل (AEO) أو تكييف جدولة المهام (ATF): على سبيل المثال، هل يمكن تبسيط عملية التسجيل إلى خطوات منظمة، هل يمكن سحب الأسعار من خلال واجهة برمجة التطبيقات، وهل يمكن التحقق من المخزون في الوقت الفعلي؛

عليك حتى أن تبدأ في تكييف بناء الجملة لاستدعاء الأطر المختلفة لـ LLM - تفضيلات OpenAI وClaude لاستدعاء الوظائف واستخدام الأدوات ليست متسقة. Chrome هو مدخل إلى العالم القديم، وليس مدخلًا إلى العالم الجديد. المشاريع الريادية التي لها مستقبل حقيقي ليست إعادة بناء متصفح، بل جعل المتصفحات الحالية تخدم الوكلاء، وبناء جسر للجيل الجديد من "تدفق الأوامر".

  • ما يجب عليك بناؤه هو "نحو واجهة" Agent لاستدعاء عالمك؛
  • ما عليك السعي إليه هو أن تصبح جزءًا من سلسلة الثقة للذكاء الاصطناعي؛
  • ما تريد بناءه هو "قلعة API" في نموذج البحث التالي.

إذا كان Web2 يعتمد على واجهة المستخدم لجذب انتباه المستخدمين، فإن عصر Web3 + وكيل الذكاء الاصطناعي يعتمد على استدعاء السلسلة لجذب نية تنفيذ الوكيل.

شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت