يقترب عصر RAG من نهايته بالنسبة للذكاء الاصطناعي الوكيل – طبقة جديدة من المعرفة تأتي في مرحلة التجميع

تشهد فئة قاعدة بيانات المتجهات تحولًا استجابةً لاحتياجات الذكاء الاصطناعي الوكيل.

لم يعد خط أنابيب قاعدة بيانات إنشاء الاسترداد المعزز (RAG) إلى المتجه كافيًا؛ يتطلب الذكاء الاصطناعي القائم على الوكيل نهجًا مختلفًا مدركًا للسياق. VentureBeat Pulse للربع الأول من عام 2026 تسلط الدراسة الضوء على هذا الاتجاه: كل قاعدة بيانات متجهة مستقلة تفقد حصتها في الاعتماد، في حين تضاعفت نية تنزيل البيانات المختلطة ثلاث مرات لتصل إلى 33.3%، وهو الموقع الاستراتيجي الأسرع نموًا في مجموعة البيانات.

تدرك Pinecone، وهي شركة رائدة في قواعد بيانات المتجهات، ذلك وتتكيف مع الاحتياجات المحددة للذكاء الاصطناعي القائم على الوكيل.

أعلنت الشركة اليوم عن Nexus، الذي تعتبره محركًا للمعرفة وليس تحسينًا للبحث. تقدم Nexus مترجم سياق يحول بيانات المؤسسة الأولية إلى أدوات معرفية ثابتة ومحددة المهام قبل أن يقوم الوكلاء بالاستعلام عنها، ومسترد قابل للتركيب يتعامل مع هذه القطع الأثرية من خلال الاستشهادات على مستوى الحقل وحل النزاعات الحتمية.

بالإضافة إلى Nexus، يوفر Pinecone KnowQL، وهي لغة استعلام تعريفية تزود الوكلاء بالمفردات اللازمة لتحديد أشكال المخرجات ومتطلبات الثقة وميزانيات زمن الاستجابة. في المعيار الداخلي الخاص بـ Pinecone، تم إكمال مهمة تحليل مالي واحدة كانت تستهلك في السابق 2.8 مليون رمز مميز بواسطة Nexus بـ 4000 رمز فقط. ويمثل هذا انخفاضًا بنسبة 98%، على الرغم من أن الشركة لم تتحقق بعد من ذلك في عمليات نشر الإنتاج للعملاء. اعتبارًا من اليوم، أصبح Nexus في مرحلة الوصول المبكر.

قال الرئيس التنفيذي لشركة Pinecone Ash Ashutosh لـ VentureBeat: “تم تصميم RAG مع وضع المستخدمين في الاعتبار”. “تم تصميم Nexus لمستخدمي الوكلاء لأن لغتهم مختلفة تمامًا. والإجابات التي يتوقعونها مختلفة تمامًا. والمهمة التي تم تعيين الوكيل لتنفيذها مختلفة تمامًا عما يجب أن يفعله برنامج الدردشة الآلي.”

لماذا لم يتم تصميم RAG أبدًا لما يفعله الوكلاء بالفعل

يتضمن RAG استعلامًا واحدًا واستجابة واحدة وشخصًا في الحلقة يقوم بتفسير النتيجة. لكن الوكلاء يعملون بشكل مختلف. يتم تكليفهم بمهام، وليس أسئلة – ويتطلب إكمالها جمع السياق من مصادر متعددة، وحل النزاعات، وتتبع ما تم استرداده بالفعل، وتحديد ما يجب طرحه بعد ذلك.

التمييز مهم. يقوم خط أنابيب RAG باسترداد المستندات وتمريرها إلى النموذج في وقت الاستدلال. تبدأ كل جلسة وكيل بشكل بارد، دون فهم مجمع لمجموعة بيانات المؤسسة – ما هي الجداول التي يشيرون إليها، وما هي المصادر التي يمكن الاعتماد عليها بالنسبة للأسئلة، وما هي التنسيقات التي سيتمكن الوكيل النهائي من استخدامها بالفعل. كل جلسة تكتشفها من جديد من الصفر.

وقال أشوتوش: “في قلب هذا الأمر برمته كانت هناك مشكلة بسيطة للغاية”. “أنت تطلب من الوكلاء – الآلات – العمل على أنظمة وبيانات مصممة للبشر.”

يقدر Pinecone أن 85% من الجهد الحسابي الذي يبذله الوكيل يذهب إلى دورة إعادة الاستشعار بدلاً من إكمال المهمة. الآثار الجانبية: زمن الوصول غير المتوقع، وتكاليف الرمز المميز غير المنضبط، والنتائج غير الحتمية. قم بتشغيل نفس المهمة مرتين على نفس البيانات، وقد يعرض الوكيل استجابات مختلفة دون تسجيل المصادر التي تسببت في أي من النتائج. بالنسبة للشركات التي تكون فيها قابلية التدقيق شرطًا للامتثال، يعد هذا استبعادًا هيكليًا، وليس مشكلة توافق.

ما هو نيكزس وكيف يعمل؟

يقوم Nexus بنقل عمل الاستدلال من وقت الاستدلال إلى وقت التجميع. في خط أنابيب RAG التقليدي، يحدث المنطق المطلوب لتفسير المعرفة ووضعها في سياقها وبنيتها في لحظة استعلام الوكيل – في كل جلسة، وفي كل مرة، يتم حرق الرموز المميزة للعمل الذي كان من الممكن إنجازه مسبقًا. ومع ذلك، يقوم Nexus بالاستدلال مرة واحدة فقط أثناء خطوة التجميع، والتي يتم تشغيلها قبل أي استعلام وكيل، ثم يقوم بتخزين النتيجة كمعرفة فنية لإعادة استخدامها. بدلاً من المستندات الأولية، يتلقى الوكيل سياقًا منظمًا جاهزًا لأداء المهمة، والذي يمكنه تفسيره بشكل مستمر.

تتكون البنية التي يوفرها Pinecone من ثلاثة مكونات متميزة، يعالج كل منها طبقة مختلفة من مشكلة استرداد الوكيل.

  1. مترجم السياق. تأخذ Nexus بيانات المصدر الأولية ومواصفات المهمة ثم تقوم بإنشاء أدوات معرفية متخصصة – تمثيلات منظمة ومُحسَّنة للمهام يستهلكها الوكلاء مباشرة، دون أي تكاليف تفسيرية. تولد نفس مجموعة البيانات الأساسية عناصر مختلفة لوكلاء مختلفين: يتلقى وكيل المبيعات سياق المعاملة الذي تم تجميعه من إدارة علاقات العملاء وسجلات المكالمات، ويتلقى الوكيل المالي سياق الإيرادات الذي يربط العقود بجداول الفواتير. تكون القطع الأثرية ثابتة ويُعاد استخدامها في جلسات الوكيل، بدلاً من إعادة إنشائها في وقت الاستدلال.

  2. مسترد قابل للطي. يتم توفير العناصر المجمعة في وقت التشغيل مع الحقول المكتوبة، وعروض الأسعار لكل حقل مع مستويات الثقة، وحل التعارض الحتمي. يتم تشكيل الإخراج ليناسب التنسيق المحدد للوكيل، بدلاً من إرجاعه كنص خام يمكن للوكيل إعادة تحليله.

  3. WiedzQL. يصف Pinecone اللغة بأنها أول لغة استعلام تعريفية مصممة للوكلاء بدلاً من البشر. تعمل البدائيات الستة – الهدف، والمرشح، والأصل، وشكل المخرجات، والثقة، والميزانية – على تمكين الوكلاء من تحديد الاستجابات المنظمة والمصادر الأرضية ومغلفات التأخير في واجهة واحدة. قارن أشوتوش الفجوة الهيكلية التي تملأها KnowQL بما فعلته SQL لقواعد البيانات العلائقية: قبل أن تكون هناك واجهة قياسية، كان كل تطبيق يبني طبقة الوصول إلى البيانات الخاصة به من البداية.

العلاقة بين Nexus وقاعدة بيانات ناقل Pinecone الأساسية هي علاقة إضافية. يقوم مترجم السياق بإنشاء منتجات المعرفة التي يتم فهرستها وتخزينها في قاعدة بيانات متجهة؛ تشكل طبقة التجميع المعرفة وتخدمها؛ تتعامل الطبقة المتجهة مع الذاكرة وسرعة التنزيل والقياس.

وقال أشوتوش: “لا تزال النواقل مخزنة ومدارة بواسطة قاعدة بيانات متجهات Pinecone”.

ما رأي المحللين في النظرية المعمارية

إن نقل الاستدلال من الاستدلال إلى التجميع ليس مفهومًا جديدًا – فالأنطولوجيات وكتالوجات البيانات والطبقات الدلالية تبحث عن إصدارات منه منذ سنوات. ما تغير هو القدرة على القيام بذلك على نطاق واسع دون الحاجة إلى فرق هندسية مخصصة لكل مجال. هذه هي الحجة المحددة التي تقدمها شركة Nexus، وهي النقطة التي يرى المحللون فيها تقدمًا حقيقيًا.

قالت ستيفاني والتر، قائدة ممارسة مكدس الذكاء الاصطناعي في HyperFRAME Research، لـ VentureBeat إن Nexus اتجاهي لأنه ينقل العمل المعرفي من فوضى وقت التشغيل إلى بنية مجمعة مسبقًا. ومع ذلك، فقد أكدت على أن هذا يعد تطورًا في بنية RAG، وليس إعادة اختراع كاملة.

وقال والتر: “إن الابتكار الحقيقي ليس الفكرة نفسها، بل إنشاء مجموعة من المعرفة كطبقة بنية تحتية من الدرجة الأولى”. “إذا تمكن Pinecone من تنفيذ هذا بشكل موثوق، فسوف يصبح بنية تحتية ذات معنى، وليس مجرد خدعة ضبط RAG أخرى.”

الآلية التقنية وراء هذا الادعاء هي ما وصفه نائب رئيس جارتنر المتميز، آرون تشاندراسيكاران، بالتميز المعماري الكبير. قال شاندراسيكاران لـ VentureBeat: “على عكس RAG التقليدي، الذي يعتمد على البحث الدلالي البحت في وقت التشغيل، يقوم التجميع المعماري بتضمين المنطق الهيكلي في طبقة البيانات الوصفية، مما يمكنه تحسين أوقات الاستجابة وتوفير مبرر أفضل”. “هذه خطوة مهمة من البحث البسيط إلى الاستدلال المعزز، مما يمكّن الوكلاء من التنقل في أنماط المؤسسة واكتساب ذاكرة أفضل لوضع السياق.”

المناظر الطبيعية التنافسية

يؤكد العديد من الموردين أن قاعدة بيانات المتجهات و RAG التقليدية ليست كافية للذكاء الاصطناعي الوكيل.

قامت مايكروسوفت بتوسيع نطاقها تقنية فابريك آي كيو لتوفير السياق الدلالي للذكاء الاصطناعي الوكيل. أعلنت جوجل مؤخرا عن خاصيتها سحابة بيانات الوكيل كوسيلة للمساعدة في حل نفس المشاكل. هناك أيضًا تقنيات ذاكرة سياقية مستقلة مثل عدسة الكاميراالتي توفر للمستخدمين خيارًا آخر.

لكنيركز المحللون بشكل أقل على مقارنات الميزات وأكثر على ما يجب على المشترين تقييمه فعليًا. وقال والتر: “إن حزمة الذكاء الاصطناعي الوكيل تنقسم إلى العشرات من الميزات، ولكن لا ينبغي للمشترين من المؤسسات مطاردة الميزات”. “يجب عليهم أن يسعوا جاهدين من أجل الضوابط: ضوابط التكلفة، وضوابط الإدارة، وضوابط السلامة”.

وقالت إن معظم حالات فشل المؤسسات في الذكاء الاصطناعي القائم على الوكيل لن تكون تقنية. وستكون هذه الوحدات فعالة، وتخضع لتجاوز التكاليف والفجوات الإدارية والانضباط الأمني.

يتجاوز شريط الفرص سرعة الاسترداد. قال شاندراسيكاران: “إن الاختلاف الحقيقي هو الأساس الحتمي”، مشيرًا إلى تقنيات مثل الرسوم البيانية المعرفية التي تضمن فهم الوكلاء للروابط الهيكلية في بيانات المؤسسة بدلاً من إرجاع المطابقات على مستوى السطح. تعد إمكانية التشغيل البيني مشكلة ذات صلة: تعتبر المعايير مثل بروتوكول السياق النموذجي (MCP) مهمة لربط الوكلاء بمصادر البيانات القديمة دون إنشاء تبعيات جديدة.

ماذا يعني هذا بالنسبة للشركات

تم إنشاء قواعد بيانات RAG وقواعد بيانات المتجهات المستقلة لعصر مختلف. تكشف أعباء العمل المستندة إلى الوكيل القيود المفروضة على كلا الحلين.

مشكلة تكلفة الاسترداد هي مشكلة معمارية

تعمل الفرق التي تدير أعباء عمل معقدة للوكلاء على خطوط أنابيب RAG التقليدية على الاستفادة من الرموز المميزة عند استنتاج العمل الذي يمكن القيام به مسبقًا – تفسير المعرفة ووضعها في سياقها وتنظيمها من الصفر في كل جلسة. هذه مشكلة تصميم. لن يؤدي ضبط طبقة التنزيل إلى حل هذه المشكلة. والسؤال المطروح على فرق هندسة البيانات هو ما إذا كانت مجموعتهم الحالية قادرة من الناحية الهيكلية على تجميع المعرفة مسبقًا لمهام وكيل محددة، أو ما إذا كانت مصممة لمستخدم لم يحتاج أبدًا إلى هذه الإمكانية.

الإدارة هي ما يفصل بين التجريب ونشر الإنتاج

القدرات التي تحدد ما إذا كان سيتم اعتماد الذكاء الاصطناعي للوكيل للاستخدام في المؤسسة ليست مقاييس أداء.

وقال والتر: “إن القيمة الحقيقية للمشروع ليست مجرد البحث الأسرع، بل خطوط أنابيب المعرفة المنظمة”. “هذه هي القدرات التي تنقل الذكاء الاصطناعي القائم على الوكيل من التجربة إلى شيء ستوقع عليه فرق التمويل والمخاطر فعليًا.”

لقد تغيرت الميزانية

تظهر بيانات VentureBeat Q1 Pulse أن الاستثمار في تحسين البحث ارتفع إلى 28.9% في مارس، وهو ما يتجاوز الإنفاق التقييمي للمرة الأولى في هذا الربع. انتهت الشركات من قياس مشاكل البحث. الآن ينفقون المال لإصلاحها.

وقال والتر: “إن مستقبل الذكاء الاصطناعي الوكيل لن يعتمد على من لديه أطول نافذة سياقية”. “سيتم اتخاذ القرار بشأن من يمكنه نشر المعرفة الموثوقة على نطاق واسع، دون زيادة التكلفة أو الإدارة.”

رابط المصدر