يُظهر لك GPT-5.5 Instant ما تتذكره – ولكن ليس كل شيء

قامت OpenAI بتحديث نموذج ChatGPT الافتراضي إلى GPT-5.5 Instant الجديد، إلى جانب ميزة ذاكرة جديدة تُظهر أخيرًا الاستجابات التي تم تشكيلها في السياق – على الأقل بعضها.

يشير هذا القيد إلى أن النماذج بدأت في إنشاء طبقة ثانية غير مكتملة من إمكانية ملاحظة الذاكرة والتي قد تتعارض مع أنظمة التدقيق الحالية وسجلات الوكلاء.

يحل GPT-5.5 Instant محل GPT-5.3 Instant باعتباره نموذج ChatGPT الافتراضي وهو نسخة منه النموذج الرئيسي الجديد GPT-5.5 LLM. ويهدف إلى أن يكون أكثر موثوقية ودقة وأكثر ذكاءً من 5.3.

ومع ذلك، فإن إدخال مصادر التخزين التي ستكون متاحة على جميع نماذج المنصات يمكن أن يساعد المؤسسات في مشاريعها.

قال OpenAI: “عندما يتم تخصيص الرد، يمكنك معرفة السياق الذي تم استخدامه، مثل الذكريات المحفوظة أو الدردشات السابقة، وحذفه أو تصحيحه إذا كان هناك شيء قديم أو قديم”. دخول بلوق.

عندما يسأل المستخدم ChatGPT شيئًا ما، يمكنه النقر على زر المصادر (أسفل الرد) لمعرفة الملفات أو الدردشات السابقة التي نقر عليها النموذج للعثور على الإجابة. يتمتع المستخدمون أيضًا بالتحكم الكامل في المصادر التي يمكن للعارضات الاستشهاد بها ولن تتم مشاركة هذه المصادر إذا تم إرسال المحادثة إلى الآخرين.

وقالت الشركة إن مصادر الذاكرة يجب أن تسهل تخصيص استجابة النموذج. ومع ذلك، اعترفت شركة OpenAI بأن النماذج “قد لا تظهر جميع العوامل التي شكلت الاستجابة” ووعدت بأن هذه القدرات ستصبح أكثر شمولاً بمرور الوقت.

وهذا يعني أن مصادر الذاكرة توفر ما يشبه إمكانية الملاحظة في استجابات ChatGPT، ولكنها ليست قابلة للتدقيق بشكل كامل بعد.

أنظمة الذاكرة التنافسية

تمتلك الشركات نظامًا يحل بعض مشكلات الذاكرة والسياق في النماذج والوكلاء. يتم توفير النماذج للسياق عبر خطوط أنابيب التوليد بمساعدة الاسترجاع (RAG)؛ يتم تسجيل كل ما يسترده الوكيل من قواعد بيانات المتجهات ويتم تخزين حالة الوكيل في طبقة الذاكرة. يتم تعقب كل هذا في سجلات التطبيق، عادةً في طبقة التنسيق أو الإدارة مع إمكانية المراقبة المضمنة. ومن الناحية المثالية، يسمح هذا للفرق بتتبع حالات الفشل من خلال المكدس.

النظام الحالي غير كامل. في بعض الأحيان، ليس من السهل تتبع نقاط الفشل، ولكنها على الأقل تكون متسقة داخليًا. بالنسبة للمؤسسات التي تستخدم ChatGPT، سواء كان GPT-5.5 Instant الافتراضي أو النموذج الذي تختاره، لم يعد هذا ممكنًا.

يقدم النموذج نسخته الخاصة مع مصادر تخزين منفصلة تمامًا عن سجلات البحث الموجودة – باختصار، السياق الذي أبلغ عنه النموذج. تنشأ المشكلة إذا لم يكن من الممكن التوفيق بينهما بشكل موثوق. ولأن مصادر الذاكرة لا تمنح المستخدمين سوى جزء من الصورة – فمن غير الواضح ما هو الحد الأقصى لـ ChatGPT في اقتباس مصادر الذاكرة – فمن الصعب مطابقة ما قال GPT-5.5 Instant أنه يستخدمه مع ما فعله بالفعل في الإنتاج.

يؤدي هذا الموقف إلى إنشاء وضع فشل جديد: سجل السياق التنافسي. إذا بدا الأمر غريبًا، فقد يؤدي ذلك إلى خلق تناقضات يتعين على الشركات التعامل معها.

صرح مالكولم هاركينز، مدير الثقة والأمن في HiddenLayer، لـ VentureBeat أن خلاصات التخزين “تبدو وكأنها وسيلة عملية” في تقديم بعض الشفافية، ولكن لا يزال ليس من السهل رؤية قيمتها.

وقال هاركينز: “بالنسبة للشركات، فهو مفيد بشكل مباشر، ولكنه ليس كافياً في حد ذاته”. “ستعتمد القيمة الحقيقية على كيفية تكاملها مع أنظمة الأمن والإدارة والتحكم في الوصول والتدقيق.”

نموذج افتراضي أكثر كفاءة

ومع ذلك، يدعم GPT-5.5 Instant الذاكرة، ويطلق عليه OpenAI تحسينًا على GPT-5.3 Instant.

وأظهرت التقييمات الداخلية أن GPT-5.5 Instant أدى إلى تقليل ادعاءات الهلوسة بنسبة 52.5% مقارنة بالنموذج الافتراضي السابق، خاصة في المجالات عالية المخاطر مثل الطب والقانون والمالية. انخفض عدد العبارات غير الدقيقة في المحادثات الصعبة بنسبة 37.3%. وقالت الشركة إن النموذج أدى إلى تحسين تحليل الصور وتحميلها، والإجابة على أسئلة العلوم والتكنولوجيا والهندسة والرياضيات ومعرفة متى تستخدم قاعدة المعرفة الخاصة بها ومتى تستخدم محرك بحث عبر الإنترنت.

أوضح Peter Gostiew، المتخصص في الذكاء الاصطناعي في شركة Arena المستقلة لتصنيف النماذج، لـ VentureBeat في رسالة بريد إلكتروني أن النتيجة الرئيسية التي يجب مراقبتها لـ GPT-5.5 Instant هي أدائها في التصنيف العام للنص، خاصة وأن سابقتها لم يكن أداؤها جيدًا.

قال جوستيف: “منذ GPT-4o، فإن نموذج الدردشة OpenAI الأفضل أداءً في Arena هو GPT-5.2-Chat، والذي لا يزال يحتل المرتبة 12 في تصنيف General Text Arena بعد عدة أشهر من إطلاقه”. والجدير بالذكر أن المستخدمين فضلوا ذلك على الإصدار الأكثر معقولية GPT-5.2-High، والذي يحتل حاليًا المرتبة 52 في تصنيفات Arena. “بالمقارنة، كان GPT-5.3-Chat، النموذج الافتراضي السابق في ChatGPT، أقل قدرة على المنافسة بشكل ملحوظ، حيث احتل المرتبة 44 بشكل عام، بفارق 32 مركزًا عن GPT-5.2-Chat.”

ما يتعين على الشركات القيام به بشأن مصادر التخزين

ستحتاج المؤسسات التي تستخدم ChatGPT لمهام معينة إلى إضفاء الطابع الرسمي على سلوك الذاكرة لمكدسها. لا تقتصر مصادر التخزين على GPT-5.5 Instant؛ يتم تمكينه لجميع الطرز الموجودة على منصة ChatGPT.

لحل مشكلة مصادر الذاكرة المتنافسة، يجب على المؤسسات إجراء تدقيق لإدارة الذاكرة. قد يتداخل السياق الذي أبلغ عنه النموذج أو يتعارض مع هذه السجلات، لذلك من الأفضل تحديد مصدر واضح للحقيقة. وفي حالة الفشل، يعرف المسؤولون السجل الذي يجب الوثوق به.

ستكون فكرة جيدة أيضًا أن تقرر ما إذا كنت تريد مشاركة مصادر التخزين مع المستخدمين أم لا. يعرض ChatGPT فقط العدد المحدد من الدردشات أو الملفات المستخدمة لإكمال الطلب. قد يجد بعض المستخدمين قدرًا أكبر من الشفافية جديرًا بالثقة.

وفي نهاية المطاف، فإن الشيء الأكثر أهمية الذي تحتاج المؤسسات إلى تذكره بشأن مصادر التخزين هو أن ما يقدمه النموذج كسياق ليس الصورة الكاملة لأغراض التدقيق. وهذا شكل من أشكال إمكانية الملاحظة، لكنه لا يصمد أمام التدقيق الكامل.

رابط المصدر