كل استعلام تتم معالجته بواسطة تطبيق الذكاء الاصطناعي للمؤسسة، وكل تصحيح للنتائج يتم إجراؤه بواسطة خبير المجال – يعد هذا التفاعل بمثابة بيانات تدريب. معظم المنظمات لا تسجل هذا. إن مسارات العمل التي أنشأتها الشركات بالفعل تولد إشارة ثابتة تعمل على تحسين نماذج الذكاء الاصطناعي، لكنها تتلاشى.
أطلقت شركة Empromptu AI، ومقرها سان فرانسيسكو، يوم الخميس، نماذج Alchemy Models مع فرضية بسيطة: تعمل تطبيقات الذكاء الاصطناعي التي تبنيها الشركات بالفعل على توليد بيانات التدريب، وسيتم إهدار معظمها. تلتقط المنصة تلقائيًا هذه الإشارة وتوجه النتائج التي تم التحقق من صحتها من خبراء الموضوع إلى مسار الضبط الذي يعمل على تحسين النموذج بمرور الوقت. الشركات هي المالك المباشر للمقاييس الناتجة.
إنها في منطقة مختلفة عن RAG والضبط التقليدي. يقوم RAG باسترداد السياق الخارجي في وقت الاستدلال دون تعديل أوزان النموذج. يؤدي الضبط الدقيق التقليدي إلى تغيير الوزن، ولكنه يتطلب مجموعات بيانات مصنفة ومعقدة بشكل منفصل وخط أنابيب مخصص للتعلم الآلي. تقوم Alchemy بذلك بشكل مستمر، باستخدام تطبيق المؤسسة نفسه كمصدر للبيانات.
تواجه الشركات التي تطبق واجهات برمجة التطبيقات للنموذج الأساسي ثلاثة قيود متداخلة: تكاليف الاستدلال التي تتوسع مع الاستخدام، ونقص ملكية النماذج التي يتم تدريب بياناتها بشكل فعال، والقدرة المحدودة على تكييف السلوك للمهام الخاصة بالمجال. تقول شانيا ليفين، الرئيس التنفيذي لشركة Empromptu، إن هذه القيود محسوسة على نطاق واسع ولكن نادرًا ما يتم التصرف بناءً عليها.
قال ليفين لـ VentureBeat في مقابلة حصرية: “كل عميل أتحدث معه يسأل نفسه: كيف أبقى بعيدًا عن الطريق؟ كيف أحمي عملي؟ وهم لا يرون الطريق”.
كيف تقوم Alchemy ببناء نموذج من تطبيق قيد التشغيل
تتطلب معظم أساليب التدريب على النماذج المخصصة من الشركات جمع البيانات وتنظيفها وتصنيفها بشكل منفصل قبل بدء الضبط. تأخذ Alchemia مسارًا مختلفًا: يقوم تطبيق المؤسسة بإنشاء بيانات التدريب وتنظيفها بنفسه.
تعمل الآلية من خلال Empromptu خطوط أنابيب البيانات الذهبية البنية التحتية على مرحلتين. قبل إنشاء التطبيق، يتم تنظيف بيانات المؤسسة واستخراجها وإثرائها بحيث يبدأ التطبيق بإدخال منظم. بمجرد إطلاقه، تعود كل نتيجة تولدها إلى المسار، حيث يقوم الخبراء المختصون في المؤسسة بمراجعتها وتصحيحها. يصبح هذا الإخراج الذي تم التحقق من صحته بيانات التدريب لتمرير الضبط التالي.
وقال ليفين: “إن تطبيق الذكاء الاصطناعي الذي يبنيه العملاء بالفعل ينظف البيانات”.
النماذج المضبوطة بدقة والتي تم إنشاؤها بهذه الطريقة هي ما يسمى بنماذج Expert Nano Empromptu: نماذج صغيرة خاصة بمهمة محددة تم تحسينها لسير عمل محدد بدلاً من التفكير للأغراض العامة. تعمل جميع التقييمات وحواجز الحماية وفحوصات الامتثال ضمن نفس المسار، لذلك تتم الإدارة جنبًا إلى جنب مع عملية التدريب. يمتلك العملاء أوزان النموذج. تقوم Empromptu باستضافة وتشغيل الاستدلال على بنيتها التحتية، ولكن يمكن نقل الأوزان وتصديرها مقابل رسوم. النظام الأساسي لا يعتمد على النماذج ويدعم نماذج Lamy وQwen وغيرها من نماذج المبتدئين.
الحد الصعب هو كمية البيانات. يتم تشغيل عمليات النشر المبكرة على نموذج أساسي بينما يقوم التطبيق بجمع بيانات إنتاج كافية لتشغيل عملية ضبط مفيدة. اعترف ليفين بالجدول الزمني دون أن يغلفه بالسكر. وقالت: “إن تدريب النموذج سيستغرق وقتا”.
تختلف الكيمياء عن الضبط المُدار لمن يقوم بالعمل
تتيح كل من نماذج OpenAI API المخصصة ونماذج AWS Bedrock المخصصة الضبط داخل المؤسسة. يتطلب كلاهما من المؤسسات تقديم مجموعات بيانات تدريبية منسقة بشكل منفصل وإدارة عملية الضبط خارج حزمة التطبيقات. يقع عبء التحقق من صحة البيانات وتقييم النموذج على عاتق فريق تعلم الآلة الخاص بالعميل.
السمة المميزة لـ Alchemia هي تكامل العمليات. يتم إنشاء بيانات التدريب بواسطة تطبيق المؤسسة نفسه، لذلك لا توجد حاجة إلى خطوة منفصلة لإعداد البيانات أو معرفة التعلم الآلي. سير عمل التطبيق هو خط أنابيب.
قال ليفين: “هل يجب أن يكون لديّ Bedrock وأن أقوم بإنشاء فريق آخر لتعلم الآلة لمعرفة كيفية ضبط النموذج وتطوير البنية التحتية بأكملها؟ لا، يمكن لأي شخص القيام بذلك الآن”.
المقايضة هي الاعتماد على المنصة. تعمل Alchemy فقط في بيئة Empromptu. سيتعين على الشركات التي ترغب في تحقيق نفس النتيجة على البنية التحتية الحالية تكرار عملية جمع البيانات والتحقق من صحتها وضبطها بنفسها.
قامت إحدى شركات الصحة السلوكية بتخفيض وقت توثيق الجلسة بنسبة تصل إلى 87% باستخدام Alchemy
تركز Empromptu في المقام الأول على الصناعات المنظمة والمكثفة للبيانات: الرعاية الصحية والخدمات المالية والتكنولوجيا القانونية وتجارة التجزئة والتنبؤ بالإيرادات. هذه هي القطاعات التي تحمل فيها نتائج النماذج ذات الأغراض العامة أكبر خطر من عدم التوافق وحيث تتركز بيانات سير العمل الخاصة بشكل أكبر.
إحدى أوائل الشركات التي تبنّت هذه الخدمة هي شركة Ascent Autism، وهي شركة للصحة السلوكية تستخدم Alchemy لأتمتة توثيق الجلسة والتواصل مع أولياء الأمور.
يستخدم الميسرون تسجيلات جلسات الطلاب والنصوص وملاحظات الجلسة والمؤشرات السلوكية لإنشاء ملاحظات منظمة وتحديثات مخصصة لأولياء الأمور. في السابق، كان سير العمل يتطلب ساعة أو ساعتين من الكتابة في كل جلسة. يستغرق تدريب الكيمياء على نفس البيانات الآن من 10 إلى 15 دقيقة.
قال فراز فدوي، المؤسس المشارك والرئيس التنفيذي للتكنولوجيا في Ascent Autism، لـ VentureBeat: “الاعتماد فقط على النماذج المعتمدة على واجهة برمجة التطبيقات يمكن أن يصبح مكلفًا بسرعة”. “لقد أتاحت لنا Alchemy تبسيط سير العمل لدينا، وتدريب النماذج على بياناتنا الخاصة، وخفض التكاليف مع تحسين جودة النتائج بمرور الوقت.”
وقال فدوي إن الشركة أنتجت بسرعة نتائج قابلة للاستخدام، وتم إجراء تحسينات مستمرة مع تحسين النظام. تجاوزت معايير التقييم الدقة وتضمنت إمكانية تتبع بيانات الجلسة واتساق النتائج مع الحكم السريري للشركة. وقال: “أردنا نظامًا يمكنه تعلم سير العمل لدينا وتحقيق نتائج تتوافق مع الطريقة التي نعمل بها فعليًا، بدلاً من مجرد تلخيص النص”. اختبار تدريبي: مقدار ما يتعين على المشرفين تعديله، وما إذا كانت النتيجة تتطابق مع أصواتهم وما إذا كان ذلك يقلل بشكل كبير من الوقت المستغرق. انتقل الميسرون من تدوين الملاحظات التي تم إنشاؤها إلى تحريرها والتحقق من جودتها.
ماذا يعني هذا بالنسبة للشركات
دولاب الموازنة للبيانات حقيقي – لكن قفل النظام الأساسي كذلك:
كل سير عمل هو فرصة للتدريب. ستزيد الشركات التي تلتقط نتائج تطبيقات الذكاء الاصطناعي الخاصة بالإنتاج وتتحقق من صحتها من هذه الميزة بمرور الوقت. يؤدي الاستخدام العالي إلى توليد المزيد من إشارات التدريب، مما ينتج نماذج أكثر دقة خاصة بالمجال، والتي تنتج نتائج أفضل، والتي تنتج بيانات تدريب أنظف في الدورة التالية.
يضع ليفين الكيمياء كخياره المعماري الثالث. أمضت الشركات العامين الماضيين في الاختيار بين RAG للوصول إلى المعرفة بالمجال وضبط التخصص النموذجي. الخيار الثالث هو التدريب النموذجي القائم على سير العمل، والذي يجمع بين التحسين المستمر في الضبط والبساطة التشغيلية للبناء داخل منصة مُدارة.
وقال ليفين: “إن وجود خندق من البيانات هو العملة الأكثر قيمة”.









