لم تعد نماذج الذكاء الاصطناعي المخصصة مخصصة لعمالقة الذكاء الاصطناعي فقط. نظرًا لأن شركة Krea الناشئة المكونة من 37 شخصًا تطلق أول نموذج توليدي للذكاء الاصطناعي، حيث تعيد الشركة الناشئة لأدوات التصميم وضعها كمختبر أبحاث متكامل للذكاء الاصطناعي.
تعتبر هذه الخطوة مهمة بالنسبة لـ Krea، ولكن يبدو أيضًا أنها تبشر بلحظة شبه لا مفر منها في سوق الذكاء الاصطناعي سريع التطور حيث يمكن للاعبين الأصغر حجمًا في الصناعة القيام بمزيد من الرهانات المدمرة.
من ناحية، لم تعد شركة Krea تعتبر نفسها شركة ناشئة بعد الآن. لقد جمعت الآن 83 مليون دولار من خلال السلسلة B بتقييم 500 مليون دولار. من ناحية أخرى، فهي صغيرة جدًا مقارنة بالشركات الرائدة في مجال النماذج الحدودية، والتي تعمل باستمرار على جمع المزيد من الأموال لضمان أن يكون لديها صندوق حرب غير محدود لتدريب النموذج الأفضل التالي: OpenAI وAnthropic، اللتين جمعتا 180 مليار دولار أمريكي و 72 مليار دولار أمريكيعلى التوالى.
لكن بالنسبة إلى دييغو رودريغيز، المؤسس المشارك لشركة Krea، فمن المنعش أن تكون شركة صغيرة وذكية، وإلى حد كبير، لا تقل نجاحًا عن أي شركة نموذجية رائدة كعمل أساسي.
يقول بابتسامة ماكرة: “إلى أن يكون هناك فائز – حتى يحقق OpenAI أو أي شخص آخر ربحًا – تستمر الألعاب الأولمبية”.
تطور كريا
تم إطلاق Krea في عام 2023 ليكون شيئًا يشبه Adobe في عصر الذكاء الاصطناعي، وهي منصة إبداعية مصممة من الألف إلى الياء لتتيح لك ليس فقط إنشاء الوسائط باستخدام الذكاء الاصطناعي ولكن أيضًا ضبط تلك المخرجات، مع عناصر تحكم تبدو وكأنها مُركِّب أكثر من كونها طاولة صياغة. لقد كانوا أول من قدم أدوات تحرير الذكاء الاصطناعي في الوقت الفعلي وأول من وضع واجهات برمجة التطبيقات من نماذج الذكاء الاصطناعي الأخرى في تطبيقاتهم الخاصة (وهي ممارسة أصبحت الآن قياسية). وكانوا مربحين بسرعة.
ولكن مع مرور الوقت، أدرك الفريق حدودًا واضحة لعملهم: لا يمكن أن يكون Krea منفتحًا إلا بقدر النماذج التي يعتمد عليها.
تعتبر قوالب الصور اليوم مذهلة عند تلبية طلبات محددة غالبًا ما تنتشر بسرعة كبيرة، ولكنها قد تبدو أيضًا وكأنها مبنية على قضبان. لا يزال بإمكان العبارات الإبداعية أن تقودك إلى نفس المسارات القديمة لأن القوالب لا يمكنها تكرار ما يدور في ذهنك.
يقول فيكتور بيريز، المؤسس المشارك لشركة Krea: “يتم تدريب العارضات على عدم الفشل وعلى إعطاء صورة جيدة دائمًا”. “وأشعر أن هذا يلغي الكثير من الاستخدامات الإبداعية – كسر الحواجز وإبعاد الأشخاص عن الطريق، والسماح (لك) بإنشاء صور “سيئة”، وأشياء تبدو أكثر فنية والتي يمكن للمبدع أن يقدرها أكثر.”
في الواقع، نماذج الصور مثيرة للدهشة عندما يتعلق الأمر بما أعطته هذه الشركات الأولوية: الصورة الواقعية. لكن أي مصمم يقرأ هذا يعرف أنه عندما يتعلق الأمر بالتصميم الجرافيكي والتوضيح، يمكنك الوصول إلى حدودك بشكل أسرع مما تعتقد.
في العرض التوضيحي، أجرى كريا مقارنات بين عبارة “قطة تركب دراجة” و”Nano Banana” من Google. في حالة كريا، كانت النتائج الأولى غير تقليدية ومتنوعة، حيث أظهر بعضها إحساسًا بالرسم اليدوي. على Google، بغض النظر عن كيفية ضبط المطالبة، فإنك تحصل على صورة تشبه كتاب التلوين معروضة بنفس الطريقة. إنه الفرق بين تناول الطعام في مطعم ماكدونالدز أو مطعم ميشلان. سيهدف أحدهما دائمًا إلى الإرضاء، بينما قد يستقطب الآخر.
يقول بيريز: “أعتقد أن نوع الأشياء التي نهتم بها أكثر تحديدًا”. “إنها سوق أصغر بكثير، لكننا موافقون على ذلك.”
لقد أمضيت 15 دقيقة في طلب قالب التصوير K2 الجديد من Krea بنفسي وأنا معجب باتساع نطاقه. فهو يُنشئ مشاهد واقعية سريالية، ولكنه يُنشئ أيضًا صورًا مُفلترة محببة بأسلوب VHS ومجموعة متنوعة من التقنيات التوضيحية (العلامات النصية والمانجا والأنيمي والرسومات اليدوية والرسوم المتحركة). وكانت الأمثلة التي رأيتها من كريا مثيرة للإعجاب أيضًا، بل وأكثر من ذلك نظرًا للفجوة في الموارد بين كريا والشركات العملاقة. ويعزو بيريز هذا النجاح إلى ذوق فريقه. لقد أمضوا الأشهر السبعة الماضية في بناء مجموعة البيانات الخاصة بهم (لا، إنهم لا يكشفون عن المصادر)، ووضع علامات عليها يدويًا، وإنشاء مسارات عمل فريدة خاصة بهم لتدريب نظام الذكاء الاصطناعي التوليدي الخاص بهم.
كما يوضح بيريز، فإن معظم النماذج الرائعة تبدأ بنفس الطريقة في التطوير لبناء شبكة عصبية عاملة، ولكن الخطوات المتوسطة وما بعد التدريب على وجه الخصوص هي التي تعطي النموذج وجهة نظره. لقد سمعت من العاملين في الصناعة أنه لا يوجد سوى حوالي 200 خبير حقيقي في مرحلة ما بعد التدريب في العالم، وهذا هو سبب المنافسة الشديدة في السوق.
يقول بيريز: “هذا هو المكان الذي يحدث فيه الاتجاه الفني للنموذج”. “في نهاية المطاف، بناء نموذج يشبه تقريبًا إنشاء تمثال.”
هذه الطبقة الأخيرة من التدريب، حيث يقوم النموذج بتطوير صوته المرئي أو اللفظي، حيث يأتي دور الذوق. إن جعل الذكاء الاصطناعي يفعل شيئًا واحدًا بشكل أفضل يمكن أن يجعله يفعل شيئًا أسوأ في كثير من الأحيان، وتكون الموازنة بين هذه الأولويات صعبة بشكل خاص عند محاولة بناء نموذج ينتج أشياء رائعة ومعبرة شخصيًا.
يقول بيريز: “يبدو هذا بمثابة عدو لباحثي الذكاء الاصطناعي، لأن ما يجيده الباحثون حقًا هو المقاييس”. “ولكن ما هو هذا المقياس الذي نعمل على تحسينه؟ إنه شيء ما ثم شخصي.”
واجهة المستخدم
K2، الطراز الجديد من Krea، يبدو مثيرًا للإعجاب في حد ذاته. ولكن ما يجعلها جذابة للغاية هو كيف ستسمح لك Krea باستخدامها.
في الأساس، تعد Krea بأن مجرد وصف ما تريده سوف يمنحك نتائج أفضل مع K2 مقارنة بمنافسيها. لذا تتيح لك واجهة مستخدم Krea أن تتسخ يديك حقًا من خلال ضبط الإخراج. يمكنك سحب صورة واحدة أو عدة صور مرغوبة إلى شريط المطالبة، لاستخدامها في التأثير على النمط الذي تنشئه. يمكنك بعد ذلك سحب شريط التمرير لأعلى أو لأسفل على هذه الصور للإشارة إلى مدى رغبتك في التأثير على النمط المرئي. يمكنك أيضًا إنشاء لوحة مزاجية لإبلاغك بالجمالية التي تريدها. (بعد قيامك بإنشاء بعض الصور، ستنتج Krea بشكل استباقي نوعًا من لوحة Pinterest المخصصة مع المزيد من الصور التي تعتقد أنها ستعجبك.)
ونظرًا لأن هذا النظام مصمم للمبدعين، فإن Krea أيضًا حريص على كيفية تأطير IP. بينما تقوم ظاهريًا بتدريب نموذجك الخاص داخل Krea، يمكنك إزالته من تدريب نموذج Krea الخاص. وكل عنوان IP يتم إنشاؤه هو ملكك. لذا، إذا كنت رسامًا زيتيًا ولديك أسلوب خاص للغاية وتريد استخدامه في وسائط الذكاء الاصطناعي العامة، فيمكنك إرسال عملك لإعادة إنتاجه دون القلق من أن Krea على وشك بيعه كمرشح لشخص آخر.
على المدى الطويل، يدرس كريا ما إذا كانت هناك طرق لمنح الفضل للفنانين الذين تؤثر ملكيتهم الفكرية بشكل ملموس على قطعة من وسائل الإعلام، ويقومون بتجربة استخدام الذكاء الاصطناعي للقيام بذلك وإنشاء نظام حقوق ملكية أكثر استدامة.
يعترف رودريجيز بوجود بعض الالتباس حول السبب وراء عدم اجتماع شركات الذكاء الاصطناعي الصغيرة معًا لبناء أفكار أكبر وتقاسم الثروة، في صناعة تهيمن عليها OpenAI وAnthropic وGoogle. في الأصل، حاولت Krea الدخول في شراكة مع شركة نموذجية رفضت تقديم حتى حصة صغيرة من الإيرادات، مما دفعها إلى تطوير التكنولوجيا بالكامل داخل الشركة.
لكن الآن لا يسعني إلا أن ألاحظ مدى نمو طموحات كريا. أعلن بيريز أن منتج الإطلاق هذا، K2، “محافظ”. مجموعة GPU التي استخدمتها Krea لمدة عام، والتي ستقوم خلالها بتدريب K2 ونموذجين مستقبليين من Krea، ستكلف الشركة 20 مليون دولار. لم يكن كريا قادرًا على تحمل تكاليف تنفيذ نهج تجريبي قد لا ينجح. ومع ذلك، مع النجاح المتراكم، يشعرون بثقة أكبر لتحمل المزيد من المخاطر وتحدي معايير التدريب.
يقول بيريز: “أردنا فقط أن ينجح الأمر”. “لقد نجح الأمر بشكل أفضل مما توقعنا، لكنه كان مقامرة محفوفة بالمخاطر للغاية. لم يسبق لنا تدريب نموذج من قبل. لم نكن نعرف مدى صعوبة الأمر. وكان الأمر صعبًا للغاية، ولكن في نهاية اليوم اكتشفنا الأمر. والآن نعرف الكثير من الأشياء، لأن هناك أشياء كثيرة حول تدريب النموذج لا يمكنك تعلمها إلا من خلال تدريب النموذج.”









-1.png)

