تقنية

ذكاء اصطناعي

تمكن باحثو الذكاء الاصطناعي في جامعتي ستانفورد وواشنطن من تدريب نموذج استدلال للذكاء الاصطناعي بتكلفة لا تتجاوز 50 دولارًا في رصيد الحوسبة السحابية، وذلك وفقًا لدراسة نُشرت يوم الجمعة الماضي.

النموذج، الذي يحمل اسم “S1″، يعمل بشكل مشابه لنماذج الاستدلال المتطورة مثل “O1” من “OpenAI” و “R1” من “DeepMind” في اختبارات قياس قدرات الرياضيات والترميز.

يمكن الوصول إلى نموذج “S1” على GitHub، حيث يتوفر مع البيانات والرمز البرمجي المستخدم في تدريبه، وفقًا لتقرير نشره موقع “TechCrunch”.

قال الفريق الذي طور نموذج “S1” إنهم بدأوا بنموذج أساسي جاهز، ثم قاموا بتحسينه عبر عملية التقطير، التي تهدف لاستخراج قدرات الاستدلال من نموذج ذكاء اصطناعي آخر من خلال التدريب على إجابات هذا النموذج.

وأوضح الباحثون أن “S1” مستمد من نموذج تفكير منطقي تابع لشركة غوغل يُعرف باسم “Gemini 2.0 Flash Thinking Experimental”.

تعد عملية التقطير هي نفس النهج الذي استخدمه

باحثو جامعة بيركلي لإنشاء نموذج تفكير منطقي للذكاء الاصطناعي مقابل حوالي 450 دولارًا في الشهر الماضي.

بالنسبة للبعض، فإن الفكرة التي تقول بأن هناك قلة من الباحثين غير المدعومين بملايين الدولارات يستطيعون الابتكار في مجال الذكاء الاصطناعي تعتبر مثيرة.

ومن المتوقع أن تكون مختبرات الذكاء الاصطناعي الكبيرة غير راضية عن هذه الابتكارات.

وقد اتهمت “OpenAI” شركة “DeepSic” بجمع البيانات بشكل غير صحيح من واجهة برمجة التطبيقات الخاصة بها لأغراض التقطير.

وكان هدف الباحثين وراء “S1” هو العثور على أبسط نهج لتحقيق أداء قوي في التفكير، مع تعزيز قدرة النموذج على التوسع في وقت الاختبار، أو السماح للنموذج بالتفكير أكثر قبل تقديم الإجابة.

وكانت هذه بعض الاختراقات التي حققتها “O1” من “OpenAI”، والتي حاولت “DeepSic” ومختبرات أخرى تقليدها باستخدام تقنيات مختلفة.

تشير ورقة “S1” إلى أنه يمكن تقطير نماذج التفكير باستخدام مجموعة بيانات صغيرة نسبيًا عبر عملية تُسمى “الضبط الدقيق الخاضع للإشراف” (SFT)، حيث يتم تدريب نموذج الذكاء الاصطناعي على محاكاة سلوكيات معينة استنادًا إلى مجموعة بيانات محددة.

وتعتبر “SFT” عادةً أرخص من طريقة “التعلم التعزيزي” واسعة النطاق التي اعتمدت عليها “DeepSic” لتدريب نموذج “O1” المنافس لنموذج “OpenAI”.

تقدم “غوغل” وصولاً مجانيًا إلى “Gemini 2.0 Flash Thinking Experimental” عبر منصة Google AI Studio، مع وجود بعض القيود على معدل الاستخدام اليومي.

ومع ذلك، تمنع شروط “غوغل” إجراء الهندسة العكسية على نماذجها لتطوير خدمات تنافس عروض الذكاء الاصطناعي الخاصة بالشركة.

يعتمد نموذج “S1” على نموذج ذكاء اصطناعي صغير جاهز للاستخدام من مختبر الذكاء الاصطناعي الصيني “Qwen” المملوك لشركة “علي بابا”، والذي يتوفر للتنزيل مجانًا.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى