DeepSeek

رانيا عبد القادر9 أبريل، 2025

0 99 2 دقائق

أعلنت شركة DeepSeek الصينية الناشئة في مجال الذكاء الاصطناعي عن اعتماد نهج مبتكر يهدف إلى تعزيز قدرات الاستدلال في النماذج اللغوية الكبيرة (LLMs)، وذلك في وقت يتزايد فيه الاهتمام بإصدار الجيل المقبل من نماذج الشركة.

وكشفت الشركة، بالتعاون مع باحثين من جامعة تسينغهوا الصينية، عن تقنية جديدة تعتمد على منهجيتين مبتكرتين أطلقت عليهما “نمذجة المكافآت التوليدية” (Generative Reward Modelling – GRM) و”ضبط التقييم الذاتي المرتكز إلى المبادئ الذاتية” (Self-principled Critique Tuning)، وذلك وفقًا لورقة بحثية نُشرت يوم الجمعة على منصة arXiv المتخصصة في الأبحاث العلمية.

تهدف هذه المنهجية المزدوجة إلى تمكين النماذج اللغوية الكبيرة (LLMs) من تقديم إجابات أكثر دقة وبسرعة أكبر عند التعامل مع الأسئلة العامة.

أسلوب المكافآت

تعد نمذجة المكافآت التوليدية (Generative Reward Modeling – GRM) طريقة لتدريب نماذج الذكاء الاصطناعي على محاكاة تفضيلات البشر في الإجابات. بدلاً من أن يقوم الإنسان بتقييم كل إجابة يقدمها النموذج، تُستخدم GRM لتدريب نموذج آخر قادر على أداء هذه المهمة بشكل آلي. يتعلم هذا النموذج “الذكي” كيفية تقييم الإجابات ومنح “مكافآت” بناءً على جودتها ومدى توافقها مع تفضيلات البشر.

يمكن تشبيه الفكرة بلعبة يحصل فيها الذكاء الاصطناعي على نقاط عند تقديم إجابات جيدة، بينما يخسر نقاطًا عند ارتكاب أخطاء. ومع مرور الوقت، يتعلم النموذج كيفية تحسين إج suasاته للحصول على أكبر عدد من المكافآت، مما يعزز قدراته في الاستدلال ويؤدي إلى تقديم إجابات أدق وأكثر توافقًا مع توقعات المستخدمين.

وقد أظهرت أبحاث جديدة أن نماذج DeepSeek-GRM قد تفوقت على الأساليب الحالية، محققة أداءً تنافسياً مقارنة بنماذج المكافآت العامة ذات الأداء القوي.

جيل جديد

أوضح الفريق أن تقنية “نمذجة المكافآت” (Award Modelling) تُعد إحدى الأساليب المستخدمة لتوجيه النماذج اللغوية نحو تفضيلات البشر، مما يسهم في تحسين جودة الاستجابات التي تقدمها هذه النماذج. كما أشار الباحثون إلى أن الشركة تخطط لإتاحة نماذج GRM مفتوحة المصدر في المستقبل، إلا أنها لم تحدد موعداً زمنياً لذلك حتى الآن.

تأتي هذه الورقة البحثية في وقت يشهد تزايداً في التكهنات حول الخطوات التالية لشركة DeepSeek، خاصة بعد أن حظيت باهتمام عالمي واسع بفضل نموذجها الأساسي V3 ونموذج الاستدلال R1.

وكانت وكالة “رويترز” قد أفادت في تقرير لها الشهر الماضي بأن الإصدار المقبل، DeepSeek-R2، قد يُطرح في الأسواق في وقت قريب، وربما في أوائل شهر أبريل الجاري، في إطار سعي الشركة للاستفادة من شعبيتها المتزايدة.

أثار التقرير حالة من الترقب في الأوساط التقنية العالمية، خاصة بعد النجاح الذي حققه نموذج DeepSeek-R1 بأدائه الفعّال بتكلفة منخفضة، مما جعله منافساً قوياً لأبرز النماذج الموجودة حالياً.

رغم ذلك، لم تعلق الشركة على التقارير التي تحدثت عن قرب إصدار R2، ولم تصدر أي تصريحات رسمية بهذا الخصوص.

في المقابل، أفادت وسائل إعلام صينية بأن حساب خدمة العملاء الخاص بشركة DeepSeek نفى صحة هذه المعلومات، وذلك ضمن محادثة خاصة مع عملاء تجاريين.

وكانت الشركة قد أجرت في مارس الماضي تحديثاً كبيراً على نموذج V3 الخاص بها، حيث أطلقت الإصدار “DeepSeek-V3-0324″، والذي تضمن “تحسينات في قدرات الاستدلال، تطوير واجهات المستخدم لمواقع الإنترنت، بالإضافة إلى تعزيز كفاءة الكتابة باللغة الصينية”.

وفي فبراير الماضي، فتحت الشركة خمسة من مستودعاتها البرمجية لتكون مفتوحة المصدر، مما أتاح للمطورين حول العالم إمكانية مراجعة الشيفرات البرمجية والمساهمة في تطويرها. وأكدت الشركة في بيان لها التزامها بـ “تحقيق تقدم حقيقي بشفافية تامة”.

الوسوم