أنثروبيك

0 5 4 دقائق

أنثروبيك تكشف عن نموذج Claude Sonnet 5 أعلنت شركة أنثروبيك عن إطلاق نموذج Claude Sonnet 5، الذي يمثل أحدث إصدارات الشركة ضمن فئة النماذج متوسطة الحجم، ويأتي بمجموعة كبيرة من التحسينات التي تستهدف رفع كفاءة الذكاء الاصطناعي في تنفيذ المهام بشكل مستقل، مع الحفاظ على تكلفة تشغيل منخفضة مقارنة بالنماذج الأكبر والأكثر تعقيدًا. ويهدف هذا الإصدار إلى توفير توازن عملي بين الأداء العالي والكفاءة الاقتصادية، بما يجعله مناسبًا للمطورين والشركات والمستخدمين الذين يحتاجون إلى حلول متقدمة دون تحمل تكاليف مرتفعة.

وأوضحت الشركة أن النموذج الجديد يتمتع بقدرات متقدمة في التخطيط وإدارة المهام، كما يستطيع استخدام أدوات متعددة مثل متصفحات الإنترنت وسطر الأوامر وتنفيذ سلسلة من الإجراءات بصورة ذاتية حتى الوصول إلى النتيجة المطلوبة. وتعد هذه الإمكانات نقلة مهمة، إذ كانت تتطلب في السابق الاعتماد على نماذج أكبر حجمًا وأكثر استهلاكًا للموارد.

سباق جديد بين شركات الذكاء الاصطناعي

يعكس إطلاق Claude Sonnet 5 استمرار المنافسة المتصاعدة بين كبرى شركات الذكاء الاصطناعي العالمية، حيث أصبحت قدرات الوكلاء الأذكياء من أهم المعايير التي تعتمد عليها الشركات عند تطوير نماذجها الجديدة. ولم يعد التركيز مقتصرًا على سرعة الإجابة أو جودة المحتوى، بل امتد ليشمل قدرة النموذج على تنفيذ المهام المعقدة بصورة مستقلة مع أقل قدر ممكن من التدخل البشري.

وخلال الفترة الأخيرة أعلنت عدة شركات عن نماذج جديدة تركز على مفهوم الوكلاء الأذكياء. فقد قدمت OpenAI نموذج GPT-5.6 Sol الذي يستطيع تقسيم المهام الكبيرة إلى مجموعة من المهام الأصغر وتوزيعها على وكلاء فرعيين لإنجاز الأعمال الطويلة بكفاءة أعلى. كما كشفت غوغل عن نموذج Gemini 3.5 Flash الذي يركز على التخطيط للمشروعات والمساعدة في تطويرها مع تقليل الحاجة إلى تدخل المستخدم بشكل مستمر.

وترى أنثروبيك أن المنافسة المستقبلية لن تعتمد فقط على امتلاك أفضل نموذج ذكاء اصطناعي، وإنما على توفير نموذج يتمتع بالاعتمادية والقدرة على العمل لفترات طويلة مع تكلفة تشغيل مناسبة، لأن هذه العوامل أصبحت مؤثرة بشكل مباشر في اعتماد الشركات على حلول الذكاء الاصطناعي ضمن أعمالها اليومية.

أداء يقترب من Opus 4.8 بتكلفة أقل

أكدت أنثروبيك أن Claude Sonnet 5 يقدم مستوى أداء يقترب كثيرًا من نموذج Opus 4.8 الذي يعد من أقوى نماذج الشركة، إلا أنه يتميز بتكلفة أقل، وهو ما يجعله خيارًا مناسبًا للمؤسسات التي تحتاج إلى تشغيل النموذج بشكل مكثف دون زيادة كبيرة في النفقات.

وأصبح Claude Sonnet 5 النموذج الافتراضي لجميع مستخدمي خطتي Free وPro، كما أصبح متاحًا لجميع المشتركين، في خطوة تهدف إلى تعميم استخدامه والاستفادة من إمكاناته الجديدة.

وخلال الفترة التي تمتد حتى الحادي والثلاثين من أغسطس تبلغ تكلفة الاستخدام دولارين لكل مليون رمز إدخال وعشرة دولارات لكل مليون رمز إخراج. وبعد انتهاء هذه الفترة سترتفع الأسعار إلى ثلاثة دولارات لكل مليون رمز إدخال وخمسة عشر دولارًا لكل مليون رمز إخراج.

ورغم هذه الزيادة السعرية، لا يزال Claude Sonnet 5 أقل تكلفة من نموذج Opus 4.8، كما يقدم أسعارًا تنافسية مقارنة ببعض النماذج الرائدة الأخرى مثل GPT-5.5 وGemini 3.1 Pro، بينما يحتفظ Gemini 3.5 Flash بمكانته كأحد أقل النماذج تكلفة في السوق.

تحسينات ملحوظة في البرمجة والاستدلال

أشارت أنثروبيك إلى أن Claude Sonnet 5 يحقق تقدمًا واضحًا مقارنة بالإصدار السابق Sonnet 4.6 الذي تم إطلاقه في فبراير الماضي، حيث شملت التحسينات العديد من المجالات المهمة التي يعتمد عليها المطورون والشركات.

وتضمنت هذه التحسينات تطوير قدرات الاستدلال المنطقي، وتحسين استخدام الأدوات المختلفة، ورفع كفاءة برمجة التطبيقات، بالإضافة إلى تعزيز أداء النموذج في تنفيذ المهام المعرفية التي تتطلب تحليلًا واتخاذ قرارات متتابعة.

وفي اختبارات البرمجة المعتمدة على الوكلاء الأذكياء حقق Claude Sonnet 5 نسبة نجاح بلغت 63.2 بالمئة، مقارنة بنسبة 69.2 بالمئة لنموذج Opus 4.8، بينما سجل الإصدار السابق Sonnet 4.6 نسبة 58.1 بالمئة فقط، وهو ما يعكس التحسن الملحوظ في قدرات النموذج الجديد.

كما أظهرت نتائج الاختبارات أن Sonnet 5 تمكن من التفوق بفارق بسيط على Opus 4.8 في أحد اختبارات العمل المعرفي، إلا أن Opus 4.8 ما زال يحتفظ بأفضليته عند التعامل مع المشكلات الأكثر تعقيدًا، وإجراء الأبحاث المتقدمة، واتخاذ القرارات الدقيقة التي تتطلب تحليلًا عميقًا.

وترى الشركة أن Sonnet 5 يمثل خيارًا متوازنًا يجمع بين الأداء القوي والتكلفة المنخفضة، بينما يبقى Opus 4.8 الأنسب للمهام التي تتطلب أعلى مستويات الدقة والقدرات التحليلية.

ينجز المهام حتى النهاية

من أبرز المزايا التي يتمتع بها Claude Sonnet 5 قدرته على إكمال المهام الطويلة والمعقدة حتى نهايتها دون التوقف في منتصف التنفيذ، وهي مشكلة كانت تظهر أحيانًا في الإصدارات السابقة عند التعامل مع العمليات متعددة الخطوات.

وأوضحت الاختبارات التي أجراها عدد من المستخدمين قبل الإطلاق الرسمي أن النموذج أصبح أكثر قدرة على متابعة تنفيذ الخطوات المطلوبة بشكل متسلسل، مع مراجعة النتائج التي ينتجها بصورة تلقائية بهدف تصحيح الأخطاء وتحسين جودة المخرجات حتى في حال لم يطلب المستخدم ذلك بشكل صريح.

وأكد دانيال شيبرد، كبير المهندسين في شركة Zapier، أن فريقه طلب من Claude Sonnet 5 تنفيذ سلسلة من المهام تضمنت تحديث بيانات حسابات Salesforce ثم إرسال إعلان إطلاق منتج جديد إلى عملاء الشركات، وتمكن النموذج من إنجاز جميع الخطوات من البداية وحتى النهاية دون الحاجة إلى تدخل إضافي، بينما كانت الإصدارات السابقة تتوقف قبل إكمال العملية بالكامل. ويرى شيبرد أن هذه الإمكانات تجعل النموذج مناسبًا لأتمتة العديد من الأعمال اليومية داخل الشركات.

أكثر أمانًا وأقل عرضة للهلوسة

ركزت أنثروبيك أيضًا على تحسين الجوانب المتعلقة بالأمان والموثوقية في Claude Sonnet 5، مؤكدة أن النموذج الجديد يسجل انخفاضًا في السلوكيات غير المرغوبة مقارنة بالإصدار السابق، مع تحسين قدرته على التعامل مع الطلبات الحساسة بطريقة أكثر مسؤولية.

ويتميز النموذج بقدرة أكبر على رفض الطلبات الضارة، ومقاومة محاولات حقن الأوامر، وتقليل احتمالات إنتاج معلومات غير دقيقة أو مختلقة، إضافة إلى الحد من الميل إلى موافقة المستخدم بصورة مبالغ فيها عندما تكون المعلومات المقدمة غير صحيحة.

ورغم هذه التحسينات، أوضحت الشركة أن Opus 4.8 ونسخة Claude Mythos Preview لا يزالان يتفوقان في بعض المهام المعقدة، خاصة تلك المتعلقة بالأمن السيبراني أو السيناريوهات التي تتطلب مستويات عالية جدًا من التحليل واتخاذ القرار.

وأشار فابيان هيدين، الشريك المؤسس لشركة Lovable، إلى أن Claude Sonnet 5 يتميز برفض الطلبات غير الآمنة بطريقة واضحة ومتسقة، مضيفًا أن أهمية النموذج لا تكمن فقط في قدرته على تنفيذ المهام، بل أيضًا في معرفته بالوقت المناسب لرفض الطلبات التي قد تنطوي على مخاطر، وهو ما يعزز الثقة في استخدامه على نطاق واسع بين المطورين والشركات.

يعد Claude Sonnet 5 أحدث نموذج متوسط الحجم من أنثروبيك.
يركز النموذج على تنفيذ المهام بشكل مستقل باستخدام الوكلاء الأذكياء.
يستطيع استخدام المتصفح وسطر الأوامر وإدارة المهام متعددة الخطوات.
يوفر أداء قريبًا من Opus 4.8 مع تكلفة تشغيل أقل.
أصبح النموذج الافتراضي لمستخدمي خطتي Free وPro.
تبلغ تكلفة الاستخدام حتى نهاية أغسطس دولارين لكل مليون رمز إدخال وعشرة دولارات لكل مليون رمز إخراج.
ترتفع الأسعار بعد ذلك إلى ثلاثة دولارات لكل مليون رمز إدخال وخمسة عشر دولارًا لكل مليون رمز إخراج.
حقق تحسينات واضحة في الاستدلال والبرمجة واستخدام الأدوات والمهام المعرفية.
سجل نتائج أفضل من الإصدار السابق في اختبارات البرمجة المعتمدة على الوكلاء الأذكياء.
أصبح أكثر قدرة على إكمال المهام الطويلة دون انقطاع.
يراجع مخرجاته تلقائيًا لتحسين جودة النتائج.
يتميز بمستوى أعلى من الأمان وتقليل الهلوسة ومقاومة هجمات حقن الأوامر.
يبقى Opus 4.8 الخيار الأفضل للمهام الأكثر تعقيدًا، بينما يوفر Sonnet 5 أفضل توازن بين الأداء والتكلفة.