ذكاء اصطناعي
أعلن فريق “Qwen” التابع لشركة “علي بابا” الصينية، يوم الاثنين، عن إطلاق عائلة جديدة من نماذج الذكاء الاصطناعي تحمل اسم “Qwen2.5-VL”. تتميز هذه النماذج بقدرتها على أداء مجموعة متنوعة من المهام، بما في ذلك التحليل المتقدم للنصوص والصور والملفات، بالإضافة إلى فهم مقاطع الفيديو والإجابة على الأسئلة المتعلقة بها. كما تتمتع هذه النماذج بالقدرة على التفاعل مع الأجهزة الإلكترونية، مثل الهواتف والحواسيب، والتحكم فيها بشكل محدود. يُعد هذا الإطلاق خطوة جديدة في تطوير تقنيات الذكاء الاصطناعي متعددة المهام.
وفقًا لفريق “Qwen”، فإن النموذج الأفضل في المجموعة، وهو “Qwen2.5-VL”، يتفوق على منافسيه مثل “GPT-4o” من شركة “OpenAI” و”Gemini 2.0 Flash” من “غوغل” في عدة مجالات تشمل فهم الفيديو، والرياضيات، وتحليل المستندات، والإجابة على الأسئلة.
ويتوفر “Qwen2.5-VL” للاختبار عبر تطبيق “Qwen Chat” التابع لشركة “علي بابا”، كما يمكن تنزيله من منصة “Hugging Face” المخصصة لتطوير الذكاء الاصطناعي، وفقًا لتقرير نشرته “TechCrunch” المتخصصة في أخبار التكنولوجيا.
يتميز النموذج بقدراته المتقدمة في تحليل الرسوم البيانية،
واستخراج البيانات من الصور الضوئية للفواتير، بالإضافة إلى فهم مقاطع الفيديو الطويلة التي قد تستغرق عدة ساعات. كما يمتلك “Qwen2.5-VL” قدرة فريدة على التفاعل مع البرامج سواء على أجهزة الكمبيوتر أو الأجهزة المحمولة، مما يسمح له بالتحكم في التطبيقات مثل فتح تطبيق “Booking” على جهاز أندرويد وحجز رحلة مباشرةً.
وقد ظهرت قدرات النموذج في التحكم بتطبيقات سطح مكتب الحاسوب، رغم أنه لم يقم بمهام معقدة بخلاف التبديل بين علامات التبويب في الفيديو التوضيحي.
وتشمل عائلة “Qwen” التي تم الكشف عنها نموذجين آخرين أقل تطورًا، وهما “Qwen2.5-VL-3B” و”Qwen2.5-VL-7B”. ويعد فريق “Qwen” التابع لشركة “علي بابا” من أبرز المنافسين المحليين لمختبر الذكاء الاصطناعي الصيني “DeepSeek”، الذي لاقى اهتمامًا كبيرًا من قطاع التكنولوجيا مؤخرًا.