تقنية

ذكاء اصطناعي

أعلنت شركة ميسترال الفرنسية الناشئة عن إطلاق نموذجها الصوتي الجديد Voxtral، الذي يُعد أول نموذج صوتي مفتوح المصدر تم تطويره خصيصًا لتقديم “ذكاء كلامي عملي” يلبي الاحتياجات التجارية. ويأتي هذا الإعلان في وقت تتسارع فيه الابتكارات في مجال الذكاء الاصطناعي، حيث تسعى الشركات إلى تقنيات أكثر كفاءة ومرونة في التعامل مع الصوت.

ذكاء اصطناعي
ذكاء اصطناعي

وبحسب تقرير نشره موقع TechCrunch، فإن Voxtral يُمثل خيارًا جديدًا واعدًا للمطورين، إذ يجمع بين الأداء القوي للنماذج المغلقة المصدر والتكلفة المنخفضة للنماذج المفتوحة، دون التضحية بجودة النتائج. ويعني ذلك أن النموذج الجديد يوفر للمستخدمين أفضل ما في العالمين: إمكانيات تقنية متقدمة مع حرية الاستخدام والتخصيص، مما يجعله مناسبًا لمجموعة واسعة من التطبيقات العملية في السوق.

وأوضحت “ميسترال” أن Voxtral مصمم لتمكين الشركات من التعامل مع الصوت بكفاءة عالية، سواء من حيث النسخ التلقائي للكلام أو تحليل وفهم الصوت البشري. وقد أشارت الشركة إلى أن تكلفة استخدام هذا النموذج أقل من نصف تكلفة النماذج المنافسة في السوق، وعلى رأسها نموذج “Whisper” الشهير من شركة “OpenAI”.

ويبدو أن Voxtral يركز على تقديم أداء فعّال في البيئات التجارية التي تتطلب تحليلًا دقيقًا وسريعًا للبيانات الصوتية، مثل خدمات العملاء، والمساعدات الافتراضية، ومراكز الاتصال، وتطبيقات الترجمة اللحظية. وتؤكد “ميسترال” أن النموذج قادر على تحقيق نتائج دقيقة بسرعة وكفاءة، ما يساعد الشركات في تقليل التكاليف التشغيلية وزيادة الإنتاجية.

من الناحية التقنية، لم تكشف الشركة بعد عن جميع التفاصيل الدقيقة المتعلقة بالبنية الداخلية للنموذج أو طريقة تدريبه، إلا أن ما تم الإعلان عنه حتى الآن يشير إلى أنه يعتمد على تقنيات حديثة في تعلم الآلة ومعالجة اللغة الطبيعية، مع دعم للغات متعددة، وقدرة على العمل في بيئات مختلفة، سواء عبر السحابة أو محليًا على الأجهزة.

ويُعد هذا الإطلاق خطوة جديدة في مساعي “ميسترال” لبناء منظومة متكاملة من أدوات الذكاء الاصطناعي المفتوحة المصدر، بعدما أثارت الشركة الاهتمام سابقًا بإصدار نماذج لغوية قوية تنافس ما هو متوفر من الشركات الكبرى.

ختامًا، يعكس تقديم Voxtral توجهًا متزايدًا في سوق الذكاء الاصطناعي نحو توفير حلول مفتوحة المصدر تلبي احتياجات المؤسسات دون التقيّد بقيود النماذج المغلقة. وإذا أثبت النموذج نجاحه في الاستخدام الفعلي، فقد يكون له تأثير كبير على مستقبل تقنيات التعرف على الصوت وتحليل الكلام، مع فتح الباب أمام المزيد من الابتكار في هذا المجال المتسارع.

معالجة صوتية متقدمة بدعم “ميسترال سمول 3.1”

يستطيع Voxtral التعامل مع ملفات صوتية تصل مدتها إلى 30 دقيقة، بينما يمكّنه اعتماده على نموذج “Mistral Small 3.1” من فهم ما يصل إلى 40 دقيقة من الصوت بفعالية. يتيح هذا قدرات متقدمة في تحليل المحتوى الصوتي، تلخيصه، أو تنفيذ أوامر صوتية مباشرة، مثل تفعيل واجهات برمجة التطبيقات.

دعم متعدد اللغات يناسب مختلف الاستخدامات

يدعم Voxtral طيفًا واسعًا من اللغات، بما في ذلك الإنجليزية، الفرنسية، الإسبانية، الألمانية، البرتغالية، الهولندية، الإيطالية، والهندية، مما يجعله أداة مثالية للشركات العالمية والتطبيقات متعددة اللغات.

نماذج متنوعة بأداء عالٍ وتكلفة منخفضة

تقدم Mistral النموذج الرئيسي Voxtral Small، الذي يعتمد على 24 مليار معلمة، ليكون منافسًا مباشرًا لنماذج مثل ElevenLabs Scribe وGemini 2.5 Flash وGPT-4o Mini.
كما توفر الشركة إصدارًا أخف هو Voxtral Mini، بعدد 3 مليارات معلمة، مُصمم للتشغيل المحلي وعلى أطراف الشبكة. إلى جانب ذلك، هناك إصدار متخصص في النسخ فقط، Voxtral Mini Transcribe، يتفوق على “Whisper” من حيث الكفاءة، ويأتي بسعر منخفض يبدأ من 0.001 دولار للدقيقة.

تجربة مجانية وواجهات تكامل متاحة الآن

يمكن للمستخدمين تجربة Voxtral مجانًا عبر منصة Hugging Face أو من خلال روبوت المحادثة التفاعلي “Le Chat” التابع لشركة ميسترال.
كما أتاحت الشركة واجهة برمجة التطبيقات (API) الخاصة بها لتمكين المطورين من دمج النموذج في تطبيقاتهم التجارية بكل سهولة.

توسع سريع يؤكد ريادة ميسترال الأوروبية

جاء إطلاق Voxtral بعد شهر واحد فقط من تقديم Magistral، سلسلة نماذج جديدة تركز على تحسين دقة الاستدلال وحل المشكلات.
بهذا، تؤكد ميسترال موقعها كلاعب أساسي في مجال الذكاء الاصطناعي مفتوح المصدر في أوروبا.
تجدر الإشارة إلى أن تقارير صحفية أفادت بدخول الشركة في محادثات لجمع تمويل يصل إلى مليار دولار، بدعم من مستثمرين كبار مثل صندوق “MGX” التابع لإمارة أبوظبي.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى