ذكاء اصطناعي

طوّرت شركة غوغل نموذجًا للذكاء الاصطناعي يهدف إلى مساعدة العلماء في دراسة طرق تواصل الدلافين وفهم ما تقوله. يُسمى النموذج “DolphinGemma”، وهو أحد النماذج اللغوية الكبيرة التي تعتمد على نماذج الذكاء الاصطناعي المفتوحة المصدر “Gemma” من غوغل، والتي بُنيت استنادًا إلى نفس الأسس المستخدمة في نماذج “Gemini” التجارية للشركة.
لطالما كانت الأصوات المختلفة التي تصدرها الدلافين، مثل النقرات والصفارات والنبضات، تمثل تحديًا كبيرًا أمام العلماء طوال عقود.
تتعاون “غوغل” في هذا المشروع مع باحثين من معهد جورجيا للتكنولوجيا ومشروع “Wild Dolphin Project” المتخصص في دراسة الدلافين، وفقًا لما ذكرته الشركة في مدونتها يوم الاثنين.
تم تدريب نموذج “DolphinGemma” ليكتسب القدرة على فهم بنية الأصوات التي تصدرها الدلافين، بالإضافة إلى توليد تسلسلات صوتية جديدة مشابهة لأصواتها الحقيقية.
يستخدم النموذج تقنية صوتية من تطوير “غوغل”
تُسمى “SoundStream” لتشفير أصوات الدلافين، مما يتيح دمج الأصوات في النموذج أثناء تسجيلها.
ويأمل الفريق أن يساعد “DolphinGemma” في اكتشاف أنماط معقدة قد تساهم في بناء مفردات مشتركة بين البشر والدلافين. وتؤكد “غوغل” أن فحص البيانات يدويًا من قبل البشر سيستغرق وقتًا طويلاً للغاية.
وقد بدأ مشروع “Wild Dolphin Project” بالفعل في استخدام نموذج “DolphinGemma” خلال موسم العمل الميداني الحالي، مع وعود بتحقيق فوائد فورية.
من خلال تحديد الأنماط الصوتية المتكررة والتجمعات الموثوقة، يستطيع النموذج مساعدة الباحثين في اكتشاف البُنى والمعاني الخفية داخل تواصل الدلافين الطبيعي، وهي مهمة كانت تتطلب في السابق جهدًا بشريًا هائلًا.
وبمرور الوقت، يمكن أن تُستخدم هذه الأنماط، إلى جانب الأصوات التركيبية التي يُنشئها الباحثون للإشارة إلى الأشياء التي تحب الدلافين اللعب بها، لتطوير مفردات مشتركة تسهم في إنشاء تواصل تفاعلي حقيقي بين البشر والدلافين.
وكون الفريق يستخدم هواتف بيكسل من “غوغل” ميدانيًا، كان من الضروري أن يكون النموذج فعالًا. وغالبًا ما يمثل تشغيل نماذج الذكاء الاصطناعي على الهواتف الذكية تحديًا بسبب القيود المحدودة للموارد. وكلما كان النموذج أكبر وأكثر كفاءة، زادت الذاكرة العشوائية ومعدل المعالجة اللازم لتشغيله.
لكن نموذج “DolphinGemma” حل هذه المشكلة، إذ يتكون من حوالي 400 مليون معلمة فقط، وهو عدد صغير مقارنة بالنماذج اللغوية الكبيرة.
وتخطط “غوغل” لإصدار “DolphinGemma” كنموذج مفتوح المصدر هذا الصيف، لتزويد الباحثين حول العالم بالأدوات اللازمة لتحليل بيانات الصوت وتسريع أبحاثهم حول الأنماط الصوتية.