غوغل

أعلنت شركة غوغل عن تحديث جديد لروبوت الدردشة الخاص بها “Gemini”، يشمل إدراج نموذج ذكاء اصطناعي متطور مخصص لمعالجة الصور، يحمل اسم “Gemini 2.5 Flash Image” ، وذلك في إطار سعي الشركة لتعزيز قدراته التنافسية أمام أدوات الذكاء الاصطناعي المتقدمة التي تقدمها شركات أخرى مثل “OpenAI”. هذا التحديث الجديد يمنح المستخدمين تحكماً أدق وأكثر مرونة في تعديل الصور وإنشائها ، ويأتي كخطوة استراتيجية من غوغل لتقوية موقعها في سباق الذكاء الاصطناعي، واستقطاب جمهور أوسع من المستخدمين، خصوصًا من جمهور “ChatGPT” الذي يعتمد على أدوات مثل “DALL·E” التابعة لـOpenAI.

سيتم طرح “Gemini 2.5 Flash Image” ابتداءً من يوم الثلاثاء ، وسيكون متاحًا لجميع مستخدمي تطبيق “Gemini”، إلى جانب المطورين عبر واجهة برمجة التطبيقات (API) الخاصة بمنصة “Gemini”، وكذلك من خلال منصتي “Google AI Studio” و”Vertex AI”، اللتين توفران بيئة تطوير متكاملة لمطوري الذكاء الاصطناعي.
ويُعد هذا التحديث خطوة مهمة في تطور أدوات غوغل الخاصة بتوليد الصور، إذ يسعى إلى تزويد المستخدمين بإمكانات متقدمة لتخصيص المحتوى المرئي، والتحكم في التفاصيل الدقيقة للصورة الناتجة، مثل الألوان، الأسلوب الفني، العناصر البصرية، والمشهد العام، مما يرفع من جودة النتائج ويجعلها أقرب لما يتصوره المستخدم أو يطلبه تحديدًا.
يأتي هذا التحديث في وقت يشهد فيه مجال توليد الصور بالذكاء الاصطناعي منافسة شديدة ، حيث تتسابق كبرى شركات التكنولوجيا لتطوير أدوات قادرة على إنتاج صور واقعية أو فنية بمجرد أوامر نصية، مما يجعل من التحكم الدقيق ميزة تنافسية رئيسية. غوغل، من خلال تحديث “Gemini”، تُظهر رغبتها الواضحة في أن تكون لاعبًا رئيسيًا في هذا المجال، لا مجرد تابع للتوجهات التقنية السائدة.
كما تهدف الشركة من خلال هذا التحديث إلى تسهيل عمليات الدمج بين توليد الصور والنصوص، بحيث يستطيع المستخدم إنشاء حوارات، محتوى تسويقي، أو حتى مشاهد إبداعية شاملة تحتوي على صور ونصوص بشكل متكامل وسلس. ومن المتوقع أن تلقى هذه الميزة اهتمامًا خاصًا من المطورين والمبدعين، الذين يعتمدون على أدوات الذكاء الاصطناعي لإنتاج محتوى مرئي غني واحترافي.
ويأتي هذا التحديث بعد سلسلة من التحسينات التي أضافتها غوغل مؤخرًا إلى “Gemini”، والتي شملت تحسين الفهم اللغوي، القدرة على تحليل الصور والفيديوهات، وتقديم نتائج أسرع وأكثر دقة في الاستجابات. ويبدو أن الشركة عازمة على الاستمرار في تطوير روبوتها الذكي ليواكب المنافسة الحادة، ويقدم تجربة مستخدم متكاملة تجمع بين النص، الصورة، والإبداع الاصطناعي.
بهذا التحديث، ترسم غوغل ملامح الجيل القادم من أدوات الذكاء الاصطناعي التفاعلية، حيث يصبح المستخدم شريكًا في عملية الإبداع**، لا مجرد متلقٍ للنتائج، مما يعكس تطوراً مهماً في طريقة تفاعل البشر مع الآلات الذكية.
أطلقت “غوغل” نموذجها الجديد لتحرير الصور باستخدام الذكاء الاصطناعي، ضمن منظومة “Gemini”، حيث يتميز هذا النموذج بإمكانيات متقدمة في تعديل الصور بدقة عالية بناءً على أوامر المستخدمين المكتوبة باللغة الطبيعية. ووفقًا لتقرير نشره موقع “TechCrunch” المتخصص في أخبار التكنولوجيا، فإن النموذج الجديد يُظهر قدرة فائقة على الحفاظ على التفاصيل الدقيقة داخل الصور، مثل ملامح الوجوه أو ملامح الحيوانات، وهو ما تعاني منه العديد من أدوات الذكاء الاصطناعي المنافسة في السوق.
ولعل أحد الأمثلة البارزة على تفوق هذا النموذج هو قدرته على تنفيذ أوامر بسيطة مثل تغيير لون قميص في صورة ما، دون التأثير سلبًا على الخلفية أو تشويه ملامح الوجه، وهو أمر لم تنجح فيه أدوات شهيرة مثل “ChatGPT” أو “Groq” التابع لشركة “xAI”، حيث كانت النتائج أحيانًا تتضمن أخطاء واضحة كتشويه الوجوه أو إدخال تعديلات غير مرغوبة على أجزاء أخرى من الصورة.
اللافت أن النموذج الجديد أثار اهتمامًا واسعًا حتى قبل أن تعلن “غوغل” رسميًا عن تفاصيله. فقد انتشر خلال الأسابيع الأخيرة عبر منصة “LMArena” — وهي منصة تتيح للمستخدمين تقييم ومقارنة نماذج الذكاء الاصطناعي — نموذج مجهول الهوية يحمل الاسم المستعار “Nano Banana”، وحقق هذا النموذج أداءً استثنائيًا في مهام تحرير الصور، متفوقًا على العديد من النماذج المعروفة الأخرى.
وقد تفاعل مستخدمو مواقع التواصل الاجتماعي بشكل ملحوظ مع هذا النموذج المجهول، حيث شارك كثيرون تجاربهم الإيجابية في تعديل الصور بدقة واحترافية، ما أثار فضول المتابعين حول الجهة المطوّرة لهذا النموذج. وفي تأكيد رسمي، أعلنت “غوغل” يوم الثلاثاء أن نموذج “Nano Banana” هو في الواقع النسخة التجريبية من “Gemini 2.5 Flash Image”، التي كانت تختبرها بهدوء قبل الإطلاق الرسمي.
ويتيح هذا النموذج الجديد من “غوغل” إمكانيات موسعة للمستخدمين. فوفقًا لما أعلنت عنه الشركة، يمكن لمستخدمي النسخة المجانية من خدمة “Gemini” إجراء ما يصل إلى 100 تعديل على الصور يوميًا، في حين يحصل المشتركون في الخطة المدفوعة على إمكانية تنفيذ ما يصل إلى 1000 تعديل يوميًا باستخدام النموذج المتقدم.
وتُعد هذه الخطوة من “غوغل” جزءًا من منافسة محتدمة في مجال أدوات الذكاء الاصطناعي البصرية، حيث تسعى الشركات الكبرى إلى تحسين تجربة المستخدم من خلال تقديم أدوات تحرير صور تتسم بالدقة والمرونة وسهولة الاستخدام. وبما أن “Gemini 2.5 Flash Image” قد أثبت فعاليته من خلال التقييمات الجماعية والتجارب العملية، فإنه من المتوقع أن يُشكّل تحولًا مهمًا في الطريقة التي يتم بها التعامل مع تحرير الصور باستخدام الذكاء الاصطناعي خلال الفترة المقبلة.