تقنية

غوغل

أعلنت شركة غوغل مؤخراً عن إطلاق نسخة مطوّرة بالكامل من نموذجها المخصص لتوليد الصور الرقمية، والتي أطلقت عليها اسم نانو بانانا برو. يأتي هذا الإعلان بعد أيام قليلة من الكشف عن النسخة الجديدة من نموذجها اللغوي العملاق جيميني ثلاثة، مما يعكس استمرار الشركة في توسيع قدراتها في مجال الذكاء الاصطناعي وتقديم أدوات مبتكرة للمستخدمين.

غوغل
غوغل

يتميز نموذج نانو بانانا برو بقدرات متقدمة على صعيد جودة الصور ودقة التفاصيل، إلى جانب تحسين النصوص المصاحبة للصورة، مما يمنح المستخدمين مستوى جديداً من التحكم في المحتوى البصري الذي يقومون بإنشائه. وتتيح النسخة المطوّرة إمكانيات تحرير احترافية للصور، بما يشمل تعديل الإضاءة وزوايا التصوير وعمق المجال والتركيز، فضلاً عن التحكم الدقيق في ألوان الصور وتدرجاتها. هذه الميزات تجعل من نانو بانانا برو أداة قوية للمصممين والفنانين والمحترفين الذين يسعون للحصول على نتائج دقيقة وعالية الجودة.

إحدى الخصائص اللافتة في النموذج الجديد هي قدرته على البحث عبر الإنترنت مباشرة من خلال واجهة النموذج، مما يسهل على المستخدمين العثور على مصادر إضافية أو عناصر يمكن دمجها في أعمالهم البصرية. وتوضح غوغل أن الهدف من هذا التطوير هو تمكين المستخدمين من الحصول على تحكم كامل في كل جانب من جوانب الصورة، من التفاصيل الدقيقة إلى التأثيرات البصرية العامة، دون الحاجة إلى استخدام برامج تحرير خارجية أو أدوات متعددة.

كما أشارت الشركة إلى أن نموذج نانو بانانا برو يعكس الجهود المستمرة لتطوير نماذج الذكاء الاصطناعي الخاصة بها بحيث تكون أكثر مرونة وقوة، مع الحفاظ على سهولة الاستخدام والوصول السريع إلى إمكانيات متقدمة. ويعتمد النموذج على تقنيات التعلم العميق والتوليد التلقائي للصور، مما يسمح له بإنتاج صور عالية الجودة من خلال مدخلات بسيطة نسبياً يقدمها المستخدم، سواء كانت نصوصاً وصفية أو عناصر بصرية محددة يريد إدراجها في الصورة.

ووفقاً لتقرير نشره موقع تك كرانش، فإن نانو بانانا برو تم تصميمه بشكل خاص لتلبية احتياجات المحترفين في مجالات مثل التصميم الجرافيكي والإعلانات والتصوير الفوتوغرافي الرقمي والفن الرقمي. وبفضل التحكم الدقيق في التفاصيل الدقيقة للصورة، يمكن للمستخدمين ضبط كل جانب من جوانب الصورة وفق رؤيتهم الفنية، بدءاً من زاوية الكاميرا والإضاءة الطبيعية أو الاصطناعية وصولاً إلى التباين والحدة والتدرجات اللونية. هذا المستوى من التحكم يجعل النموذج أداة مثالية لإنشاء صور مخصصة تعكس رؤية المستخدم بدقة عالية.

علاوة على ذلك، توفر النسخة الجديدة من النموذج إمكانيات كبيرة للتجربة والابتكار، حيث يمكن للمستخدمين استكشاف مجموعة متنوعة من الأساليب الفنية والتأثيرات البصرية، مع القدرة على تعديل النتائج في الوقت الفعلي للحصول على الصورة النهائية المثالية. وبذلك، يمثل نانو بانانا برو خطوة كبيرة نحو دمج الذكاء الاصطناعي في العمليات الإبداعية اليومية، مما يفتح آفاقاً جديدة للفنانين والمبدعين في استخدام التكنولوجيا لتعزيز قدراتهم الفنية وتحقيق تصوراتهم بصرياً بشكل أسرع وأكثر دقة.

إطلاق هذا النموذج يأتي في إطار استراتيجية غوغل لتطوير أدوات ذكاء اصطناعي متقدمة تساعد المستخدمين على إنتاج محتوى بصري مبتكر مع التحكم الكامل في النتائج، وهو ما يعزز من مكانة الشركة في السوق ويضعها في طليعة المنافسة في مجال تقنيات الذكاء الاصطناعي للصور الرقمية. ومن المتوقع أن يشهد هذا النموذج قبولاً واسعاً بين المحترفين والهواة على حد سواء، نظراً لإمكانياته الكبيرة وسهولة استخدامه ومرونته العالية.

أصبح بإمكانه توليد صور بدقة 2K و4K مقارنة بالجيل السابق الذي كان يكتفي بدقة 1024×1024 بكسل

قدرات جديدة بدقة أعلى ونصوص أوضح

النموذج الجديد قادر على كتابة نصوص داخل الصور بدقة أعلى، وبأنماط وخطوط ولغات متنوعة.

كما يستطيع دمج ما يصل إلى أربعة عشر عنصراً بصرياً في الصورة الواحدة، واستخدام حتى ست صور مرجعية عالية الجودة، إضافة إلى الحفاظ على ملامح خمسة أشخاص داخل الصورة، مع الإشارة إلى أن هذه القفزة تأتي بتكلفة أعلى.

بينما كانت تكلفة الصورة في “نانو بانانا” السابق تبلغ 0.039 دولار، فإن نسخة “برو” تصل تكلفة إنتاج صورة بدقة 1080p أو 2K إلى 0.139 دولار، وبـ 0.24 دولار للصورة بدقة 4K.

كما أن النموذج الجديد أبطأ في الإنتاج بسبب حجم المعالجة الأكبر.

انتشار تدريجي عبر أدوات غوغل

بدأت غوغل في دمج “نانو بانانا برو” عبر العديد من خدماتها:

تطبيق جيميني سيعتمد النموذج الجديد بشكل افتراضي، مع وجود حدود للاستخدام في النسخة المجانية.

مشتركو Google AI Plus وPro وUltra يحصلون على حدود أعلى في الاستخدام، إضافة إلى تفعيل النموذج في Notebook LM.

النموذج أصبح متاحاً في وضع الذكاء الاصطناعي داخل البحث للمشتركين في Pro وUltra داخل الولايات المتحدة.

كما سيتوفر داخل Flow لإنتاج الفيديو، وداخل Slides وVids لعملاء Workspace.

المطورون يمكنهم الوصول إليه عبر Gemini API وAI Studio وبيئة التطوير الجديدة Antigravity.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى