تقنية

OpenAI

أعلنت شركة OpenAI، الرائدة في مجال الذكاء الاصطناعي ومقرها سان فرانسيسكو، عن إطلاق ميزة صوتية جديدة طال انتظارها ضمن منصة ChatGPT، وذلك بعد مرور أربعة أشهر على كشفها لأول مرة خلال حدث إطلاق المنتجات في وقت سابق من هذا العام. الميزة الجديدة تُعرف باسم “الوضع الصوتي المتقدم”، وهي متاحة الآن لمشتركي الخدمة المدفوعة ChatGPT Plus، بالإضافة إلى مستخدمي باقة الأعمال “ChatGPT for Teams”.

OpenAI
OpenAI

وتأتي هذه الخطوة في إطار جهود OpenAI المستمرة لتطوير واجهات التفاعل بين البشر والذكاء الاصطناعي، حيث تسعى الشركة إلى جعل المحادثة مع روبوت الدردشة أكثر طبيعية وتفاعلية من خلال إدخال الصوت كوسيلة رئيسية للتواصل. وبفضل هذه التقنية، بات بإمكان المستخدمين الآن إجراء محادثات صوتية مباشرة مع المساعد الذكي، ما يُضفي بُعدًا جديدًا من الواقعية والسلاسة على تجربة الاستخدام.

ووفقًا لتصريحات الشركة، فإن الخدمة الجديدة ستُطرح بشكل تدريجي، وقد بدأت بالفعل بالوصول إلى مستخدمي ChatGPT Plus ومشتركي Teams، فيما ستتاح لمستخدمي الخدمتين المدفوعتين “ChatGPT Enterprise” و”ChatGPT Edu” في الأسبوع التالي. ويُتوقع أن تسهم هذه الميزة في تعزيز تجربة المستخدم داخل المؤسسات التعليمية والشركات، حيث يمكن استخدام المساعد الصوتي في الاجتماعات، والعروض التقديمية، والمساعدة الفورية في المهام اليومية.

الجدير بالذكر أن ميزة “الوضع الصوتي المتقدم” لا تقتصر فقط على تحويل الكلام إلى نص، بل تعتمد على تقنيات متقدمة لفهم السياق الصوتي، وتحليل النبرة، والاستجابة بطريقة طبيعية تشبه المحادثات البشرية الحقيقية. كما تعمل OpenAI على توسيع نطاق خيارات الأصوات المتاحة، لتشمل عدة لهجات ونبرات، مما يسمح للمستخدم باختيار النمط الذي يناسبه.

إطلاق هذه الميزة يأتي في وقت يشهد فيه سوق الذكاء الاصطناعي التفاعلي نموًا متسارعًا، حيث تتنافس كبرى الشركات التقنية على تقديم حلول متطورة تجعل التفاعل مع الأنظمة الذكية أكثر سهولة وفعالية. وتُعد OpenAI من بين الشركات الرائدة التي تحاول دفع حدود الابتكار في هذا المجال، وذلك من خلال دمج تقنيات المحادثة النصية والصوتية ضمن نظام موحد مدعوم بالذكاء الاصطناعي المتقدم.

وقد أشار عدد من المحللين إلى أن إدخال هذه التقنية إلى ChatGPT يعكس توجه OpenAI نحو جعل منصتها متعددة الوسائط، بحيث تتيح للمستخدمين التفاعل عبر النص، والصوت، والصورة، مما يوفر تجربة أكثر شمولية. كما أن الميزة قد تمهد الطريق لدمج المساعد الصوتي في الأجهزة المحمولة، والتطبيقات الذكية، وحتى الأنظمة المنزلية.

من المتوقع أن تواصل OpenAI تطوير الميزة خلال الأشهر المقبلة، استنادًا إلى ملاحظات المستخدمين وتجاربهم الفعلية، مع احتمالية إضافة دعم لغات متعددة، وتحسين مستوى الاستجابة، وتعزيز الأمان والخصوصية عند استخدام الأوامر الصوتية.

OpenAI والمساعد الصوتي الجديد

كشفت شركة OpenAI عن مساعدها الصوتي للمرة الأولى في شهر مايو، حيث عرضت كيف يمكنه الاستجابة بسرعة للمطالبات النصية والبصرية باستخدام صوت بشري منطوق. إلا أن الشركة قررت في يونيو تأجيل إطلاق هذه الميزة لمعالجة بعض المخاوف المتعلقة بالسلامة. وفي يوليو، بدأت بإتاحتها لمجموعة محدودة من مستخدمي خدمة “ChatGPT PLUS”.

عقب هذا التأجيل، أوضحت OpenAI أن المساعد الصوتي لن يكون قادراً على تقليد أصوات الآخرين، وأضافت أنها أدخلت مرشحات جديدة تتيح للنظام التعرف على بعض الطلبات ورفضها تلقائياً، وخصوصاً تلك التي تتعلق بإنتاج موسيقى أو أصوات أخرى محمية بحقوق النشر.

رغم ذلك، لا يزال المساعد الصوتي يفتقر إلى بعض الوظائف التي سبق أن عرضتها الشركة. فعلى سبيل المثال، لا يستطيع حالياً استخدام ميزة “الرؤية الحاسوبية” التي تمكّنه من تقديم تعليقات صوتية على حركات رقص الأشخاص باستخدام كاميرا الهاتف الذكي.

وفي إطار التوسع في طرح الميزة، أعلنت OpenAI عن إضافة خمس أصوات جديدة، ليصل إجمالي عدد الأصوات المتوفرة للمستخدمين إلى تسعة. وتحمل هذه الأصوات أسماء مستوحاة من الطبيعة مثل “آربور” (Arbor)، “سبروس” (Spruce)، و”مابل” (Maple).

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى