قالت شركة “أوبن إيه.آي” مطورة روبوت الدردشة (تشات جي.بي.تي)، إنها ستطلق نموذجًا جديدًا للذكاء الاصطناعي يُسمى “جي.بي.تي-4o”، يمكنه إجراء محادثة صوتية واقعية والتعامل مع النصوص والصور.
وهذه أحدث خطوة تخطوها الشركة المدعومة من مايكروسوفت للبقاء في مقدمة سباق السيطرة على تلك التكنولوجيا الناشئة، وفق رويترز، اليوم الثلاثاء 14 مايو 2024.
نموذج جديد للذكاء الاصطناعي
تتيح الإمكانيات الصوتية الجديدة للمستخدمين التحدث إلى “تشات جي.بي.تي” والحصول على ردود في الوقت الفعلي دون أي تأخير، بالإضافة إلى مقاطعته أثناء التحدث، وكلاهما من السمات المميزة للمحادثات الواقعية التي استعصت على خدمات سابقة من المساعد الصوتي الذي يعمل بالذكاء الاصطناعي.
وقال سام ألتمان، رئيس أوبن إيه.آي التنفيذي: “يبدو الأمر وكأن الذكاء الاصطناعي ضربًا من الخيال.. لم يكن التحدث إلى جهاز كمبيوتر أمرًا طبيعيًا بالنسبة لي أبدًا، والآن أصبح كذلك”.
وتواجه “أوبن إيه.آي” منافسة وضغوطًا متزايدين لتوسيع قاعدة مستخدمي (تشات جي.بي.تي)، وهو روبوت الدردشة الذائع الصيت الذي أبهر العالم بقدرته على إنتاج محتوى مكتوب يشبه الذي ينتجه البشر وكتابة رموز برمجيات الكمبيوتر.
وأظهر باحثو “أوبن إيه.آي” في مؤتمر مباشر قدرات المساعد الصوتي الجديدة لتشات “جي.بي.تي”، ففي أحد العروض التوضيحية، استخدم “تشات جي.بي.تي” إمكاناته البصرية والصوتية للتحدث مع أحد الباحثين لحل معادلة رياضية على ورقة.
وفي عرض توضيحي آخر، أظهر الباحثون قدرة نموذج “جي.بي.تي-4o” على الترجمة في الوقت الفعلي.
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
— OpenAI (@OpenAI) May 13, 2024
رابط مختصر : https://roayahnews.com/?p=1847532