آخر الأخبار

OpenAI تكشف النقاب عن “المحرك الصوتي”: يحاكي الكلام البشري من خلال عينة صوتية مدتها 15 ثانية فقط

OpenAI، المشهورة بخطواتها المبتكرة في مجال تكنولوجيا الذكاء الاصطناعي مع إبداعات مثل Sora، مولد الفيديو الخاص بها، قدمت الآن “Voice Engine”، وهي أداة رائدة لاستنساخ الصوت. يمكن لهذا النموذج الصوتي الرائع أن يكرر بدقة الفروق الدقيقة في الكلام البشري، بما في ذلك نغمة الصوت وأنماط الكلام الفريدة، باستخدام عينة قصيرة مدتها 15 ثانية فقط من الصوت الأصلي. على الرغم من الترقب الشديد، اختارت OpenAI إبقاء هذه الميزة الجديدة طي الكتمان بإحكام، مشيرة إلى المخاوف بشأن سوء الاستخدام المحتمل وانتشار المحتوى المزيف عبر الإنترنت.

كفاءة ودقة ملحوظة

وقالت الشركة في تقرير حديث: “بشكل لا يصدق، يمكن لمحركنا الصوتي أن يصدر أصواتًا عاطفية ونابضة بالحياة باستخدام عينة واحدة مدتها 15 ثانية فقط”. مشاركة مدونة.

المحرك الصوتي لـ OpenAI مقابل معايير الصناعة

في المقابل، فإن منصات الصوت القائمة على الذكاء الاصطناعي تحب أحد عشر مختبرًا تتطلب عادةً عينات أطول، حيث تتطلب أداة استنساخ الصوت الفورية الخاصة بها دقيقة واحدة على الأقل من الصوت للتشغيل. للحصول على أفضل النتائج، يوصى بحوالي 10 دقائق من الكلام المتواصل، خاصة بالنسبة للخدمات الاحترافية.

عرضت OpenAI قدرات Voice Engine من خلال عروض توضيحية مختلفة، بما في ذلك مثال مؤثر حيث تم نسخ صوت مريضة شابة، فقدت الكثير من قدرتها على التحدث بسبب ورم في المخ، باستخدام تسجيل قديم من مشروع مدرسي. مكنتها التكنولوجيا من التواصل باستخدام صوتها، وهو إنجاز أصبح ممكنًا من خلال التعاون مع Lifespan، وهي منظمة غير ربحية مرتبطة بكلية الطب بجامعة براون.

علاوة على ذلك، كشفت OpenAI عن شراكات مع منظمات مثل HeyGen، يوضح كيف يقوم Voice Engine بتسهيل ترجمة الكلام الطبيعي من لغة إلى أخرى.

وفقًا لـ OpenAI، تم تطوير Voice Engine في البداية في أواخر عام 2022 وتم دمجه بالفعل في الأصوات المعدة مسبقًا المتوفرة في واجهة برمجة تطبيقات تحويل النص إلى كلام الخاصة بـ OpenAI، بالإضافة إلى ميزة الصوت والقراءة بصوت عالٍ في ChatGPT. مع هذه التطورات الأخيرة، تتصرف الشركة بحذر قبل إصدارها على نطاق أوسع.

(العلامات للترجمة) الذكاء الاصطناعي


المصدر

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *