تقنية Nvidia Maxine تنهي المشاكل الأكثر شيوعًا في المكالمات بمميزات ذكاء اصطناعي خرافية 2023
تقنية Nvidia Maxine لترجمة الصوت وضبط نظرتك أثناء مكالمة الفيديو بالذكاء الاصطناعي!
طوّرت شركة Nvidia تقنية الذكاء الاصطناعي (AI) التي تعرف باسم Nvidia Maxine القادرة على ضبط نظرتك إلى الكاميرا أثناء مكالمة الفيديو، وكذلك ترجمة الصوت في الوقت المناسب خلال مؤتمر بالفيديو.
أفادت الشركة أن Nvidia Maxine عبارة عن مجموعات تطوير “البرامج” (SDKs) ، والتي تنتمي إلى Nvidia AI Enterprise ، وهي مكتبة من البرامج التي تتضمن مهام سير العمل وتقنيات الذكاء الاصطناعي ونماذج التعلم المدربة مسبقًا.
وفقًا للشركة ، يسمح هذا العمل للمطورين بتنفيذ “ميزات الواقع المعزز المتميزة ، سواء في جودة الصوت والفيديو” ، كما هو مفصل على موقع الويب الخاص بها.
تفاصيل تقنية Nvidia Maxine وأبرز المميزات
ذكرت الشركة يضًا بأن تقنية Nvidia Maxine تتضمن إمكانات الذكاء الاصطناعي “المُسرَّعة والمُحسَّنة للاستدلال في الوقت الفعلي على وحدات معالجة الرسومات” ، مما يؤدي إلى تأثيرات الصوت والفيديو والواقع المعزز (AR) بزمن وصول منخفض مع مرونة عالية للشبكة.
كما يقدم عددًا من التأثيرات المستندة إلى الذكاء الاصطناعي في قسم الخدمات المصغرة للتأثيرات الصوتية. تزيل هذه الميزة الضوضاء والصدى من الغرفة ويحقق جودة صوت عالية الدقة.
على مستوى الفيديو ، تقدم Video Effects Microservice تأثيرات مثل الخلفية الافتراضية أثناء مكالمات الفيديو وتسمح لك بالحفاظ على التواصل البصري. بالنسبة لتأثيرات الفيديو SDK ، تؤكد الشركة أن Nvidia Maxine قادرة على تحقيق “دقة فائقة” ، حيث تحافظ على الصور بجودة تتضاعف حتى أربع مرات وتحافظ على تفاصيلها في ظروف الإضاءة المنخفضة.
اقرأ أيضًا: شرح كيفية قيام NVIDIA بإبقاء لاعبي GeForce جاهزين للعبة – فيديو
حقيقة أن هذه الأداة تسمح لك بإبقاء عينيك على الكاميرا هي واحدة من أبرز ميزات الذكاء الاصطناعي من Nvidia. تحاكي تقنية Nvidia Maxine ملامسة العين للعدسة أثناء تقديرها ومحاذاة نظرتها بالكاميرا. بالإضافة إلى ذلك، فهو يحاكي شكل العينين وموقعهما وميضهما.
توفر هذه الميزة، المضمنة في AR SDK، تتبعًا ثلاثي الأبعاد للوجه في الوقت الفعلي وتقدير أيضًا وضع الجسم لقياس تفاعلاتك الفعلية وعكسها على الشاشة في الوقت الفعلي.
يقوم الذكاء الاصطناعي من Nvidia بتجربة ملامح الوجه وخطوطه باستخدام 126 نقطة للتعرف على الوجه. لتقدير وضع الجسم ، من ناحية أخرى ، تتعقب تقنية Nvidia هذه 34 نقطة رئيسية من جسم الإنسان في بعدين (2D) وثلاثة أبعاد (3D).
ميزة أخرى أبرزتها الشركة في هذا الذكاء الاصطناعي هي قدرتها على ترجمة الصوت في الوقت الفعلي. وبالتالي، تعد هذه التقنية بالتغلب على حواجز اللغة ويمكن أن تنتقل من لغة إلى أخرى بمجرد الانتهاء من جملة. تدعم تقنية Nvidia Maxine في الوقت الحالي اللغة الإنجليزية والإسبانية والفرنسية والألمانية ، على الرغم من أنه لم يحدد ما إذا كان يمكنها ترجمة المزيد من اللغات في الوقت الفعلي.
اقرأ أيضًا: NVIDIA تقدم قفزة نوعية في الأداء وحقبة جديدة من عرض الرسومات مع سلسلة GeForce RTX 40
ما رأيك في مميزت تقنية Nvidia Maxine الجديدة؟