فراوری ویدئوی هوش مصنوعی با فایل های صوتی ممکن شد
به گزارش انوار بلاگ، به گزارش خبرنگاران به نقل از ونچربیت، اگر چه کوشش برای فراوری ویدئوهای هوش مصنوعی با استفاده از فایل های صوتی پدیده تازه ای نیست، اما مایکروسافت مدعی است فناوری جدید ابداع شده توسط این شرکت منجر به خلق ویدئوهای بسیار باکیفیت و کاملا منطبق با ویژگی های خاص هر فایل صوتی می شود.

تا پیش از این برای افزایش کیفیت فایل های ویدئویی تهیه شده، باید فایل صوتی اولیه فاقد هرگونه صدای مزاحم بوده و فرد در آن با حالت عادی سخن می گفت. اما فناوری مایکروسافت پیشرفته تر بوده و حتی در صورت وجود صدای پس زمینه مزاحم و شرایطی همچون هیجان زده و غیرعادی بودن فرد نیز می تواند تصاویر ویدئویی باکیفیت را استخراج نموده و خروجی نهایی را تحویل دهد.
مایکروسافت مدعی است فناوری هوش مصنوعی جدید این شرکت با آنالیز تن صدا، حالت حرف زدن و دیگر ویژگی های خاص هر فرد خروجی مناسبی از چهره افراد با رعایت حالت های احساسی، ویژگی های هویتی و جنسیتی نژاد و شخصیت افراد ارائه می دهد.
این شرکت برای ارتقای این فناوری هوش مصنوعی از هزار فایل صوتی و ویدئویی ضبط شده مربوط به بیش از 107 هزار نفر در حالت های مختلفی عاطفی و احساسی استفاده نموده است.
منبع: خبرگزاری مهر