به لطف ابزار هوش مصنوعی جدید مایکروسافت، مرز بین آنچه واقعی هست و نیست، روز به روز باریکتر میشود. این فناوری که VASA-۱ نام دارد، تصویری ثابت از چهره یک فرد را به یک کلیپ متحرک از صحبت کردن یا آواز خواندن او تبدیل میکند.
به گزارش روزیاتو، این غول فناوری ادعا میکند که حرکات لب «بهطرز بینظیری» با صدا هماهنگ میشوند تا به نظر برسد که سوژه زنده است. در واقع عملکرد VASA-۱ فراتر از تطبیق حرکات لب با صدا است و میتواند طیف گستردهای از احساسات، ظرافتهای چهره و حرکات طبیعی سر را نیز به تصویر بکشد و چهرههای ساختهشده را واقعیتر نشان دهد.
در یک نمونه، شاهکار قرن شانزدهمی لئوناردو داوینچی، «مونالیزا»، با لهجه آمریکایی شروع به رپ کردن میکند.
مطالعه دیگری توسط کارشناسان دانشگاه لنکستر نشان داد که چهرههای جعلی ساختهشده توسط هوش مصنوعی قابل اعتمادتر به نظر میرسند، که این موضوع پیامدهایی برای حفظ حریم خصوصی آنلاین دارد.
در همین حال، OpenAI، خالق ربات معروف ChatGPT، ابزار ترسناک تبدیل متن به ویدیو سورا (Sora) خود را در ماه فوریه معرفی کرد که میتواند کلیپهای ویدیویی هوش مصنوعی فوقالعاده واقعی را تنها بر اساس دستورالعملهای متنی کوتاه و توصیفی بسازد.
کارشناسان هشدار دادند که این موضوع میتواند کل صنایعی مانند تولید فیلم را از بین ببرد و منجر به افزایش ویدیوهای دیپ فیک بهویژه در آستانه رویدادهای مهم سیاسی مانند انتخابات ریاست جمهوری شود.
منبع: fararu-727628