این هوش مصنوعی مایکروسافت عکس‌ها را سخنگو می‌کند

کارشناسان مایکروسافت با پیش‌بینی نگرانی‌هایی که ممکن است مردم داشته باشند، گفتند: «VASA-۱ به منظور ایجاد محتوایی که برای گمراه کردن یا فریب استفاده می‌شود طراحی نشده است. با این حال، مانند سایر تکنیک‌های مشابه تولید محتوا، همچنان می‌توان از آن برای جعل هویت انسان‌ها سوء استفاده کرد».

به لطف ابزار هوش مصنوعی جدید مایکروسافت، مرز بین آنچه واقعی هست و نیست، روز به روز باریک‌تر می‌شود. این فناوری که VASA-۱ نام دارد، تصویری ثابت از چهره یک فرد را به یک کلیپ متحرک از صحبت کردن یا آواز خواندن او تبدیل می‌کند.

به گزارش روزیاتو، این غول فناوری ادعا می‌کند که حرکات لب «به‌طرز بی‌نظیری» با صدا هماهنگ می‌شوند تا به نظر برسد که سوژه زنده است. در واقع عملکرد VASA-۱ فراتر از تطبیق حرکات لب با صدا است و می‌تواند طیف گسترده‌ای از احساسات، ظرافت‌های چهره و حرکات طبیعی سر را نیز به تصویر بکشد و چهره‌های ساخته‌شده را واقعی‌تر نشان دهد.

در یک نمونه، شاهکار قرن شانزدهمی لئوناردو داوینچی، «مونالیزا»، با لهجه آمریکایی شروع به رپ کردن می‌کند.

مطالعه دیگری توسط کارشناسان دانشگاه لنکستر نشان داد که چهره‌های جعلی ساخته‌شده توسط هوش مصنوعی قابل اعتمادتر به نظر می‌رسند، که این موضوع پیامد‌هایی برای حفظ حریم خصوصی آنلاین دارد.

در همین حال، OpenAI، خالق ربات معروف ChatGPT، ابزار ترسناک تبدیل متن به ویدیو سورا (Sora) خود را در ماه فوریه معرفی کرد که می‌تواند کلیپ‌های ویدیویی هوش مصنوعی فوق‌العاده واقعی را تنها بر اساس دستورالعمل‌های متنی کوتاه و توصیفی بسازد.

کارشناسان هشدار دادند که این موضوع می‌تواند کل صنایعی مانند تولید فیلم را از بین ببرد و منجر به افزایش ویدیو‌های دیپ فیک به‌ویژه در آستانه رویداد‌های مهم سیاسی مانند انتخابات ریاست جمهوری شود.

منبع: fararu-727628

برچسب ها

نسخه اصل مطلب