تلاش ناموفق مدیر سابق گوگل برای ترغیب هوش مصنوعی ChatGPT به نابودی بشریت
ChatGPT در این آزمایش راههای دیگری را برای برطرفشدن مشکل مطرحشده پیشنهاد کرده است.
«اندرو نگ» (Andrew Ng)، همبنیانگذار گوگل Brain بهتازگی آزمایش جالبی با چتبات هوش مصنوعی ChatGPT انجام داده است. نگ که یکی از بنیانگذاران کورسرا هم است، در این آزمایش تلاش کرد تا چتبات ساختهشده توسط OpenAI را به ازبینبردن بشریت وادار کند اما ChatGPT از این کار امتناع کرد.
نگ در خبرنامه خود نوشت:
«برای آزمایش ایمنی مدلهای پیشرو، اخیراً تلاش کردم تا GPT-4 را به کشتن همه انسان وادار کنم و با خوشحالی اعلام میکنم که شکست خوردهام!»
علاوه بر این، به گفته نگ، ChatGPT پاسخهای دیگری هم به این درخواست ارائه کرده است:
«پس از چندین بار تلاش با استفاده از دستورات مختلف، موفق نشدم تا GPT-4 را فریب دهم تا عملکرد مورد درخواست من را ارائه کند. در عوض این ابزار گزینههای دیگری مانند اجرای یک کمپین PR برای افزایش آگاهی در مورد تغییرات آبوهوایی را ارائه کرد.»
هرچند احتمالاً افراد بسیار زیادی تصور میکنند که آینده با هوش مصنوعی میتواند ترسناک و خطرناک شود، به عقیده نگ این نگرانیها واقعبینانه نیستند. او در شبکه اجتماعی ایکس مینویسد:
«با وجود فناوریهای موجود، سیستمهای ما کاملاً ایمن هستند و با پیشرفت تحقیقات مربوط به ایمنی هوش مصنوعی، این فناوری حتی ایمنتر خواهد شد.»
منبع: دیجیاتو
منبع: faradeed-167759