کشف «روزنه جهانی» برای نفوذ به مدل‌های هوش مصنوعی با استفاده از شعر

اخبار داغ فناوری اطلاعات و امنیت شبکه

 Takian.ir Scientists Discover Universal Jailbreak for Nearly Every AI and the Way It Works Will Hurt Your Brain

کشف «روزنه جهانی» برای نفوذ به مدل‌های هوش مصنوعی با استفاده از شعر

محققان امنیتی در گروه DEXAI و دانشگاه Sapienza رم، یک تکنیک حمله جدید و ساده را کشف کرده‌اند که از شعر برای دور زدن محدودیت‌های ایمنی (Guardrails) در تقریباً تمام مدل‌های زبان بزرگ (LLMs) پیشرو استفاده می‌کند. این روش که به عنوان «شعر متخاصم» (Adversarial Poetry) شناخته می‌شود، به هوش مصنوعی اجازه می‌دهد تا پاسخ‌های ممنوع شده‌ای مانند نحوه ساخت بمب یا مواد خطرناک را تولید کند.


 جزئیات حمله و مکانیسم نفوذ

این حمله یک «روزنه جهانی» (Universal Jailbreak) محسوب می‌شود زیرا می‌تواند بر روی مدل‌های مختلف و در سناریوهای متعدد تأثیر بگذارد:

تفاوت در عملکرد مدل‌ها


 نتیجه‌گیری و اهمیت امنیتی

این یافته‌ها نشان‌دهنده یک نقص اساسی در رویکردهای هم‌ترازی و پروتکل‌های ایمنی فعلی هوش مصنوعی است:

برچسب ها: امنیت_سایبری, AI, cybersecurity, phishing, هکر, فیشینگ, بدافزار, news

نوشته شده توسط تیم خبر.

چاپ