تهران ، ولیعصر
021-987654

واترمارک ChatGPT چگونه کار می کند و چرا می توان آن را شکست داد

OpenAI’s ChatGPT راهی را برای ایجاد خودکار محتوا معرفی کرد، اما برنامه‌هایی برای معرفی ویژگی واترمارکینگ برای آسان‌تر کردن تشخیص آن، برخی افراد را عصبی می‌کند. این نحوه کار واترمارک ChatGPT است و چرا ممکن است راهی برای شکست آن وجود داشته باشد.

ChatGPT ابزاری باورنکردنی است که ناشران آنلاین، وابسته‌ها و سئوکاران به طور همزمان آن را دوست دارند و از آن می‌ترسند.

برخی از بازاریابان آن را دوست دارند زیرا در حال کشف راه‌های جدیدی برای استفاده از آن برای تولید خلاصه محتوا، طرح‌های کلی و مقالات پیچیده هستند.

ناشران آنلاین از احتمال هجوم محتوای هوش مصنوعی به نتایج جستجو و جایگزینی مقالات تخصصی نوشته شده توسط انسان می ترسند.

در نتیجه، اخبار مربوط به ویژگی واترمارکینگ که تشخیص محتوای نوشته شده توسط ChatGPT را باز می کند نیز با نگرانی و امید پیش بینی می شود.

واترمارک رمزنگاری

واترمارک یک علامت نیمه شفاف (یک لوگو یا متن) است که روی یک تصویر تعبیه شده است. واترمارک نشان می دهد که نویسنده اصلی اثر چه کسی است.

این تا حد زیادی در عکس‌ها و به‌طور فزاینده‌ای در ویدیوها دیده می‌شود.

متن واترمارکینگ در ChatGPT شامل رمزنگاری به شکل جاسازی الگویی از کلمات، حروف و نقطه گذاری در قالب یک کد مخفی است.

اسکات آرونسون و ChatGPT Watermarking

یک دانشمند کامپیوتر با نفوذ به نام اسکات آرونسون در ژوئن ۲۰۲۲ توسط OpenAI استخدام شد تا روی ایمنی و تراز هوش مصنوعی کار کند.

ایمنی هوش مصنوعی یک زمینه تحقیقاتی است که به مطالعه راه هایی می پردازد که هوش مصنوعی ممکن است به انسان آسیب برساند و راه هایی برای جلوگیری از این نوع اختلالات منفی ایجاد کند.

مجله علمی Distill، با حضور نویسندگان وابسته به OpenAI، تعریف می کند ایمنی هوش مصنوعی مانند این:

“هدف ایمنی بلندمدت هوش مصنوعی (AI) این است که اطمینان حاصل شود که سیستم‌های هوش مصنوعی پیشرفته به‌طور قابل اعتمادی با ارزش‌های انسانی همسو هستند——اینکه آن‌ها به‌طور قابل اعتماد کارهایی را انجام می‌دهند که مردم می‌خواهند انجام دهند.

هم ترازی هوش مصنوعی حوزه هوش مصنوعی است که با اطمینان از همسویی هوش مصنوعی با اهداف مورد نظر مرتبط است.

یک مدل زبان بزرگ (LLM) مانند ChatGPT را می توان به روشی استفاده کرد که ممکن است مغایر با اهداف تراز AI همانطور که توسط OpenAI تعریف شده است، که برای ایجاد هوش مصنوعی مفید برای بشریت است.

بر این اساس، دلیل واترمارک گذاری جلوگیری از سوء استفاده از هوش مصنوعی به گونه ای است که به بشریت آسیب برساند.

آرونسون دلیل واترمارک کردن خروجی ChatGPT را توضیح داد:

“بدیهی است که این می تواند برای جلوگیری از سرقت علمی آکادمیک مفید باشد، اما همچنین، برای مثال، تولید انبوه تبلیغات…”

ChatGPT Watermarking چگونه کار می کند؟

واترمارک ChatGPT سیستمی است که یک الگوی آماری، یک کد را در انتخاب کلمات و حتی علائم نگارشی جاسازی می‌کند.

محتوای ایجاد شده توسط هوش مصنوعی با الگوی نسبتاً قابل پیش بینی انتخاب کلمه تولید می شود.

کلمات نوشته شده توسط انسان و هوش مصنوعی از یک الگوی آماری پیروی می کنند.

تغییر الگوی کلمات استفاده شده در محتوای تولید شده راهی برای “واترمارک کردن” متن است تا تشخیص دهد که آیا این متن محصول یک تولید کننده متن هوش مصنوعی بوده است یا خیر.

ترفندی که واترمارک کردن محتوای هوش مصنوعی را غیرقابل تشخیص می‌کند این است که توزیع کلمات همچنان ظاهری تصادفی شبیه به متن معمولی ایجاد شده توسط هوش مصنوعی دارد.

به این توزیع شبه تصادفی کلمات گفته می شود.

شبه تصادفی یک سری از کلمات یا اعداد تصادفی آماری است که در واقع تصادفی نیستند.

واترمارک ChatGPT در حال حاضر استفاده نمی شود. با این حال، اسکات آرونسون در OpenAI گزارش داده است که برنامه ریزی شده است.

در حال حاضر ChatGPT در پیش‌نمایش است، که به OpenAI اجازه می‌دهد تا از طریق استفاده در دنیای واقعی “ناهمترازی” را کشف کند.

احتمالاً واترمارکینگ ممکن است در نسخه نهایی ChatGPT یا زودتر از آن معرفی شود.

اسکات آرونسون نوشت در مورد نحوه کار واترمارکینگ:

“پروژه اصلی من تاکنون ابزاری برای واترمارک کردن خروجی های یک مدل متنی مانند GPT بوده است.

اساساً، هر زمان که GPT متن طولانی تولید می‌کند، ما می‌خواهیم یک سیگنال مخفی غیرقابل توجه در انتخاب کلمات آن وجود داشته باشد، که می‌توانید بعداً برای اثبات اینکه، بله، از GPT آمده است، استفاده کنید. /blockquote>

آرونسون نحوه عملکرد واترمارک ChatGPT را بیشتر توضیح داد. اما ابتدا، درک مفهوم توکن سازی بسیار مهم است.

Tokenization مرحله‌ای است که در پردازش زبان طبیعی اتفاق می‌افتد، جایی که ماشین کلمات موجود در یک سند را می‌گیرد و آنها را به واحدهای معنایی مانند کلمات و جملات تجزیه می‌کند.

Tokenization متن را به شکل ساختار یافته ای تغییر می دهد که می تواند در یادگیری ماشین استفاده شود.

فرآیند تولید متن به این صورت است که ماشینی حدس می‌زند کدام نشانه بر اساس نشانه قبلی، بعد از آن قرار می‌گیرد.

این کار با یک تابع ریاضی انجام می‌شود که احتمال اینکه توکن بعدی چیست، که توزیع احتمال نامیده می‌شود، تعیین می‌کند.

کلمه بعدی پیش‌بینی می‌شود اما تصادفی است.

خود واترمارک همان چیزی است که هارون آن را شبه تصادفی توصیف می‌کند، به این معنا که یک دلیل ریاضی برای یک کلمه یا علامت نگارشی خاص وجود دارد، اما هنوز از نظر آماری تصادفی است.

در اینجا توضیح فنی واترمارکینگ GPT آمده است:

“برای GPT، هر ورودی و خروجی رشته‌ای از نشانه‌ها است، که می‌توانند کلمات باشند، اما همچنین علائم نگارشی، بخش‌هایی از کلمات یا بیشتر – در مجموع حدود ۱۰۰۰۰۰ نشانه وجود دارد.

در هسته خود، GPT دائماً در حال ایجاد توزیع احتمال بر روی نشانه بعدی برای تولید است، مشروط به رشته توکن های قبلی.

بعد از اینکه شبکه عصبی توزیع را تولید کرد، سرور OpenAI در واقع یک توکن را مطابق با آن توزیع نمونه‌برداری می‌کند – یا نسخه‌ای تغییر یافته از توزیع، بسته به پارامتری به نام “دما”.

تا زمانی که دما غیرصفر باشد، معمولاً در انتخاب نشانه بعدی تصادفی وجود خواهد داشت: می‌توانید بارها و بارها با همان اعلان اجرا کنید و تکمیل متفاوتی دریافت کنید (به عنوان مثال، رشته‌ای از نشانه‌های خروجی ) هر بار.

بنابراین برای واترمارک کردن، به جای انتخاب تصادفی نشانه بعدی، ایده این است که آن را به صورت تصادفی شبه انتخاب کنید، با استفاده از یک تابع شبه تصادفی رمزنگاری، که کلید آن فقط برای OpenAI شناخته شده است.”

واترمارک برای کسانی که متن را می خوانند کاملاً طبیعی به نظر می رسد زیرا انتخاب کلمات از تصادفی بودن همه کلمات دیگر تقلید می کند.

اما این تصادفی حاوی یک سوگیری است که فقط توسط شخصی که کلید رمزگشایی آن را دارد می تواند شناسایی شود.

این توضیح فنی است:

“برای نشان دادن، در مورد خاص که GPT دارای یک دسته از توکن‌های ممکن بود که به همان اندازه محتمل بود، شما به سادگی می‌توانید هر توکنی را انتخاب کنید که g را به حداکثر برساند. این انتخاب برای کسی که کلید را نمی‌دانست به طور یکنواخت تصادفی به نظر می‌رسد، اما کسی که کلید را می‌دانست بعداً می‌تواند g را روی همه n گرم جمع کند و ببیند که به طور غیرعادی بزرگ است.»

<. div data-total="14" id="SEJ_300x250_UnderPost_7_i-parent" class="content-unit sss2_sllo_o mmh-90-wrap">

واترمارکینگ یک راه حل برای حفظ حریم خصوصی است

من بحث‌هایی را در رسانه‌های اجتماعی دیده‌ام که در آن برخی از افراد پیشنهاد کردند که OpenAI می‌تواند رکوردی از هر خروجی‌ای که تولید می‌کند نگه دارد و از آن برای شناسایی استفاده کند.

اسکات آرونسون تأیید می‌کند که OpenAI می‌تواند این کار را انجام دهد، اما انجام این کار باعث ایجاد مشکل در حفظ حریم خصوصی می‌شود. استثنای احتمالی مربوط به وضعیت اجرای قانون است که او توضیح بیشتری در مورد آن نداد.

نحوه تشخیص واترمارک ChatGPT یا GPT

یک چیز جالب که به نظر می رسد هنوز به خوبی شناخته نشده است این است که اسکات آرونسون خاطرنشان کرد که راهی برای شکست دادن واترمارک وجود دارد.

او نگفت که ممکن است شکست واترمارک انجام شود، او گفت که می‌توان آن را شکست داد.

“اکنون، با تلاش کافی می توان همه اینها را شکست داد.

به عنوان مثال، اگر از هوش مصنوعی دیگری برای بازنویسی خروجی GPT استفاده کرده باشید – خوب، ما قادر به تشخیص آن نخواهیم بود.”

به نظر می‌رسد که می‌توان واترمارکینگ را شکست داد، حداقل از نوامبر که عبارات فوق بیان شد.

هیچ نشانه ای مبنی بر اینکه واترمارکینگ در حال حاضر در حال استفاده است وجود ندارد. اما هنگامی که استفاده می شود، ممکن است ناشناخته باشد که آیا این حفره بسته شده است.

نقل قول

پست وبلاگ اسکات آرونسون اینجا را بخوانید.

تصویر ویژه توسط Shutterstock/RealPeopleStudio

مقالات مرتبط
پاسخ دهید

آدرس ایمیل شما منتشر نخواهد شد.قسمتهای مورد نیاز علامت گذاری شده اند *