تقدم Google علامات مائية غير مرئية للنصوص التي تم إنشاؤها

تقدم Google علامات مائية غير مرئية للنصوص التي تم إنشاؤها
قام الباحثون في Google DeepMind في لندن بتطوير "علامة مائية" لتحديد النص الذي تم إنشاؤه بواسطة الذكاء الاصطناعي (AI)-وقد تم استخدام هذا بالفعل في ملايين مستخدمي Chatbot.
العلامة المائية التي تم نشرها في 23 أكتوبر في مجلة Nature 1 لا يتم إنشاؤها من أجل AI. Aaronson ، عالم الكمبيوتر في جامعة تكساس في أوستن ، الذي عمل على علامات المياه في Openai حتى أغسطس ، منشئي Chatt ، ومقرها في سان فرانسيسكو ، كاليفورنيا
أصبح اكتشاف النصوص التي تم إنشاؤها من الذكاء الاصطناعي ذات أهمية متزايدة لأن لديك حلًا محتملًا لمشاكل أخبار مزيفة "https://www.nature.com/articles/D41586-03507-3" Data-Track-category = "Body Text Link"> الاحتيال الأكاديمي . بالإضافة إلى ذلك ، يمكن أن يساعد في .
في دراسة مكثفة ، تم تقييم مستخدمي نموذج اللغة الكبير في Google Gemini (LLM) في 20 مليون إجابة نصية مائية معادلة مع النصوص غير المميزة. يقول فورونج هوانغ ، عالم الكمبيوتر في جامعة ماريلاند في كوليدج بارك: "أنا متحمس لرؤية أن Google تتخذ هذه الخطوة لمجتمع التكنولوجيا". وأضاف زاخار شومايلوف ، عالم الكمبيوتر في جامعة كامبريدج ، المملكة المتحدة: "من المحتمل أن تحتوي معظم الأدوات التجارية على علامات مائية في المستقبل القريب".
اختيار الكلمات
يصعب تطبيق علامة مائية على النص أكثر من الصور ، لأن اختيار الكلمات هو المتغير الوحيد الذي يمكن تغييره. تغييرات نصية مائية تسمى العلامة المائية من DeepMind والتي تختارها النموذج ، بطريقة سرية ولكن صيغة يمكن تسجيلها باستخدام مفتاح تشفير. بالمقارنة مع الأساليب الأخرى ، فإن العلامة المائية DeepMind أسهل قليلاً في التعرف عليها ، ولا يؤخر التطبيق موضع النص. يقول شومايلوف ، وهو موظف سابق وشقيق لأحد مؤلفي الدراسة: "يبدو أنه يتجاوز مفاهيم المنافسين في العلامات المائية LLMS".
تم الكشف عن الأداة أيضًا حتى يتمكن المطورون من تطبيق العلامة المائية الخاصة بهم على نماذجهم. يقول Pushmeet Kohli ، عالم الكمبيوتر في DeepMind: "نأمل أن يأخذ مطورون آخرون من نماذج الذكاء الاصطناعي هذا ويدمجونها في أنظمتهم الخاصة". تحتفظ Google بسرها الرئيسي بحيث لا يمكن للمستخدمين استخدام أدوات الكشف لتحديد النص المريح لنموذج Gemini.
الحكومات . ومع ذلك ، هناك العديد من المشكلات ، بما في ذلك التزام المطورين باستخدام العلامات المائية وتنسيق مناهجهم. في بداية هذا العام ، أظهر الباحثون في التكنولوجيا الفيدرالية Zurich أن
تستخدم خوارزمية أخذ عينات النص السينتيد مفتاح تشفير لتعيين قيم عشوائية لكل رمز ممكن. تتناسب تذاكر المرشحين مع احتمال توزيعها وتصنيفها في "البطولة". هناك تقارن الخوارزمية القيم في سلسلة من الدورات الواحدة-واحد من ك. تجعل هذه الطريقة المتطورة من السهل اكتشاف العلامة المائية ، حيث يتم تطبيق نفس رمز التشفير على النص الذي تم إنشاؤه للبحث عن القيم العالية التي تشير إلى "الفوز". هذا يمكن أن يجعل المسافة أكثر صعوبة. يمكن اعتبار الجولات العديدة في البطولة مزيجًا من القفل ، حيث تمثل كل جولة رقمًا مختلفًا يجب حله لإلغاء قفل العلامة المائية أو إزالة العلامة المائية. وتضيف: "هذه الآلية تجعل من الصعب للغاية التنظيف ، أو تنشيط العلامة المائية أو تطوير العلامة المائية". بالنسبة للنصوص التي تضم حوالي 200 رمز ، أظهر المؤلفون أنه لا يزال بإمكانهم التعرف على العلامة المائية ، حتى لو تم استخدام LLM ثانية لإعادة كتابة النص. مع نصوص أقصر ، تكون العلامة المائية أقل قوة. لم يدرس الباحثون مدى مقاومة العلامة المائية للمحاولات المتعمدة لإزالتها. يقول إيف-ألكسندر دي مونتجوي ، عالم الكمبيوتر في إمبراطوري كوليدج لندن ، إن مقاومة العلامات المائية ضد مثل هذه الهجمات هي "سؤال سياسي ضخم". "في سياق أمان الذكاء الاصطناعى ، من غير الواضح إلى أي مدى يوفر هذا الحماية". Kohli أن تساعد العلامة المائية في البداية في دعم الاستخدام المنتقل جيدًا لـ LLMs. ويضيف: "كانت الفلسفة التوجيهية هي أننا أردنا تطوير أداة يمكن تحسينها من قبل المجتمع". dathri ، S. et al. Nature 634 ، 818–823 (2024). بطولة الرمز المميز
يعتمد نهج