هل يمكن أن تكون الذكاء الاصطناعي خارقا؟ تثير العيوب في أفضل لاعب الشكوك

هل يمكن أن تكون الذكاء الاصطناعي خارقا؟ تثير العيوب في أفضل لاعب الشكوك
التحليل الذي في يونيو "انقر فوق" data- made = "annor-link" label = "انتقل إلى" مرجع "مسار البيانات =" المصادر "> 1 ولم يتم مراجعته بعد مراجعته من إدخالات أنظمة الذكاء الاصطناعي يهدف إلى إغراء الأنظمة بالأخطاء ، سواء كان ذلك لأغراض البحث أو لأغراض ضارة. على سبيل المثال ، يمكن لبعض الإدخالات أن "Jailbreaks" chatbots من خلال إصدار معلومات ضارة يجب عليك قمعها عادة.
عندما يضع اللاعبان ، يضع اثنان من الأحجار بالأبيض والأسود على شبكة لتطويق والتقاط أحجار اللاعب الآخر. في عام 2022 ، أبلغ الباحثون عن كان الدفاع الأول هو الذي استخدمه مطورو كاتاجو بالفعل بعد هجمات 2022: أمثلة كاتاجو على مواقف اللعبة التي شاركت في الهجمات ودعها تلعب لمعرفة كيفية اللعب ضد هذه المواقف. هذا مشابه لذلك لأنه يدرس بشكل عام الذهاب. ومع ذلك ، وجد مؤلفو أحدث الأوراق أن عرضًا عدوانيًا تعلموا التغلب على هذا الإصدار المحدث من Katago وفازوا بنسبة 91 ٪ من الوقت.
كانت استراتيجية الدفاع الثانية التي حاول فريق Gleave تكرارًا: لتدريب نسخة من Katago ضد Beversarielle Bots ، ثم تدريب المهاجمين على Katago المحدثة وما إلى ذلك في تسع جولات. لكن هذا لم يؤدي إلى نسخة لا تقهر من كاتاغو أيضًا. واصل المهاجمون إيجاد نقاط ضعف ، حيث هزم كاتاجو الأخير 81 ٪ من الوقت.
كاستراتيجية دفاعية ثالثة ، قام الباحثون بتدريب نظام الذكاء الاصطناعي الجديد للعب من البداية. يعتمد Katago على نموذج حساب يُعرف باسم الشبكة العصبية التلافيفية (CNN). يشتبه الباحثون في أن CNNs يمكن أن تركز أكثر من اللازم على التفاصيل المحلية وتغفل الأنماط العالمية. لذلك ، قاموا ببناء مشغل Go مع بديل
وبما أن الناس قادرون على استخدام تكتيكات الروبوتات العدائية لهزيمة Go-kis الرائدة ، فهل من المنطقي تسمية هذه الأنظمة Superhuman؟ يقول جليف: "هذا سؤال رائع تصارع معه بالتأكيد". "لقد بدأنا نقول" عادةً ما يكون خارقًا ". يقول ديفيد وو ، عالم الكمبيوتر في نيويورك ، الذي طور كاتاجو لأول مرة ، إن GO-KIS القوية "في المتوسط خارق" ، ولكن ليس "في أسوأ الحالات". glaeve إن النتائج يمكن أن يكون لها تأثيرات بعيدة المدى على أنظمة الذكاء الاصطناعي ، بما في ذلك نماذج اللغة الكبيرة التي تستند إلى chatbots مثل chatgpt . يقول جليف: "إن أهم اكتشاف لمنظمة العفو الدولية هو أن نقاط الضعف هذه سيكون من الصعب القضاء عليها". "إذا لم نتمكن من حل المشكلة في منطقة بسيطة مثل GO ، فيبدو أن هناك احتمالًا ضئيلًا في المستقبل القريب لحل مشاكل مماثلة مثل Jailbreaks في Chatt." Tseng ، T. ، McLean ، E. ، Pelrine ، K. ، Wang ، T. Data-Track-Label = "https://doi.org/10.48550/arxiv.2406.12843"> https://doi.org/10.48550/arxiv.2406.12843 (2024).