هل يمكن أن تكون الذكاء الاصطناعي خارقا؟ تثير العيوب في أفضل لاعب الشكوك

Forschung zeigt, dass selbst Superintelligenzen im Go-Spiel anfällig sind. Erfahren Sie, wie KI-Systeme wie KataGo gegen Angriffe kämpfen und welche Auswirkungen dies auf die Entwicklung von KI-Systemen haben könnte.
تظهر الأبحاث أنه حتى الإلغاء في لعبة GO أمر عرضة. اكتشف كيف تحارب أنظمة الذكاء الاصطناعى مثل كاتاغو ضد الهجمات وما هي الآثار التي يمكن أن تحدثها على تطوير أنظمة الذكاء الاصطناعي. (Symbolbild/natur.wiki)

هل يمكن أن تكون الذكاء الاصطناعي خارقا؟ تثير العيوب في أفضل لاعب الشكوك

<الشكل class = "الشكل"> Technology/ilya-sutske-openai-superintelligence.html" data-track "data-label = "https://www.nytimes.com/2024/19/technology/ilya-sutske-openai-superintelligence.html" TRACH-TRACH CATEGORY = "Body Text Link" في العالم-الذي يظهر أن هذا التفوق يمكن أن يكون هشًا يقول هوان تشانغ ، عالم الكمبيوتر في جامعة إلينوي أوربانا تشامباي ، "تترك الورقة علامة استفهام كبيرة حول كيفية تحقيق الهدف الطموح لبناء وكلاء ذكاء الذكاء الاصطناعى القويين في العالم الحقيقي الذي يمكن للناس أن يثقوا به". ويضيف ستيفن كاسبر ، عالم الكمبيوتر في معهد ماساتشوستس للتكنولوجيا في كامبريدج: "حتى الآن تقدم بعضًا من أقوى الأدلة على أنه من الصعب تنفيذ نماذج متقدمة كما تريد".

التحليل الذي في يونيو "انقر فوق" data- made = "annor-link" label = "انتقل إلى" مرجع "مسار البيانات =" المصادر "> 1 ولم يتم مراجعته بعد مراجعته من إدخالات أنظمة الذكاء الاصطناعي يهدف إلى إغراء الأنظمة بالأخطاء ، سواء كان ذلك لأغراض البحث أو لأغراض ضارة. على سبيل المثال ، يمكن لبعض الإدخالات أن "Jailbreaks" chatbots من خلال إصدار معلومات ضارة يجب عليك قمعها عادة.

عندما يضع اللاعبان ، يضع اثنان من الأحجار بالأبيض والأسود على شبكة لتطويق والتقاط أحجار اللاعب الآخر. في عام 2022 ، أبلغ الباحثون عن كان الدفاع الأول هو الذي استخدمه مطورو كاتاجو بالفعل بعد هجمات 2022: أمثلة كاتاجو على مواقف اللعبة التي شاركت في الهجمات ودعها تلعب لمعرفة كيفية اللعب ضد هذه المواقف. هذا مشابه لذلك لأنه يدرس بشكل عام الذهاب. ومع ذلك ، وجد مؤلفو أحدث الأوراق أن عرضًا عدوانيًا تعلموا التغلب على هذا الإصدار المحدث من Katago وفازوا بنسبة 91 ٪ من الوقت.

كانت استراتيجية الدفاع الثانية التي حاول فريق Gleave تكرارًا: لتدريب نسخة من Katago ضد Beversarielle Bots ، ثم تدريب المهاجمين على Katago المحدثة وما إلى ذلك في تسع جولات. لكن هذا لم يؤدي إلى نسخة لا تقهر من كاتاغو أيضًا. واصل المهاجمون إيجاد نقاط ضعف ، حيث هزم كاتاجو الأخير 81 ٪ من الوقت.

كاستراتيجية دفاعية ثالثة ، قام الباحثون بتدريب نظام الذكاء الاصطناعي الجديد للعب من البداية. يعتمد Katago على نموذج حساب يُعرف باسم الشبكة العصبية التلافيفية (CNN). يشتبه الباحثون في أن CNNs يمكن أن تركز أكثر من اللازم على التفاصيل المحلية وتغفل الأنماط العالمية. لذلك ، قاموا ببناء مشغل Go مع بديل

وبما أن الناس قادرون على استخدام تكتيكات الروبوتات العدائية لهزيمة Go-kis الرائدة ، فهل من المنطقي تسمية هذه الأنظمة Superhuman؟ يقول جليف: "هذا سؤال رائع تصارع معه بالتأكيد". "لقد بدأنا نقول" عادةً ما يكون خارقًا ". يقول ديفيد وو ، عالم الكمبيوتر في نيويورك ، الذي طور كاتاجو لأول مرة ، إن GO-KIS القوية "في المتوسط ​​خارق" ، ولكن ليس "في أسوأ الحالات".

يقول

glaeve إن النتائج يمكن أن يكون لها تأثيرات بعيدة المدى على أنظمة الذكاء الاصطناعي ، بما في ذلك نماذج اللغة الكبيرة التي تستند إلى chatbots مثل chatgpt . يقول جليف: "إن أهم اكتشاف لمنظمة العفو الدولية هو أن نقاط الضعف هذه سيكون من الصعب القضاء عليها". "إذا لم نتمكن من حل المشكلة في منطقة بسيطة مثل GO ، فيبدو أن هناك احتمالًا ضئيلًا في المستقبل القريب لحل مشاكل مماثلة مثل Jailbreaks في Chatt."

يقول تشانغ إن ما تعنيه النتائج لإمكانية إنشاء الذكاء الاصطناعي الذي يتجاوز المهارات الإنسانية على نطاق واسع أقل وضوحًا. يقول: "على الرغم من أن هذا يشير بشكل سطحي إلى أن الناس قد لا يزالون يحتفظون بمزايا إدراكية مهمة على الذكاء الاصطناعى ، إلا أن المعرفة الحاسمة هي أن

<قسم حاوية بيانات DIV = "المراجع">
  1. Tseng ، T. ، McLean ، E. ، Pelrine ، K. ، Wang ، T. Data-Track-Label = "https://doi.org/10.48550/arxiv.2406.12843"> https://doi.org/10.48550/arxiv.2406.12843 (2024).

  2. Wang ، T. T. et al. preprint at Arxiv https://doi.org/10.48550/arxiv.2211.00241 .