Lehet -e ai emberfeletti? A legjobb játékos bot hibái kétségeket vetnek fel

A kutatások azt mutatják, hogy a Go játék szuperintelligenciája is érzékeny. Tudja meg, hogy az AI rendszerek, mint például a Katago küzdenek a támadások ellen, és hogy ez milyen hatással lehet az AI rendszerek fejlesztésére.
(Symbolbild/natur.wiki)

Lehet -e ai emberfeletti? A legjobb játékos bot hibái kétségeket vetnek fel

<ábra class = "ábra">

a Túlzott mesterséges intelligencia (KI) Növekszik. A világban-ami azt mutatja, hogy az ilyen fölény törékeny lehet.

"A cikk nagy kérdőjelet hagy arról, hogy miként lehet elérni az ambiciózus célt a valós világ robusztus AI ügynökeinek felépítéséhez, amelyben az emberek bízhatnak"-mondja Huan Zhang, az Illinoisi Egyetemen Urbana-Champay számítógépes tudós. Stephen Casper, a Cambridge -i Massachusetts Technológiai Intézet számítógépes tudósa hozzáteszi: "Eddig a legerősebb bizonyítékot szolgáltatta arra, hogy nehéz a fejlett modelleket olyan megbízhatóan megvalósítani, amennyit csak akar."

Annak elemzése, hogy júniusban 1 and has not yet been peer-reviewed uses the AI ​​​​systems Entries Hely, amelynek célja a rendszerek hibáinak kísértése , legyen az kutatási célokra vagy rosszindulatú célokra. Például bizonyos bejegyzések „Jailbreaks” chatbotokat káros információk kiadásával adhatnak ki, amelyeket általában el kell szüntetni.

Amikor a GO, két játékos felváltva a fekete -fehér köveket helyezi egy rácsra, hogy körülveszi és rögzítse a másik játékos kövét. 2022-ben a kutatók a

Katago kiaknázása

Ez egyedülálló dolog volt, vagy ez a munka rámutatott a katago alapvető gyengeségére, és a bővítésben más AI rendszerekre, látszólag emberfeletti képességekkel? Ennek kivizsgálására Adam Gleave, a Kaliforniai Berkeley-i nonprofit kutatási szervezet ügyvezető igazgatója, a 2022-es Papers társszerzője, a Far AI ügyvezetõ igazgatója, a Far AI ügyvezetõ igazgatója. Három lehetőség tesztelése, hogy megvédje a GO-KIS-t az ilyen támadások ellen.

Az első védekezés az volt, amelyet a Katago fejlesztői már a 2022 -es támadások után használtak: Katago példák a támadásokban részt vevő játékhelyzetekről, és hagyta, hogy megtanulja, hogyan kell játszani e helyzetek ellen. Ez hasonló ehhez, mivel általában megtanította a menetet. A legfrissebb cikkek szerzői azonban úgy találták, hogy egy versengő ajánlat megtanulta legyőzni a Katago frissített változatát, és az idő 91 % -át nyerte.

A második védelmi stratégia, amelyet a Kleave csapat megpróbált, iteratív volt: a Katago verziójának kiképzésére az Alklarielle botok ellen, majd a támadókat a frissített Katago ellen és így tovább kilenc fordulóban. De ez sem vezetett a Katago legyőzhetetlen verziójához. A támadók továbbra is gyengeségeket találtak, és az utolsó támadás Katago az idő 81 % -át legyőzte.

Mint harmadik védelmi stratégia, a kutatók egy új Go-Playing AI rendszert képeztek a semmiből. A Katago a Convolutional Neural Network (CNN) néven ismert számítási modellen alapul. A kutatók azt gyanították, hogy a CNN -ek túl sokat koncentrálhatnak a helyi részletekre, és figyelmen kívül hagyhatják a globális mintákat. Ezért építettek egy GO-lejátszót, amelynek alternatívája van. (Vit). De az ellenfél botja új támadást talált, amely az idő 78 % -át segítette neki a Vit rendszer ellen.

gyenge ellenfél

Mindezen esetekben a versengő botok-bár képesek voltak legyőzni Katago-t és más vezető go-playing rendszereket, hogy felfedezzék a rejtett gyengeségeket más AI-kben, és ne legyenek sokoldalú stratégák. "Az ellenfelek még mindig meglehetősen gyengék - elég könnyen legyőztük őket" - mondja Gleave.

És mivel az emberek képesek használni a versenytárs botok taktikáját a vezető GO-KI-k legyőzésére, van-e értelme ezeket a rendszereket emberfeletti nevezni? "Ez egy nagyszerű kérdés, amellyel határozottan birkóztam" - mondja Gleave. "Elkezdtük mondani, hogy" tipikusan emberfeletti ". David Wu, a New York-i számítógépes tudós, aki először fejlesztette ki a Katagót, azt mondja, hogy az erős go-KIS "átlagosan emberfeletti", de nem "a legrosszabb esetekben".

A

Gleave azt mondja, hogy az eredmények messzemenő hatással lehetnek az AI rendszerekre, beleértve a nagy nyelvű modellek, amelyek olyan chatbotokon alapulnak, mint például a chatgpt . "Az AI legfontosabb megállapítása az, hogy ezeket a gyenge pontokat nehéz lesz megszüntetni" - mondja Gleave. "Ha nem tudjuk megoldani a problémát egy olyan egyszerű területen, mint a GO, akkor úgy tűnik, hogy a közeljövőben kevés kilátás nyílik a hasonló problémák megoldására, mint például a Chatt -i jailbreak."

A

mit jelent az eredmények az emberi készségeket túllépő AI létrehozásának lehetősége szempontjából, kevésbé egyértelmű, mondja Zhang. "Bár ez felületesen azt jelzi, hogy az emberek továbbra is fontos kognitív előnyöket tarthatnak az AI-vel szemben", mondja "," Úgy gondolom, hogy a döntő tudás az, hogy Még nem értjük teljesen az AI rendszereket, amelyeket ma építettünk .

  1. Tseng, T., McLean, E., Pelrine, K., Wang, T. T. és Gleave, A. Preprint az arxiv https://doi.org/10.48550/arxiv.2406.12843 (2024).

  2. Wang, T. T. et al. Preprint az arxiv-nál ">"> https://doi.org/10.48550/arxiv.2211.00241 .

  3. Letöltés