Môže byť AI nadľudský? Defekty v najlepšom hráči robotnom vyvolávajú pochybnosti

Forschung zeigt, dass selbst Superintelligenzen im Go-Spiel anfällig sind. Erfahren Sie, wie KI-Systeme wie KataGo gegen Angriffe kämpfen und welche Auswirkungen dies auf die Entwicklung von KI-Systemen haben könnte.
Výskum ukazuje, že aj superintelligencia v hre Go je náchylná. Zistite, ako systémy AI ako Katago bojujú proti útokom a aké účinky by to mohlo mať na vývoj systémov AI. (Symbolbild/natur.wiki)

Môže byť AI nadľudský? Defekty v najlepšom hráči robotnom vyvolávajú pochybnosti

hovorí o Nadmerné umelé inteligencie (KI) Zvýšenie výsledkov výskumu však odhalené slabé stránky v jednom z najúspešnejších systémov AI, ktoré majú čo najlepšie prebiehať. Svet, ktorý ukazuje, že takáto nadradenosť môže byť krehká.

„Príspevok zanecháva veľkú otázku o tom, ako možno dosiahnuť ambiciózny cieľ na vybudovanie robustných agentov AI v skutočnom svete, ktorým môžu ľudia veriť,“ hovorí Huan Zhang, počítačový vedec na University of Illinois Urbana-Champay. Stephen Casper, počítačový vedec v Massachusetts Institute of Technology v Cambridge, dodáva: „Doteraz poskytuje niektoré z najsilnejších dôkazov o tom, že je ťažké implementovať pokročilé modely tak spoľahlivo, ako chcete.“

Analýza, že v júni 1 a ešte nebol peer-reviewed, používa položky systémov AI Miesto, ktoré sa snažia pokúšať systémy na chyby , či už ide o výskumné účely alebo pre škodlivé účely. Napríklad niektoré záznamy môžu „chatboty útek z väzení“ vydaním škodlivých informácií, ktoré by ste mali normálne potlačiť.

Keď go, dvaja hráči striedavo umiestnia čiernobiele kamene na mriežku, aby obklopovali a zachytili kamene druhého hráča. V roku 2022 vedci informovali o 1 .

Prvá obrana bola tá, ktorú vývojári Katago už použili po útokoch na rok 2022: Katago Príklady herných situácií, ktoré boli zapojené do útokov, a nechali ho hrať, aby sa naučili, ako hrať proti týmto situáciám. Je to podobné tomu, ako sa to všeobecne učil. Autori najnovších novín však zistili, že kontradiktórna ponuka sa naučila poraziť túto aktualizovanú verziu Katago a získala 91 % času.

Druhá obranná stratégia, ktorú sa tím Gleave snažil, bola iteratívna: trénovať verziu Katago proti kontradiktómom robotov, potom školiť útočníkov proti aktualizovaným Katago a tak ďalej na deväť kôl. To však neviedlo k neporaziteľnej verzii Katago. Útočníci naďalej hľadali slabosti, pričom posledný útok porazil Katago 81 % času.

Ako tretia obranná stratégia vedci od nuly vyškolili nový systém AI. Katago je založený na výpočtovom modeli známeho ako konvolučná neurónová sieť (CNN). Vedci mali podozrenie, že CNN sa môžu príliš sústrediť na miestne detaily a prehliadnuť globálne vzorce. Preto postavili hráča Go s alternatívou

Slabý súper

Vo všetkých týchto prípadoch kontradiktórne roboti-hoci dokázali poraziť Katago a ďalšie vedúce systémy GO-Hra, vyškolili sa na objavenie skrytých slabostí v iných AI a nebyli by byť všestrannými stratégmi. „Oponenti sú stále dosť slabí - porazili sme ich pomerne ľahko,“ hovorí Gleave.

A keďže ľudia sú schopní použiť taktiku kontradiktórnych robotov na porážku vedúcich go-kis, má zmysel nazvať tieto systémy nadľudským? „Je to skvelá otázka, s ktorou som určite zápasil,“ hovorí Gleave. „Začali sme hovoriť„ zvyčajne nadľudské “.“ David Wu, počítačový vedec v New Yorku, ktorý prvýkrát vyvinul Katago, hovorí, že silné go-kis sú „v priemere nadľudské“, ale nie „v najhorších prípadoch“.

Gleave hovorí, že výsledky by mohli mať ďalekosiahle účinky na systémy AI, vrátane Veľké jazykové modely, ktoré sú založené na chatbotoch, ako je chatgpt . „Najdôležitejším nálezom pre AI je, že tieto slabé body bude ťažké odstrániť,“ hovorí Gleave. „Ak nedokážeme vyriešiť problém v jednoduchej oblasti, ako je napríklad Go, zdá sa, že v blízkej budúcnosti riešenie podobných problémov, ako sú útek z väzenia v Chatte, existuje len malá vyhliadka.“

Čo znamenajú výsledky pre možnosť vytvorenia AI, ktorá rozsiahle presahuje ľudské zručnosti, je menej jasné, hovorí Zhang. „Aj keď to povrchne naznačuje, že ľudia si môžu stále udržiavať dôležité kognitívne výhody oproti AI,“ hovorí, „myslím si, že kľúčovou znalosťou je, že Zatiaľ nerozumieme systémom AI, ktoré dnes zostavujeme .

  1. Tseng, T., McLean, E., Pelrine, K., Wang, T. T. & Gleave, A. Pretlač na Arxiv https://doi.org/10.48550/arxiv.2406.12843 (2024).

  2. wang, T. T. et al. predprint na ARXIV https://doi.org/10.48550/arxiv.2211.00241 .

  3. Stiahnutie zdrojov