Ali je lahko AI nadčloveški? Napake v najvišjem igralcu sprožajo dvome

Raziskave kažejo, da je celo nadrejena v igri GO dovzetna. Ugotovite, kako se sistemi AI, kot je Katago, borijo proti napadom in kakšne učinke bi to lahko imelo na razvoj sistemov AI.
(Symbolbild/natur.wiki)

Ali je lahko AI nadčloveški? Napake v najvišjem igralcu sprožajo dvome

govori o Technology/ilya-sutske-openai-superilligence.html" Data-Track "Data-Label = "https://www.nytimes.com/2024/19/Technology/ilya-sutske-openai-superintelgence.html" Data-Track-kategorija = "Body besedilna povezava"> Prekomerna umetna inteligenca (KI), ki se znajdejo v enem izmed najbolj uspešnih sistemov AI-A, so se v raziskavah povečevali. V svetu kaže, da je taka superiornost lahko krhka

"Papir pušča veliko vprašanj o tem, kako je mogoče doseči ambiciozen cilj za gradnjo močnih agentov AI iz resničnega sveta, ki jim ljudje lahko zaupajo," pravi Huan Zhang, računalniški znanstvenik z Univerze v Illinoisu v Urbani-Champay. Stephen Casper, računalniški znanstvenik na Massachusetts Institute of Technology v Cambridgeu, dodaja: "Do zdaj je zagotavljal nekaj najmočnejših dokazov, da je težko izvajati napredne modele tako zanesljivo, kot želite."

Analiza, ki je v juniju 1 in še ni bil revidiran, ki uporablja vnose AI sistemov mesto, ki si prizadeva za skušnjavo sistemov do napak , naj bo to za raziskovalne namene ali za zlonamerne namene. Na primer, nekateri vnosi lahko 'Japbreaks' klepetajo z izdajo škodljivih informacij, ki bi jih morali običajno zatreti.

Ko gre, dva igralca izmenično postavljata črno -bele kamne na omrežje, da obkrožata in zajameta kamne drugega igralca. Leta 2022 so raziskovalci poročali o 2 , Adversarielle bote za preizkušanje treh možnosti, za obrambo Go-kis pred takšnimi napadi 1

Prva obramba je bila tista, ki so jo razvijalci Katago že uporabili po napadih leta 2022: Katago Primeri iger, ki so bili vpleteni v napade, in pustijo, da se igra, da bi se naučila igrati proti tem situacijam. To je podobno tistemu, kot se je na splošno naučil. Vendar so avtorji najnovejših dokumentov ugotovili, da se je nasprotna ponudba naučila premagati to posodobljeno različico Katago in osvojila 91 % časa.

Druga obrambna strategija, ki jo je preizkusila ekipa Gleave, je bila iterativna: usposabljanje različice Katago proti Adtersarielle Botsu, nato usposabljanje napadalcev proti posodobljenim Katagom in tako naprej za devet krogov. Toda to tudi ni privedlo do nepremagljive različice Kataga. Napadalci so še naprej našli slabosti, zadnji napad je Katago premagal 81 % časa.

Kot tretja obrambna strategija so raziskovalci iz nič usposobili nov sistem AI, ki igra AI. Katago temelji na modelu izračuna, znan kot konvolucijska nevronska mreža (CNN). Raziskovalci so sumili, da bi se CNN lahko preveč osredotočili na lokalne podrobnosti in spregledali globalne vzorce. Therefore, they built a go player with an alternative Neural Network called Vision Transformator (VIT). Toda njen nasprotni bot je našla nov napad, ki mu je pomagal osvojiti 78 % časa proti sistemu VIT.

šibek nasprotnik

V vseh teh primerih so nasprotni boti-čeprav so lahko premagali Katago in druge vodilne sisteme, ki so bili usposobljeni za odkrivanje skritih slabosti v drugih AI, in ne bi bili vsestranski strategi. "Nasprotniki so še vedno precej šibki - premagali smo jih precej enostavno," pravi Gleave.

In ker ljudje lahko uporabljajo taktiko nasprotnih botov, da premagajo vodilne kise, ali je smiselno, da te sisteme imenujejo nadčloveški? "To je veliko vprašanje, s katerim sem se zagotovo boril," pravi Gleave. "Začeli smo reči" običajno nadčloveško "." David Wu, računalniški znanstvenik v New Yorku, ki je prvič razvil Katago, pravi, da so močni go-kis "v povprečju nadčloveški", vendar ne "v najslabših primerih".

Gleave says that the results could have far-reaching effects on AI systems, including the veliki jezikovni modeli, ki temeljijo na klepetih, kot je chatgpt . "Najpomembnejša ugotovitev za AI je, da bo te šibke točke težko odpraviti," pravi Gleave. "Če težave ne moremo rešiti na preprostem območju, kot je Go, se zdi, da je v bližnji prihodnosti reševanja podobnih težav, kot so Jailbreaks v Chattu, malo možnosti."

Kaj pomenijo rezultati za možnost ustvarjanja AI, ki obsežno presega človeške veščine, je manj jasno, pravi Zhang. "Čeprav to površno kaže, da lahko ljudje še vedno ohranjajo pomembne kognitivne prednosti nad AI," pravi, "mislim, da je ključno znanje, da je še ne razumemo v celoti sistemov AI, ki jih gradimo danes . "

    >
  1. tseng, T., McLean, E., Pelrine, K., Wang, T. T. & Gleave, A. Preprint na arxiv https://doi.org/10.48550/arxiv.2406.12843 (2024).

  2. Wang, T. T. et al. predprint pri arxivu