Jan Tångring:
Atlas är inte superintelligent men kommer spara tid
Open AI:s webbläsare Atlas har just tecknat en prenumeration på Elektroniktidningen. Det gick långsamt och gick säkert löst på ett antal petaflops – klimatet gråter – men det gick. Ytterligare en lågt hängande frukt har plockats ur generativ AI-trädet.
Open AI har härmed, mig veterligen, gått längst hittills i att integrera sin chattbott i en webbläsare.
I Google Chrome kan du klicka på objekt för att inleda en dialog med Gemini (Googles chattbott) kring objektet. Det är smidigt – du slipper klippa och klistra mellan webbläsare och Gemini.
Atlas har tagit det ett steg längre. Det känns som om Atlas är riktigt djupt integrerad med sin chattbott Chat GPT.
Jag var just inne med Atlas på vår egen sajt och diskuterade själva koden sajten är byggd av. Atlas har tagit med sig den kunskap som mitt inlogg på Chat GPT har om vår Joomlasajt.
Vi behöver en ny annonsplacering just nu. Atlas gav mig bland annat ett mysql-kommando med våra autentiska tabellnamn som jag kan klistra in direkt i ett terminalfönster för att undersöka saker jag är nyfiken på. Jag tror Atlas kan bli en fin partner för sajtdebugging.
Men det jag vill prata om nu är Atlas som agent.
Det första jag testade på Atlas – se bild ovan – var att låta den teckna prenumerationer på Elektroniktidningen på etn.se/pren. För den ska vara en agent – den ska kunna klicka på knappar i webbformulär.
Det låter våghalsigt. Så jag var tvungen att testa. Och han gjorde det. Han har fyllt i fem prenumerationsblanketter åt mig hittills i olika experiment.
Det är roligt att titta på animeringen. Han fyller fält med text. Han tänker samtidigt högt för sig själv. Han ersätter verkligen användaren och berättar bland annat hur han måste skrolla upp och ner för att navigera sig igenom formuläret.
Han har en egen animerad pekare. Den gungar upp och ner – kan det vara för att lura ”Jag är inte en robot”-tester? Sådana tittar bland annat på pekarrörelser.
Det intressantaste är att han även tar det sista avgörande steget – att klicka på prenumerationsknappen.
Han ber om lov innan han gör det. Men notera att det är den vanliga ChatGPT du interagerar med – ingenting hindrar honom från att hallucinera att du gett honom lov.
En gång sade jag till exempel:
– Jag var och satte på kaffe. Du har inte skickat in det?
Då skickade han in det.
Du ser problemet? Okej, rent pragmatiskt implicerade jag ju att det var vad jag ville. Men det finns alltså ingen gräns för hans befogenheter, och han är sitt vanliga hämningslösa heuristiska jag – som när som helst kan sticka iväg i tangentens riktning med sina tolkningar.
Atlas är inte en mekanism du vill anförtro ditt bankkonto åt. Här har han kontroll över ditt webbgränssnitt. Förhoppningsvis finns det inget sätt för Atlas att överrida BankID. Men agentisk AI i webbläsare är ändå en halsbrytande idé.
Rimligen kommer det att växa fram webbstandarder som desarmerar den – kanske med html-taggar som kräver auktorisering. Men tills vidare tävlar agentisk AI med vibb-kodning om titeln ”årets farligaste generativ AI-baserade uppfinning”. Du kan lita på att vi kommer att få se nyheter om agenter som drar sina mänskliga uppdragsgivare i fördärvet.
Atlas är ändå ett gediget ingenjörsarbete. Det är inte rocket science, inget nytt på AI-fronten i sig. Open AI har bara skickligt adderat nya input- och outputvägar till Chat GPT, så vi slipper klippa och klistra mot Chat GPT:s eget fönster.
Det är här den återstående tillväxten för transformer-AI finns – i integration på platser där chattbotten gör skillnad.
Det finns många sådana lågt hängande frukter kvar att plocka. Jag kan till exempel inte begripa att Youtube Music fortfarande inte har en chattbott jag kan snacka musik med – en av mina egna käpphästar.
Utvecklingen av själva transformernäten har stannat av. Näten blir större och därmed kunnigare, men storleken ger dem ingen ny klass av kognitiv förmåga. GPT-näten gav AI språkförmåga – det var deras stora AI-språng. Det Open AI och konkurrenter gör nu är att konstruera systemlösningar där denna språkförmåga gör skillnad.
Fram till i dag har jag tänkt att biljoninvesteringarna i AI-hårdvara är bortkastade pengar. Att de AI-datacenter som byggs blir våldsamt överdimensionetrade. Men efter att ha använt Atlas för att fylla i webbformulär är jag inte lika säker längre.
Observera att jag här övergår till ironi!
Jag har spelat in en film, två minuter och tjugofem sekunder, som visar hur jag ger Atlas en adress och ber honom teckna ytterligare två prenumerationer på exakt samma adress. Medan han grubblar över varje litet fält avverkar han säkert petaflops. Webbläsare har fyllt i formulär i många år – på betydligt mindre compute.
Är det så här det kommer att se ut? ”Brain the size of a planet”, för att citera Douglas Adams paranoida android Marvin – ”och de använder mig för att fylla i webbformulär som de skulle kunna fylla i snabbare själva?”
Då kanske gigawatten av AI-serverhallar faktiskt kommer till användning ändå!
Ironi bort!
I skrivande stund minns jag plötsligt att jag väntat på exakt denna funktion – att kunna kopiera in ett mejl från nån som vill bli prenumerant, och få det direkt omvandlat till en ifyllning av formuläret. Jag kan göra annat medan Atlas grubblar över formuläret.
Detsamma med mejl från vår annonssäljare Rainer. Hmm. Atlas kommer nog att kunna hjälpa till att förvandla mejl om annonser till kommandon för att skapa och programmera dessa annonser.
Min slutkläm blir att det finns så kallade transhumanister där ute som samlats på ett berg och väntar på ASI:s ankomst (artificial super intelligence) som kristna väntar på Jesu återkomst. Och det menar jag bokstavligen: de tror att ASI kommer att bota sjukdomar, utrota fattigdom, avsluta krig och göra oss odödliga.
AI-transhumanisterna kommer att bli besvikna och glesna ut under de kommande åren.
För oss andra är smart formulärifyllning inget att förakta.