Om den tekniska frontlinjen, om att använda de lösningar som är mogna, och om behovet av ett precist språk kring teknik.
Jag hann aldrig göra det många andra gjorde veckan före jul eller i mellandagarna: Att skriva sin personliga sammanfattning av 2024. Men under helgerna fanns tid att fundera vidare (men långt i från klart) i tre delvis överlappande tankespår om artificiell intelligens som var med mig under stora delar av förra året.
I första hand är det ett försök att för mig själv strukturera upp några av de saker jag grunnade på under hösten. Men eftersom det är tankar som jag gärna diskuterar med andra så publicerar jag dem här.
Först en liten tillbakablick #
Jag ser stora likheter mellan var AI i allmänhet och språkmodeller i synnerhet befinner sig just nu och hur jag brukar beskriva att mitt jobb som teknikjournalist förändrades från det att jag klev innanför dörrarna på Ny Tekniks redaktion som praktikant hösten 1999 och framåt: Ett växande fokus på teknikens konsekvenser och tillämpningar.
Det som lockade mig till journalisthögskolan var en nyfikenhet på teknik och naturvetenskap i väldigt bred bemärkelse, och min tanke var att man som teknik- eller vetenskapsreporter fick ägna hela sitt yrkesliv åt att lära om nya saker. Och det var där min journalistiska karriär startade: Med bevakning av det breda genomslaget för både internet och mobiltelefoni. Först handlade det om de tekniska byggstenarna. Om GPRS, WAP, bredband och så vidare. Om infrastrukturbyggen och entreprenörers bild av vart den utvecklingen skulle leda oss.
Ett exempel från mina första år som journalist: Jag satt bland annat på ett elskåp på Söder, inte långt från adressen där AI Sweden har sitt kontor idag, med min bärbara dator och kopplade upp mig till ett öppet trådlöst nätverk för att visa för läsarna att det nu minsann gick att skicka e-post och surfa på www även utanför kontoret. Under några år publicerade vi en årlig kartläggning över alla surfzoner som fanns i Sverige, men till slut blev en sådan helhetsbild varken möjlig att sammanställa eller relevant att ta del av. Öppna wifin fanns på för många ställen, och där det saknades kunde man koppla upp sig via mobilen istället.
Men det tog inte många år innan användningen och konsekvenserna av teknikutvecklingen blev viktigare. Det märktes bland annat genom vinjetten Teknik som förändrar i Ny Teknik. Vi hade redan IT Insikt där vi beskrev den “råa” tekniken, men vi kände med tiden att den inte räckte till. Det behövdes något som fokuserade på användning och konsekvenser.
Det som just nu händer med artificiell intelligens påminner väldigt mycket om förflyttningen som skedde då. Men det finns också skillnader. Den kanske allra viktigaste är hur mycket bredare diskussionerna om teknikens användning är. Då var det fackpressen som skrev. Idag syns nyheter om nya modeller i morgontidningen.
Tanke 1: Ständigt(?) expanderande förmågor #
Min första tanke om AI är kort: Precis som många andra tycker jag att det är fascinerande att följa utvecklingen av inte minst de stora språkmodellerna och hur de snabbt får nya förmågor.
Strax före jul kunde vi på AI Sweden bjuda in våra partner till ett event med Geoffrey Hinton. När han fick frågan om han kunde förutspå den här utvecklingen tidigt i sin karriär svarade han:
I kind of foresaw it in the '70s, I just didn't know if it would ever happen. What I've been amazed by is how fast it's happened in the last few years. I thought I wouldn't live to see it.
Just nu är det stort fokus på huruvida vi nått vägs ände med dagens sätt att bygga språkmodeller och om det behövs något nytt för nästa stora kliv eller inte. Den mest teknikintresserade delen av min hjärna tycker att det här är en diskussion (och en flod av modellsläpp) som är intressant att följa. Och den har relevans på många olika sätt, inte minst för en framåtriktad diskussion om hur kraftfull AI till slut kommer att bli och hur den kraften ska hanteras. Både på samhällsnivå och i organisationer som använder AI.
Men här och nu, för den dagliga användningen av AI spelar det mindre roll. Det finns fortfarande oerhört mycket värde och stora möjligheter att hämta med de språkmodeller och andra typer av AI som vi har till hands idag.
Så nyfikenheten och tankarna om varthän utvecklingen är på väg lämnar jag därhän för nu. Vi kan nöja oss med att den fortsätter och att mycket kommer att hända under 2025.
Om du däremot vill få en känsla för hur snabbt saker och ting utvecklas rekommenderar jag Simon Willisons genomgång av de viktigaste tekniska framstegen under 2024. De är många och de är stora. Och de påverkar i allra högsta grad förutsättningarna för användningen.
Läs också Arvind Narayanan och Sayash Kapoors Is AI progress slowing down?, som tar sig an frågan om utvecklingen av stora språkmodeller är på väg in i en vägg eller inte.
Tanke 2: Att använda AI #
Min andra tanke är betydligt längre och handlar om användningen av artificiell intelligens. I januari 2015 skrev jag en artikel i IVA-aktuellt, med en ingress som lika gärna skulle kunna vara formulerad idag:
"Den snabba teknikutvecklingen inom big data håller på att förändra forskningen i grunden. Både hur forskning bedrivs och hur pålitliga vetenskapliga resultat produceras. Kraftfulla datorer och bättre mjukvara skapar nya möjligheter att samla in, bearbeta, hantera och analysera data."
Den enda ändring som skulle behöva göras 2025 är att byta "big data" mot "artificiell intelligens". Men det finns två viktiga skillnader mellan 2015 och 2025:
- Den underliggande tekniken har hunnit bli många gånger kraftfullare...
- ...och den blir tillgänglig för allt fler.
Acceleration bortom forskning #
Under det senaste året har den där tio år gamla artikeln dykt upp i huvudet många gånger – men inte bara i sammanhang som handlar om forskning även om några omskrivna exempel går att hämta just därifrån. Det mest uppenbara är kanske Nobelpriset i kemi 2024, till Demis Hassabis och John Jumper för arbetet med AlphaFold och AI som ett verktyg för att räkna på proteiner. På angränsande tema var Aidan Toner-Rodgers working paper Artificial Intelligence, Scientific Discovery, and Product Innovation ett av de mest intressanta jag läste under hösten:
AI-assisted researchers discover 44% more materials, resulting in a 39% increase in patent filings and a 17% rise in downstream product innovation. These compounds possess more novel chemical structures and lead to more radical inventions.
Men verktygen och möjligheterna blir i rask takt tillgängliga för allt fler. I sin årskrönika har Simon Willison ett av de mest talande räkneexempel jag sett:
Here’s a fun napkin calculation: how much would it cost to generate short descriptions of every one of the 68,000 photos in my personal photo library using Google’s Gemini 1.5 Flash 8B, their cheapest model? Each photo would need 260 input tokens and around 100 output tokens. [...] That’s a total cost of $1.68 to process 68,000 images. That’s so absurdly cheap I had to run the numbers three times to confirm I got it right.
Ett annat tydligt exempel är ett av projekten inom ramen för AI for Impact som koordineras av kollegor på AI Sweden. Där fick Sjöräddningssällskapet hjälp att bättre förstå motorerna i sina båtar, för att kunna slippa oplanerade stillestånd i sin flotta:
Ännu fler exempel går att hitta på Ny Tekniks årliga 33-lista, där de hetaste svenska unga teknikbolagen tar plats. Jag har varit med och gjort listan sedan starten, och när vi i maj 2018 presenterade den elfte upplagan svarade jag på några frågor om juryarbetet. En av dem handlade om eventuella trender på listan. Mitt svar skiljde sig från när samma fråga ställts tidigare år:
Det har aldrig varit så många företag som har pratat om en och samma grundläggande teknik. Dataanalys kommer in i så otroligt många branscher och har så många olika tillämpningar.
När fjolårets lista presenterades fick jag en liknande fråga på scenen. Svaret hade ett liknande tema, men med en twist: Med kraftfullare verktyg tar sig svenska (och internationella) entreprenörer sig an allt större och viktigare utmaningar. Många av bolagen på listan 2024 utvecklar produkter och tjänster som bland annat kan minska klimatpåverkan eller förbättra i sjukvården. Och för många av dem är artificiell intelligens en central komponent.
Till slut blir den tekniska förmågan tillräckligt pålitlig #
Och det är ju så här det är, i teknikgenombrott efter teknikgenombrott. Först utvecklas tekniken, sen blir den enklare att använda, billigare och tillgänglig för fler, och sen börjar den påverka och förändra på allvar. Det var sant för wifi och det är sant för artificiell intelligens.
Ett avgörande steg i den utvecklingen är klivet från teknisk förmåga till pålitlig teknisk förmåga. I en annan text, AI companies are pivoting from creating gods to building products. Good., skriver Arvind Narayanan och Sayash Kapoor om skillnaden på “capability” och “reliability”:
We see capability and reliability as somewhat orthogonal. If an AI system performs a task correctly 90% of the time, we can say that it is capable of performing the task but it cannot do so reliably.
Ethan Mollick skrev hösten 2023 ett välciterat blogginlägg om den hackiga frontlinjen för AI, Centaurs and Cyborgs on the Jagged Frontier. Mollicks resonemang handlar om att förstå var AI kan göra skillnad och var tekniken ännu inte är mogen och att det inte är uppenbart var den gränsen går:
Imagine a fortress wall, with some towers and battlements jutting out into the countryside, while others fold back towards the center of the castle. That wall is the capability of AI, and the further from the center, the harder the task. Everything inside the wall can be done by the AI, everything outside is hard for the AI to do. The problem is that the wall is invisible, so some tasks that might logically seem to be the same distance away from the center, and therefore equally difficult – say, writing a sonnet and an exactly 50 word poem – are actually on different sides of the wall. The AI is great at the sonnet, but, because of how it conceptualizes the world in tokens, rather than words, it consistently produces poems of more or less than 50 words. Similarly, some unexpected tasks (like idea generation) are easy for AIs while other tasks that seem to be easy for machines to do (like basic math) are challenges for LLMs.
Så vad vi behöver göra är två saker: Att utforska vad AI har förmåga att göra, och att hitta sätt att göra de förmågorna robusta nog så att vi kan lita på att resultatet blir det vi förväntar oss.
Och här blir den snabba utvecklingen av de underliggande tekniska förmågorna en utmaning. Arvind Narayanan igen:
The furious debate about whether there is a capability slowdown is ironic, because the link between capability increases and the real-world usefulness of AI is extremely weak. [...] From the perspective of AI impacts, what matters far more than capability improvement at this point is actually building products that let people do useful things with existing capabilities.
Att ta det som fungerar och maximera nyttan #
I mitten av november arrangerades Kraftsamling för AI i kommuner och civilsamhälles nationella konferens. Det var en heldag om lärdomarna från två års arbete inom ramen för Kraftsamling för AI i kommuner och civilsamhälle, med tydligt fokus på vad som krävs för att komma vidare med användningen av artificiell intelligens. Många diskussioner, både på scenen och kring borden, handlade om behovet av skalning. Att ta det som fungerar och maximera nyttan. Men också behov av juridiskt mod och samverkan. Det finns teknik som fungerar, men som ännu inte implementeras brett. Exempel är lösningar för att minska fallolyckor. Och det finns lösningar som högst troligen skulle kunna skapa stort värde, men där juridisk osäkerhet åtminstone för stunden fungerar som en broms.
Det här är resonemang som jag hört i många sammanhang under 2024. Vad vi som samhälle och land behöver göra är att ta den teknik som bevisats fungera och se till att den får bredast möjliga användning. Utmaningarna mänskligheten står inför är många och stora, och vi har teknik som hjälper oss med (åtminstone) dellösningar.
Vägen dit går bland annat via kunskap om tekniken. Och den behövs i alla yrkeskategorier. De som är AI-experter är inte nödvändigtvis de som är bäst på att förstår hur den används.
Simon Willison igen:
A drum I’ve been banging for a while is that LLMs are power-user tools—they’re chainsaws disguised as kitchen knives. They look deceptively simple to use—how hard can it be to type messages to a chatbot?—but in reality you need a huge depth of both understanding and experience to make the most of them and avoid their many pitfalls. If anything, this problem got worse in 2024. We’ve built computer systems you can talk to in human language, that will answer your questions and usually get them right! ... depending on the question, and how you ask it, and whether it’s accurately reflected in the undocumented and secret training set. [...] What are we doing about this? Not much. Most users are thrown in at the deep end. The default LLM chat UI is like taking brand new computer users, dropping them into a Linux terminal and expecting them to figure it all out.
Tanke 3: Behov av en spetsigare terminologi #
Och så den sista, återigen korta, tanken som också både är en brygga och en viktig skiljelinje mellan de två första, och dessutom en påminnelse till både mig själv och andra: Var så tydlig som möjligt med vad jag/du lägger i begreppet “AI”.
Allt för ofta blandas teknikutvecklings- och användningsperspektiven ihop, vilket skapar problem. Det är skillnad på vilka nya förmågor som de senaste modellerna från de största labben fått och vad som går att göra, allt billigare, med de modeller som redan är brett tillgängliga. Olika typer av tillämpningar, som bygger på olika typer av teknik, kommer med sina specifika utmaningar var gäller exempelvis integritet och energiförbrukning, men också med olika typer av värde.
Förmåga och genomförbarhet existerar längst ett kontinuum – men vägen från det förra till det senare är inte nödvändigtvis spikrak och när det är otydligt vad vi menar med AI, både i form av typ av AI och mognadsgrad, blir samtalet för svårt att föra. Oavsett om vi pratar om utmaningar eller möjligheter. 2019 skrev jag en text här på bloggen om att Digitaliseringen inte finns, inte med stort D i bestämd form singular. Däremot finns många olika typer av digitalisering, i olika organisationer och sammanhang, och med olika typer av digital teknik.
På samma sätt är det med artificiell intelligens.
Tre tankar som blir tre förväntningar för 2025 #
Så vad mynnar detta ut i, precis i början av året? En förväntan om fler tekniska genombrott, om många värdeskapande tillämpningar med den teknik som fungerar, och ett offentligt samtal om AI handlar där det blir tydligt när det handlar om det förra och när det handlar om det senare.
Ser fram emot att fortsätta följa, beskriva och diskutera den här utvecklingen under året som kommer!