Ny studie: 45 procent av alla AI-svar innehöll minst ett allvarligt fel
700 miljoner människor. Så många använder ChatGPT varje vecka, enligt deras egna siffror. En ganska svindlande siffra, med tanke på att bolaget inte fanns för bara några år sedan.
Bakom antalet döljer sig också ett helt nytt beteende för hur människor tar del av information. Istället för att googla – eller läsa nyhetsartiklar, för den delen – väljer en snabbt växande skara människor att ställa frågor och få blixtsnabba svar. Bland gymnasieelever i Sverige är det nästan hälften som redan nu säger att de väljer ChatGPT istället för Google när de söker information.
Det är förståeligt. Jämfört med att söka, klicka på länkar, scrolla och leta efter information är en chatt som levererar väldigt specifika och snabba svar naturligtvis ett attraktivt alternativ.
Men – och här finns ett men – det gäller ju bara om svaren går att lita på.
I ny studie från BBC och Europeiska public service-nätverket EBU visar att AI-assistenter fortfarande inte är det. I alla fall inte när det gäller att hantera nyheter. EBU har testat fyra av de största AI-modellerna – inklusive ChatGPT, Microsofts Copilot och Googles Gemini – på tusentals nyhetsrelaterade frågor. Man bad dem förklara vad som hänt, ge sammanhang, svara på politik och världshändelser.
Och resultatet? Svaren lät bra. Men de höll inte.
- 45 procent av alla AI-svar innehöll minst ett allvarligt fel.
- I nästan var tredje svar fanns det problem med källorna.
- Var femte svar innehöll rena faktafel.
Nu är ju EBU inte någon oberoende part, och det finns vissa frågetecken kring metoden. Men resultaten ligger i linje med tidigare granskningar av det här slaget.
Samtidigt visar både OpenAI:s och andras siffror att ganska få använder ChatGPT just för att hitta nyheter. Betydligt vanligare är jobbrelaterade frågor, att skriva och bearbeta texter, men också råd kring relationer. Men sannolikt kommer allt fler att vända sig till AI-assistenter även för nyheter, i takt med att de tar större plats i våra liv.
Aftonbladets ägare Schibsted har ett avtal med OpenAIsom äger ChatGPT. Det ger oss möjlighet att testa tekniken, men också att ställa krav. Just därför är det extra viktigt att vi granskar hur de här verktygen fungerar, inte minst när det gäller nyheter. Vi måste kunna både samarbeta och vara kritiska.
Samtidigt kan vi inte blunda för att det här beteendet växer kraftigt. Vi på Aftonbladet har tagit fram vår egen chattbot, Hej Aftonbladet, som precis som ChatGPT och dess konkurrenter ger dig möjlighet att ställa frågor och få svar om nyheter. För alla som föredrag att slippa scrolla och läsa hela artiklar. Och ni är många, Hej har redan svarat på över 6 miljoner (!) frågor.
Skillnaden på Hej Aftonbladet och andra AI-assistenter är att svaren bygger på en databas av vår verifierade journalistik. Och våra medarbetare – alltså människor – jobbar kontinuerligt med att kvalitetssäkra och utvärdera svaren.
AI-tekniken är imponerande. Men ibland är det skönt att veta att det fortfarande finns människor som dubbelkollar fakta.
Så att du slipper.