Geschreven door Maarten de Borst

Geschreven door Maarten de Borst

28.03.2025

Research Agents kunnen de kosten voor onderzoek met 95% verlagen

Wie de ontwikkeling van generatieve AI ook maar een beetje volgt, weet dat de veranderingen elkaar in vrij rap tempo opvolgen . Maar laten we eerlijk zijn; een écht grote doorbraak hebben we sinds de lancering van OpenAI’s GPT4 niet meer gezien. Waar GPT 3.5 (het eerste model waarmee het publiek kennismaakte) houterig was wat betreft teksten en ronduit belabberd in rekenkundige opgaven, was GPT4 eindelijk die all-round digitale assistent . En die lancering kwam medio maart ’23, ondertussen alweer ruim twee jaar geleden.

Natuurlijk; de reguliere modellen van OpenAI en haar concurrenten zijn sneller, beter en efficiënter geworden, er zijn applicaties uitgebracht waar wij op rekenkundig vlak nog een puntje aan kunnen zuigen, de omni-modellen kunnen zoals de naam al zegt álles in één (rekenen, tekst verwerken, afbeeldingen maken etc.) en de redeneermodellen geven betere antwoorden doordat ze eerst ‘nadenken’ voordat ze een antwoord geven. Maar toch; ondanks al dit moois heb ik het echte wow-effect van AI alweer even niet gevoeld. Tot nu.

Deep Research: onderzoeksassistent in zakformaat

In de afgelopen weken hebben zowel ChatGPT (OpenAI), Perplexity en Gemini (Google)
hun Deep Research functionaliteit uitgebracht. De functionaliteiten zijn allemaal nog in beta dus er wordt nog aan gesleuteld, maar de eerste indruk is ronduit indrukwekkend.

Deep Research is een AI functionaliteit die onderzoek doet op het web, razendsnel verschillende bronnen raadpleegt om vervolgens samen te vatten in één overzicht. Nu zal je misschien denken; dit doen ChatGPT, Copilot en al die andere AI-tools met hun Search-functionaliteit toch al? Ja. Maar toch is dit écht anders. Dit is namelijk de eerste agent waarmee we kennis maken.

AI Agents

2025 is pas net begonnen, maar AI Agents zijn nu al dé hype van het jaar. Begin maart maakte OpenAI nog bekend dat het tot wel $20.000 per maand voor haar AI agents kon gaan vragen. Waarschijnlijk eerder een goede marketingstunt dan een serieuze business case, maar het geeft iets aan wat betreft de verwachtingen rondom agents. Waar AI’s nu nog taakgebaseerd zijn, zijn AI agents doelgebaseerd. En dat maakt een groot verschil. 

Een vaak aangehaald voorbeeld als het om agents gaat is het boeken van een vakantie. Steeds meer mensen maken nu thuis gebruik van AI om hun vakanties te plannen: je wil met de kinderen twee weken naar Toscane, dus vraag je ChatGPT voor een overzicht van autoverhuurders, een overzicht van kindvriendelijke campings 50km buiten Florence, een route tussen stadjes waarbij meer te zien is dan alleen asfalt etc. De AI is veel behulpzamer dan simpelweg Googlen, maar al die taken moet je alsnog zelf bedenken, om vervolgens zelf uit te voeren.

Waar je eigenlijk naar op zoek bent is een vlucht voor vier personen, een huurauto voor onder de 1000 euro, een afwisselende route en veel campings. En dat is nu precies wat een agent doet; je geeft de AI een doel (‘regel een vakantie voor vier etc.’) en de AI bedenkt vervolgens zélf welke taken hierbij horen. Na vijf minuten kom je terug bij je laptop en zie je een reisvoorstel liggen zoals je deze ook van een (goede) reisorganisatie kunt verwachten; voorstel voor vluchten en huurauto’s, overzicht van de overnachtingen en routebeschrijving. Het enige dat je nog hoeft te doen is over het reisbescheiden heen te lopen en de creditcard uit de portemonnee te halen.

Analyse van de paymentsmarkt

Deep Research is net zo’n agent, maar dan voor onderzoek. Je geeft de AI een onderzoeksopdracht (het doel) en vervolgens gaat ie zélf bedenken welke taken en subtaken hierbij horen om het web af te struinen, informatie te interpreteren, bronnen op te slaan en  vervolgens een onderzoeksrapport op te stellen.

Stel dat we een financiële analyse willen maken over de paymentsmarkt, over betaalverwerker Adyen in het bijzonder. We zijn vrij onbekend met de markt, dus moeten een alles omvattende analyse hebben om uberhaupt iets te kunnen zeggen over Adyen, de paymentsmarkt, eventuele innovaties etc.

Dit is natuurlijk een onsamenhangend verhaal, of in AI-taal gezegd; een slechte prompt. Garbage in, garbage out. Om deze reden heb ik een GPT gemaakt om mijn prompt te optimaliseren voor Deep Research; deze heb ik heel toepasselijk ‘Promptmaster voor Deep Research’ genoemd.

Bron: ChatGPT

Mijn GPT heeft de prompt vervolgens als volgt geoptimaliseerd:

Je bent een topconsultant, vergelijkbaar met een senior McKinsey-analist. Laten we een diepgaande analyse maken van het veranderende landschap van de betalingsindustrie en de strategische implicaties voor Adyen:

  1. Onderzoek eerst wat de gemiddelde jaarlijkse groei van de wereldwijde betaalvolumes was in de afgelopen 20 jaar.
  2. Geef vervolgens een overzicht van de belangrijkste technologieën en betaalmethoden die deze groei hebben aangedreven (zoals creditcards, digitale wallets, bankoverschrijvingen, buy-now-pay-later, enz.).
  3. Maak daarna een prognose voor de verwachte groei in betaalvolumes voor het komende decennium, rekening houdend met factoren zoals de opkomst van AI-gedreven commerce, veranderende regelgeving en consumentengedrag.
  4. Onderzoek ten slotte welke betaalmethoden, technologieën of ecosystemen het best gepositioneerd zijn om die toekomstige vraag op te vangen — en rangschik deze op basis van relevantie en strategische waarde voor Adyen.

Dit is een veel betere formulering; deze prompt heeft duidelijke rollen, heldere afbakening en ook vier duidelijke stappen om achtereenvolgens af te werken. Voordat we deze opdracht invoeren, is het goed om eens te bedenken hoe lang je met deze analyse bezig zou zijn als je géén gebruik zou maken van AI; oftewel met ‘ouderwets’ bronnenonderzoek; een onderzoeksplan maken, openbronnenonderzoek’, rapporten doorlezen, terugbladeren etc. Ikzelf schat in dat je hier minimaal een dag voor nodig hebt, waarschijnlijk eerder enkele dagen. 

Ik heb deze vraag ook even langs vrienden in private equity en strategy consulting gehaald die vaker met dergelijke vraagstukken te maken hebben; die schatten eerder enkele dagen tot weken. Het voornaamste probleem van onderzoek doen – zo werd mij verteld – is dat het ontzettend inefficient is; zo’n 90% van alles dat je tot je neemt is nauwelijks tot niet relevant voor het beantwoorden van de onderzoeksvragen, maar daar kom je vaak pas achter als je 100% gelezen hebt. Kortom: onderzoek doen is ontzettend tijdrovend en tijd is geld.

Van dagen naar minuten

Dan het alternatief: deze onderzoeksvraag beantwoorden d.m.v. een onderzoeksagent. Ik ben fan van Perplexity en heb deze exercitie daarom met mijn favoriete AI-zoekmachine gedaan, ChatGPT en Google Gemini hebben soortgelijke Deep Research functionaliteiten. Om meteen maar met de deur in huis te vallen: met AI kost deze analyse je geen uren, dagen of weken meer, maar slechts minuten. Je bent bijna nog langer bezig met het optimaliseren van de prompt, dan met het wachten op de output. En die output mag er zijn: een net onderzoeksrapport van 8 pagina’s, inclusief net logootje linksboven. Zie screenshot hieronder of gehele rapport onder deze link. In zo’n drie minuten tijd (!!!) heeft de AI een research-plan geschreven, 44 zoekslagen gemaakt en 170 bronnen gelezen; van webpagina’s tot PDF’s, van grafieken tot afbeeldingen en alles er tussenin. De AI doet precies wat wij zouden doen, maar dan sneller, efficiënter en beter. De eerste keer dat ik op ‘download’ klikte, had ik voor het eerst weer dat wow-gevoel dat ik ook had toen ik voor het eerst kennismaakte met ChatGPT.

Bron: Perplexity

De agent laat zien wat ie doet: de stappen zijn te volgen en bronnen te verifiëren

Het produceren van een rapport van 8 pagina’s in zo’n drie minuten tijd is op zichzelf al iets indrukwekkends, maar wat Deep Research misschien nog wel indrukwekkender maakt is dat de AI’s je meeneemt in z’n denkstappen. De agent maakt namelijk géén gebruik van de reguliere omni-modellen, maar van zogenaamde redeneermodellen. Deze modellen ‘denken’ eerst na voordat ze een antwoord geven, waarbij ze vertellen wat ze aan het doen zijn: ‘ik begin met het onderzoeken van…’ om vervolgens zoekwoorden te formuleren om de eerste (sub)vraagte kunnen beantwoorden: ‘wereldwijde betaalvolumes groei laatste 20 jaar’ of ‘payment industry annual growth data KcKinsey report’. Kortom: alle stappen van de AI agent zijn na te lopen en daarmee te verifiëren.

Bron: Perplexity

Naast de acties die je dus zelf kunt controleren (‘snijdt dit wel hout?’), laat de AI je óók zien welke bronnen geraadpleegd worden. Het ‘enige’ dat de AI namelijk doet, is websites, rapporten en andere bronnen doorlezen, alleen dan vele malen sneller dan mensen dit zouden kunnen. Tijdens de eerste zoekslag zien we dat de AI de website van onder meer de Vereniging van Effectenbezitters de Nederlandse betaalvereneiging en McKinsey leest op zoek naar antwoord op onze onderzoeksvraag. 

De AI is zo’n drie tot vier minuten ‘aan het werk’ en in de tussentijd kan je koffie pakken en de agent z’n gang laten gaan, maar meekijken is eigenlijk nog veel leuker. Sterker nog, het is oprecht leerzaam: je ziet ‘m ‘nadenken’, hij formuleert zoekvragen (wat ie beter kan dan een gemiddeld persoon), leest bronnen, pakt hierop door door, om vervolgens te constateren dat er geen bruikbare informatie in staat om de (sub)vraag te kunnen beantwoorden. Het klinkt misschien enigszins gek, maar zulke momenten geven zelfs zo nu en dan voldoening: als je er zélf achter had moeten komen dat er geen bruikbare informatie in stond, had het je minstens een kwartier gekost. Nu weet je dat binnen een seconde! 

Het resultaat: kwalitatief sterk rapport met enkele ruwe randjes 

Zoals gezegd, na zo’n drie tot vier minuten hebben we een onderzoeksrapport, met bronvermelding en al. En dat rapport is van vrij hoog niveau; alle informatie is middels de bronvermelding te controleren, dus dat gaat goed. Ook de bronnen zélf zijn van hoog niveau: géén halfbakken nieuwssites, maar rapporten van strategie consultants (BCG, McKinsey etc.), Big4 (PWC, EY) en andere gerenommeerde partijen. Het mooie is ook dat ie zo nu en dan ook grafieken en tabellen laat zien, wat nog meer het gevoel geeft dat je naar een écht rapport zit te kijken (hij neemt visualisaties niet mee in het rapport, maar zijn wel apart te exporteren, zie onderstaand). 

Zijn er dan helemaal geen minpuntjes? Jawel; zo nu en dan zie je ‘m de mist in gaan (hallicunaties), al vind ik dat verwaarloosbaar omdat de bronvermelding erbij staat. Vervelender vind ik dat AI’s nog altijd moeite hebben met het concept tijd, zo ook Deep Research: ik heb gevraagd naar cijfers van de afgelopen twintig jaar. Soms gaat dit goed en geeft ie cijfers tot en met 2024, maar zo nu en dan gaat ie tot 2023 of zelfs 2022. Vraag je nadrukkelijk om recente informatie, dan kan het zomaar dat ie met artikelen van negen maanden oud aan komt zetten. Niet onoverkomelijk, wel irritant als de meest recente informatie (bijvoorbeeld nieuwsredacties?) belangrijk is. Gelukkig zijn al deze modellen in beta, dus zullen deze kinderziektes vast snel verholpen worden. 

Bron: Perplexity

Het leuke aan Perplexity is dat de AI afsluit met follow-up questions: ‘hoe heeft de opkomst van digitale wallets de betaalvolumes beïnvloed?’ of ‘in hoeverre heeft AI-gedreven commerce al invloed gehad op betaalvolumes?’ Het grote voordeel van Perplexity Pro ten opzichte van ChatGPT Plus: bij Perplexity krijg je honderd Deep Research opdrachten per dag, waar je er bij ChatGPT tien per maand krijgt. Er moet wel bijgezegd worden dat ChatGPT nog een stuk grondiger is dan Perplexity; méér zoekslagen en méér bronnen, maar daarmee ook een langere wachttijd (tot dertig minuten). 

Bron: Perplexity

 

Conclusie: de kosten kunnen 95% omlaag. (Uiteindelijk)

Na lange tijd en heel veel functionaliteiten en tooltjes getest te hebben, heb ik eindelijk weer het gevoel: wow, dat we hier nú al zijn! In eerste instantie dacht ik direct terug hoe handig dit geweest zou tijdens mijn scriptieperiode (voor ideëen uiteraard!), vervolgens aan alle beroepsgroepen die hier direct of indirect gebruik van kunnen maken. En dat zijn er veel. Heel veel: van redacteurs bij nieuwsmedia, marktonderzoekers en financieel analisten tot strategie- en managementconsultants, sales- en accountmanagers, OSINT-onderzoekers in de opsporing en M&A adviseurs. Een groot gedeelte van de kenniswerkers heeft te maken met bronnenonderzoek en neemt op wekelijkse of zelfs dagelijkse basis grote rapporten door om bij te blijven. Dn daarmee is Deep Research absoluut een gamechanger. 

De vraag die resteert: waar gaat dit heen? Laat ik een gewaagde voorspelling doen: Deep Research kan de kosten van (openbronnen)onderzoek en bijbehorende rapportages met 95% reduceren:

  • Is deze vorm van onderzoek je werk, dan ben je in staat veel sneller en effectiever te werk te gaan en daarmee veel meer werk te verzetten. Dit zal uiteindelijk een prijsdempend effect hebben; onderzoek en onderzoeksrapportages in het bijzonder worden meer een commodity;
  • Besteed je dit werk normaliter uit, zoals in M&A en Private Equity het geval is, dan kost het produceren van dergelijke rapportages minder tijd en daarmee geld. Bovendien ben je als professional in staat zélf een eerste, grondige analyse te maken.

Dit is de theorie, de vraag is natuurlijk op welke termijn dit in de praktijk gaat gebeuren. Voor de bank zal een stempel van Perplexity of ChatGPT nog altijd minder waard zijn dan een van Deloitte. 

  

Neem contact met ons op​

Nieuwe technologie kan overweldigend overkomen. Om orde in de chaos te scheppen en zin van onzin te scheiden, geloven wij in persoonlijk contact. Daarom levert Numbers uitsluitend maatwerk. Neem gerust contact met ons op om te bespreken wat wij voor jouw organisatie kunnen betekenen.

Recente artikelen

Onze laatste artikelen over Artificial Intelligence | Crypto & Blockchain

 

Data bevragen met AI

Sinds de lancering van ChatGPT haalt de tool bijna dagelijks het nieuws. Hoewel deze ontwikkeling ontzettend hard gaat, zijn er nog genoeg juridische en ethische vraagstukken rondom de inzet van AI’s als ChatGPT. Concrete voorbeelden hiervan bespreken we in dit artikel.

Lees verder »

Documenten bevragen met AI

Documenten met betrekking tot regelgeving zijn vaak enorm. Of het nu gaat om risicorapportages, nalevingsverslagen of interne audits, het doornemen van deze documenten is meestal een tijdrovende bezigheid. Voor veel financials is het een terugkerende uitdaging om in deze rapporten snel de belangrijkste informatie te vinden. De inhoud is vaak noodzakelijk, maar soms lastig om in één keer overzichtelijk te krijgen zonder elk detail door te spitten.

Lees verder »

Numbers is een specialistisch advieskantoor in hartje Amsterdam. Wij adviseren klanten binnen de overheid en financiële sector over de toepassingen van AI, crypto- en blockchaintechnologie