AITEK.no

Det siste innen AI, teknologi og fremtiden

KUNSTIG INTELLIGENS

Fra språkmodeller til autonome AI-agenter: En guide for næringslivet

Forståelse av AI-agenter kan virke kompleks, men er avgjørende for å utnytte kunstig intelligens i næringslivet. Denne artikkelen bryter ned konseptet fra grunnleggende språkmodeller til avanserte, autonome AI-agenter.

Begrepet «AI-agenter» dukker stadig oftere opp i diskusjoner om kunstig intelligens, men forklaringene er ofte enten for tekniske eller for enkle. For de som bruker AI-verktøy regelmessig, men mangler teknisk bakgrunn, er det viktig å forstå hva AI-agenter er og hvordan de påvirker produktiviteten.

Store språkmodeller (LLM-er): Grunnlaget

På det mest grunnleggende nivået finner vi store språkmodeller (LLM-er) som ChatGPT, Google Gemini og Claude. Disse er utmerkede til å generere og redigere tekst. En LLM fungerer ved å ta et menneskelig innspill, for eksempel en forespørsel om å utforme en e-post, og produserer et svar basert på treningsdataene sine. Imidlertid har LLM-er to sentrale begrensninger: De har begrenset kunnskap om proprietær informasjon, som personlige data eller interne bedriftsdata, og de er passive – de venter på et spørsmål før de svarer.

AI-arbeidsflyter: Menneskestyrt automatisering

AI-arbeidsflyter bygger videre på LLM-er ved å la dem følge forhåndsdefinerte stier. Forestill deg at en LLM får beskjed om å søke i kalenderen din hver gang du spør om en personlig hendelse. Dette gjør at den kan hente relevant informasjon og gi et korrekt svar. Men hvis du deretter spør om været for samme dag, vil LLM-en feile, fordi den forhåndsdefinerte stien kun inkluderer kalendersøk. En AI-arbeidsflyt kan ha mange trinn og integrere ulike verktøy, som å hente nyhetsartikler fra Google Sheets, oppsummere dem med Perplexity, og deretter utforme innlegg for sosiale medier med Claude. Nøkkelen her er at mennesker definerer og kontrollerer disse stiene.
Et relatert konsept er Henteforsterket generering (RAG), som er en type AI-arbeidsflyt der AI-modeller slår opp informasjon fra eksterne kilder før de svarer.

AI-agenter: Autonom beslutningstaking

Den store forskjellen mellom en AI-arbeidsflyt og en AI-agent er hvem som tar beslutningene. I en AI-arbeidsflyt er det mennesket som er beslutningstakeren. I en AI-agent overtar LLM-en denne rollen. En AI-agent må kunne to ting:

  • Resonnere: Tenke over den mest effektive tilnærmingen for å nå et mål. For eksempel, hvordan best samle nyhetsartikler – ved å kopiere og lime inn, eller ved å samle lenker og bruke et annet verktøy for å hente data?
  • Handle: Bruke verktøy for å utføre oppgaver basert på resonnementet. Dette kan innebære å bruke Google Sheets for lenker, Perplexity for oppsummering, og Claude for tekstforfatting.

En vanlig konfigurasjon for AI-agenter er «REACT»-rammeverket, som står for «Reason» (resonnere) og «Act» (handle). En tredje viktig egenskap ved AI-agenter er deres evne til å iterere autonomt. Der et menneske manuelt ville justert en prompt for å forbedre et resultat, kan en AI-agent selv legge til en annen LLM for å kritisere sin egen produksjon og gjenta prosessen til kriteriene er møtt. Et eksempel er en AI-visjonsagent som, når den søker etter «skiløper», først resonnerer hva en skiløper ser ut som, og deretter handler ved å analysere videoklipp for å identifisere, indeksere og returnere relevante klipp – alt uten menneskelig inngripen i beslutningsprosessen.

Kort sagt, mens LLM-er er passive og arbeidsflyter er menneskestyrte, er AI-agenter autonome systemer der LLM-en er beslutningstakeren, i stand til å resonnere, handle og iterere for å nå et gitt mål.