Uusi agenttityökalu ilmestyy joka viikko. Ongelma ei ole se, ettet ehdi kokeilla niitä kaikkia. Ongelma on se, jos et näe samaa rakennetta niiden alla.

Rahulin (@sairahul1) X:ssä kiertänyt artikkeli lupasi otsikossa 30 agenttisuunnittelun konseptia, mutta julkisesti luettava versio listaa 20 numeroitua ydinkohtaa. Se ei haittaa. Nuo 20 riittävät rakentamaan hyvän kartan siitä, mistä AI-agentit oikeasti koostuvat: silmukasta, tilasta, ohjeista, työkaluista, muistista, orkestroinnista, suojakaiteista ja mittareista.

Pikalukijan tiivistelmä

  • Agentti on palautetta käyttävä työsilmukka, ei vain chatbot uudella nimellä.

  • Hyvä agenttijärjestelmä syntyy kerroksista: peruspalikat, ohjaus, kyvykkyydet, orkestrointi, suojakaiteet ja havainnointi.

  • Konteksti ei ole sama asia kuin tieto. Agentti käyttää vain sitä, mikä on sen näkyvissä tai haettavissa.

  • Turvallisuus pitää rakentaa oikeuksiin, hiekkalaatikkoon, hookeihin ja tarkistusportteihin. Pelkkä "älä tee vaarallisia asioita" -kehote ei riitä.

  • Mittaa lopputulosta, ei agentin itsevarmuutta.

Agentti: silmukka, joka jatkaa, kunnes työ valmistuu

Chatbot vastaa kerran. Agentti jatkaa.

Tämä on koko eron ydin. Tavallinen kielimallikutsu lukee pyynnön, muodostaa vastauksen ja pysähtyy. Agentti saa tavoitteen, päättää seuraavan askeleen, käyttää työkalua, lukee tuloksen ja päättää uudelleen. Sitä kutsutaan usein Think → Act → Observe -silmukaksi.

Hyvä nyrkkisääntö:

Tarve

Käytä tätä

Miksi

Yksi vastaus

Prompti

Et tarvitse tilaa, työkaluja tai toistoa

Ennalta tiedetty prosessi

Skripti tai automaatio

Vaiheet eivät muutu tulosten perusteella

Työ, jossa seuraava askel riippuu edellisestä

Agentti

Tarvitset palautesilmukan

Esimerkiksi "tiivistä tämä muistio" on prompti. "Vie kaikki uudet laskut kirjanpitoon joka perjantai samalla kaavalla" on automaatio. "Tutki miksi tämä testipaketti kaatuu, korjaa syy ja varmista, että muutos ei riko muuta" on agenttitehtävä.

Tähän liittyy AI-Sanomien aiempi kuuden kerroksen agenttiarkkitehtuuriopas. Se lähestyy samaa asiaa järjestelmän rakentamisen näkökulmasta. Tässä jutussa mennään yhtä tasoa alemmas: käsitteisiin, jotka toistuvat lähes kaikissa agenttityökaluissa.

Kuusi kerrosta: näin 20 konseptia asettuvat kartalle

Agenttien suunnittelu selkeytyy, kun käsitteet jakaa kuuteen kerrokseen.

Kerros

Käsitteet

Kysymys, johon kerros vastaa

Peruspalikat

Agentti, toimintasilmukka, tila, agenttimallit

Miten agentti ajattelee ja jatkaa työtä?

Ohjaus

Config-tiedostot, workflowt, prompt caching, context rot

Miten agentille annetaan oikea työtapa?

Kyvykkyydet

MCP, dokumenttien haku, pysyvä muisti

Mihin agentti pääsee käsiksi?

Orkestrointi

Subagentit, agenttiloopit

Miten työ jaetaan usealle agentille tai useaan kierrokseen?

Suojakaiteet

Sandboxing, permissions, hooks, prompt injection -puolustus, pre-commit-portit

Miten estetään vahingot?

Havainnointi

Tracing, mittarit

Mistä tiedetään, mitä agentti teki?

Tämä kartta auttaa lukemaan uusia työkaluja rauhallisemmin. Kun seuraava framework lupaa "autonomisia työntekijöitä", voit kysyä: missä sen tila elää, miten työkalut rajataan, miten turvallisuus toteutuu ja mistä näen työn jäljet?

Jos vastauksia ei löydy, työkalu on vasta demo.

1:1 AI-sparraus (2h)
1:1 AI-sparraus (2h)
Kaksi tuntia henkilökohtaista AI-sparrausta, joka rakentuu kokonaan sinun tilanteesi ja tavoitteidesi ympärille.
€350.00 eur

Peruspalikat: agentti, tila ja työnjako

Ensimmäiset neljä käsitettä muodostavat agentin rungon.

1. Agentti

Agentti on järjestelmä, joka toimii tavoitteen perusteella useamman askeleen ajan.

Sana "agentti" kärsii jo inflaatiosta. Sitä käytetään chatbotista, automaatiosta, selaimessa toimivasta työkalusta ja kokonaisesta moniagenttitiimistä. Käytännöllinen määritelmä on tiukempi: agentti saa tavoitteen, valitsee toiminnon, lukee seurauksen ja jatkaa.

Tämä tekee agenteista hyödyllisiä juuri niissä tehtävissä, joissa et tiedä kaikkia vaiheita etukäteen.

2. Execution loop

Toimintasilmukka on agentin moottori.

  1. Agentti lukee tavoitteen ja nykyisen tilanteen.

  2. Se päättää seuraavan askeleen.

  3. Se kutsuu työkalua, lukee tiedoston, hakee dokumentaatiota tai kysyy käyttäjältä.

  4. Se havainnoi tuloksen.

  5. Se päättää, jatkuuko työ.

Ilman tätä silmukkaa kyse on tavallisesta mallivastauksesta. Silmukan kanssa malli voi olla väärässä ensimmäisellä askeleella, nähdä virheen ja korjata suuntaa toisella.

3. Agent state

Tila tarkoittaa kaikkea sitä, minkä varassa agentti tekee seuraavan päätöksen.

Tila jakautuu kahteen:

Tilan tyyppi

Mitä se sisältää

Riski

Konteksti-ikkuna

Käyttäjän pyyntö, ohjeet, aiemmat työkalukutsut, ladatut tiedostot

Liikaa tavaraa, huomio hajoaa

Ulkoinen tila

Tiedostot, tietokannat, muisti, Git-historia, hakutulokset

Agentti ei käytä sitä, ellei se hae tai lue sitä

Tärkeä lause: pääsy ei ole tietoisuutta.

Jos agentilla on teoriassa pääsy Google Driveen, GitHubiin tai tietokantaan, se ei silti "tiedä" niiden sisältöä. Sen pitää hakea oikea asia oikealla hetkellä. Tämä on syy, miksi hyvä agenttisuunnittelu on usein tiedon näkyvyyden suunnittelua.

4. Common agent patterns

Kun agentteja on enemmän kuin yksi, tarvitaan työnjakomalli.

Malli

Perusidea

Hyvä käyttökohde

Planner / Executor

Yksi suunnittelee, toinen toteuttaa

Koodimuutokset, projektityö, tutkimus

Router / Specialist

Reititin valitsee oikean erikoisagentin

Asiakaspalvelu, sisäinen tuki, tietotyön assistentit

Map-Reduce

Työ pilkotaan osiin ja yhdistetään lopuksi

Laajat dokumentit, koodikatselmukset, markkinatutkimus

Tässä kohtaa moni innostuu liikaa. Yksi agentti on usein parempi kuin viisi huonosti rajattua agenttia. Moniagenttijärjestelmä toimii vasta, kun jokaisella osalla on selkeä vastuu ja hyvä luovutus seuraavalle.

Ohjaus: agentti tarvitsee perehdytyksen, ei motivaatiopuhetta

Seuraavat neljä käsitettä liittyvät siihen, miten agentille annetaan työtapa.

5. Agent config files

AGENTS.md, CLAUDE.md ja vastaavat tiedostot ovat agentin perehdytys. Ne kertovat, miten juuri tässä projektissa toimitaan.

Hyvä agenttiohje ei sano:

Kirjoita laadukasta koodia ja noudata parhaita käytäntöjä.

Se sanoo:

Tässä projektissa käytetään pnpm:ää.
Testit ajetaan komennolla pnpm test.
Älä muuta julkista API:a ilman erillistä mainintaa.
Kun lisäät uuden komponentin, seuraa src/components-kansion nykyistä rakennetta.

Ero on iso. Ensimmäinen on toive. Toinen muuttaa agentin käytöstä.

6. Reusable workflow files

Config-tiedosto on aina mukana. Workflow-tiedosto latautuu silloin, kun tietty työ pitää tehdä.

Hyviä workflow-tiedostoja voivat olla:

  • miten kirjoitetaan testit

  • miten julkaistaan artikkeli

  • miten tehdään tietoturvakatselmus

  • miten luodaan asiakasraportti

  • miten tarkistetaan lähteet

AI-Sanomien ChatGPT Skills ja Codex -opas käsittelee samaa periaatetta tietotyön näkökulmasta. Kun toistuva työtapa tallennetaan skilliksi tai workflowksi, käyttäjän ei tarvitse selittää samaa asiaa joka maanantai uudelleen.

7. Prompt caching

Agentit toistavat paljon samaa kontekstia: järjestelmäohjeita, projektisääntöjä, työkalukuvauksia ja työnkulkuja. Prompt caching tarkoittaa, että mallipalvelu voi käyttää vakaan osan uudelleen eikä käsitellä sitä joka vuorolla alusta asti.

Tämä voi laskea kustannusta ja viivettä. Mutta se ei paranna huonoa kontekstia.

Jos config-tiedosto on täynnä geneerisiä ohjeita, cache tekee vain huonosta kontekstista halvempaa. Siksi ensin siivotaan ohjeet, vasta sitten iloitaan välimuistista.

8. Context rot

Context rot on hetki, jolloin kontekstia on niin paljon, että agentti toimii huonommin.

Tätä on helppo vähätellä, koska modernit mallit nielevät valtavia määriä tekstiä. Pitkä konteksti ei kuitenkaan takaa tarkkaa huomiota. "Lost in the Middle" -tutkimus näytti jo aiemmin, että mallit löytävät olennaista tietoa heikommin, kun se hautautuu pitkän kontekstin keskelle.

Agenttien kohdalla sama näkyy näin:

  • vanhat virheet jäävät keskusteluun kummittelemaan

  • työkalujen pitkät lokit vievät tilaa

  • geneeriset säännöt peittävät tärkeät projektisäännöt

  • agentti alkaa ratkaista eilistä ongelmaa tämän päivän tehtävässä

Siksi hyvä agenttisuunnittelija ei vain lisää kontekstia. Hän poistaa sitä.

Kyvykkyydet: agentti tarvitsee oikeat ovet oikeisiin paikkoihin

Agentti on hyödyllinen vasta, kun se pääsee käsiksi oikeaan tietoon ja oikeisiin työkaluihin.

9. Model Context Protocol

Model Context Protocol eli MCP on avoin standardi, jolla agenttisovellus voi kytkeytyä ulkoisiin työkaluihin ja tietolähteisiin. MCP:n omassa määrittelyssä palvelimet voivat tarjota esimerkiksi resursseja, promptteja ja työkaluja. Työkalut taas voivat tehdä toimintoja ulkoisissa järjestelmissä, kuten hakea tietokannasta, kutsua API:a tai suorittaa laskentaa.

AI-Sanomien MCP- ja A2A-opas käy taustan läpi laajemmin. Tässä yhteydessä tärkeintä on ymmärtää MCP suunnittelukysymyksenä: mitä agentille kannattaa paljastaa, millä oikeuksilla ja missä muodossa?

Huono MCP-palvelin antaa agentille liian monta työkalua kerralla. Hyvä MCP-palvelin tarjoaa rajatut, ymmärrettävät ja turvallisesti kutsuttavat toiminnot.

Työkalu ei silti ole sama asia kuin oikeus. Agentti voi tietää, että jokin toiminto on olemassa, mutta sen ei pidä saada käyttää sitä kaikissa tilanteissa. Hyvä agenttiarkkitehtuuri erottaa löydettävyyden, käyttöoikeuden ja hyväksynnän toisistaan.

10. Live document retrieval

Kielimallilla on koulutusdata. Työllä on nykyhetki.

Jos API on muuttunut, kirjasto päivittynyt tai tuotteen käyttöehdot vaihtuneet, malli voi arvata vanhan tiedon pohjalta. Usein se ei sano "en tiedä". Se kuulostaa varmalta.

Live document retrieval tarkoittaa, että agentti hakee ajantasaisen dokumentaation ennen kuin tekee päätöksen tai kirjoittaa koodia. Tämä on erityisen tärkeää kehittäjätyössä, mutta sama periaate pätee juridiikkaan, HR:ään, markkinointialustoihin ja sisäisiin prosesseihin.

Hyvä kysymys ei ole "osaako malli tämän yleensä?" Parempi kysymys on: "lukiko agentti juuri oikean dokumentin?"

11. Persistent memory

Pysyvä muisti säilyttää tietoa sessioiden yli.

Yksinkertaisin versio on projektin MEMORY.md-tiedosto. Siihen kirjataan päätökset, nimet, periaatteet ja toistuvat havainnot. Laajempi versio voi olla haettava muistikerros, tietograafi tai asiakasjärjestelmään kytketty muisti.

Muisti on hyödyllinen, kun agentin pitää muistaa:

  • miten projektissa on aiemmin päätetty toimia

  • mitä käyttäjä arvostaa

  • mitkä ratkaisut on jo hylätty

  • mitä asiakas sanoi viimeksi

  • missä vaiheessa pitkä prosessi on

Mutta muisti voi pilaantua. Vanha, väärä tai liian pitkä muisti on uusi context rot. Muisti tarvitsee siivousta siinä missä inboxikin.

Orkestrointi: milloin yksi agentti ei riitä

Orkestrointi alkaa siitä, että yksi agentti ei enää jaksa pitää kaikkea mielessään.

logo

Tilaa AI-Sanomien Plus-jäsenyys niin näet loput sisällöstä

Tilaamalla AI-Sanomien maksullisen jäsenyyden saat pääsyn kaikkiin uutiskirjeen sisältöihin sekä tuet Suomen parasta AI-mediaa.

Tilaa jäsenyys tästä! Voit lopettaa koska tahansa.

Miksi tilaus kannattaa?:

  • Näet kaikki uutiskirjeen sisällöt, uudet AI-työkalut sekä vinkit tekoälyn käyttöön.
  • Pääsy kaikkiin verkkokursseihin kurssit.aisanomat.fi-alustassa
  • Pääsy Kehotesuunnittelija.fi Premium-tasoon (15 €/kk)
  • Pääsy satoihin maksullisiin sisältöihin, oppaisiin ja artikkeleihin

Reply

Avatar

or to participate

Keep Reading