Näin rakennat tekoälyagentin: kuuden kerroksen arkkitehtuuriopas

Tekoälyagentit ovat vuoden 2026 kuumin aihe. Jokainen teknologiayritys rakentaa niitä, jokainen konsultti puhuu niistä, ja jokainen yrittäjä miettii pitäisikö sellainen hankkia.

Mutta kun pääset hehkutuksen ohi, vastaan tulee käytännön kysymys: miten tekoälyagentti oikeasti rakennetaan?

Ei riitä, että valitset kielimallin ja liität sen rajapintaan. Toimiva agentti koostuu kuudesta kerroksesta, joista jokainen vaikuttaa kaikkiin muihin. Väärä valinta yhdessä kerroksessa pakottaa tekemään kompromisseja kaikissa muissa.

Tämä opas käy läpi jokaisen kerroksen: mitä se tekee, mitä vaihtoehtoja on ja miten valitset oikean. Lopussa esittelen kuusi valmista arkkitehtuurimallia eri tilanteisiin -- aloittavasta yrittäjästä suuryrityksen tietoturvavaatimuksiin.

Et tarvitse ohjelmointitaustaa ymmärtääksesi kokonaisuutta. Mutta jos rakennat agentteja, tarvitset tämän viitekehyksen.

Oppaan sisältö

Kerros 2: Työkalut -- agentin kädet
- Kolme tapaa rakentaa työkaluja
Kerros 3: Taidot (Skills) -- agentin osaaminen
- Taidot vs. työkalut
- Miksi progressiivinen lataus on ratkaisevaa
Kerros 4: Muisti -- mikä erottaa chatbotin agentis …
Kerros 5: Kielimalli -- aivojen valinta agentille
Kerros 6: Orkestrointi -- liima joka yhdistää kaik …
- Kehykset jotka kannattaa tuntea
- Agenttiarkkitehtuurimallit
Kuusi valmista arkkitehtuurimallia
- Malli 1: Startupin MVP

Kuuden kerroksen malli

Jokainen tekoälyagentti -- yksinkertaisesta monimutkaiseen -- koostuu kuudesta kerroksesta. Ajattele niitä kuin talon rakentamista: perustukset ensin, kattomaalaus viimeisenä.

Jokainen kerros nojaa alempaan. Väärä perusta kaataa kaiken sen päällä.

Useimmat aloittavat ylhäältä -- "mikä kielimalli minun pitäisi valita?" -- ja etenevät alaspäin. Se on väärin päin. Aloita aina datasta.

Kerros 1: Data -- perusta kaikelle

Data-kerros on kallio, jonka päälle kaikki muu rakennetaan. Jokainen päätös ylempänä riippuu siitä, mitä dataa sinulla on, missä se sijaitsee, kuinka arkaluontoista se on ja miten sitä pitää käsitellä.

Jos ohitat tämän kerroksen tai kiirehdit sen läpi, rakennat kaiken myöhemmin uudelleen.

Kolme tietovarastotyyppiä

Vektoritietokannat mahdollistavat merkityspohjaisen haun. Ne tallentavat sisältösi matemaattisina esityksinä (embedding) ja hakevat niistä samankaltaisia -- ei avainsanoilla vaan merkityksellä. Tämä on RAG-tekniikan (Retrieval Augmented Generation) ydin: agentti vetää relevanttia kontekstia omasta datastasi.

Tietokanta	Tyyppi	Parhaiten sopii
Pinecone	Pilvipalvelu	Yritys-RAG, alle 10 ms viive
Qdrant	Oma palvelin tai pilvi	Tietosuoja edellä, edistynyt suodatus
ChromaDB	Paikallinen	Prototyypit, nopea kehitys
pgvector	PostgreSQL-laajennus	Tiimit joilla jo Postgres käytössä

Dokumenttivarastot säilyttävät raakamateriaalin ja rakenteisen metadatan. MongoDB, Elasticsearch ja PostgreSQL ovat yleisimmät vaihtoehdot.

Graafitietokannat (kuten Neo4j) tallentavat kohteiden välisiä suhteita. Kun agentti tarvitsee vastauksen kysymykseen "miten nämä asiat liittyvät toisiinsa?", se on graafin aluetta.

Tietosuojapäätös joka määrittää kaiken

Ensimmäinen kysymys ennen mitään muuta: missä data sijaitsee ja kuka näkee sen?

Tämä yksittäinen kysymys määrittää puolet arkkitehtuurista:

Julkinen tai ei-arkaluontoinen data -- Pilvipalvelut riittävät. Pinecone, Qdrant Cloud tai Weaviate Cloud. Useimmat yksinyrittäjät ja pienyritykset elävät täällä.
Yrityksen oma data, ei sääntelyä -- Hybridimalli. Vektoritietokanta omalla palvelimella, kielimalli pilvestä API:n kautta.
Säännelty data (GDPR, terveydenhuolto) -- Kaikki omalla palvelimella. Oma vektoritietokanta, oma graafitietokanta, salatut avaimet. Budjetoi 7 000--22 000 euroa lisää vaatimustenmukaisuuden toteuttamiseen.
Ilmaraollinen ympäristö -- Kaikki paikan päällä. Avoimen lähdekoodin kielimallit, ei ulkoisia API-kutsuja.

Datapipeline: raakadatasta agentiksi

Pilkkomisstrategia on tärkeämpi kuin useimmat tajuavat. Pienet palat antavat tarkkoja hakutuloksia mutta menettävät kontekstin. Isot palat säilyttävät kontekstin mutta tuovat kohinaa. Merkityspohjainen pilkkominen -- jakaminen sisällön mukaan, ei merkkimäärän -- on nykyinen paras käytäntö.

1-to-1 AI-sparraus (190 €) - Janne Ikola

Tunti henkilökohtaista AI-sparrausta, joka rakentuu kokonaan sinun tilanteesi ja tavoitteidesi ympärille. Ei valmiita kalvoja, ei geneeristä sisältöä - vaan konkreettista apua juuri niihin kysymyksiin, joita sinulla on tekoälyn hyödyntämisestä.

Sessio räätälöidään ennakkokyselyn perusteella, joten jokainen tapaaminen on ainutlaatuinen.

zcal.co/janneikola/1-to-1-ai-sparraus

Kerros 2: Työkalut -- agentin kädet

Työkalut ovat tapa, jolla agentti toimii ulkomaailmassa. Jokainen työkalu tekee täsmälleen yhden asian, ottaa määritellyt syötteet ja tuottaa ennustettavan tuloksen.

Yhden vastuun periaate on ehdoton. Työkalu joka tekee kahta asiaa on kaksi työkalua jotka pitää erottaa.

Kolme tapaa rakentaa työkaluja

Python-skriptit UV:llä -- Nopein tapa. UV mahdollistaa täysin itsenäiset Python-skriptit, joissa riippuvuudet määritellään suoraan skriptin sisällä. Ei virtualenv-hallintaa, ei requirements.txt-tiedostoja, ei riippuvuusristiriitoja.

Go-binäärit -- Go kääntyy yhdeksi binääririedostoksi ilman ajonaikaisia riippuvuuksia. Ei "asensitko Python 3.12?" -keskusteluja. Suorituskykykriittisissä tilanteissa paras valinta.

MCP-palvelimet (Model Context Protocol) -- Avoin standardi kielimallien yhdistämiseksi ulkoisiin työkaluihin ja datalähteisiin. Valmiita MCP-palvelimia on olemassa Google Drivelle, Slackille, GitHubille, Postgresille ja kymmenille muille palveluille.

Tapa	Milloin käyttää	Kompromissi
UV Python	Nopea kehitys, API-integraatiot	Hitaampi suoritus
Go-binäärit	Suorituskykykriittinen, jakelu	Pidempi kehityssykli
MCP-palvelimet	Standardoidut integraatiot	Protokollakustannus

Kerros 3: Taidot (Skills) -- agentin osaaminen

Taidot edustavat aitoa paradigman muutosta. Anthropic julkaisi ne avoimena standardina joulukuussa 2025, ja sittemmin Microsoft (VS Code, GitHub Copilot), OpenAI (Codex), Google (Gemini CLI), Cursor ja kymmenet muut alustat ovat ottaneet ne käyttöön.

Tämä on kerros, josta useimmat eivät vielä tiedä. Ja se muuttaa kaiken.

Taidot vs. työkalut

Työkalut suorittavat toimintoja ja palauttavat tuloksia. Taidot injektoivat toimialaosaamista ja käyttäytymisohjeita agentin päättelyyn.

Työkalu on "kutsu tätä rajapintaa." Taito on "näin asiantuntija lähestyy tätä kokonaisuutta -- mukaan lukien mitä työkaluja käytetään, missä järjestyksessä ja mihin pitää kiinnittää huomiota."

Ominaisuus	Työkalut	Taidot
Kontekstin lataus	Kaikki skeemat kerralla	Progressiivinen (~100 tavua metatietoa)
Token-kustannus	Korkea skeemakustannus	500x tehokkaampi
Tehtävä	Suorita toiminto	Ohjaa päättelyä
Laajennettavuus	Vaatii koodimuutoksia	Pudota SKILL.md-tiedosto, ei koodia

Miksi progressiivinen lataus on ratkaisevaa

Perinteiset MCP-palvelimet 90+ työkalulla kuluttavat yli 50 000 tokenia JSON-skeemoja ennen kuin agentti edes aloittaa päättelyn. Se on kallista, hidasta ja tuhlailevaa.

Taidot käyttävät kolmitasoista latausmallia:

Metatieto -- Nimi ja kuvaus (~100 tavua). Aina kontekstissa.
Täydet ohjeet -- Ladataan kun taito aktivoituu.
Resurssit -- Skriptit, mallipohjat. Ladataan tarpeen mukaan.

Agentti voi käyttää tuhansia taitoja ilman konteksti-ikkunan turvotusta.

Kerros 4: Muisti -- mikä erottaa chatbotin agentista

Muisti on raja "hyödyllisen työkalun" ja "aidosti käyttökelpoisen agentin" välillä. Ilman muistia jokainen keskustelu alkaa nollasta. Muistin kanssa agentti oppii ja kehittyy ajan myötä.

Viisi muistityyppiä

Tyyppi	Tarkoitus	Elinikä
Työmuisti	Aktiivinen konteksti nykyisessä päätöksessä	Yksi vuoro
Lyhytkestoinen	Keskusteluhistoria, työkalukutsut	Yksi sessio
Keskipitkä	Tiivistetyt yhteenvedot, poimitut faktat	Päivistä viikkoihin
Pitkäkestoinen	Käyttäjän mieltymykset, suhteet, mallit	Pysyvä
Proseduraalinen	Agentin käyttäytymissäännöt	Pysyvä

Kaksi muistiarkkitehtuuria

Vektorihaku (semanttinen palautus) -- Tallenna keskusteluvuorot ja faktat embedding-muodossa. Hae merkityksen perusteella. Paras "etsi jotain aiheeseen X liittyvää" -kyselyihin.

Tietograafi (rakenteinen palautus) -- Tallenna kohteet ja suhteet aikaleimoineen. Paras "miten X ja Y liittyvät toisiinsa?" ja "mitä X:stä on muuttunut ajan myötä?" -kyselyihin.

Tuotantosuositus: käytä molempia.

Muistikehykset jotka kannattaa tuntea

Mem0 -- Universaali muistikerros. SOC 2 ja HIPAA -yhteensopiva. 26 % parannus OpenAI:n peruslinjaan, 90 % tokenisäästöt. Helpoin aloituspiste.
Letta (aiemmin MemGPT) -- Käyttöjärjestelmäinspiroitu muistinhallinta, jossa agentti muokkaa aktiivisesti omaa muistiaan. Mahdollistaa persoonallisuuden kehittymisen ajan myötä.
Zep / Graphiti -- Ajallinen tietograafialusta. Reaaliaikaiset graafipäivitykset ilman eräajoja. 18,5 % tarkempi kuin MemGPT LongMemEval-vertailussa.

Kerros 5: Kielimalli -- aivojen valinta agentille

Kielimallikerros on se, missä päättely tapahtuu. Mutta valinta ei ole pelkästään "mikä malli." Se on "mitkä mallit, milloin ja miten ne toimivat yhdessä."

Tässä useimmat maksavat liikaa tai saavat liian vähän. Oikea reititys on ero 200 euron kuukausikustannuksen ja 2 000 euron kuukausikustannuksen välillä -- samoilla tuloksilla.

Nykyinen mallimaisema (helmikuu 2026)

Malli	Hinta (M tokenia)	Vahvuus
Claude Opus 4.6	$5 / $25	Autonomiset agentit, monimutkainen päättely
Claude Sonnet 4.5	$3 / $15	Nopea iterointi, kehitystyökalut
GPT-5.2	$2.50 / $10	Yrityskäyttö, monidokumenttipäättely
Gemini 3 Pro	$2 / $12	Tuotantoagentit, 1M+ konteksti
Gemini 3 Flash	$0.075 / $0.40	Suuri volyymi, pieni budjetti
Llama 4 Maverick (avoin)	Oma palvelin	Tietosuoja, oma hallinta
DeepSeek R1 (avoin)	$0.55 / $2.19	Edullinen päättely (27x halvempi kuin o1)

Kolme reititysmalli jotka toimivat

1. Tehtäväpohjainen reititys -- Ohjaa tehtävätyypin mukaan:

Luokittelu/yhteenveto → Gemini Flash (halpa, nopea)
Koodin generointi → Codex tai Claude (paras luokassaan)
Monimutkainen päättely → Claude Opus (paras luokassaan)
Reaaliaikainen chat → nopein saatavilla oleva malli

2. Kaskadireititys -- Aloita halvalla, eskaloida epävarmuudessa:

Aja kysely pienellä mallilla, aseta luottamuskynnys (esim. 0,7)
Jos luottavainen, hyväksy vastaus
Jos ei, eskaloida keskitasolle
Jos edelleen epävarma, eskaloida huippumallille
Tulos: 85 % kustannussäästö, 95 % laadun säilyminen

3. Varajärjestelmä -- Ensisijainen → toissijainen → kolmas vaihtoehto. Seuraa palveluntarjoajan tilaa 30 sekunnin välein. Pitää agentin käynnissä katkosten aikana.

Reititysinfrastruktuuri

OpenRouter -- Täysin hallinnoitu, nolla infrastruktuuria. Seuraa palveluntarjoajien tilaa automaattisesti.
LiteLLM -- Avoimen lähdekoodin välityspalvelin omalle palvelimelle. Paras tiimeille jotka haluavat hallinnan.
Helicone -- Seurantakerros. 8 ms viive. Natiivi kustannusseuranta, välimuisti (jopa 95 % kustannusvähennys toistuville kyselyille).

Kerros 6: Orkestrointi -- liima joka yhdistää kaiken

Orkestrointikerros sitoo kaiken alemman toimivaksi järjestelmäksi. Se hallinnoi agenttisilmukkaa: kehote → päättely → toiminta → havainto → toisto.

Kehykset jotka kannattaa tuntea

Kehys	Parhaiten sopii	Rajoitus
Claude Agent SDK	Tuotanto-Claude-käyttöönotot	Vain Claude-mallit
Pi-Mono	Minimaaliset kehittäjät	Pienempi ekosysteemi
MindStudio	Ei-tekniset tiimit, nopea prototyyppi	Ei omaa palvelinta
OpenClaw	Monikanavaiset agentit, oma palvelin	Vaatii infrastruktuuriosaamista
CrewAI	Moniagenttiorkestrointi	Monimutkaisempi hallinta
LangGraph	Matalan tason DAG-orkestrointi	Jyrkkä oppimiskäyrä

Agenttiarkkitehtuurimallit

Yksittäinen agentti -- Yksi agentti, kaikki työkalut. Toimii hyvin 10--15 työkaluun asti. Yksinkertaisin rakentaa ja debugata.

Moniagentti aliagentteilla -- Pääagentti delegoi erikoistuneille aliagentteille. Jokainen saa oman konteksti-ikkunan ja työkalut. Anthropicin tutkimuksen mukaan moniagenttijärjestelmä (Opus 4 + Sonnet-aliagentit) päihitti yksittäisen Opus 4:n 90,2 prosentilla.

Reititinmalli -- Kevyt agentti luokittelee saapuvat pyynnöt ja ohjaa ne erikoistuneille agenteille.

Ihminen silmukassa -- Agentti ehdottaa toimintoja kriittisissä kohdissa. Ihminen hyväksyy, muokkaa tai hylkää. Ehdoton vaatimus kaikessa, mikä koskettaa rahaa, juridisia asioita tai asiakasviestintää.

Kuusi valmista arkkitehtuurimallia

Älä yliajattele. Etsi oma rivisi:

Malli 1: Startupin MVP

Tilaa AI-Sanomien Plus-jäsenyys niin näet loput sisällöstä

Tilaamalla AI-Sanomien maksullisen jäsenyyden saat pääsyn kaikkiin uutiskirjeen sisältöihin sekä tuet Suomen parasta AI-mediaa.

Tilaa jäsenyys tästä! Voit lopettaa koska tahansa.

Miksi tilaus kannattaa?:

Pääsy kaikkiin maksullisiin oppaisiin
Webinaari-tallenteet
Näet kaikki uutiskirjeen sisällöt, uudet AI-työkalut sekä vinkit tekoälyn käyttöön.
GPT4o-botti: Tämä on tietoturvallinen versio ChatGPT:stä, jossa syöttämääsi dataa ei käytetä kielimallin kouluttamiseen.
Tuet Suomen parasta AI-mediaa 😊