Maanantaiaamuna myyntitiimi saa agentilta listan viikon tärkeimmistä liideistä. Lista näyttää järkevältä. Isoimmat yritykset ylhäällä, hiljaiset kontaktit alhaalla, riskiset tapaukset sivuun.

Vasta kuukauden päästä joku huomaa kuvion. Agentti on pudottanut jatkuvasti pois pienempiä yrityksiä ja vieraskielisiä yhteyshenkilöitä, vaikka osa niistä olisi ollut hyviä asiakkaita.

Agentti ei rikkonut sääntöä. Se vain optimoi väärää maailmankuvaa.

Tässä on ero chatbotin ja agentin välillä. Chatbotin bias on huono vastaus. Agentin bias on huono päätös, joka pääsee CRM:ään, Slackiin, rekrytointiputkeen tai laskutusjärjestelmään.

Niin kauan kuin tekoäly vain kirjoitti tekstiä, vinouma näytti kieliongelmalta. Nyt agentit priorisoivat liidejä, tekevät ehdotuksia, käyttävät työkaluja ja valmistelevat päätöksiä. Sama vanha mallivinouma kulkee mukana, mutta vaikutus muuttuu.

Yrityksen ei siis kannata kysyä vain: "Onko tämä malli turvallinen?" Parempi kysymys kuuluu: "Tekeekö tämä agentti päätöksiä meidän arvojen, mission ja tavoitteiden mukaan?"

Vastaus tähän ei synny itsestään.

Malli ei aloita tyhjästä

LLM ei ole tyhjä päättelykone. Se on valtava tilastollinen tiivistelmä kielestä, teksteistä, kulttuurista, valinnoista ja palautteesta.

Tämä kuulostaa itsestäänselvältä, mutta seuraukset unohtuvat nopeasti. Malli oppii kielen mukana myös kielen vinoumat. Jo ennen nykyisiä chat-malleja tutkijat näyttivät, että web-teksteistä opitut sanavektorit toistivat ihmisten implisiittisiä assosiaatioita. Esimerkiksi ammatteihin, sukupuoleen ja etnisyyteen liittyvät yhteydet eivät jääneet ihmisten päähän. Ne päätyivät mallin representaatioihin.

Nykyiset LLM:t ovat eri mittaluokassa, mutta perusongelma ei kadonnut. Mallit oppivat laajasta datasta. Sitten niitä hienosäädetään, turvallistetaan ja ohjataan RLHF:n, järjestelmäpromptien ja tuoterajojen avulla. Tuloksena on malli, joka yrittää käyttäytyä neutraalisti.

Yrittää on tärkeä sana.

Ensimmäinen olennainen havainto on tämä: malli voi oppia sanomaan oikeat sanat ja silti tehdä vinoutuneen valinnan.

Vuonna 2025 julkaistu PNAS-paperi osoitti, että arvoihin sovitetut suuret kielimallit voivat näyttää eksplisiittisissä bias-testeissä neutraaleilta ja silti muodostaa implisiittisiä vinoutuneita assosiaatioita.

Toinen havainto on vielä hankalampi. "Aligned but Blind" -tutkimuksen mukaan mallin linjaus voi vähentää näkyvää biasia, mutta samalla malli voi tulla sokeammaksi tilanteen kannalta olennaisille eroille. Täysin "värisokea" malli ei välttämättä ole reilu malli. Jos konteksti ratkaisee, kontekstin ohittaminen voi tuottaa huonon päätöksen.

Tässä on yritysten kannalta pieni mutta tärkeä johtopäätös: neutraalius ei ole sama asia kuin oman organisaation mukainen harkinta.

Yleisesti turvallinen malli ei automaattisesti tiedä, mikä sinun yrityksessäsi on hyväksyttävä kompromissi. Se ei tiedä, milloin asiakassuhteen pitkä luottamus ohittaa lyhyen myyntitavoitteen. Se ei tiedä, milloin riskin siirtäminen asiakkaalle rikkoo yrityksen arvoja, vaikka se näyttäisi metriikassa hyvältä.

Se pitää kertoa sille selkeästi.

Agentti tekee vinoumasta toimintaa

Chatbot vastaa. Agentti toimii.

Tämä on koko artikkelin ydin. Agentti hakee tietoa, vertailee vaihtoehtoja, kutsuu työkalua, päivittää järjestelmää, lähettää viestin tai ehdottaa seuraavaa toimenpidettä.

Silloin mallin sisäinen suunta alkaa näkyä päätöksissä ja toiminnassa.

Palataan alun myyntiagenttiin. Sen tehtävä on priorisoida viikon tärkeimmät liidit. Datassa on yrityksen koko, toimiala, budjetti, aiempi aktiivisuus, vastausten sävy ja yhteyshenkilön titteli. Agentti voi tehdä sinänsä loogisen rankingin, mutta sen opitut oletukset voivat vaikuttaa siihen, mitä se pitää "vakavasti otettavana", "riskisenä" tai "hyvänä asiakkaana".

Sama logiikka näkyy rekrytoinnissa ja asiakaspalvelussa. Rekrytointiagentti voi kirjoittaa tiivistelmän, joka vaikuttaa haastattelukutsuun. Asiakaspalveluagentti voi päättää, milloin tiketti eskaloidaan ihmiselle. Näissäkin tapauksissa vinouma ei jää tekstiin. Se siirtyy prosessiin.

Myyntiagentti on kuitenkin hyvä pääesimerkki, koska sen päätös näyttää helposti harmittomalta. Sehän vain järjestää listan. Mutta juuri lista ohjaa ihmisten huomiota. Ylhäällä olevat saavat kontaktin. Alhaalla olevat jäävät myöhemmäksi. Lopulta priorisointi muuttuu todelliseksi kohteluksi.

Agenttien perusarkkitehtuuria avasin aiemmin jutussa Tekoälyagenttien arkkitehtuuriopas. Tämä artikkeli jatkaa samasta kohdasta: mitä tapahtuu, kun arkkitehtuuriin lisätään organisaation arvot ja päätöskontrollit.

Tutkimus tukee tätä huolta. "From Biased Chatbots to Biased Agents" -paperi tarkasteli, miten demografiset personaohjeet vaikuttavat LLM-agenttien suorituskykyyn. Havainto oli karu: persona saattoi heikentää agentin suoriutumista jopa 26,2 prosenttia, vaikka persona ei liittynyt tehtävään.

Tämä on hyvä muistutus kaikille, jotka rakentavat agentteja "roolipromptilla". Rooli ei ole koriste. Se muuttaa päätöksiä.

Samoin kieli ja maa voivat muuttaa agentin suosituksia. Multilingual national bias -tutkimuksessa agenttimaisesti neuvoja antavat mallit käyttäytyivät eri tavoin riippuen kielestä ja kansallisesta kontekstista. Suomalaiselle yritykselle tämä on olennainen huomio. Agentti, joka toimii englanniksi hyvin, ei välttämättä tee samaa päätöstä suomeksi, ruotsiksi tai saksaksi.

Nyt tullaan käytännön kohtaan. Jos agentti pääsee vaikuttamaan asiakkuuksiin, työntekijöihin, rahaan, pääsyyn, priorisointiin tai maineeseen, mallin sisäinen suunta on liiketoimintariski.

"Ole reilu" ei riitä periaatteeksi

Moni ratkaisee tämän kirjoittamalla järjestelmäpromptiin jotain tällaista:

Toimi neutraalisti, eettisesti ja syrjimättömästi.

Parempi kuin ei mitään. Mutta aika ohut.

Ongelma on, että tällainen ohje ei ratkaise yhtään todellista jännitettä. Mitä agentin pitää tehdä, kun myyntitavoite ja asiakassuhteen pitkä luottamus ovat ristiriidassa? Entä kun nopein tapa hoitaa tiketti on myös asiakkaan kannalta hämmentävin? Entä kun data näyttää yhtä, mutta arvojen mukaan päätös pitäisi hidastaa ihmisen tarkistettavaksi?

Hyvä periaate muuttaa päätöstä. Huono periaate kuulostaa hyvältä.

Tässä on ero:

Heikko ohje

Parempi ohje

Ole reilu.

Jos päätös vaikuttaa asiakkaan pääsyyn, hintaan, palvelutasoon tai prioriteettiin, tarkista perustelu eri asiakassegmenteillä ennen suositusta.

Ole asiakaslähtöinen.

Älä optimoi lyhyen aikavälin myyntiä tavalla, joka siirtää epäselvän riskin asiakkaalle.

Toimi yrityksen arvojen mukaan.

Kun ehdotat toimenpidettä, arvioi vaikutus luottamukseen, läpinäkyvyyteen, asiakkaan etuun ja yrityksen pitkän aikavälin tavoitteeseen.

Älä syrji.

Testaa, muuttuisiko suositus, jos henkilön nimi, kieli, maa, ikä tai rooli vaihtuisi mutta asia pysyisi samana.

Tässä kohtaa values.md ja objectives.md ovat hyödyllisiä. Ne eivät ole vain agentin persoonallisuutta. Ne ovat päätöksenteon käyttöjärjestelmä.

Mutta ne eivät riitä yksin.

Jos agentti voi vain kirjoittaa luonnoksen, arvotiedosto voi olla hyvä ohjauskerros. Jos agentti voi käyttää työkaluja tai vaikuttaa korkean vaikutuksen päätökseen, tarvitaan vahvempi rakenne.

Tämä on jatkoa aiemmalle Principles.md-artikkelille, jossa käsittelin agentin periaatteita identiteetin näkökulmasta. Tässä painopiste on riskissä: mitä tapahtuu, kun periaatteet alkavat ohjata päätöksiä.

Yrittäjän AI-kehotepankki: +130 kehotetta (Toukokuu 2026)
Yrittäjän AI-kehotepankki: +130 kehotetta (Toukokuu 2026)
Lopeta arpominen ja ala hyödyntämään tekoälyä oikeasti. 130+ valmista kehotepohjaa suomalaiselle yrittäjälle - markkinointiin, myyntiin, talouteen, rekrytointiin ja johtamiseen. Kopioi, muokkaa, kä...
€87.00 eur

Neljä kerrosta agentin arvo-ohjaukseen

Yritysagentin arvoja ei kannata jättää yhteen promptiin. Parempi malli on nelikerroksinen.

Kerros

Kysymys

Käytännön muoto

Identiteetti

Mikä agentti on?

identity.md

Arvot

Mitä ei saa uhrata?

values.md

Tavoitteet

Mitä optimoidaan juuri nyt?

objectives.md

Portti

Kuka pysäyttää väärän päätöksen?

validaattori

1. Identiteetti: mikä tämä agentti on?

Agentin pitää tietää roolinsa. On eri asia olla myyntiassistentti, riskianalyytikko, asiakaspalvelun triage-agentti tai johdon sparraaja.

Hyvä identiteetti ei ole "olet avulias AI-assistentti". Se kertoo, mihin agentti on vastuussa.

Esimerkiksi:

Olet B2B-myyntitiimin priorisointiagentti.
Tehtäväsi on auttaa tiimiä löytämään oikeat asiakkaat, ei maksimoida
lyhyen aikavälin kontaktimäärää hinnalla millä hyvänsä.

Sinun pitää suojella kolmea asiaa:
1. asiakkaan luottamusta
2. myyntitiimin ajankäyttöä
3. yrityksen pitkän aikavälin mainetta

Tämä muuttaa sävyä heti. Agentti ei enää optimoi vain "enemmän myyntiä". Se optimoi myyntiä rajojen sisällä.

2. Arvot: mitä ei saa uhrata?

values.md kannattaa kirjoittaa niin, että se ratkaisee jännitteitä. Ei juhlapuhetta.

Huono arvo:

Olemme asiakaslähtöisiä.

Parempi:

Asiakkaan luottamus on tärkeämpi kuin yksittäinen lisämyynti.
Jos ehdotettu toimenpide voi tuntua asiakkaasta painostavalta,
epäselvältä tai riskin siirtämiseltä, pysäytä ehdotus ja pyydä
ihmisen arvio.

Tällainen arvo ohjaa toimintaa. Se kertoo, milloin agentti saa jatkaa ja milloin sen pitää pysähtyä.

3. Tavoitteet: mitä optimoidaan juuri nyt?

Arvot pysyvät, tavoitteet vaihtuvat.

objectives.md voi kertoa agentille viikon tai prosessin tavoitteen:

Tämän kampanjan tavoite on löytää 30 laadukasta keskustelua.
Älä maksimoi lähetettyjen viestien määrää.
Priorisoi asiakkaat, joille ratkaisu on todennäköisesti aidosti hyödyllinen.

Tässä on iso ero. Ilman tavoitetta agentti voi tulkita "onnistumisen" liian kapeasti. Se voi optimoida vastausprosenttia, kokousmääriä tai nopeutta, vaikka yritys haluaa laatua, luottamusta ja hyvää asiakasfitttiä.

4. Validaattori: kuka tarkistaa päätöksen?

Korkean vaikutuksen päätöksissä erillinen validointivaihe on usein parempi kuin yksi pidempi prompti.

Tämä voi olla toinen agentti, evaluaatioskripti tai työnkulun erillinen vaihe:

Ennen kuin päätös hyväksytään, tarkista:

1. Onko päätös linjassa values.md-tiedoston kanssa?
2. Optimooko agentti tavoitetta liian kapeasti?
3. Muuttuisiko suositus, jos nimi, kieli, alue tai asiakassegmentti vaihtuisi?
4. Tarvitseeko päätös ihmisen hyväksynnän?
5. Onko perustelu lokitettavissa jälkikäteen?

Tätä kannattaa ajatella porttina. Agentti voi ehdottaa, mutta validaattori päättää, pääseekö ehdotus eteenpäin.

Eikö tämä ole liioittelua?

Osittain kyllä, jos puhutaan harmittomasta tekstibotista. Jokainen ideointiapuri, tiivistäjä tai sisäinen kirjoitusassistentti ei tarvitse erillistä auditointikerrosta.

Riskitaso muuttuu, kun agentti vaikuttaa asiakkaisiin, työntekijöihin, rahaan, pääsyyn, priorisointiin tai maineeseen. Silloin kontrolli ei ole byrokratiaa. Se on samaa perushygieniaa kuin käyttöoikeudet, lokitus ja tietoturva.

Myyntiagentin kohdalla tämä tarkoittaa käytännössä yhtä rajaa: agentti saa järjestää ja perustella liidit, mutta sen pitää pysähtyä, jos päätös perustuu epäselvään oletukseen asiakkaan koosta, kielestä, maasta, nimestä tai segmentistä. Ihmisen ei tarvitse hyväksyä jokaista pientä asiaa. Ihmisen pitää nähdä ne kohdat, joissa väärä optimointi voi muuttua vääräksi kohteluksi.

Tämä on hyvä mittari agenttien hallintaan. Mitä vähemmän päätös vaikuttaa ihmisiin tai rahaan, sitä kevyempi kontrolli riittää. Mitä enemmän vaikutusta, sitä selkeämmät arvot ja vahvempi portti tarvitaan.

Testaa päätöksiä, älä vain vastauksia

Moni testaa agenttia kysymällä: "Vastaatko syrjimättömästi?"

Se on liian helppo testi. Malli tietää, mitä siltä odotetaan.

Parempi testi on päätössarja. Anna agentille sama tilanne useilla pienillä muutoksilla ja katso, muuttuuko suositus ilman asiallista syytä.

Esimerkiksi myyntiagentille:

  • Sama yritys, eri yhteyshenkilön nimi.

  • Sama asiakasdata, eri maa.

  • Sama ostosignaali, eri kieli.

  • Sama tiketti, eri asiakassegmentti.

  • Sama hakemus, eri nimi ja harrastukset.

Jos suositus muuttuu, agentin pitää perustella miksi. Jos perustelu ei liity päätöksen kannalta olennaiseen eroon, prosessissa on ongelma.

Tämä on myös hyvä tapa löytää "hiljaiset" vinoumat. Agentti ei sano mitään ongelmallista. Se vain valitsee hieman eri tavalla.

Juuri siksi lokitus on tärkeää. Tallenna agentin syöte, päätös, perustelu, käytetyt lähteet, työkalukutsut ja mahdollinen ihmisen hyväksyntä. Muuten et voi myöhemmin tietää, miksi päätös syntyi.

NISTin generatiivisen tekoälyn profiili painottaa samaa suuntaa: biasia ja fairnessia pitää arvioida käyttötilanteessa, dokumentoida ja testata myös vastakkaisilla sekä matalan kontekstin esimerkeillä. OWASP taas nostaa LLM-sovellusten riskeihin liiallisen autonomian ja yliluottamuksen. Molemmat osuvat agentteihin suoraan.

Käytännön aloitus: kolme tiedostoa ja yksi portti

Jos rakennat yritykseen agenttia, aloita näin:

  1. Kirjoita identity.md: mikä agentti on, kenelle se on vastuussa ja mitä se ei optimoi.

  2. Kirjoita values.md: mitkä arvot ohittavat lyhyen aikavälin metriikat.

  3. Kirjoita objectives.md: mikä on tämän työnkulun tavoite juuri nyt.

  4. Lisää validointivaihe ennen työkaluja tai korkean vaikutuksen suosituksia.

Tämä ei tee agentista täydellistä. Se tekee sen käyttäytymisestä näkyvämpää.

Ja se on jo paljon.

Useimmat agenttiriskit eivät synny siitä, että malli päättää olla paha. Ne syntyvät siitä, että malli optimoi väärää tavoitetta liian kuuliaisesti. Se yrittää auttaa. Se täyttää mittarin. Se tekee pyydetyn asian. Vasta myöhemmin huomataan, että päätös ei ollut linjassa yrityksen arvojen kanssa.

Siksi agentin arvoja ei kannata kirjoittaa vasta jälkikäteen kriisin jälkeen. Ne ovat osa tuotantoarkkitehtuuria.

AI-natiivi startup: näin saat startup-yrityksesi toimimaan AI-pohjaisesti
AI-natiivi startup: näin saat startup-yrityksesi toimimaan AI-pohjaisesti
60-sivuinen suomenkielinen pelikirja startup-perustajalle. Work Graph, L1-L4-autonomia, kontekstijärjestelmä, kevyin toimiva automaatio, harness-malli ja mallipohjat.
€79.00 eur

Kopioitavat kehotteet

Kehote 1: Luo agentille values.md

Toimi AI-agenttien hallintamallin asiantuntijana.

Haluan luoda values.md-tiedoston seuraavalle agentille:

[Kuvaa agentin tehtävä]
[Kuvaa mihin järjestelmiin agentti pääsee]
[Kuvaa keihin päätökset voivat vaikuttaa]
[Kuvaa yrityksen arvot omin sanoin]

Tee values.md päätösohjeeksi juhlapuheen sijaan.

Muotoile arvot näin:
1. Arvon nimi
2. Mitä tämä tarkoittaa agentin päätöksissä
3. Mitä agentti ei saa uhrata
4. Milloin agentin pitää pysähtyä ja pyytää ihmisen arvio
5. Esimerkkitilanne, jossa arvo muuttaa päätöstä

Kehote 2: Tee bias- ja arvotestit agentille

Toimi AI-agentin testausasiantuntijana.

Tässä on agentin tehtävä:
[Liitä agentin tehtävä]

Tässä on values.md:
[Liitä values.md]

Tässä on objectives.md:
[Liitä objectives.md]

Luo 12 testiskenaariota, joilla tarkistetaan:
1. muuttuuko agentin päätös eri nimillä, kielillä, alueilla tai asiakassegmenteillä
2. optimoiko agentti tavoitetta liian kapeasti
3. tunnistaako agentti tilanteet, jotka vaativat ihmisen hyväksynnän
4. perusteleeko agentti päätöksen tavalla, joka voidaan auditoida

Anna jokaiselle testille:
- syöte
- odotettu hyvä toiminta
- punainen lippu
- mitä lokiin pitää tallentaa

Kehote 3: Rakenna validaattoriagentin ohje

Toimi agenttisen työnkulun riskivalidaattorina.

Laadi ohje validaattoriagentille, joka tarkistaa toisen agentin päätökset
ennen kuin ne etenevät työkaluun tai ihmiselle.

Validaattorin pitää tarkistaa:
1. linjaus values.md-tiedoston kanssa
2. linjaus objectives.md-tiedoston kanssa
3. mahdolliset vinoumat tai epäolennaiset erot päätöksessä
4. tarve ihmisen hyväksynnälle
5. puuttuvat perustelut tai lähteet
6. lokitettava päätöspolku

Palauta:
- validaattoriagentin järjestelmäprompti
- hyväksy/hylkää/eskaloi-päätöskriteerit
- esimerkkiloki yhdestä päätöksestä

Yhteenveto

Agentilla on aina arvot. Jos et kirjoita niitä itse, ne tulevat mallista, koulutusdatasta, RLHF:stä, järjestelmäohjeista, käyttöliittymästä ja hetkellisestä promptista.

Se voi riittää harmittomaan tekstityöhön. Päätöksentekoon se on liian vähän.

Yrityksen pitää kohdella agentin arvoja samalla vakavuudella kuin käyttöoikeuksia, tietoturvaa ja mittareita. Kirjoita arvot. Käännä ne päätöskysymyksiksi. Testaa päätöksiä, älä vain vastauksia. Lisää validointivaihe ennen kuin agentti pääsee vaikuttamaan asiakkaisiin, työntekijöihin, rahaan tai maineeseen.

Paras agentti tietää, mitä sen ei pidä tehdä.

Lähteet

Haluatko sparrailla AI:sta etäkahvitellen?

Tekoäly voi olla voimakas työkalu, ja näiden aloittelijaystävällisten vaihtoehtojen avulla voit hyödyntää sitä omissa projekteissasi – olipa kyseessä sisällöntuotanto, ohjelmointi, markkinointi tai oppiminen.

Jos kaipaat koulutusta tekoäly-työkalujen käyttöön, nappaa tästä sitoumukseton etäkahvitteluaika ja jutellaan tarpeistasi 👇

Reply

Avatar

or to participate

Keep Reading