20 AI-käsitettä jotka pitää ymmärtää vuonna 2026

Kaikki käyttävät tekoälyä. Harva kuitenkaan ymmärtää, mitä konepellin alla tapahtuu.

Se näkyy arjessa. ChatGPT:ltä kysytään faktoja kuin hakukoneelta. Claudeen liitetään 100-sivuinen PDF ja oletetaan, että malli muistaa kaiken täydellisesti. Cursorin annetaan muokata koodia ymmärtämättä, missä kohtaa agentti oikeasti tekee päätöksiä. Midjourneyltä odotetaan täsmällistä sommittelua, vaikka kuvamalli toimii aivan eri tavalla kuin ihminen.

❝

Ongelma ei ole matematiikka. Et tarvitse tohtorintutkintoa ymmärtääksesi tekoälyn peruskäsitteet. Tarvitset vain oikeat mentaalimallit.

Tässä oppaassa avataan 20 käsitettä, jotka tekevät nykyisestä tekoälystä ymmärrettävää: neuroverkot, tokenit, embeddingit, attention, transformerit, kielimallit, konteksti-ikkunat, temperature, hallusinaatiot, promptaus, transfer learning, fine-tuning, RLHF, LoRA, kvantisointi, RAG, vektorikannat, agentit, chain of thought ja diffuusiomallit.

Kun nämä ymmärtää, AI-uutiset eivät kuulosta enää taikuudelta. Eivätkä myyntipuheet mene yhtä helposti läpi.👇

Miten AI oikeasti toimii?

Tekoälystä puhutaan usein kuin yhdestä asiasta. Todellisuudessa nykyinen AI on kerroksia kerrosten päällä.

Alimpana on matematiikka: neuroverkot, painot, vektorit ja todennäköisyydet. Sen päällä on arkkitehtuuri: transformer, attention ja muut tavat käsitellä dataa. Sen päällä on tuote: chat, hakubotti, koodausagentti tai kuvageneraattori.

Aloitetaan pohjalta.

1. Neuroverkot: painotettu putki datasta ennusteeksi

Neuroverkko on laskentaputki.

Data menee sisään. Se kulkee kerrosten läpi. Lopulta ulos tulee ennuste, luokitus, sana, kuva, ääni tai jokin muu tulos.

Nimi johtaa vähän harhaan. Neuroverkko ei ole digitaaliset aivot pienoiskoossa. "Neuroni" on tässä analogia. Käytännössä neuroverkko on valtava määrä lukuja ja matriisilaskentaa.

Yksinkertainen putki näyttää tältä:

Syöte tulee sisään.
Ensimmäinen kerros muuntaa sen numeroiksi.
Piilokerrokset jalostavat numeroesitystä.
Viimeinen kerros tuottaa ennusteen.

Jokaisen yhteyden välissä on paino. Paino on pieni luku, joka kertoo, kuinka paljon jokin piirre vaikuttaa seuraavaan vaiheeseen.

Koulutus tarkoittaa painojen säätämistä.

Jos malli ennustaa väärin, painoja korjataan vähän. Tätä toistetaan valtavalla määrällä esimerkkejä. Lopputuloksena syntyy malli, joka osaa tehdä hyödyllisiä ennusteita uusista syötteistä.

❝

Roskapostisuodatin on helppo esimerkki. Syötteenä on sähköposti. Malli katsoo sanoja, lähettäjää, linkkejä ja muita piirteitä. Ulos tulee todennäköisyys: onko tämä roskapostia vai ei?

Kielimalli toimii samalla perusperiaatteella, mutta mittakaava on eri. Syötteenä on tekstin palasia. Ulos tulee todennäköisyys sille, mikä palanen tulee seuraavaksi.

Tässä kohtaa moni kysyy: "Missä mallin tieto sitten on?"

Se on painoissa. Ei tietokantariveinä, ei muistiinpanoina, ei hakemistona, vaan opittuina lukuarvoina. Siksi kielimalli voi osata selittää Suomen historiaa ilman, että sen sisällä on erillistä tiedostoa nimeltä suomen-historia.txt.

Tämä selittää myös AI:n oudot virheet. Malli ei nouda vastausta varastosta. Se laskee todennäköisen vastauksen syötteen ja opittujen painojen perusteella.

Tärkeä varoitus: mallin koko ei yksin kerro laatua.

Parametrimääristä puhutaan paljon, mutta kaikkia lukuja ei ole julkaistu virallisesti. GPT-4:n tai Claude-mallien tarkkoja parametrimääriä ei kannata käsitellä varmoina faktoina, ellei mallin tekijä ole ne itse vahvistanut. Lisäksi data, arkkitehtuuri, koulutusmenetelmä ja jälkikoulutus vaikuttavat vähintään yhtä paljon.

Nyrkkisääntö: neuroverkko on opittu muunnos syötteestä ulostuloksi. Se ei ajattele kuten ihminen. Se laskee.

Kehotesuunnittelun mestariopas: käytännön tekniikat Claudelle, ChatGPT:lle ja Geminille

Suomenkielinen 200-sivuinen mestariopas kehotesuunnittelusta. Mallineutraali, käytännöllinen, 80+ kopiovalmista kehotetta 10 rooliin. Opus, GPT, Gemini, Skills ja MCP mukana.

€79.00 eur

2. Tokenisaatio: AI:n tekstinpalastelija

Kielimalli ei lue tekstiä sanoina.

Ensin teksti pilkotaan tokeneiksi. Tokeni voi olla sana, sanan osa, kirjainyhdistelmä tai joskus yksittäinen merkki.

Esimerkiksi englannissa:

dog voi olla yksi tokeni
playing voi pilkkoutua osiin play ja ing
ChatGPT voi pilkkoutua useaan osaan

Tarkka pilkkominen riippuu mallin tokenisaattorista. GPT, Claude, Gemini ja avoimet Llama-mallit voivat pilkkoa saman tekstin eri tavalla.

Miksi tällä on väliä?

Koska tokenit ovat AI:n käytännön mittayksikkö. Niillä mitataan:

kuinka paljon tekstiä malli voi nähdä kerralla
paljonko API-kutsu maksaa
kuinka pitkä vastaus voi olla
miksi pitkä dokumentti ei aina mahdu mukaan

Kun mallin konteksti on esimerkiksi 128 000 tokenia, se ei tarkoita 128 000 sanaa. Karkea englanninkielinen sääntö on, että yksi token on noin 0,75 sanaa tai 3–4 merkkiä. Suomen kielessä arvio voi heittää, koska meillä on taivutuksia, pitkiä yhdyssanoja ja erilainen sanarakenteen rytmi.

Sama koskee koodia, taulukoita ja dokumentteja. Lyhytkin tiedosto voi viedä paljon tokeneita, jos siinä on paljon erikoismerkkejä, JSON-rakennetta tai taulukkomuotoista dataa.

❝

Käytännön esimerkki:

Annat mallille 40-sivuisen sopimuksen ja pyydät tiivistelmää. Jos sopimus mahtuu kontekstiin, malli voi käsitellä sitä suoraan. Jos ei mahdu, työkalu joutuu tiivistämään, pilkkomaan tai hakemaan vain osia dokumentista. Silloin vastauksen laatu riippuu siitä, mitä osia mukaan päätyy.

Tokenisaatio selittää myös API-kustannuksia. Jos rakennat asiakastukibotin, jokainen käyttäjän kysymys, haettu dokumenttipala ja mallin vastaus kuluttavat tokeneita. Kun volyymi kasvaa, pienistäkin promptin parannuksista tulee rahaa.

Nyrkkisääntö: tokeni on mallin tekstiyksikkö. Se ei ole sama asia kuin sana.

3. Embeddingit: merkityksen koordinaatit

Kun teksti on pilkottu tokeneiksi, se pitää muuttaa numeroiksi.

Embedding on tällainen numeroesitys. Se on vektori eli pitkä numerosarja, joka kuvaa sanan, lauseen, dokumentin, kuvan tai muun sisällön merkitystä.

Hyvä vertaus on kartta.

Kartalla Helsinki ja Espoo ovat lähempänä toisiaan kuin Helsinki ja Tokio. Embedding-avaruudessa "lääkäri" ja "sairaanhoitaja" ovat lähempänä toisiaan kuin "lääkäri" ja "pizza". Kyse ei ole fyysisestä etäisyydestä, vaan merkityksen etäisyydestä.

Tämä on tärkeä idea: malli ei ymmärrä sanoja ihmisen tavoin. Se käsittelee etäisyyksiä ja suuntia moniulotteisessa avaruudessa.

Embeddingit mahdollistavat monta asiaa, joita käytät jo arjessa:

semanttinen haku
suosittelut
dokumenttien ryhmittely
samankaltaisten tapausten löytäminen
RAG-järjestelmät
hakutulosten uudelleenjärjestäminen

Semanttinen haku tarkoittaa, että haku löytää merkityksen, vaikka sanat eivät täsmää.

Kysyt sisäiseltä AI-botilta:

❝

"Miten työsuhteen voi päättää koeajalla?"

Dokumentissa ei välttämättä ole täsmälleen tuota lausetta. Siellä voi lukea "koeaikapurku", "palvelussuhteen päättäminen" tai "työsopimuksen purkaminen". Avainsanahaku voi epäonnistua. Embedding-haku löytää samankaltaisen merkityksen.

Tässä on myös riski. Merkityksen läheisyys ei ole sama asia kuin oikea vastaus. Jos dokumentit ovat huonosti nimetyt, vanhentuneet tai ristiriitaiset, embedding voi löytää lähimmän huonon vastauksen.

Embedding ei siis ratkaise tietotyötä yksin. Se tekee tiedosta haettavaa merkityksen perusteella.

Nyrkkisääntö: embedding on tekstin tai muun sisällön koordinaatti merkityskartalla.

4. Attention: miten malli tietää, mihin sana liittyy

Sana "Apple" tarkoittaa eri asioita eri lauseissa.

❝

Söin omenan.

❝

Ostin Applea salkkuun.

Suomeksi esimerkki on vähemmän hämäävä, koska omena ja Apple eroavat sanoina. Englanniksi sama sana voi tarkoittaa hedelmää tai yhtiötä. Sama ilmiö näkyy silti kaikkialla: "malli", "pankki", "verkko", "agentti" ja "solu" vaihtavat merkitystä kontekstin mukaan.

Embedding yksin ei riitä ratkaisemaan tätä. Sana tarvitsee ympäristön.

Attention on mekanismi, jolla malli katsoo muita tokeneita ja päättää, mitkä niistä ovat olennaisia juuri nyt.

Self-attentionissa jokainen token voi suhteuttaa itseään muihin tokeneihin. Jos lauseessa lukee "Apple julkaisi tuloksensa", malli painottaa sanoja "julkaisi" ja "tuloksensa". Jos lauseessa lukee "Apple maistui makealta", painotus muuttuu.

Attention ei ole ihmisen tietoista huomiota. Se on matemaattinen painotusjärjestelmä.

Silti se muutti kaiken.

Ennen transformer-aikaa monet mallit käsittelivät tekstiä vahvemmin järjestyksessä. Pitkät riippuvuudet olivat vaikeita. Attention auttoi mallia yhdistämään kaukana toisistaan olevia asioita ja kouluttamaan malleja tehokkaammin rinnakkain.

Käytännön merkitys näkyy promptauksessa. Jos annat mallille sekavan tehtävänannon, se voi painottaa vääriä kohtia. Jos annat selkeän tavoitteen, esimerkit ja rajoitteet, malli saa paremman kartan siitä, mihin sen pitää kiinnittää huomiota.

Huono prompti:

❝

Tee tästä parempi.

Parempi prompti:

❝

Muokkaa tästä asiantuntijalle suunnattu LinkedIn-postaus. Säilytä pääväite, lyhennä 30 %, poista hype ja anna lopuksi kolme vaihtoehtoista aloitusta.

Toisessa tapauksessa mallilla on paljon selkeämpi konteksti.

Nyrkkisääntö: attention auttaa mallia painottamaan oikeita osia kontekstista.

1-to-1 AI-sparraus (300 €)

Kaksi tuntia henkilökohtaista AI-sparrausta, joka rakentuu kokonaan sinun tilanteesi ja tavoitteidesi ympärille. Ei valmiita kalvoja, ei geneeristä sisältöä - vaan konkreettista apua juuri niihin kysymyksiin, joita sinulla on tekoälyn hyödyntämisestä.

zcal.co/janneikola/ai-sparraus

5. Transformerit: modernin kieli-AI:n perusrunko

Transformer on arkkitehtuuri, jonka päälle moderni kieli-AI pitkälti rakentuu.

Se tuli tunnetuksi vuonna 2017 julkaistusta paperista "Attention Is All You Need". Paperin idea oli kova: sekvenssejä voidaan käsitellä attentionin avulla ilman perinteistä toistuvaa rakennetta, joka etenee askel kerrallaan.

Yksinkertaistettu transformer-putki:

Teksti pilkotaan tokeneiksi.
Tokenit muutetaan embeddingeiksi.
Malli lisää tiedon tokenien järjestyksestä.
Attention-kerrokset katsovat tokenien suhteita.
Feed-forward-kerrokset jalostavat esitystä.
Tätä pinotaan monta kertaa.
Lopuksi malli tuottaa seuraavan tokenin tai muun ulostulon.

GPT, Claude, Gemini, Llama ja Mistral ovat kaikki transformer-perheen malleja. Niiden yksityiskohdat eroavat, mutta perusajatus on sama: paljon kerroksia, paljon attentionia, paljon opittuja painoja.

Transformerin vahvuus on skaalautuvuus. Sitä voi kouluttaa valtavilla datamäärillä, ja se hyödyntää rinnakkaista laskentaa hyvin.

Tämä ei tarkoita, että kaikki AI olisi transformer-pohjaista. Kuvamalleissa, videossa, äänessä, robotiikassa ja uusissa hybridiarkkitehtuureissa käytetään muitakin menetelmiä. Silti kielimallien kannalta transformer on se iso perusidea.

❝

Jos ymmärrät transformer-putken, nykyiset kielimallit eivät enää tunnu yhtä mystisiltä. Malli ei "lue" tekstiä kuten ihminen. Se muuttaa tekstin numeroesityksiksi, suhteuttaa osat toisiinsa ja ennustaa seuraavaa sopivaa osaa.

Nyrkkisääntö: transformer on tehokas tapa käsitellä kontekstia attentionin avulla.

Mitä tapahtuu, kun keskustelet LLM:n kanssa?

Nyt peruspalikat ovat kasassa. Seuraavaksi katsotaan, mitä tapahtuu, kun avaat ChatGPT:n, Clauden tai Geminin ja kirjoitat viestin.

Tässä kohtaa moni väärinkäsitys syntyy. Kielimalli näyttää keskustelukumppanilta, mutta taustalla se toimii todennäköisyyksien, kontekstin ja generoinnin varassa.

6. LLM: seuraavan tokenin ennustaja, joka oppi paljon muutakin

LLM tarkoittaa large language modelia eli suurta kielimallia.

20 AI-käsitettä jotka kannattaa ymmärtää vuonna 2026

Miten AI oikeasti toimii?

1. Neuroverkot: painotettu putki datasta ennusteeksi

2. Tokenisaatio: AI:n tekstinpalastelija

3. Embeddingit: merkityksen koordinaatit

4. Attention: miten malli tietää, mihin sana liittyy

5. Transformerit: modernin kieli-AI:n perusrunko

Mitä tapahtuu, kun keskustelet LLM:n kanssa?

6. LLM: seuraavan tokenin ennustaja, joka oppi paljon muutakin

Reply

Keep Reading

AI-Sanomat

Home

Account

Bottiverstas

Premium-sisällöt

Työkalut

20 AI-käsitettä jotka kannattaa ymmärtää vuonna 2026

Miten AI oikeasti toimii?

1. Neuroverkot: painotettu putki datasta ennusteeksi

2. Tokenisaatio: AI:n tekstinpalastelija

3. Embeddingit: merkityksen koordinaatit

4. Attention: miten malli tietää, mihin sana liittyy

5. Transformerit: modernin kieli-AI:n perusrunko

Mitä tapahtuu, kun keskustelet LLM:n kanssa?

6. LLM: seuraavan tokenin ennustaja, joka oppi paljon muutakin

Subscribe to keep reading

Reply

Keep Reading

AI-Sanomat

Home

Account

Bottiverstas

Premium-sisällöt

Työkalut