
Kaikki käyttävät tekoälyä. Harva kuitenkaan ymmärtää, mitä konepellin alla tapahtuu.
Se näkyy arjessa. ChatGPT:ltä kysytään faktoja kuin hakukoneelta. Claudeen liitetään 100-sivuinen PDF ja oletetaan, että malli muistaa kaiken täydellisesti. Cursorin annetaan muokata koodia ymmärtämättä, missä kohtaa agentti oikeasti tekee päätöksiä. Midjourneyltä odotetaan täsmällistä sommittelua, vaikka kuvamalli toimii aivan eri tavalla kuin ihminen.
Ongelma ei ole matematiikka. Et tarvitse tohtorintutkintoa ymmärtääksesi tekoälyn peruskäsitteet. Tarvitset vain oikeat mentaalimallit.
Tässä oppaassa avataan 20 käsitettä, jotka tekevät nykyisestä tekoälystä ymmärrettävää: neuroverkot, tokenit, embeddingit, attention, transformerit, kielimallit, konteksti-ikkunat, temperature, hallusinaatiot, promptaus, transfer learning, fine-tuning, RLHF, LoRA, kvantisointi, RAG, vektorikannat, agentit, chain of thought ja diffuusiomallit.
Kun nämä ymmärtää, AI-uutiset eivät kuulosta enää taikuudelta. Eivätkä myyntipuheet mene yhtä helposti läpi.👇
Miten AI oikeasti toimii?
Tekoälystä puhutaan usein kuin yhdestä asiasta. Todellisuudessa nykyinen AI on kerroksia kerrosten päällä.
Alimpana on matematiikka: neuroverkot, painot, vektorit ja todennäköisyydet. Sen päällä on arkkitehtuuri: transformer, attention ja muut tavat käsitellä dataa. Sen päällä on tuote: chat, hakubotti, koodausagentti tai kuvageneraattori.
Aloitetaan pohjalta.
1. Neuroverkot: painotettu putki datasta ennusteeksi

Neuroverkko on laskentaputki.
Data menee sisään. Se kulkee kerrosten läpi. Lopulta ulos tulee ennuste, luokitus, sana, kuva, ääni tai jokin muu tulos.
Nimi johtaa vähän harhaan. Neuroverkko ei ole digitaaliset aivot pienoiskoossa. "Neuroni" on tässä analogia. Käytännössä neuroverkko on valtava määrä lukuja ja matriisilaskentaa.
Yksinkertainen putki näyttää tältä:
Syöte tulee sisään.
Ensimmäinen kerros muuntaa sen numeroiksi.
Piilokerrokset jalostavat numeroesitystä.
Viimeinen kerros tuottaa ennusteen.
Jokaisen yhteyden välissä on paino. Paino on pieni luku, joka kertoo, kuinka paljon jokin piirre vaikuttaa seuraavaan vaiheeseen.
Koulutus tarkoittaa painojen säätämistä.
Jos malli ennustaa väärin, painoja korjataan vähän. Tätä toistetaan valtavalla määrällä esimerkkejä. Lopputuloksena syntyy malli, joka osaa tehdä hyödyllisiä ennusteita uusista syötteistä.
Roskapostisuodatin on helppo esimerkki. Syötteenä on sähköposti. Malli katsoo sanoja, lähettäjää, linkkejä ja muita piirteitä. Ulos tulee todennäköisyys: onko tämä roskapostia vai ei?
Kielimalli toimii samalla perusperiaatteella, mutta mittakaava on eri. Syötteenä on tekstin palasia. Ulos tulee todennäköisyys sille, mikä palanen tulee seuraavaksi.
Tässä kohtaa moni kysyy: "Missä mallin tieto sitten on?"
Se on painoissa. Ei tietokantariveinä, ei muistiinpanoina, ei hakemistona, vaan opittuina lukuarvoina. Siksi kielimalli voi osata selittää Suomen historiaa ilman, että sen sisällä on erillistä tiedostoa nimeltä suomen-historia.txt.
Tämä selittää myös AI:n oudot virheet. Malli ei nouda vastausta varastosta. Se laskee todennäköisen vastauksen syötteen ja opittujen painojen perusteella.
Tärkeä varoitus: mallin koko ei yksin kerro laatua.
Parametrimääristä puhutaan paljon, mutta kaikkia lukuja ei ole julkaistu virallisesti. GPT-4:n tai Claude-mallien tarkkoja parametrimääriä ei kannata käsitellä varmoina faktoina, ellei mallin tekijä ole ne itse vahvistanut. Lisäksi data, arkkitehtuuri, koulutusmenetelmä ja jälkikoulutus vaikuttavat vähintään yhtä paljon.
Nyrkkisääntö: neuroverkko on opittu muunnos syötteestä ulostuloksi. Se ei ajattele kuten ihminen. Se laskee.

2. Tokenisaatio: AI:n tekstinpalastelija

Kielimalli ei lue tekstiä sanoina.
Ensin teksti pilkotaan tokeneiksi. Tokeni voi olla sana, sanan osa, kirjainyhdistelmä tai joskus yksittäinen merkki.
Esimerkiksi englannissa:
dogvoi olla yksi tokeniplayingvoi pilkkoutua osiinplayjaingChatGPTvoi pilkkoutua useaan osaan
Tarkka pilkkominen riippuu mallin tokenisaattorista. GPT, Claude, Gemini ja avoimet Llama-mallit voivat pilkkoa saman tekstin eri tavalla.
Miksi tällä on väliä?
Koska tokenit ovat AI:n käytännön mittayksikkö. Niillä mitataan:
kuinka paljon tekstiä malli voi nähdä kerralla
paljonko API-kutsu maksaa
kuinka pitkä vastaus voi olla
miksi pitkä dokumentti ei aina mahdu mukaan
Kun mallin konteksti on esimerkiksi 128 000 tokenia, se ei tarkoita 128 000 sanaa. Karkea englanninkielinen sääntö on, että yksi token on noin 0,75 sanaa tai 3–4 merkkiä. Suomen kielessä arvio voi heittää, koska meillä on taivutuksia, pitkiä yhdyssanoja ja erilainen sanarakenteen rytmi.
Sama koskee koodia, taulukoita ja dokumentteja. Lyhytkin tiedosto voi viedä paljon tokeneita, jos siinä on paljon erikoismerkkejä, JSON-rakennetta tai taulukkomuotoista dataa.
Käytännön esimerkki:
Annat mallille 40-sivuisen sopimuksen ja pyydät tiivistelmää. Jos sopimus mahtuu kontekstiin, malli voi käsitellä sitä suoraan. Jos ei mahdu, työkalu joutuu tiivistämään, pilkkomaan tai hakemaan vain osia dokumentista. Silloin vastauksen laatu riippuu siitä, mitä osia mukaan päätyy.
Tokenisaatio selittää myös API-kustannuksia. Jos rakennat asiakastukibotin, jokainen käyttäjän kysymys, haettu dokumenttipala ja mallin vastaus kuluttavat tokeneita. Kun volyymi kasvaa, pienistäkin promptin parannuksista tulee rahaa.
Nyrkkisääntö: tokeni on mallin tekstiyksikkö. Se ei ole sama asia kuin sana.
3. Embeddingit: merkityksen koordinaatit

Kun teksti on pilkottu tokeneiksi, se pitää muuttaa numeroiksi.
Embedding on tällainen numeroesitys. Se on vektori eli pitkä numerosarja, joka kuvaa sanan, lauseen, dokumentin, kuvan tai muun sisällön merkitystä.
Hyvä vertaus on kartta.
Kartalla Helsinki ja Espoo ovat lähempänä toisiaan kuin Helsinki ja Tokio. Embedding-avaruudessa "lääkäri" ja "sairaanhoitaja" ovat lähempänä toisiaan kuin "lääkäri" ja "pizza". Kyse ei ole fyysisestä etäisyydestä, vaan merkityksen etäisyydestä.
Tämä on tärkeä idea: malli ei ymmärrä sanoja ihmisen tavoin. Se käsittelee etäisyyksiä ja suuntia moniulotteisessa avaruudessa.
Embeddingit mahdollistavat monta asiaa, joita käytät jo arjessa:
semanttinen haku
suosittelut
dokumenttien ryhmittely
samankaltaisten tapausten löytäminen
RAG-järjestelmät
hakutulosten uudelleenjärjestäminen
Semanttinen haku tarkoittaa, että haku löytää merkityksen, vaikka sanat eivät täsmää.
Kysyt sisäiseltä AI-botilta:
"Miten työsuhteen voi päättää koeajalla?"
Dokumentissa ei välttämättä ole täsmälleen tuota lausetta. Siellä voi lukea "koeaikapurku", "palvelussuhteen päättäminen" tai "työsopimuksen purkaminen". Avainsanahaku voi epäonnistua. Embedding-haku löytää samankaltaisen merkityksen.
Tässä on myös riski. Merkityksen läheisyys ei ole sama asia kuin oikea vastaus. Jos dokumentit ovat huonosti nimetyt, vanhentuneet tai ristiriitaiset, embedding voi löytää lähimmän huonon vastauksen.
Embedding ei siis ratkaise tietotyötä yksin. Se tekee tiedosta haettavaa merkityksen perusteella.
Nyrkkisääntö: embedding on tekstin tai muun sisällön koordinaatti merkityskartalla.
4. Attention: miten malli tietää, mihin sana liittyy

Sana "Apple" tarkoittaa eri asioita eri lauseissa.
Söin omenan.
Ostin Applea salkkuun.
Suomeksi esimerkki on vähemmän hämäävä, koska omena ja Apple eroavat sanoina. Englanniksi sama sana voi tarkoittaa hedelmää tai yhtiötä. Sama ilmiö näkyy silti kaikkialla: "malli", "pankki", "verkko", "agentti" ja "solu" vaihtavat merkitystä kontekstin mukaan.
Embedding yksin ei riitä ratkaisemaan tätä. Sana tarvitsee ympäristön.
Attention on mekanismi, jolla malli katsoo muita tokeneita ja päättää, mitkä niistä ovat olennaisia juuri nyt.
Self-attentionissa jokainen token voi suhteuttaa itseään muihin tokeneihin. Jos lauseessa lukee "Apple julkaisi tuloksensa", malli painottaa sanoja "julkaisi" ja "tuloksensa". Jos lauseessa lukee "Apple maistui makealta", painotus muuttuu.
Attention ei ole ihmisen tietoista huomiota. Se on matemaattinen painotusjärjestelmä.
Silti se muutti kaiken.
Ennen transformer-aikaa monet mallit käsittelivät tekstiä vahvemmin järjestyksessä. Pitkät riippuvuudet olivat vaikeita. Attention auttoi mallia yhdistämään kaukana toisistaan olevia asioita ja kouluttamaan malleja tehokkaammin rinnakkain.
Käytännön merkitys näkyy promptauksessa. Jos annat mallille sekavan tehtävänannon, se voi painottaa vääriä kohtia. Jos annat selkeän tavoitteen, esimerkit ja rajoitteet, malli saa paremman kartan siitä, mihin sen pitää kiinnittää huomiota.
Huono prompti:
Tee tästä parempi.
Parempi prompti:
Muokkaa tästä asiantuntijalle suunnattu LinkedIn-postaus. Säilytä pääväite, lyhennä 30 %, poista hype ja anna lopuksi kolme vaihtoehtoista aloitusta.
Toisessa tapauksessa mallilla on paljon selkeämpi konteksti.
Nyrkkisääntö: attention auttaa mallia painottamaan oikeita osia kontekstista.
5. Transformerit: modernin kieli-AI:n perusrunko

Transformer on arkkitehtuuri, jonka päälle moderni kieli-AI pitkälti rakentuu.
Se tuli tunnetuksi vuonna 2017 julkaistusta paperista "Attention Is All You Need". Paperin idea oli kova: sekvenssejä voidaan käsitellä attentionin avulla ilman perinteistä toistuvaa rakennetta, joka etenee askel kerrallaan.
Yksinkertaistettu transformer-putki:
Teksti pilkotaan tokeneiksi.
Tokenit muutetaan embeddingeiksi.
Malli lisää tiedon tokenien järjestyksestä.
Attention-kerrokset katsovat tokenien suhteita.
Feed-forward-kerrokset jalostavat esitystä.
Tätä pinotaan monta kertaa.
Lopuksi malli tuottaa seuraavan tokenin tai muun ulostulon.
GPT, Claude, Gemini, Llama ja Mistral ovat kaikki transformer-perheen malleja. Niiden yksityiskohdat eroavat, mutta perusajatus on sama: paljon kerroksia, paljon attentionia, paljon opittuja painoja.
Transformerin vahvuus on skaalautuvuus. Sitä voi kouluttaa valtavilla datamäärillä, ja se hyödyntää rinnakkaista laskentaa hyvin.
Tämä ei tarkoita, että kaikki AI olisi transformer-pohjaista. Kuvamalleissa, videossa, äänessä, robotiikassa ja uusissa hybridiarkkitehtuureissa käytetään muitakin menetelmiä. Silti kielimallien kannalta transformer on se iso perusidea.
Jos ymmärrät transformer-putken, nykyiset kielimallit eivät enää tunnu yhtä mystisiltä. Malli ei "lue" tekstiä kuten ihminen. Se muuttaa tekstin numeroesityksiksi, suhteuttaa osat toisiinsa ja ennustaa seuraavaa sopivaa osaa.
Nyrkkisääntö: transformer on tehokas tapa käsitellä kontekstia attentionin avulla.
Mitä tapahtuu, kun keskustelet LLM:n kanssa?
Nyt peruspalikat ovat kasassa. Seuraavaksi katsotaan, mitä tapahtuu, kun avaat ChatGPT:n, Clauden tai Geminin ja kirjoitat viestin.
Tässä kohtaa moni väärinkäsitys syntyy. Kielimalli näyttää keskustelukumppanilta, mutta taustalla se toimii todennäköisyyksien, kontekstin ja generoinnin varassa.
6. LLM: seuraavan tokenin ennustaja, joka oppi paljon muutakin

LLM tarkoittaa large language modelia eli suurta kielimallia.
Se on yleensä transformer-pohjainen malli, joka on koulutettu valtavalla määrällä tekstiä: verkkosivuja, kirjoja, koodia, artikkeleita, dokumentaatiota, keskusteluja ja muuta ihmisten tuottamaa sisältöä.
Koulutustehtävä kuulostaa melkein liian yksinkertaiselta:
Ennusta seuraava token.
Siinä se.
Malli saa tekstin alun ja yrittää ennustaa, mikä token tulee seuraavaksi. Jos ennuste on väärä, painoja säädetään. Tätä toistetaan biljoonilla tokeneilla.
Miksi tästä syntyy jotain niin hyödyllistä?
Koska tekstissä on valtavasti rakennetta. Kielioppi on rakennetta. Koodi on rakennetta. Matematiikan ratkaisut ovat rakennetta. Juridiset sopimukset ovat rakennetta. Asiakaspalvelun keskustelut ovat rakennetta.
Kun malli oppii ennustamaan tekstiä suuressa mittakaavassa, se oppii samalla paljon tekstissä näkyvistä tavoista ajatella, selittää, ohjelmoida, perustella ja ratkaista.
Tämä ei tee mallista tietoista. Se tekee siitä hämmästyttävän hyvän tekstin ja rakenteiden jatkajan.
Kun pyydät mallia kirjoittamaan SQL-kyselyn, se ei "muista" yhtä tiettyä Stack Overflow -vastausta. Se tuottaa todennäköisen ratkaisun, joka muistuttaa monia koulutusdatassa nähtyjä rakenteita.
Kun pyydät sitä selittämään RAGin, se tuottaa selityksen, joka sopii kysymykseen, sävyyn ja kontekstiin.
Tässä on LLM:n voima ja ongelma samassa paketissa.
Se on erinomainen luonnostelija, muuntaja, tiivistäjä, keskustelija ja koodin apuri. Mutta se ei ole hakukone, totuusmoottori tai tietokanta.
Nyrkkisääntö: LLM ennustaa seuraavaa tokenia niin hyvin, että se näyttää usein ymmärrykseltä.
7. Konteksti-ikkuna: työpöytä, ei pysyvä muisti

Konteksti-ikkuna on mallin hetkellinen työpöytä.
Se kertoo, kuinka monta tokenia malli voi nähdä yhdellä kertaa. Mukana ovat järjestelmäohjeet, keskusteluhistoria, käyttäjän viesti, liitetyt dokumentit, haetut lähteet, työkalujen tulokset ja mallin oma vastaus.
Kun konteksti täyttyy, jotain pitää jättää pois, tiivistää tai hakea uudelleen.
Tämä on tärkeä ero: konteksti ei ole pysyvä muisti.
Jos kirjoitat pitkän keskustelun alussa tärkeän ohjeen, malli voi myöhemmin painottaa sitä vähemmän. Pitkän kontekstin tutkimuksessa puhutaan "Lost in the Middle" -ilmiöstä: mallit käyttävät usein paremmin kontekstin alkua ja loppua kuin keskelle hautautunutta tietoa.
Tämä selittää monta arkista pettymystä.
Latasit pitkän PDF:n ja sanoit: "Käytä vain tätä dokumenttia." Malli vastaa silti oudosti. Se ei välttämättä johdu siitä, että dokumentti puuttuu. Se voi johtua siitä, että olennainen kohta on keskellä massaa, dokumentti on pilkottu huonosti tai työkalu on hakenut väärän osan.
Pitkä konteksti on silti hyödyllinen. Se mahdollistaa laajemmat analyysit, pitkät koodipohjat, monen dokumentin vertailun ja syvemmät keskustelut. Se vaan ei ole täydellinen muisti.
Käytännön vinkki:
Kun annat pitkän aineiston, kerro mallille mitä etsit.
Huono:
Lue tämä 80-sivuinen dokumentti ja kerro tärkeimmät asiat.
Parempi:
Lue dokumentti ostajan näkökulmasta. Etsi hinnoitteluun, sopimusriskeihin, tietosuojaan ja irtisanomiseen liittyvät kohdat. Anna jokaisesta lähdekohta ja epävarmuus.
Nyrkkisääntö: konteksti-ikkuna on mallin työpöytä. Hyvä työpöytäjärjestys auttaa.
8. Temperature: luovuuden ja kurinalaisuuden säädin

Kun malli tuottaa tekstiä, se ei näe vain yhtä mahdollista seuraavaa tokenia. Se näkee joukon vaihtoehtoja ja niiden todennäköisyyksiä.
Temperature säätää, kuinka rohkeasti malli valitsee näistä vaihtoehdoista.
Matala temperature tekee vastauksesta konservatiivisemman. Malli valitsee todennäköisemmän ja turvallisemman jatkon. Korkeampi temperature lisää vaihtelua. Vastaus voi olla luovempi, mutta myös epätasaisempi.
Karkeasti:
Tehtävä | Sopiva suunta |
|---|---|
Koodi | matalampi |
Faktatiivinen tiivistelmä | matalampi |
Taulukon muunnos | matalampi |
Ideointi | korkeampi |
Otsikkovaihtoehdot | korkeampi |
Luova kirjoittaminen | korkeampi |
Kaikki työkalut eivät näytä temperature-säädintä. Kuluttajatuotteissa se on usein piilossa. Silti sama ajatus näkyy promptauksessa.
Jos vastaus on tylsä, pyydä lisää vaihtelua:
Anna 10 rohkeampaa vaihtoehtoa. Tee niistä keskenään erilaisia.
Jos vastaus harhailee, kiristä tehtävää:
Vastaa vain kolmella bulletilla. Käytä vain annettuja lähteitä. Älä keksi esimerkkejä.
Temperature ei tee mallista älykkäämpää. Se säätää riskinottoa.
Nyrkkisääntö: matala temperature on kurinalainen, korkea temperature kokeilevampi.
9. Hallusinaatio: kun todennäköinen kuulostaa todelta

AI voi olla väärässä tavalla, joka kuulostaa ärsyttävän varmalta.
Se voi keksiä tutkimuspaperin, jota ei ole olemassa. Se voi antaa API-funktion, jota kirjasto ei tue. Se voi muistaa henkilön tittelin väärin. Se voi siteerata lakia uskottavasti mutta epätarkasti.
Tätä kutsutaan hallusinaatioksi.
Sana on vähän huono, mutta ilmiö on todellinen. Malli ei välttämättä hae totuutta. Se tuottaa todennäköiseltä kuulostavaa jatkoa kontekstille.
Jos kysyt:
Anna kolme tutkimusta, jotka todistavat väitteen X.
Malli voi tuottaa kolme lähdeviitettä, koska lähdeviitteiden muoto on sille tuttu. Se ei välttämättä tarkista, että lähteet ovat oikeita.
Hallusinaatiot näkyvät erityisesti kohdissa, joissa muoto on helppo mutta totuus vaikea:
lähdeviitteet
henkilönnimet
päivämäärät
hinnat
lakipykälät
API-metodit
lääketieteelliset väitteet
yritysten ajankohtaiset tiedot
Korjaus ei ole "älä käytä AI:ta". Korjaus on käyttää sitä oikein.
Faktatyössä kannattaa vaatia lähteet, käyttää hakua, tarkistaa viralliset dokumentit ja testata tekniset väitteet. RAG auttaa, koska malli saa lähteitä kontekstiin. Mutta sekään ei poista virheitä kokonaan. Jos haku tuo väärän dokumentin, malli voi vastata väärään lähteeseen nojaten.
Käytännön sääntö AI-Sanomien lukijalle:
Luonnostele AI:lla. Tarkista nimet, numerot, hinnat, lait ja tekniset rajapinnat alkuperäislähteestä.
Nyrkkisääntö: itsevarma vastaus ei ole sama asia kuin oikea vastaus.
10. Prompt engineering: selkeä työpyyntö voittaa taikasanat

Prompt engineering kuulostaa hienolta. Usein se tarkoittaa vain selkeää työpyyntöä.
Sama malli voi antaa huonon tai hyvän vastauksen sen mukaan, miten tehtävä annetaan.
Huono prompti:
Selitä API:t.
Parempi prompti:
Selitä REST API -autentikointi juniorikehittäjälle. Käytä yhtä Node.js-esimerkkiä. Kerro ero API-avaimen, bearer tokenin ja OAuthin välillä. Lopuksi anna viiden kohdan tarkistuslista.
Jälkimmäinen toimii paremmin, koska malli tietää:
kenelle se vastaa
mitä aihetta rajataan
mitä esimerkkiä käytetään
missä muodossa vastaus halutaan
mikä on onnistunut lopputulos
Hyvä prompti sisältää yleensä viisi asiaa:
Konteksti: missä tilanteessa tätä käytetään?
Tavoite: mitä lopputulosta haetaan?
Rooli tai näkökulma: millä osaamisella asiaa katsotaan?
Rajoitteet: mitä pitää välttää?
Formaatti: miltä vastauksen pitää näyttää?
Promptaus ei ole taikasanojen keräilyä. "Act as..." voi auttaa, mutta se ei tee mallista oikeaa juristia tai lääkäriä. "Think step by step" voi auttaa, mutta pitkä päättelyketju voi silti olla väärä.
Parempi tapa ajatella promptausta on työn suunnittelu.
Jos tehtävä on iso, älä pyydä kaikkea yhdellä kertaa. Pyydä ensin suunnitelma, sitten luonnos, sitten kritiikki, sitten viimeistely.
Nyrkkisääntö: promptaus on käyttöliittymä mallin kykyihin.
Miten AI-mallit paranevat?
Raaka kielimalli ei ole sama asia kuin hyvä tuote.
Jotta malli tuntuu hyödylliseltä, sitä muokataan, ohjataan, tiivistetään, hienosäädetään ja pakataan. Tässä kohtaa tulevat käsitteet, jotka selittävät, miksi yksi malli on hyvä koodissa, toinen asiakaspalvelussa ja kolmas pyörii läppärillä.
11. Transfer learning: älä aloita tyhjästä

Mallin kouluttaminen tyhjästä on kallista.
Tarvitaan dataa, laskentaa, osaamista, infraa, arviointia ja aikaa. Frontier-mallien tasolla puhutaan valtavista kustannuksista.
Transfer learning muuttaa pelin.
Sen idea on yksinkertainen: otetaan malli, joka on jo oppinut suuren yleisen tehtävän, ja mukautetaan se uuteen tehtävään.
Ihmisvertaus:
Jos osaat ajaa polkupyörää, moottoripyörän oppiminen on helpompaa kuin jos et olisi koskaan tasapainoillut kahdella pyörällä. Kaikkea ei tarvitse oppia alusta.
AI:ssa tämä tarkoittaa, että perusmalli on jo oppinut kieltä, käsitteitä, koodin rakennetta ja yleisiä vastausmuotoja. Sovellus rakentaa sen päälle.
Siksi useimmat yritykset eivät kouluta omaa mallia tyhjästä. Ne käyttävät valmista foundation-mallia ja lisäävät päälle:
promptit
RAGin
fine-tuningin
LoRA-adapterin
työkalut
käyttöliittymän
arviointimittarit
Tämä on hyvä kysymys jokaiselle AI-tuotteelle:
Mikä tässä on perusmallin kykyä, ja mikä on tuotteen omaa lisäarvoa?
Jos tuote on vain ohut käyttöliittymä ChatGPT:n päällä, sen kilpailuetu voi olla heikko. Jos se yhdistää mallin hyvään dataan, työnkulkuun ja arviointiin, arvo voi olla todellinen.
Tärkeä varaus: jotkut yhtiöt kouluttavat edelleen malleja alusta. OpenAI, Anthropic, Google, Meta, Mistral ja muut mallintekijät tekevät tätä. Sovellusyritykselle se on harvoin järkevää.
Nyrkkisääntö: transfer learning antaa pienen tiimin seistä suuren mallin hartioilla.
12. Fine-tuning: opeta mallille käytös, ei koko maailmaa

Fine-tuning tarkoittaa mallin jatkokouluttamista kohdennetulla datalla.
Perusmalli osaa jo kieltä. Fine-tuning opettaa sille tarkemman tavan vastata.
Se voi opettaa esimerkiksi:
asiakastuen vastausformaatin
yrityksen äänensävyn
tietyn luokittelutehtävän
juridisen dokumentin analyysirakenteen
koodigeneraattorin halutun tyylin
🆘 Fine-tuning ei ole paras ratkaisu kaikkeen.
Jos haluat mallin tietävän uusimmat tuotehinnat, yrityksen sisäiset ohjeet tai muuttuvat sopimusehdot, RAG on usein parempi. Silloin tieto pysyy dokumenteissa tai tietokannassa ja päivittyy ilman mallin uudelleenkoulutusta.
Fine-tuning sopii paremmin toistuvaan käyttäytymiseen.
Esimerkki:
Asiakastukitiimi haluaa, että malli vastaa aina samalla rakenteella:
tunnista asiakkaan ongelma
anna lyhyt ratkaisu
linkitä ohje
kerro, milloin asia siirtyy ihmiselle
Jos tästä on tuhansia hyviä esimerkkejä, fine-tuning voi parantaa laatua ja vähentää pitkien promptien tarvetta.
Huono fine-tuning-data tekee mallista huonomman. Se voi opettaa virheitä, huonoa tyyliä tai vanhentuneita käytäntöjä. Siksi data ja arviointi ovat tärkeämpiä kuin itse menetelmä.
Käytännön kysymys:
Haluammeko opettaa mallille uutta tietoa vai uuden tavan toimia?
Jos vastaus on "uutta tietoa", katso ensin RAGia. Jos vastaus on "uusi tapa toimia", fine-tuning voi olla järkevä.
Nyrkkisääntö: fine-tuning muokkaa mallin käyttäytymistä.
13. RLHF: miksi raakatekstigeneraattorista tuli assistentti

Raaka kielimalli jatkaa tekstiä.
Assistenttimalli yrittää auttaa.
Tuo ero syntyy pitkälti jälkikoulutuksesta. Yksi tärkeä menetelmä on RLHF eli reinforcement learning from human feedback.
Perusidea:
Mallille annetaan prompti.
Malli tuottaa useita vastauksia.
Ihmiset arvioivat, mikä vastaus on parempi.
Palautteesta koulutetaan palkkiomalli.
Kielimallia ohjataan tuottamaan ihmisten suosimia vastauksia.
OpenAI:n InstructGPT-paperi teki tämän lähestymistavan tunnetuksi. Siinä näytettiin, että ihmispalautteella hienosäädetty pienempi malli voi olla käyttäjien mielestä parempi kuin paljon suurempi raakamalli.
RLHF opettaa mallille, millainen vastaus tuntuu ihmisestä hyvältä:
selkeä
hyödyllinen
turvallinen
ohjeen mukainen
vähemmän toksinen
vähemmän satunnainen
Tämä on syy, miksi ChatGPT ja Claude tuntuvat keskustelukumppaneilta. Ne eivät vain jatka tekstiä. Ne yrittävät vastata roolissaan.
Mutta RLHF ei tee mallista erehtymätöntä. Se voi myös luoda uusia ongelmia. Mallista voi tulla miellyttämishaluinen. Se voi kuulostaa varmemmalta kuin pitäisi. Se voi kieltäytyä liian herkästi tai käyttää turhan varovaista sävyä.
Kun malli sanoo "en voi auttaa tuossa", kyse ei välttämättä ole perusmallin kyvyttömyydestä. Se voi olla turvallisuus- ja ohjauskerroksen päätös.
Nyrkkisääntö: RLHF tekee mallista käyttökelpoisemman assistentin, mutta ei totuuden mittaria.

14. LoRA: pieni adapteri suuren mallin kyljessä

Fine-tuning voi olla kallista, jos koko mallin painoja muutetaan.
LoRA eli Low-Rank Adaptation ratkaisee tätä ongelmaa. Sen idea on pitää perusmalli jäädytettynä ja kouluttaa pieniä lisäosia mallin kylkeen.
Ajattele perusmallia isona koneena. LoRA on vaihdettava lisäosa, joka säätää koneen toimintaa tiettyyn tehtävään.
Tämä auttaa kolmella tavalla:
Koulutettavia parametreja on paljon vähemmän.
Adapterit vievät vähemmän tallennustilaa.
Sama perusmalli voi käyttää eri adaptereita eri tehtäviin.
Avoimen mallin yhteisössä LoRA on ollut iso juttu. Se teki erikoismallien kokeilusta halvempaa. Yksi perusmalli voi saada adapterin suomenkieliseen asiakaspalveluun, toisen lääketieteelliseen tekstiluokitteluun ja kolmannen pelihahmon dialogiin.
LoRA ei kuitenkaan poista vaikeinta osaa: dataa.
Jos koulutusdata on huonoa, adapteri oppii huonon tavan. Jos arviointi puuttuu, et tiedä paransiko hienosäätö mitään. Jos tehtävä vaatii ajantasaista faktatietoa, LoRA ei välttämättä ole oikea ratkaisu.
Käytännön kysymys:
Tarvitsemmeko kevyen erikoistuksen avoimeen malliin vai riittääkö prompti ja RAG?
Nyrkkisääntö: LoRA on kevyt tapa erikoistaa mallia ilman koko mallin uudelleenkoulutusta.
15. Kvantisointi: malli pienempään tilaan

Suuret mallit vievät paljon muistia.
Painot tallennetaan numeroina. Mitä tarkempia numeroita käytetään, sitä enemmän muistia tarvitaan. Perinteisesti painot voivat olla 32- tai 16-bittisiä. Kvantisointi pienentää tarkkuutta esimerkiksi 8- tai 4-bittiseksi.
Kuulostaa vaaralliselta. Eikö tarkkuus romahda?
Joskus heikkenee. Usein yllättävän vähän.
Kaikki desimaalit eivät ole yhtä tärkeitä mallin toiminnan kannalta. Kun kvantisointi tehdään fiksusti, malli voi säilyttää suuren osan laadustaan mutta mahtua paljon pienempään muistiin.
Tämä on yksi syy, miksi ns. paikallinen AI on noussut.
Kvantisoitu avoin malli voi pyöriä Macilla, kuluttaja-GPU:lla tai joissain tapauksissa puhelimessa. Täystarkkuudella sama malli vaatisi paljon enemmän muistia.
QLoRA yhdistää kaksi ajatusta: 4-bittinen kvantisointi ja LoRA-adapterit. Näin mallia voidaan hienosäätää paljon pienemmillä muistivaatimuksilla.
Tässäkin on varaus.
Kvantisointi ei ole ilmainen lounas. Laatu voi pudota etenkin vaativassa päättelyssä, pitkissä konteksteissa, pienissä malleissa tai tilanteissa, joissa mallilta vaaditaan tarkkaa numeerista käyttäytymistä. Tuotannossa pitää aina testata.
Silti perusmerkitys on valtava. Ilman kvantisointia monet paikalliset AI-sovellukset jäisivät datakeskuksiin.
Nyrkkisääntö: kvantisointi pakkaa mallin niin, että sitä voi ajaa halvemmalla ja lähempänä käyttäjää.
Miten oikeat AI-järjestelmät rakennetaan?
Pelkkä kielimalli ei vielä tee hyvää AI-tuotetta.
Tuotannossa tarvitaan tietoa, hakua, työkaluja, muistia, rajoja, valvontaa ja käyttöliittymä. Tässä kohtaa tulevat RAG, vektorikannat ja agentit.
16. RAG: avoimen kirjan koe kielimallille

LLM vastaa helposti muistinsa varassa. RAG antaa sille kirjan auki pöydälle.
RAG tarkoittaa retrieval-augmented generationia. Suomeksi: hakuavusteinen generointi.
Perusputki:
Käyttäjä kysyy kysymyksen.
Järjestelmä hakee relevantit dokumentit.
Dokumentit annetaan mallille kontekstiksi.
Malli vastaa niiden pohjalta.
Tämä on yritys-AI:n tärkeimpiä perusmalleja.
Jos asiakastukibotti vastaa yrityksen ohjeiden perusteella, se ei yleensä tarkoita, että malli on koulutettu uudelleen kaikilla ohjeilla. Todennäköisemmin ohjeet on laitettu hakujärjestelmään. Kun asiakas kysyy, järjestelmä hakee sopivat ohjepalat ja antaa ne mallille.
RAGin hyödyt:
tietoa voi päivittää ilman mallin uudelleenkoulutusta
vastaukset voidaan ankkuroida lähteisiin
yrityksen oma data saadaan käyttöön
hallusinaatioiden riski pienenee
mallin kontekstia käytetään valikoivammin
Mutta RAG ei ole taikatemppu.
Huono RAG on yllättävän yleinen. Dokumentit pilkotaan väärin. Vanhoja versioita jää mukaan. Haku löytää semanttisesti läheisen mutta juridisesti väärän kohdan. Malli ei kerro epävarmuutta. Lähdeviitteet puuttuvat.
Hyvä RAG vaatii:
siistit dokumentit
versionhallinnan
järkevän paloittelun
hyvän embedding-mallin
hakutulosten uudelleenjärjestämisen
lähdeviitteet
arvioinnin
Jos tieto muuttuu usein, RAG on yleensä parempi kuin fine-tuning. Tuotehinnat, ohjeet, sopimusehdot ja sisäiset prosessit kannattaa pitää haettavana tietona.
Nyrkkisääntö: RAG tekee kielimallista avoimen kirjan kokeen suorittajan.
17. Vektorikannat: merkityspohjaisen haun muistivarasto

RAG tarvitsee hyvän haun.
Mutta miten haetaan miljoonista dokumenttipaloista merkityksen perusteella?
Vektorikanta on yksi vastaus.
Perusprosessi:
Dokumentit pilkotaan palasiksi.
Jokainen pala muutetaan embeddingiksi.
Embedding tallennetaan vektorikantaan.
Käyttäjän kysymys muutetaan embeddingiksi.
Kanta hakee lähimmät vektorit.
Löydetyt dokumenttipalat annetaan mallille.
Työkaluja ovat esimerkiksi Pinecone, Qdrant, Weaviate ja pgvector.
Vektorihaku eroaa avainsanahausta. Avainsanahaku etsii samoja sanoja. Vektorihaku etsii samankaltaista merkitystä.
Esimerkki:
Kysymys:
"Miten lomaraha maksetaan?"
Dokumentissa:
"Vuosilomapalkan lisä suoritetaan palkanmaksun yhteydessä..."
Avainsanahaku voi missata tämän. Vektorihaku voi löytää sen, koska merkitys on lähellä.
Tuotannossa paras haku on usein hybridi. Vektorihaku löytää merkityksen, avainsanahaku löytää täsmälliset termit, metadata rajaa oikean maan, tuotteen tai version, ja reranker järjestää tulokset uudelleen.
Vektorikanta ei myöskään korjaa sotkuista tietoa. Jos kansiossa on kolme vanhaa henkilöstöohjetta ja yksi uusi, haku voi löytää väärän version. Siksi AI-projektin tylsin osa on usein tärkein: dokumenttien siivous.
Nyrkkisääntö: vektorikanta on RAG-järjestelmän merkityspohjainen hakumuisti.
18. AI-agentit: kielimalli saa kädet

Chatbot vastaa.
Agentti tekee.
Tämä on yksinkertaistus, mutta hyödyllinen.
AI-agentti yhdistää kielimallin tavoitteeseen, työkaluihin ja palautesilmukkaan. Se ei vain kirjoita vastausta. Se voi suunnitella, hakea tietoa, kutsua API:a, muokata tiedostoa, ajaa testin, tarkistaa tuloksen ja yrittää uudelleen.
Agenttisilmukka näyttää tältä:
Suunnittele.
Toimi.
Havainnoi tulos.
Korjaa suunnitelmaa.
Toista.
Koodausagentti on hyvä esimerkki.
Käyttäjä antaa bugin. Agentti lukee kuvauksen, etsii oikeat tiedostot, avaa testit, muokkaa koodia, ajaa testit, katsoo virheilmoituksen, tekee uuden korjauksen ja raportoi mitä muutti.
Tässä mallissa LLM on aivot. Työkalut ovat kädet.
Työkaluja voivat olla:
verkkohaku
selain
komentorivi
tiedostojärjestelmä
tietokanta
sähköposti
kalenteri
yrityksen API:t
koodin suoritus
Agentti kuulostaa helposti taialta. Tuotannossa se on myös riski.
Jos agentti saa lähettää sähköposteja, poistaa tiedostoja tai muuttaa asiakasdataa, se tarvitsee rajat. Tarvitaan oikeudet, hyväksynnät, lokit, budjetit, testit ja virheenkäsittely.
Hyvä agentti ei ole malli, jolle annetaan vapaat kädet. Hyvä agentti on tarkasti rajattu työnkulku, jossa malli saa tehdä hyödyllisiä asioita turvallisesti.
Nyrkkisääntö: agentti on LLM plus tavoite, työkalut ja palautesilmukka.
19. Chain of Thought: anna mallille työtila

Joskus malli epäonnistuu, koska se hyppää vastaukseen liian nopeasti.
Chain of Thought eli vaiheittainen päättely auttaa monivaiheisissa tehtävissä. Tutkimuksessa on nähty, että suuret kielimallit suoriutuvat paremmin tietyissä matematiikan, logiikan ja päättelyn tehtävissä, kun niille annetaan esimerkkejä välivaiheista.
Käytännön tasolla idea on yksinkertainen:
Älä pyydä vain lopputulosta. Pyydä mallia jäsentämään tehtävä.
Huono:
Mikä on vastaus?
Parempi:
Tunnista ensin annetut tiedot, valitse kaava, laske vaiheittain ja tarkista lopputulos.
Vuonna 2026 tähän liittyy tärkeä tarkennus. Moni malli ei näytä käyttäjälle varsinaista sisäistä päättelyketjuaan. Se voi silti tehdä sisäistä päättelyä ja antaa ulos tiivistetyn perustelun.
Siksi käyttäjän kannattaa pyytää tarkistettavia välivaiheita, ei mallin "salaista ajattelua".
Hyviä pyyntöjä:
"Näytä laskun välivaiheet."
"Tee ensin suunnitelma, toteuta vasta sitten."
"Listaa oletukset ennen vastausta."
"Anna lopuksi virhetarkistus."
"Erota faktat, päätelmät ja epävarmuudet."
Vaiheittainen päättely ei takaa oikeaa vastausta. Malli voi rakentaa siistin mutta väärän perustelun. Siksi monivaiheiseen työhön kannattaa lisätä tarkistusvaihe:
Tarkista oma vastauksesi. Etsi kolme kohtaa, joissa päättely voi mennä pieleen.
Nyrkkisääntö: anna mallille työtila, mutta älä usko jokaista välivaihetta ilman tarkistusta.
20. Diffuusiomallit: kohinasta kuvaksi

Kaikki tähän asti on pyörinyt tekstin ympärillä. Kuvamallit toimivat usein eri tavalla.
Diffuusiomalli oppii tuottamaan kuvaa opettelemalla ensin rikkomaan kuvia.
Koulutuksessa prosessi menee näin:
Aloitetaan oikeasta kuvasta.
Siihen lisätään kohinaa askel askeleelta.
Lopulta kuvasta tulee lähes pelkkää kohinaa.
Malli oppii kääntämään prosessin: poistamaan kohinaa ja palauttamaan rakennetta.
Generoinnissa aloitetaan kohinasta. Malli poistaa kohinaa vaiheittain ja ohjaa prosessia tekstikehotteen perusteella. Vähitellen satunnaisesta kohinasta alkaa muodostua kuva.
Tämä selittää monta kuvamallien piirrettä.
Sama prompti voi tuottaa eri kuvan, koska lähtökohina vaihtelee. Kuvan yksityiskohdat voivat olla vaikeita, koska malli ei rakenna kuvaa ihmisen tavoin esine esineeltä. Teksti kuvassa voi mennä pieleen, koska malli tuottaa visuaalista rakennetta, ei tekstinkäsittelyä.
Diffuusio muutti ensin kuvageneroinnin. Sen jälkeen sama ajattelutapa on levinnyt videoon, ääneen, 3D-sisältöön ja tieteellisiin sovelluksiin. Kenttä on kuitenkin nykyään hybridinen. Kaikki visuaalinen generointi ei ole puhdasta diffuusiota, ja monet uudet järjestelmät yhdistelevät eri menetelmiä.
Käyttäjän kannalta tärkein oppi on tämä: kuvamalli ei "piirrä" pyytämääsi asiaa kuten graafikko. Se jalostaa kohinasta kuvan, joka sopii promptiin ja opittuun dataan.
Siksi hyvä kuvaprompti ei kerro vain aihetta. Se kertoo myös sommittelun, tyylin, valaistuksen, rajauksen, värimaailman ja sen, mitä kuvassa ei saa olla.
Nyrkkisääntö: diffuusiomalli tekee kuvasta vähitellen vähemmän kohinaa ja enemmän rakennetta.

Pikaopas: mitä nämä käsitteet tarkoittavat käytännössä?
Käsite | Selitys yhdellä lauseella | Missä se näkyy? |
|---|---|---|
Neuroverkko | Kerroksittainen laskentamalli, joka oppii painoja | Kaikkien modernien mallien pohjalla |
Tokenisaatio | Tekstin pilkkominen mallin käsiteltäviksi palasiksi | Konteksti, hinta, vastauspituus |
Embedding | Merkityksen numeerinen koordinaatti | AI-haku, RAG, suosittelu |
Attention | Tapa painottaa kontekstin olennaisia osia | Transformer-mallit |
Transformer | Attentioniin perustuva kielimalliarkkitehtuuri | GPT, Claude, Gemini, Llama |
LLM | Suuri kielimalli, joka tuottaa tekstiä | ChatGPT, Claude, Gemini |
Konteksti-ikkuna | Mallin hetkellinen työpöytä | Pitkät keskustelut, PDF:t, koodi |
Temperature | Generoinnin vaihtelun säädin | Luovat vastaukset ja API:t |
Hallusinaatio | Uskottavalta kuulostava virhe | Lähteet, faktat, koodi |
Prompt engineering | Tehtävänannon suunnittelu | Kaikki AI-käyttö |
Transfer learning | Valmiin mallin hyödyntäminen uudessa tehtävässä | AI-tuotekehitys |
Fine-tuning | Mallin jatkokoulutus kohdennetulla datalla | Erikoismallit |
RLHF | Ihmispalautteella ohjaaminen | Assistenttimainen käytös |
LoRA | Kevyt adapteri mallin hienosäätöön | Avoimet erikoismallit |
Kvantisointi | Mallin pakkaaminen pienempään tarkkuuteen | Paikallinen AI |
RAG | Haku + generointi | Sisäiset tietobotit |
Vektorikanta | Embeddingien hakukanta | RAG-järjestelmät |
AI-agentti | LLM, joka käyttää työkaluja tavoitteeseen | Koodausagentit, automaatiot |
Chain of Thought | Vaiheittainen ongelman jäsennys | Matematiikka, logiikka, suunnittelu |
Diffuusiomalli | Kohinan poistoon perustuva generointi | Kuvamallit, video, ääni |
Kolme käytännön sääntöä vuodelle 2026
Ensimmäinen sääntö: älä kohtele LLM:ää hakukoneena.
Kielimalli osaa selittää, luonnostella, muuntaa, tiivistää ja auttaa ajattelussa. Faktatyössä se tarvitsee lähteet. Jos väite on tärkeä, tarkista se.
Toinen sääntö: rakenna AI-työ tietovirran ympärille.
Hyvä AI-työnkulku ei ole vain "kysy parempi prompti". Usein tarvitaan oikeat dokumentit, hyvä haku, rajattu konteksti, lähdeviitteet ja arviointi. RAG, vektorikannat ja agenttityökalut ovat siksi käytännön asioita, eivät vain teknisiä termejä.
Kolmas sääntö: erota kyky, käyttöliittymä ja valvonta.
Malli voi osata asian. Tuote voi silti toteuttaa sen huonosti. Agentti voi tehdä työn. Se voi silti tarvita hyväksynnän ennen kuin se lähettää sähköpostin, muuttaa tietokantaa tai julkaisee kampanjan.
Tämä on AI:n aikuisempi vaihe. Vähemmän taikuutta. Enemmän järjestelmäajattelua.
Kehotteet
Kehote 1: Selitä AI-käsitteet omaan työhöni
Toimi tekoälykouluttajana.
Haluan ymmärtää seuraavat AI-käsitteet oman työni kautta:
[Kirjoita oma roolisi, toimialasi ja tyypilliset AI-käyttötapauksesi]
Selitä minulle nämä käsitteet:
1. neuroverkot
2. tokenit
3. embeddingit
4. transformerit
5. RAG
6. agentit
Käytä jokaisessa kohdassa tätä rakennetta:
- Selitys yhdellä arkisella vertauksella
- Esimerkki minun työstäni
- Yksi asia, jota en saa ymmärtää väärin
- Yksi käytännön vinkki parempaan AI-käyttöön
Älä käytä teknistä jargonia ilman selitystä.
Kehote 2: Arvioi AI-työkalun konepelti
Toimi AI-tuotteen arvioijana.
Arvioitava työkalu:
[Työkalun nimi ja kuvaus]
Käyttötarkoitus:
[Mihin aiomme käyttää työkalua]
Arvioi työkalu näiden käsitteiden kautta:
1. Käyttääkö se todennäköisesti LLM:ää, RAGia, agentteja tai kuvamalleja?
2. Mihin kohtiin voi syntyä hallusinaatioita?
3. Miten konteksti-ikkuna tai tiedostojen käsittely voi rajoittaa käyttöä?
4. Tarvitseeko työkalu vektorihakua tai tietokantayhteyttä ollakseen luotettava?
5. Mitä kysymyksiä meidän pitää kysyä toimittajalta ennen käyttöönottoa?
Anna lopuksi:
- 5 suurinta riskiä
- 5 tärkeintä kysymystä myyjälle
- suositus: kokeile / pilotoi rajatusti / älä ota käyttöön
Kehote 3: Suunnittele luotettava RAG- tai agenttityönkulku
Toimi seniorina AI-arkkitehtina.
Haluan rakentaa tämän työnkulun:
[Kuvaa tehtävä, esimerkiksi sisäinen HR-botti, asiakastuen avustaja tai koodausagentti]
Käytettävä tieto:
[Mitä dokumentteja, tietokantoja tai API:a järjestelmä saa käyttää]
Suunnittele järjestelmä seuraavasti:
1. Milloin käytetään pelkkää LLM:ää?
2. Milloin tarvitaan RAGia?
3. Tarvitaanko vektorikanta, ja jos tarvitaan, mitä sinne tallennetaan?
4. Mitä työkaluja agentti saa käyttää?
5. Mitä agentti ei saa tehdä ilman ihmisen hyväksyntää?
6. Miten hallusinaatioita ja virheitä vähennetään?
7. Miten onnistumista mitataan?
Tee lopuksi yksinkertainen arkkitehtuurikuvaus tekstinä ja 10 kohdan käyttöönottolista.
Lähteet
Vaswani et al., "Attention Is All You Need" - https://arxiv.org/abs/1706.03762
Brown et al., "Language Models are Few-Shot Learners" - https://arxiv.org/abs/2005.14165
Liu et al., "Lost in the Middle: How Language Models Use Long Contexts" - https://arxiv.org/abs/2307.03172
Ouyang et al., "Training language models to follow instructions with human feedback" - https://arxiv.org/abs/2203.02155
Hu et al., "LoRA: Low-Rank Adaptation of Large Language Models" - https://arxiv.org/abs/2106.09685
Dettmers et al., "QLoRA: Efficient Finetuning of Quantized LLMs" - https://arxiv.org/abs/2305.14314
Lewis et al., "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks" - https://arxiv.org/abs/2005.11401
Yao et al., "ReAct: Synergizing Reasoning and Acting in Language Models" - https://arxiv.org/abs/2210.03629
Wei et al., "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models" - https://arxiv.org/abs/2201.11903
Ho et al., "Denoising Diffusion Probabilistic Models" - https://arxiv.org/abs/2006.11239
OpenAI, Embeddings guide - https://developers.openai.com/api/docs/guides/embeddings
OpenAI, Prompt engineering guide - https://developers.openai.com/api/docs/guides/prompt-engineering
OpenAI, Model optimization and fine-tuning - https://developers.openai.com/api/docs/guides/model-optimization
Anthropic, Prompt engineering overview - https://platform.claude.com/docs/en/build-with-claude/prompt-engineering/overview
Anthropic, Models overview - https://platform.claude.com/docs/en/about-claude/models/overview
Google AI, Long context with Gemini - https://ai.google.dev/gemini-api/docs/long-context
Hugging Face, Quantization concepts - https://huggingface.co/docs/transformers/quantization/concept_guide
Pinecone, Understanding embeddings - https://docs.pinecone.io/guides/data/understanding-embeddings
Qdrant, Vector search - https://qdrant.tech/documentation/concepts/search/
pgvector - https://github.com/pgvector/pgvector
Haluatko sparrailla AI:sta etäkahvitellen?
Tekoäly voi olla voimakas työkalu, ja näiden aloittelijaystävällisten vaihtoehtojen avulla voit hyödyntää sitä omissa projekteissasi – olipa kyseessä sisällöntuotanto, ohjelmointi, markkinointi tai oppiminen.
Jos kaipaat koulutusta tekoäly-työkalujen käyttöön, nappaa tästä sitoumukseton etäkahvitteluaika ja jutellaan tarpeistasi 👇



