• AI-Sanomat
  • Posts
  • OPAS: Chain of Recursive Thoughts (CoRT) -kehotetekniikka

OPAS: Chain of Recursive Thoughts (CoRT) -kehotetekniikka

Chain of Recursive Thoughts (CoRT) on uusi prompt-suunnittelumenetelmä, joka laajentaa LLM-mallien päättelykykyä rekursiivisen ajattelun avulla.

Tämän uuden kehotekteniikan ydinideana on, että kielimalli “ajattelee uudelleen” useita kertoja ennen lopullisen vastauksen antamista. Toisin kuin perinteinen yhden vaiheen vastaus, CoRT kannustaa mallia tuottamaan alustavan ratkaisun, arvioimaan sitä kriittisesti ja parantamaan vastausta iteratiivisesti. Näin malli ikään kuin epäilee omaa vastaustaan ja yrittää uudestaan – yhä uudelleen, kunnes paras mahdollinen vastaus löytyy.

CoRT kehitettiin tarpeesta ratkaista monimutkaisia ongelmia luotettavammin LLM-mallien avulla. Varsinkin pienemmillä malleilla ensimmäinen yritys saattaa jäädä vajavaiseksi.

Rekursiivinen ajattelusykli antaa mallille “lisäaikaa” ajatella ja korjata virheitään, mikä on osoittautunut yllättävän tehokkaaksi.

Janne Ikola / Bottiverstas

Esimerkiksi Mistral 3.1 24B -mallin vastaukset ohjelmointitehtäviin paranivat merkittävästi, kun se laitettiin käyttämään CoRT-menetelmää – tulokset muuttuivat “meh”-tasolta “holy crap”-tasolle mallin saadessa mahdollisuuden ajatella pidempään ja iteroida ratkaisujaan. CoRT:n taustalla on ajatus, että jopa kevyemmätkin mallit voivat suoriutua haastavista tehtävistä paremmin, kun niille annetaan strukturoitu tapa syventää päättelyään useassa vaiheessa.

Määritelmä ja rekursiivinen logiikka

Chain of Recursive Thoughts (CoRT) tarkoittaa menetelmää, jossa LLM laatii vastauksensa rekursiivisen ajatteluprosessin kautta. Toisin sanoen malli käy läpi useita ajatuskierroksia: se generoi ensin ehdotuksen vastaukseksi, arvioi kriittisesti tuota ehdotusta, ja tarvittaessa palaa takaisin ajatusketjun alkuun parantaakseen vastausta.

Prosessi on rekursiivinen siinä mielessä, että jokainen uusi vastausversio perustuu edellisen kierroksen oppiin. Teknisesti tämä voidaan toteuttaa joko monivaiheisena yksittäisessä promptissa (jossa malli ohjeistetaan käymään läpi nämä vaiheet) tai ulkoisesti orkestroidulla loopilla, joka hyödyntää mallia useita kertoja peräkkäin.

CoRT-menetelmän rekursiivinen logiikka pohjautuu neljään keskeiseen komponenttiin:

  • Itsearviointi (self-evaluation): Malli arvioi oman vastauksensa tai ajatusprosessinsa lopputuloksen kriittisesti. Se tarkistaa, onko ratkaisu looginen, sisältääkö se virheitä tai puutteita, ja täyttääkö se käyttäjän vaatimukset.

  • Vaihtoehtoisten ratkaisujen generointi: Malli ei tyydy yhteen ainoaan ratkaisuun, vaan luo useita kilpailevia vaihtoehtoja. Näin se ikään kuin vertailee erilaisia lähestymistapoja saman ongelman ratkaisemiseksi. Yhdellä kierroksella saatetaan tuottaa esim. 3 erilaista vastausluonnosta samasta kysymyksestä.

  • Iteratiivinen parantelu: Malli käy vaihtoehdot läpi, arvioi niiden laadun ja valitsee parhaimman jatkoon. Tämän parhaan ratkaisun pohjalta malli voi sitten aloittaa uuden kierroksen: se saattaa muokata ja kehittää valittua ratkaisua edelleen tai luoda uusia variaatioita. Prosessi toistuu, kunnes ratkaisu on riittävän hyvä tai asetetut kierrosrajat saavutetaan.

  • Dynaaminen ajattelun syvyys: CoRT ei lukitse kiinteää kierrosmäärää, vaan mallille voidaan antaa valtuus päättää, montako ajattelukierrosta se tarvitsee. Yksinkertaisessa ongelmassa malli saattaa todeta ensimmäisen kierroksen jälkeen, että vastaus on jo riittävä. Vaativammassa tehtävässä malli voi päätyä iteroimaan useita kertoja. Tämä dynaamisuus varmistaa, että mallin ajattelusyvyys mukautuu tehtävän monimutkaisuuden mukaan.

Rekursiivisessa CoRT-prosessissa mallin ajatuskulku muistuttaa keskustelua itsensä kanssa. Malli toimii ikään kuin sekä ongelman ratkaisijana että kriitikkona: se generoi ratkaisuehdotuksia ja reflektoi niitä vuorotellen.

Teknologisesti tämän toteutus vaatii huolellisesti suunnitellun prompt-rakenteen tai ohjaavan algoritmin, joka syöttää mallille sen omia vastauksia takaisin sen käsiteltäväksi. Lopputuloksena saadaan vastaus, joka on hioutunut useamman iteraation myötä usein huomattavasti alkuperäistä korkeatasoisemmaksi.

Rakentamisvaiheet

Seuraavassa on vaiheittainen erittely siitä, miten CoRT-pohjainen prompti rakennetaan tai CoRT-prosessi toteutetaan käytännössä. Nämä askeleet voidaan toteuttaa joko yhden pitkän promptin sisällä (esim. käyttämällä erillisiä ohjeita mallille kussakin vaiheessa) tai ohjelmallisesti usean peräkkäisen mallikyselyn avulla:

Tilaa AI-Sanomien Plus-jäsenyys niin näet loput sisällöstä

Tilaamalla AI-Sanomien maksullisen jäsenyyden saat pääsyn kaikkiin uutiskirjeen sisältöihin sekä tuet Suomen parasta AI-mediaa.

Already a paying subscriber? Sign In.

Miksi tilaus kannattaa?:

  • • Pääsy kaikkiin maksullisiin oppaisiin
  • • Webinaari-tallenteet
  • • Näet kaikki uutiskirjeen sisällöt, uudet AI-työkalut sekä vinkit tekoälyn käyttöön.
  • • GPT4o-botti: Tämä on tietoturvallinen versio ChatGPT:stä, jossa syöttämääsi dataa ei käytetä kielimallin kouluttamiseen.
  • • Tuet Suomen parasta AI-mediaa 😊

Reply

or to participate.