- AI-Sanomat
- Posts
- AI-sanomat 08/2024: Tekoälyjen taisto kiristyy - mutta paranevatko mallit?
AI-sanomat 08/2024: Tekoälyjen taisto kiristyy - mutta paranevatko mallit?
Viikon tekoälykatsaus: läpimurrot, trendit, ja ennusteet

AI-Sanomat / viikko 8
Tämän viikon AI-Sanomat tarjoaa syväsukelluksen tekoälyn viimeisimpiin edistysaskeliin ja avaa näkymiä tulevaisuuden visioihin – pienistä kielimalleista, jotka mullistavat ohjelmistojen ja chatbottien maailmaa, ChatGPT:n muistitoiminnon tuomiin työtehon parannuksiin, aina OpenAI Soraan, joka luo videota tekstistä, ja Google Geminin uusiin päättelykykyihin.
Lisäksi käsitellään tekoälyn roolia työelämän muutoksessa, tekoälyn käyttöä markkinoinnissa ja patentoinnissa, sekä tutustutaan tuoreisiin innovaatioihin kuten UFO ja OS-Copilot. Lue, miten tekoäly muokkaa tulevaisuuttamme monilla eri aloilla ja tarjoaa ratkaisuja, jotka ennen tuntuivat mahdottomilta.
Uudet AI-työkalut kuluneen viikon varrelta.
Tässä AI-Sanomien viikottaisessa tiedotteessa esitellään valikoituja huippuluokan generatiivisen tekoälyn työkaluja ja uusia palveluja. Katsaus on osa AI-Sanomien Premium-tilausta:
AI-työkalu hoitaa rekrytoinnin ensivaiheet
Luo itsestäsi kaksoisolento-versio
Testaa eri tekoälymoottoreita rinta rinnan
Tekoälyn tarjoama mainostekstien mestari
Empaattinen chatbot, joka parantaa asiakaskokemusta
Palvelu joka yhdistää GPT:n ja Google Analyticsin
SEO-tuloksia tekoälyn avulla
Uusi innovatiivinen AI-palvelu tehokkaampiin kokouksiin
Kehotteesta verkkopalveluksi: AI rakentaa sinulle verkkosivun kehotteesta
Työkalu no-code AI-ohjelmistojen rakentamiseen
Sisustussuunnittelua tekoälyn voimin
Uuden sukupolven tekoälypohjainen logon suunnitteluun
AI muuttaa äänitiedostot tekstiksi ja muistiinpanoiksi
Digitaalisen liikeidean kehittämisen kumppani
Haluatko pääsyn AI-Sanomien verkkokursseihin, oppaisiin ja työkaluihin?
Nappaa nyt erikoistarjous: 27 €/kk ja saat pääsyn satojen eurojen arvoisiin kehotetyökaluihin ja verkkokursseihin. Hinta nousee vuonna 2024, kun lisäämme uutta kurssisisältöä. Liity mukaan ennen kuin hinta nousee!
Viimeisimmät oppaat: https://www.aisanomat.fi/t/Oppaat
Verkkokurssit: https://www.aisanomat.fi/t/Verkkokurssit
Työkalut: https://www.aisanomat.fi/t/Ty%C3%B6kalut
Tekoälyuutiset viikon varrelta
OpenAI Sora - tekstistä videoksi
Sora on tekoälymalli, joka pystyy luomaan realistisia jopa 60 sekuntia pitkiä videoita tekstiohjeista. OpenAI kertoo pyrkivänsä opettamaan tekoälyä ymmärtämään ja simuloimaan liikkeessä olevaa fyysistä maailmaa. Tavoitteena on kouluttaa malleja, jotka auttavat ihmisiä ratkaisemaan ongelmia, jotka edellyttävät vuorovaikutusta reaalimaailmassa tai sen kanssa.

Sora pystyy luomaan monimutkaisia kohtauksia, joissa on useita hahmoja, erityyppistä liikettä ja tarkkoja yksityiskohtia kohteesta ja taustasta. Malli ymmärtää paitsi sen, mitä käyttäjä on pyytänyt kehotuksessa, myös sen, miten nämä asiat ovat olemassa fyysisessä maailmassa.
OpenAI toteaa lisäksi, että Sora-malli kykenee käsittelemään niin kutsuttua peittymisongelmaa tehokkaasti. Nykyisten tekoälymallien haasteena on se, että ne saattavat menettää kykynsä seurata kohteita, kun nämä eivät ole enää näkyvissä. Esimerkiksi tilanteessa, jossa kuorma-auto peittää näkymästä katukyltin, on mahdollista, että kyltti ei palaa näkyviin kuorma-auton ohitettua sen.
OpenAI tutkii generatiivisten mallien laajamittaista kouluttamista videodatalla. Se kouluttaa erityisesti tekstiehtoisia diffuusiomalleja yhdessä videoille ja kuville, joiden kesto, resoluutio ja kuvasuhde vaihtelevat.
Samoin kuin DALL-E 3:ssa, OpenAI hyödyntää myös GPT:tä, jotta lyhyet käyttäjän kehotukset voidaan muuttaa pidemmiksi yksityiskohtaisiksi kuvateksteiksi, jotka lähetetään videomallille. Näin Sora pystyy tuottamaan korkealaatuisia videoita, jotka seuraavat tarkasti käyttäjän kehotuksia.
Soran esittelyissä keskitytään pääasiassa tekstistä videoiksi -muunnoksiin. Kuitenkin Sora kykenee hyödyntämään myös muita lähtöaineistoja, kuten valmiita kuvia tai videoita. Tämän monipuolisen syötteiden käsittelykyvyn ansiosta Sora on kykeneväinen toteuttamaan erilaisia kuvan- ja videonmuokkaustoimenpiteitä. Se pystyy esimerkiksi luomaan saumattomasti toistuvia videoita, herättämään eloon staattisia kuvia, sekä venyttämään videoita ajallisesti eteen- tai taaksepäin, muun muassa.
Lue lisää: https://openai.com/sora
ChatGPT päivitys - keskustelujen uusi muistitoiminto tuo tehoa toistuviin tehtäviin
ChatGPT:n uusin päivitys tuo mukanaan ominaisuuden, joka mahdollistaa muistin käytön keskusteluissa. Tämän innovaation ansiosta ChatGPT pystyy säilyttämään tiedon aiemmista vuoropuheluista, mikä edesauttaa keskustelun sujuvuutta ja lisää sen arvoa käyttäjälle. Muisti kehittyy ja rikastuu käytön myötä, mahdollistaen näin toistuvien tietojen välttämisen tulevissa keskusteluissa.
Tämä muistiominaisuus voi osoittautua erityisen arvokkaaksi yritys- ja tiimikäyttäjille, jotka hyödyntävät ChatGPT:tä ammatillisissa toimissaan.Käyttäjät voivat halutessaan aktivoida tai deaktivoida muistitoiminnon omien tarpeidensa ja toiveidensa mukaisesti.
On tärkeää huomioida, että keskustelun poistaminen ei suoraan johda sen muistitietojen häviämiseen; ne on poistettava erikseen.

Lisäksi GPT:n rakentajat voivat käyttää muistia oman GPT-mallinsa kehittämisessä. Muistin avulla GPT voi tarjota suosituksia ja räätälöidä sisältöä lukutottumuksiisi perustuen.
Miten muisti toimii?
Keskustellessasi ChatGPT:n kanssa sinulla on mahdollisuus pyytää sitä tallentamaan tiettyjä asioita tai antaa sen kerätä yksityiskohtia itsenäisesti. ChatGPT:n muistin laatu kehittyy käytön myötä, ja sen edistymisen voi havaita ajan kuluessa. Toiminnallisuuteen liittyviä esimerkkejä:
Olet kertonut, että haluat kokousmuistiinpanoihin väliotsikoita, bullet points -listauksia ja loppuun tehtävälistan. ChatGPT muistaa tämän ja laatii kokousten yhteenvedot tällä tavoin.
Olet kertonut ChatGPT:lle omistavasi kahvilan. Kun ideoit viestejä sosiaalisenmedian postaukseen, jossa juhlistetaan uutta toimipistettä, ChatGPT muistaa kahvilasi perustiedot, jotka olet aiemmin syöttänyt.
Olet kertonut, että sinulla on lapsi ja että hän rakastaa meduusoja. Kun pyydät ChatGPT:tä auttamaan syntymäpäiväkortin suunnittelussa, se ehdottaa esimerkiksi meduusaa, jolla on juhlahattu.
Esimerkiksi The Books GPT tarjoaa lukusuosituksia käyttäjälle. Muistin ollessa käytössä, mieltymykset, kuten suosikkigenret tai lempikirjat, tallentuvat ja lukusuositukset räätälöidään niiden perusteella ilman tarvetta toistuville syötteille.
Muisti tehostaa työkäyttöä
Yritys- ja tiimikäyttäjät voivat hyötyä muistiominaisuudesta käyttäessään ChatGPT:tä työtehtävissään. ChatGPT pystyy oppimaan käyttäjiensä tyylit ja mieltymykset sekä kehittämään ehdotuksia aiempien vuorovaikutusten pohjalta. Tämä mahdollistaa ajan säästämisen ja tuottaa merkityksellisempiä sekä oivaltavampia vastauksia. Esimerkkejä toiminnallisuudesta:
ChatGPT tallentaa yrityksen äänensävyn määrittelyt ja soveltaa niitä automaattisesti blogikirjoitusten luonnosteluun ilman, että näitä määrittelyjä tarvitsee toistaa.
Ohjelmointia suorittaessaan käyttäjät voivat ilmoittaa ChatGPT:lle käyttämänsä ohjelmointikielen ja kehitysympäristön. ChatGPT säilyttää tiedon näistä mieltymyksistä tulevia tehtäviä varten, mikä tekee prosessista tehokkaamman.
Liiketoimintakatsausten kuukausittaiseen tuottamiseen käyttäjät voivat ladata tietonsa turvallisesti ChatGPT:lle, joka luo pyydetyt kaaviot sisältäen kolme johtopäätöstä kustakin
UFO: UI-keskeinen AI-agentti Windows käyttöjärjestelmään
UFO on innovatiivinen käyttöliittymäagentti, joka on suunniteltu täyttämään Windows-sovelluksiin liittyviä käyttäjäpyyntöjä hyödyntämällä GPT-Visionin ominaisuuksia.
UFO käyttää kaksoisagenttikehystä graafisen käyttöliittymän ja Windows-sovellusten ohjaustietojen tarkkailuun ja analysointiin, mikä mahdollistaa sen saumattoman navigoinnin ja toimimisen yksittäisissä sovelluksissa ja sovellusten välillä. Agentti pystyy täyttämään käyttäjän pyynnöt automaattisesti, jopa silloin kun ne kattavat useita sovelluksia.
UFO muuttaa vaivalloiset prosessit yksinkertaisiksi tehtäviksi, jotka voidaan suorittaa luonnollisen kielen komennoilla. Agenttia testattiin yhdeksässä suositussa Windows-sovelluksessa erilaisilla skenaarioilla, ja sekä määrällisten mittareiden että tositapausten perusteella UFO osoittautui erittäin tehokkaaksi käyttäjän pyyntöjen täyttämisessä. UFO on ensimmäinen käyttöliittymäagentti, joka on suunniteltu erityisesti Windows-ympäristöön.
Lue lisää https://arxiv.org/abs/2402.07939?
Google Gemini - seuraavan sukupolven malli
Google on julkistanut uuden tekoälymallin, Gemini 1.5:n. Malli tarjoaa dramaattisia parannuksia monilla alueilla ja Gemini 1.5 Pro -versio pystyy saavuttamaan saman laadun kuin edeltäjänsä 1.0 Ultra, mutta käyttää vähemmän laskentatehoa. Tämä tekoälymalli on optimoitu monien tehtävien välillä skaalautuvaksi multimodaalimalliksi.
Reply