Tekoälysanasto

Tekoälysanasto tarkoittaa kokoelmaa keskeisistä AI-käsitteistä selitettynä lyhyesti ja suomeksi. Jokainen termi vastaa kysymykseen "mitä tämä tarkoittaa ja miksi sillä on väliä työssäni" muutamassa minuutissa: määritelmä, käytännön merkitys ja konkreettinen esimerkki. Termejä on tällä hetkellä 38, ja päivitämme sanastoa, kun teknologia ja sääntely muuttuvat.

38 termiä

Perusteet

Käsitteet, joihin törmäät heti ensimmäisessä tekoälykeskustelussa.

Mallit ja tekniikka

Miten kielimallit toimivat konepellin alla ja mitä tekniset termit tarkoittavat käytännössä.

RAG

retrieval-augmented generation

RAG (retrieval-augmented generation) tarkoittaa tekniikkaa, jossa kielimalli hakee vastauksen pohjaksi tietoa ulkoisesta lähteestä, kuten yrityksen omista dokumenteista, sen sijaan että vastaisi pelkän koulutusdatansa varassa.

Embedding

Embedding eli vektoriupotus tarkoittaa tekstin, kuvan tai muun sisällön muuntamista lukujonoksi eli vektoriksi niin, että merkitykseltään samankaltaiset sisällöt saavat lähekkäiset vektorit.

Vektoritietokanta

vector database

Vektoritietokanta tarkoittaa tietokantaa, joka on suunniteltu tallentamaan embedding-vektoreita ja hakemaan niistä nopeasti samankaltaisimmat.

Fine-tuning

Fine-tuning eli hienosäätö tarkoittaa valmiin kielimallin jatkokouluttamista omalla aineistolla niin, että mallin painot muuttuvat.

Token

token

Token tarkoittaa tekstin palaa, joina kielimalli käsittelee kaiken tekstin.

Konteksti-ikkuna

context window

Konteksti-ikkuna tarkoittaa enimmäismäärää tekstiä, jonka kielimalli voi käsitellä kerralla: ohjeet, keskusteluhistorian, liitetyt dokumentit ja vastauksen.

Inferenssi

inference

Inferenssi tarkoittaa valmiiksi koulutetun tekoälymallin käyttämistä: jokainen ChatGPT:lle tai Claudelle lähetetty viesti käynnistää inferenssiajon, jossa malli laskee vastauksen.

System prompt

System prompt eli järjestelmäkehote tarkoittaa ohjeistusta, jonka kielimalli saa ennen käyttäjän viestejä ja joka määrittää sen roolin, tyylin ja rajat koko keskustelun ajaksi.

LLM (suuri kielimalli)

Koko opas aiheesta ↗

Kielimalli, joka tuottaa ja ymmärtää tekstiä. Koko opas määritelmineen.

Kielimalli

Koko opas aiheesta ↗

Suomenkielinen nimitys samalle asialle, käsitellään LLM-oppaassa.

MCP (Model Context Protocol)

Koko opas aiheesta ↗

Avoin protokolla, jolla tekoäly kytkeytyy työkaluihin ja tietolähteisiin.

Käyttö ja työtavat

Termit, jotka kuvaavat tapoja käyttää tekoälyä työssä.

Riskit ja sääntely

Tekoälyn riskeihin, EU:n tekoälyasetukseen ja vastuulliseen käyttöön liittyvät käsitteet.

Hallusinaatio

hallucination

Hallusinaatio tarkoittaa tekoälyn yhteydessä tilannetta, jossa kielimalli tuottaa varmalta kuulostavaa mutta virheellistä tai keksittyä tietoa: olemattomia lähteitä, vääriä lukuja tai kuviteltuja tapahtumia.

Prompt injection

prompt injection

Prompt injection tarkoittaa hyökkäystä, jossa tekoälylle syötetään ohjeita sisällön seassa: esimerkiksi sähköpostiin tai verkkosivuun upotettu teksti käskee mallia toimimaan vastoin sen saamia ohjeita.

Deepfake

deepfake

Deepfake tarkoittaa tekoälyllä tuotettua tai muokattua kuvaa, ääntä tai videota, joka esittää todellista henkilöä tekemässä tai sanomassa jotain, mitä tämä ei ole tehnyt.

Vinouma

bias

Vinouma eli bias tarkoittaa tekoälyn taipumusta tuottaa järjestelmällisesti vääristyneitä tuloksia, jotka suosivat tai syrjivät tiettyjä ryhmiä.

GPAI

general-purpose AI

GPAI (general-purpose AI) tarkoittaa EU:n tekoälyasetuksen käsitettä yleiskäyttöiselle tekoälymallille, joka soveltuu moneen eri tehtävään: tällaisia ovat esimerkiksi GPT-, Claude- ja Gemini-mallit.

AI-lukutaito

AI literacy

AI-lukutaito tarkoittaa EU:n tekoälyasetuksen 4 artiklan velvoitetta: tekoälyä käyttävien organisaatioiden on varmistettava, että henkilöstöllä on riittävät tiedot ja taidot tekoälyn käyttöön.

Tekoälyasetus (EU AI Act)

Koko opas aiheesta ↗

EU:n tekoälysääntely: riskiluokat, velvoitteet ja aikataulu.

AI governance

Koko opas aiheesta ↗

Tekoälyn hallintamalli: roolit, prosessit ja valvonta.

ISO 42001

Koko opas aiheesta ↗

Tekoälyn hallintajärjestelmän kansainvälinen standardi.

AI-haku ja näkyvyys

Miten tekoäly muuttaa hakukoneita ja yritysten löydettävyyttä.

Termit tutuiksi, käyttö käytännöksi

Sanasto auttaa alkuun, mutta osaaminen syntyy tekemällä. Koulutamme tiimit käyttämään tekoälyä omissa työtehtävissään.

Usein kysytyt kysymykset

Mitä eroa on tekoälyllä, koneoppimisella ja syväoppimisella?

Tekoäly on yläkäsite kaikelle koneen älykkäältä vaikuttavalle toiminnalle. Koneoppiminen on sen tärkein menetelmä: ohjelma oppii säännöt datasta. Syväoppiminen on koneoppimisen alalaji, joka käyttää monikerroksisia neuroverkkoja ja jonka varassa kaikki nykyiset kielimallit toimivat.

Mitkä termit kannattaa opetella ensimmäisenä?

Työkäytön kannalta tärkeimmät ovat prompti, konteksti-ikkuna, hallusinaatio ja token. Niillä ymmärtää, miten työkalua ohjataan, miksi se unohtaa ja miksi vastaukset pitää tarkistaa. Hankinnoista päättävälle lisäksi RAG, fine-tuning ja AI-lukutaito.

Mitä eroa on LLM:llä ja GPT:llä?

LLM (suuri kielimalli) on yleiskäsite, GPT on OpenAI:n malliperheen nimi. Myös Claude ja Gemini ovat LLM:iä. Arkikielessä GPT:tä käytetään joskus virheellisesti kaikista kielimalleista.

Kuka tämän sanaston on kirjoittanut?

Sanastoa ylläpitää Aimiten Oy:n tiimi. Määritelmät perustuvat päivittäiseen työhömme tekoälykoulutusten ja -käyttöönottojen parissa, ja päivitämme niitä, kun teknologia tai sääntely muuttuu.

Ylläpitää Sampsa Sironen, Co-Founder & CEO

Kaipaatko syvempää tietoa? Selaa kaikkia tekoälyoppaitamme tai katso AI-työkalujen vertailu.