Mallit ja tekniikka

Embedding

Embedding eli vektoriupotus tarkoittaa tekstin, kuvan tai muun sisällön muuntamista lukujonoksi eli vektoriksi niin, että merkitykseltään samankaltaiset sisällöt saavat lähekkäiset vektorit. Embeddingit mahdollistavat merkityspohjaisen haun: kone löytää oikean dokumentin, vaikka kysymyksessä ei olisi yhtään samaa sanaa kuin dokumentissa.

Miten embedding eroaa hakusanahausta?

Perinteinen haku vertaa sanoja: "loma-anomus" ei löydä dokumenttia, jossa puhutaan vapaapyynnöstä. Embedding-haku vertaa merkityksiä: molemmat lauseet sijoittuvat vektoriavaruudessa lähelle toisiaan, joten haku osuu. Vektorissa on tyypillisesti satoja tai tuhansia lukuja, ja jokainen luku kuvaa jotain opittua merkityksen ulottuvuutta. Tämä on RAG-ratkaisujen ja semanttisen haun perusta.

Missä embeddingejä käytetään yrityksissä?

Sisäisessä tiedonhaussa, asiakaspalvelun ohjautumisessa (samankaltaiset tiketit löytyvät automaattisesti), suosituksissa ja duplikaattien tunnistuksessa. Embeddingin laskeminen on halpaa: mallitoimittajien rajapinnoissa hinta on murto-osa varsinaisen kielimallin käytöstä, joten suurenkin dokumenttimassan indeksointi maksaa tyypillisesti euroja, ei satoja euroja.

Lähikäsitteet

Vektoritietokanta RAG Token

Syvenny aiheeseen

Usein kysytyt kysymykset

Mikä on embedding?

Ylläpitää Sampsa Sironen, Co-Founder & CEO

Päivitetty 11. kesäkuuta 2026

Haluatko, että tiimisi osaa nämä käytännössä?

Koulutamme tekoälyn käytön teidän työtehtävillänne, ei kalvoilla.

Tutustu koulutuksiin

← Kaikki sanaston termit