Mallit ja tekniikka

Embedding

Embedding eli vektoriupotus tarkoittaa tekstin, kuvan tai muun sisällön muuntamista lukujonoksi eli vektoriksi niin, että merkitykseltään samankaltaiset sisällöt saavat lähekkäiset vektorit. Embeddingit mahdollistavat merkityspohjaisen haun: kone löytää oikean dokumentin, vaikka kysymyksessä ei olisi yhtään samaa sanaa kuin dokumentissa.

Miten embedding eroaa hakusanahausta?

Perinteinen haku vertaa sanoja: "loma-anomus" ei löydä dokumenttia, jossa puhutaan vapaapyynnöstä. Embedding-haku vertaa merkityksiä: molemmat lauseet sijoittuvat vektoriavaruudessa lähelle toisiaan, joten haku osuu. Vektorissa on tyypillisesti satoja tai tuhansia lukuja, ja jokainen luku kuvaa jotain opittua merkityksen ulottuvuutta. Tämä on RAG-ratkaisujen ja semanttisen haun perusta.

Missä embeddingejä käytetään yrityksissä?

Sisäisessä tiedonhaussa, asiakaspalvelun ohjautumisessa (samankaltaiset tiketit löytyvät automaattisesti), suosituksissa ja duplikaattien tunnistuksessa. Embeddingin laskeminen on halpaa: mallitoimittajien rajapinnoissa hinta on murto-osa varsinaisen kielimallin käytöstä, joten suurenkin dokumenttimassan indeksointi maksaa tyypillisesti euroja, ei satoja euroja.

Lähikäsitteet

Syvenny aiheeseen

Usein kysytyt kysymykset

Mikä on embedding?

Embedding eli vektoriupotus tarkoittaa tekstin, kuvan tai muun sisällön muuntamista lukujonoksi eli vektoriksi niin, että merkitykseltään samankaltaiset sisällöt saavat lähekkäiset vektorit. Embeddingit mahdollistavat merkityspohjaisen haun: kone löytää oikean dokumentin, vaikka kysymyksessä ei olisi yhtään samaa sanaa kuin dokumentissa.

Ylläpitää Sampsa Sironen, Co-Founder & CEO

Haluatko, että tiimisi osaa nämä käytännössä?

Koulutamme tekoälyn käytön teidän työtehtävillänne, ei kalvoilla.

← Kaikki sanaston termit