Mallit ja tekniikka

Vektoritietokanta

englanniksi: vector database

Vektoritietokanta tarkoittaa tietokantaa, joka on suunniteltu tallentamaan embedding-vektoreita ja hakemaan niistä nopeasti samankaltaisimmat. Se on RAG-ratkaisujen varasto-osa: dokumentit muunnetaan vektoreiksi ja talletetaan, ja kysymyksen saapuessa tietokanta palauttaa merkitykseltään lähimmät kohdat millisekunneissa, vaikka dokumentteja olisi miljoonia.

Tarvitseeko pk-yritys oman vektoritietokannan?

Harvoin heti. Valmiit työkalut (Claude Projects, Copilotin ja ChatGPT:n tietopankit) hoitavat saman pienillä dokumenttimäärillä ilman omaa infrastruktuuria. Oma vektoritietokanta tulee ajankohtaiseksi, kun aineistoa on paljon, sen pitää pysyä omassa ympäristössä tai hakuun halutaan tarkkaa hallintaa. Yleisiä vaihtoehtoja ovat PostgreSQL:n pgvector-laajennus sekä erikoistuneet palvelut kuten Qdrant ja Pinecone.

Miten vektoritietokanta liittyy RAG-ratkaisuun?

RAG-järjestelmässä vektoritietokanta on hakukerros. Dokumentit pilkotaan kappaleiksi, jokaisesta lasketaan embedding ja vektorit talletetaan tietokantaan. Käyttäjän kysymyksestä lasketaan samanlainen vektori, tietokanta palauttaa lähimmät kappaleet, ja kielimalli kirjoittaa niistä vastauksen. Tietokannan laatu ratkaisee, saako malli oikeat lähteet eteensä, joten pilkkomistapa ja haun viritys vaikuttavat lopputulokseen enemmän kuin moni odottaa.

Lähikäsitteet

Syvenny aiheeseen

Usein kysytyt kysymykset

Mikä on vektoritietokanta?

Vektoritietokanta tarkoittaa tietokantaa, joka on suunniteltu tallentamaan embedding-vektoreita ja hakemaan niistä nopeasti samankaltaisimmat. Se on RAG-ratkaisujen varasto-osa: dokumentit muunnetaan vektoreiksi ja talletetaan, ja kysymyksen saapuessa tietokanta palauttaa merkitykseltään lähimmät kohdat millisekunneissa, vaikka dokumentteja olisi miljoonia.

Ylläpitää Sampsa Sironen, Co-Founder & CEO

Haluatko, että tiimisi osaa nämä käytännössä?

Koulutamme tekoälyn käytön teidän työtehtävillänne, ei kalvoilla.

← Kaikki sanaston termit