Miten RAG toimii käytännössä?
Kun käyttäjä kysyy kysymyksen, järjestelmä etsii ensin dokumenttivarastosta osuvimmat kohdat. Haku tehdään yleensä merkitysten perusteella embedding-vektoreilla, ei pelkillä hakusanoilla, joten "vuosilomaohje" löytyy myös kysymyksellä "montako lomapäivää saan". Löydetyt katkelmat annetaan kielimallille kysymyksen mukana, ja malli muotoilee niistä vastauksen. Tieto pysyy omassa varastossa, eikä mallia tarvitse kouluttaa uudelleen, kun dokumentit päivittyvät.
Milloin yritys tarvitsee RAG-ratkaisun?
Silloin, kun vastausten pitää perustua omaan aineistoon: henkilöstöohjeisiin, tuotedokumentaatioon, sopimuksiin tai hinnastoihin. RAG vähentää hallusinaatioita merkittävästi, koska malli siteeraa lähdettä keksimisen sijaan. Kevyimmillään RAG on jo valmiina työkaluissa: Claude Projects ja vastaavat lataavat dokumentit keskustelun taustaksi. Raskaammat toteutukset rakennetaan omaan ympäristöön. Koulutamme tämän käytännössä sisäisen tiedonhaun koulutuksessa.
Esimerkki käytännöstä
Henkilöstöassistentti vastaa kysymykseen "miten toimin sairauslomalla" hakemalla työehtosopimuksen ja talon ohjeen kohdat, tiivistämällä ne ja liittämällä linkit alkuperäisiin dokumentteihin. Vastaus on tarkistettavissa, mikä erottaa RAG-ratkaisun pelkästä chatbotista.