Miksi kielimalli hallusinoi?
Malli ennustaa todennäköisintä jatkoa tekstille sen perusteella, mitä se on koulutuksessa nähnyt. Kun kysymys osuu alueelle, josta mallilla on ohut tai ristiriitainen muisti, todennäköisin jatko voi olla sujuva mutta väärä. Malli ei tiedä, ettei se tiedä. Uudemmat mallit hallusinoivat selvästi vähemmän ja osaavat useammin sanoa "en tiedä", mutta mikään malli ei ole virheetön.
Miten hallusinaatioita vähennetään käytännössä?
Neljä toimivaa keinoa: anna mallille lähdeaineisto (RAG tai liitetiedosto), jolloin se siteeraa keksimisen sijaan; pyydä lähdeviittaukset ja tarkista ne; käytä verkkohakua hyödyntäviä työkaluja ajantasaisissa kysymyksissä; ja pidä ihminen tarkistajana kaikessa, mikä lähtee talosta ulos. Koulutuksissamme tämä on ensimmäisiä asioita, jotka käymme läpi, koska yksikin tarkistamaton luku väärässä paikassa vie luottamuksen koko työkalulta.
Tunnettu esimerkki
Yhdysvalloissa asianajaja jätti vuonna 2023 oikeudelle ChatGPT:llä laaditun kirjelmän, jossa siteerattiin kuutta ennakkotapausta. Yhtäkään niistä ei ollut olemassa: malli oli keksinyt tapausten nimet, numerot ja sitaatit. Tapaus päättyi sanktioihin ja on sittemmin toiminut muistutuksena siitä, miksi lähteet tarkistetaan.