Perusteet

Multimodaalinen tekoäly

englanniksi: multimodal AI

Multimodaalinen tekoäly tarkoittaa mallia, joka käsittelee useaa tietotyyppiä: tekstiä, kuvia, ääntä ja videota samassa keskustelussa. Voit esimerkiksi näyttää mallille valokuvan ja kysyä siitä kysymyksiä tekstillä. Kaikki johtavat mallit (Claude, ChatGPT, Gemini, Copilot) ovat nykyään multimodaalisia ainakin kuvien osalta.

Mitä hyötyä multimodaalisuudesta on käytännön työssä?

Suurin hyöty on, että tieto kulkee muodosta toiseen ilman käsityötä. Valokuva fläppitaulusta muuttuu muistioksi, kuvakaappaus virheilmoituksesta selitykseksi ja ratkaisuksi, taulukon kuva Excel-tiedostoksi ja tuotekuva myyntitekstiksi. Puheen puolella sama malli litteroi palaverin ja vastaa puhuttuun kysymykseen. Käytännössä multimodaalisuus poistaa välivaiheen, jossa ihminen naputtelee kuvassa tai äänessä olevan tiedon koneelle.

Mitä rajoituksia multimodaalisilla malleilla on?

Kuvan ymmärtäminen ei ole täydellistä: pienet yksityiskohdat, käsiala ja tiheät taulukot tuottavat edelleen virheitä, joten luvut kannattaa tarkistaa. Mallien kuvantuotanto on eri asia kuin kuvan ymmärtäminen, ja niiden taso vaihtelee mallikohtaisesti. Kokosimme kuva- ja videotyökalujen tilanteen kuvaoppaaseen.

Esimerkki käytännöstä

Ostolaskun kuva Claudeen ja pyyntö: poimi toimittaja, summa, eräpäivä ja tiliöintiehdotus taulukkoon. Malli lukee kuvan ja palauttaa rakenteisen vastauksen, jonka voi liittää järjestelmään. Sama toimii kuiteille, rahtikirjeille ja käsin täytetyille lomakkeille, kunhan ihminen tarkistaa summat.

Lähikäsitteet

Syvenny aiheeseen

Usein kysytyt kysymykset

Mikä on multimodaalinen tekoäly?

Multimodaalinen tekoäly tarkoittaa mallia, joka käsittelee useaa tietotyyppiä: tekstiä, kuvia, ääntä ja videota samassa keskustelussa. Voit esimerkiksi näyttää mallille valokuvan ja kysyä siitä kysymyksiä tekstillä. Kaikki johtavat mallit (Claude, ChatGPT, Gemini, Copilot) ovat nykyään multimodaalisia ainakin kuvien osalta.

Ylläpitää Sampsa Sironen, Co-Founder & CEO

Haluatko, että tiimisi osaa nämä käytännössä?

Koulutamme tekoälyn käytön teidän työtehtävillänne, ei kalvoilla.

← Kaikki sanaston termit