Perusteet

Syväoppiminen

englanniksi: deep learning

Syväoppiminen tarkoittaa koneoppimisen menetelmää, joka käyttää monikerroksisia neuroverkkoja. Syvyys viittaa kerrosten määrään: jokainen kerros oppii edellistä abstraktimpia piirteitä datasta. Syväoppiminen mahdollisti läpimurrot kuvantunnistuksessa, puheentunnistuksessa ja kielimalleissa, ja kaikki nykyiset generatiiviset tekoälyt perustuvat siihen.

Miksi syväoppiminen mullisti tekoälyn?

Käännekohta oli vuosi 2012, kun AlexNet-niminen syvä neuroverkko voitti kuvantunnistuskilpailun selvällä erolla perinteisiin menetelmiin. Sen jälkeen sama resepti (enemmän kerroksia, enemmän dataa, enemmän laskentatehoa) on toiminut yhä uudelleen: puheentunnistus, konekäännös ja lopulta suuret kielimallit. Vuoden 2017 transformer-arkkitehtuuri, johon ChatGPT ja Claude perustuvat, on syväoppimisen toistaiseksi merkittävin sovellus.

Mitä eroa on koneoppimisella ja syväoppimisella?

Syväoppiminen on koneoppimisen alalaji. Perinteisessä koneoppimisessa ihminen valitsee, mitä piirteitä datasta malli tarkastelee (esimerkiksi viestin pituus ja linkkien määrä roskapostisuodattimessa). Syväoppimisessa verkko oppii piirteet itse suoraan raakadatasta, kuten kuvan pikseleistä tai tekstin merkeistä. Siksi se vaatii paljon dataa ja laskentaa, mutta toimii ongelmissa, joihin käsin valitut piirteet eivät riitä.

Lähikäsitteet

Syvenny aiheeseen

Usein kysytyt kysymykset

Mikä on syväoppiminen?

Syväoppiminen tarkoittaa koneoppimisen menetelmää, joka käyttää monikerroksisia neuroverkkoja. Syvyys viittaa kerrosten määrään: jokainen kerros oppii edellistä abstraktimpia piirteitä datasta. Syväoppiminen mahdollisti läpimurrot kuvantunnistuksessa, puheentunnistuksessa ja kielimalleissa, ja kaikki nykyiset generatiiviset tekoälyt perustuvat siihen.

Ylläpitää Sampsa Sironen, Co-Founder & CEO

Haluatko, että tiimisi osaa nämä käytännössä?

Koulutamme tekoälyn käytön teidän työtehtävillänne, ei kalvoilla.

← Kaikki sanaston termit