Miksi syväoppiminen mullisti tekoälyn?
Käännekohta oli vuosi 2012, kun AlexNet-niminen syvä neuroverkko voitti kuvantunnistuskilpailun selvällä erolla perinteisiin menetelmiin. Sen jälkeen sama resepti (enemmän kerroksia, enemmän dataa, enemmän laskentatehoa) on toiminut yhä uudelleen: puheentunnistus, konekäännös ja lopulta suuret kielimallit. Vuoden 2017 transformer-arkkitehtuuri, johon ChatGPT ja Claude perustuvat, on syväoppimisen toistaiseksi merkittävin sovellus.
Mitä eroa on koneoppimisella ja syväoppimisella?
Syväoppiminen on koneoppimisen alalaji. Perinteisessä koneoppimisessa ihminen valitsee, mitä piirteitä datasta malli tarkastelee (esimerkiksi viestin pituus ja linkkien määrä roskapostisuodattimessa). Syväoppimisessa verkko oppii piirteet itse suoraan raakadatasta, kuten kuvan pikseleistä tai tekstin merkeistä. Siksi se vaatii paljon dataa ja laskentaa, mutta toimii ongelmissa, joihin käsin valitut piirteet eivät riitä.