Razlika med poglobljenim učenjem in okrepljenim učenjem

Tako globoko kot okrepljeno učenje sta močno povezana z računalniško močjo umetne inteligence (AI). To so avtonomne funkcije strojnega učenja, ki računalnikom utirajo pot, da ustvarijo svoja načela pri oblikovanju rešitev. Te dve vrsti učenja lahko obstajajo tudi v več programih. Na splošno poglobljeno učenje uporablja trenutne podatke, medtem ko okrepljeno učenje pri ugotavljanju napovedi uporablja metodo preizkušanja in napak. Naslednje razprave se poglabljajo v takšna razlikovanja.

Kaj je globoko učenje?

Globoko učenje imenujemo tudi kot globoko strukturirano učenje ali hierarhično učenje. To je prvič leta 1986 predstavila Rina Dechter, profesorica računalništva. Uporablja trenutne informacije pri poučevanju algoritmov za iskanje ustreznih vzorcev, ki so bistveni pri napovedovanju podatkov. Tak sistem uporablja različne ravni umetnih nevronskih mrež, podobne nevronskim vzorcem človeških možganov. S pomočjo zapletenih povezav bo algoritem lahko obdeloval na milijone informacij in jih natančneje napovedal.

Tovrstno učenje se lahko uporablja, če bi razvijalci želeli, da bi programska oprema na različnih slikah opazila barvno vijolično. Program bi natovali s številnimi slikami (torej "globoko" učenje) z vijoličnimi barvami in brez njih. Skozi grozd bo program lahko določil vzorce in se naučil kdaj označiti barvo kot vijolično. Globoko učenje se uporablja v različnih programih prepoznavanja, kot so analize slik in naloge napovedovanja, kot so napovedi časovnih vrst.

Kaj je krepitev učenja?

Okrepljeno učenje na splošno izriše napovedi s poskusi in napakami. Glede na zgodovino z vidika AI je bila razvita v poznih osemdesetih; temeljila je na rezultatih poskusov na živalih, konceptih o optimalnem nadzoru in metodah časovne razlike. Poleg nadzorovanega in nenadzorovanega učenja je okrepitev ena temeljnih paradigem strojnega učenja. Kot že ime pove, algoritem trenira z nagradami.

Na primer, AI je razvit za igranje z ljudmi v določeni mobilni igri. Vsakič, ko izgubi AI, se algoritem revidira, da se doseže maksimalen rezultat. Tako se tovrstna tehnika nauči iz svojih napak. Po številnih ciklih se je AI razvil in postal boljši pri premagovanju človeških igralcev. Okrepitveno učenje se uporablja v različnih vrhunskih tehnologijah, kot so izboljšanje robotike, rudarjenje besedil in zdravstveno varstvo.

Razlika med poglobljenim učenjem in okrepljenim učenjem

Učna tehnika

Globoko učenje je sposobno izvesti ciljno vedenje z analizo obstoječih podatkov in uporabo novega, kar smo se naučili, na nov niz informacij. Po drugi strani pa lahko okrepljeno učenje spremeni svoj odziv s prilagajanjem stalnih povratnih informacij.

Obstoj podatkov

Globoko učenje deluje z že obstoječimi podatki, saj je nujno potrebno pri treniranju algoritma. Kar zadeva krepitev učenja, je raziskovalne narave in ga je mogoče razviti brez trenutnega nabora podatkov, saj se uči s poskusi in napakami.

Uporaba

Globoko učenje se uporablja pri prepoznavanju slike in govora, poglobljenem iskanju omrežij in nalogah za zmanjšanje dimenzij. Za primerjavo se učenje okrepitve uporablja pri interakciji z zunanjimi dražljaji z optimalnim nadzorom, kot so robotika, načrtovanje dvigal, telekomunikacije, računalniške igre in AI v zdravstvu.

Poznan tudi kot

Globoko učenje je znano tudi kot hierarhično učenje ali globoko strukturirano učenje, medtem ko okrepitveno učenje nima drugih splošno znanih izrazov.

Strojno učenje

Globoko učenje je ena izmed številnih metod strojnega učenja. Po drugi strani je okrepljeno učenje področje strojnega učenja; je ena od treh temeljnih paradigem.

Človeški možgani

V primerjavi z globokim učenjem je okrepljeno učenje bližje zmožnostim človeških možganov, saj lahko tovrstno inteligenco izboljšamo s povratnimi informacijami. Globoko učenje je predvsem za prepoznavanje in je manj povezano z interakcijo.

Zgodovina

Globinsko učenje je prvič uvedla leta 1986 Rina Dechter, medtem ko je bilo okrepljeno učenje v poznih osemdesetih letih razvito na podlagi konceptov poskusov na živalih, optimalnega nadzora in časovnih razlik.

Globoko učenje proti okrepljenemu učenju

Povzetek

  • Globoko in okrepljeno učenje sta avtonomni funkciji strojnega učenja, ki računalnikom omogoča ustvarjanje lastnih načel pri oblikovanju rešitev.
  • Globoko učenje uporablja trenutne informacije pri poučevanju algoritmov za iskanje ustreznih vzorcev, ki so bistveni pri napovedovanju podatkov.
  • Okrepljeno učenje na splošno izriše napovedi s poskusi in napakami.
  • Globoko učenje uporablja naučene vzorce na novem nizu podatkov, medtem ko okrepljeno učenje pridobi od povratnih informacij.
  • Za poglobljeno učenje je potreben že obstoječi nabor podatkov za učenje, medtem ko za okrepljeno učenje ni potreben trenutni nabor podatkov.
  • Uporaba globljega učenja je pogosteje pri nalogah prepoznavanja in zmanjševanja površin, medtem ko je okrepljeno učenje običajno povezano z interakcijo okolja z optimalnim nadzorom.
  • Globoko učenje je znano tudi kot hierarhično učenje ali poglobljeno strukturirano učenje, medtem ko okrepitveno učenje nima drugega izraza.
  • Globoko učenje je ena od mnogih metod strojnega učenja, medtem ko je okrepljeno učenje ena izmed treh osnovnih paradigem strojnega učenja.
  • Globoko učenje je bilo uvedeno leta 1986, medtem ko se je okrepljeno učenje razvilo v poznih osemdesetih letih.