Nadzorovano učenje in nenadzorovano učenje sta dva temeljna koncepta strojnega učenja. Nadzorovano učenje je naloga strojnega učenja učenja funkcije, ki preslika vhod na izhod na podlagi primernih vhodno-izhodnih parov. Nenadzorovano učenje je naloga strojnega učenja sklepati na funkcijo za opisovanje skrite strukture iz neoznačenih podatkov. The ključna razlika med nadzorovanim in nenadzorovanim strojnim učenjem je to nadzorovano učenje uporablja označene podatke, medtem ko nenadzorovano učenje uporablja neoznačene podatke.
Strojno učenje je področje računalništva, ki omogoča, da se računalniški sistem lahko uči iz podatkov, ne da bi bil izrecno programiran. Omogoča analizo podatkov in napovedovanje vzorcev v njih. Obstaja veliko aplikacij strojnega učenja. Nekateri od njih so prepoznavanje obrazov, prepoznavanje gest in prepoznavanje govora. Obstajajo različni algoritmi, povezani s strojnim učenjem. Nekatere od njih so regresija, klasifikacija in grozdenje. Najpogostejša programska jezika za razvoj aplikacij, ki temeljijo na strojnem učenju, sta R in Python. Uporabljajo se lahko tudi drugi jeziki, kot so Java, C ++ in Matlab.
1. Pregled in ključne razlike
2. Kaj je nadzorovano učenje
3. Kaj je nenadzorovano učenje
4. Podobnosti med nadzorovanim in nenadzorovanim strojnim učenjem
5. Primerjalna primerjava - nadzorovano vs nenadzorovano strojno učenje v tabeli
6. Povzetek
V sistemih, ki temeljijo na strojnem učenju, model deluje v skladu z algoritmom. Pri nadzorovanem učenju je model nadzorovan. Najprej je treba usposobiti model. S pridobljenim znanjem lahko napove odgovore na prihodnje primere. Model se usposobi z uporabo označenega nabora podatkov. Kadar sistemu ni dodeljenih vzorčnih podatkov, lahko napove rezultat. Sledi majhen izvleček iz priljubljenega nabora podatkov IRIS.
V skladu z zgornjo tabelo se atributi imenujejo dolžina Sepala, širina Sepala, dolžina Patela, širina Patela in vrste. Stolpci so znani kot funkcije. V eni vrstici so podatki za vse atribute. Zato se ena vrstica imenuje opazovanje. Podatki so lahko številčni ali kategorični. V modelu so navedena opažanja z ustreznim imenom vrste kot vhodnim podatkom. Ko je dano novo opazovanje, bi moral model predvideti vrsto, ki ji pripada.
Pri nadzorovanem učenju obstajajo algoritmi za razvrščanje in regresijo. Klasifikacija je postopek razvrščanja označenih podatkov. Model je ustvaril meje, ki so ločevale kategorije podatkov. Ko so modelu na voljo novi podatki, ga lahko razvrstimo glede na to, kje obstaja točka. K-najbližji sosedi (KNN) so klasifikacijski model. Glede na vrednost k se odloči kategorija. Na primer, kadar je k 5, če je določena podatkovna točka blizu osem podatkovnih točk kategorije A in šest podatkovnih točk kategorije B, bo podatkovna točka uvrščena kot A.
Regresija je postopek napovedovanja trenda prejšnjih podatkov za napovedovanje izida novih podatkov. V regresiji lahko izhod sestoji iz ene ali več zveznih spremenljivk. Napovedovanje poteka s črto, ki zajema večino podatkovnih točk. Najenostavnejši regresijski model je linearna regresija. Hitro je in ne potrebuje nastavitve parametrov, kot je na primer v KNN. Če podatki kažejo parabolični trend, model linearne regresije ni primeren.
To je nekaj primerov nadzorovanih algoritmov učenja. Na splošno so rezultati, pridobljeni z nadzorovanimi metodami učenja, bolj natančni in zanesljivi, saj so vhodni podatki dobro znani in označeni. Zato mora stroj analizirati samo skrite vzorce.
Pri nenadzorovanem učenju se model ne nadzira. Model deluje samostojno, da napoveduje rezultate. Uporablja algoritme strojnega učenja za sklepanje o neoznačenih podatkih. Na splošno so algoritmi nenadzorovanega učenja težji od algoritmov nadzorovanega učenja, ker je malo informacij. Grozdanje je vrsta nenadzorovanega učenja. Lahko se uporablja za združevanje neznanih podatkov z algoritmi. K-povprečje in gostovanje na podlagi gostote sta dva algoritma združevanja.
k-srednji algoritem, namesti k centroid naključno za vsak grozd. Nato je vsaka podatkovna točka dodeljena najbližjemu središču. Euklidna razdalja se uporablja za izračun razdalje od podatkovne točke do središča. Podatkovne točke so razvrščene v skupine. Položaji za k centroide se ponovno izračunajo. Nov centroidni položaj je določen s srednjo vrednostjo vseh točk v skupini. Spet je vsaka podatkovna točka dodeljena najbližjemu središču. Ta postopek se ponavlja, dokler se centroidi ne spremenijo več. k-srednja vrednost je algoritem hitrega združevanja, vendar ni določene inicializacije točk združevanja. Obstaja tudi velika različica modelov grozdov, ki temeljijo na inicializaciji točk grozda.
Drug algoritem združevanja je Gostovanje na podlagi gostote. Znan je tudi pod imenom Prostorne grozdne aplikacije z gostoto. Deluje z definiranjem grozda kot največjega nabora točk gostote. Gre za dva parametra, ki se uporabljata za gostovanje na podlagi gostote. So Ɛ (epsilon) in minimalne točke. Ɛ je največji polmer soseske. Minimalne točke so najmanjše število točk v Ɛ soseski za določitev grozda. To je nekaj primerov združevanja, ki sodi v nenadzorovano učenje.
Na splošno rezultati, pridobljeni iz nenadzorovanih algoritmov učenja, niso veliko natančni in zanesljivi, saj mora stroj določiti in označiti vhodne podatke, preden določi skrite vzorce in funkcije.
Nadzorovano vs Nenadzorovano strojno učenje | |
Nadzorovano učenje je naloga strojnega učenja, da uči funkcijo, ki preslika vhod na izhod na podlagi primernih vhodno-izhodnih parov. | Nenadzorovano učenje je naloga strojnega učenja sklepati na funkcijo za opisovanje skrite strukture iz neoznačenih podatkov. |
Glavna funkcionalnost | |
Pri nadzorovanem učenju model napoveduje rezultat na podlagi označenih vhodnih podatkov. | Pri nenadzorovanem učenju model napoveduje izid brez označenih podatkov tako, da sam identificira vzorce. |
Natančnost rezultatov | |
Rezultati, pridobljeni z nadzorovanimi metodami učenja, so bolj natančni in zanesljivi. | Rezultati, pridobljeni z nenadzorovanimi metodami učenja, niso ravno natančni in zanesljivi. |
Glavni algoritmi | |
Obstajajo algoritmi za regresijo in klasifikacijo v nadzorovanem učenju. | Obstajajo algoritmi za združevanje pri nenadzorovanem učenju. |
Nadzorovano učenje in nenadzorovano učenje sta dve vrsti strojnega učenja. Nadzorovano učenje je naloga strojnega učenja, da uči funkcijo, ki preslika vhod na izhod na podlagi primernih vhodno-izhodnih parov. Nenadzorovano učenje je naloga strojnega učenja sklepati na funkcijo za opisovanje skrite strukture iz neoznačenih podatkov. Razlika med nadzorovanim in nenadzorovanim strojnim učenjem je v tem, da nadzirano učenje uporablja označene podatke, medtem ko se pri nenadzorovanem nagibanju uporabljajo neoznačeni podatki.
1.Velika raznolikost. Strojno učenje - Nadzorovano VS Nenadzorovano učenje, kognitivni razred, 13. marec 2017. Na voljo tukaj
2. "Nenadzorovano učenje." Wikipedia, fundacija Wikimedia, 20. marec 2018. Na voljo tukaj
3. "Nadzirano učenje." Wikipedia, fundacija Wikimedia, 15. marec 2018. Na voljo tukaj
1.'2729781 'avtorja GDJ (Public Domain) prek pixabay