Uporabili bomo Google’s Teachable Machine in z njim naučili stroj, da klasificira sliko bodisi kot kolo ali kot motorno kolo. Spomnimo, da je aplikacije strojnega učenja potrebno naučiti in testirati pred njihovo uporabo v praksi. Zbrali in razvrstili bomo vzorčne primere kategorij, ki jih bo kasneje razvrščal stroj, nato bomo model usposobili (naučili) ter testirali, ali vzorčne slike pravilno kategorizira.
Izvedi naslednja dejanja:
Izberi Učenje (Training), nato klikni na Učenje modela (Train Model). Model se bo sedaj naučil, kako prepoznati kolesa in motorna kolesa. Počakaj na obvestilo Model naučen / Model usposobljen (Model Trained).
Verjetno boš opazil(-a), da ni potrebno ročno izbirati in vnašati posameznih lastnosti (značilnosti) koles in motornih koles. Algoritmi jih znajo namreč sami poiskati na slikah!
Izvedi naslednja dejanja:
Če uporabiš sliko za učenje klasifikatorja, bo stroj že zabeležil ustrezno oznako za dotično sliko. Prikaz te slike stroju v fazi testiranja ne bo omogočil merjenja uspešnosti generalizacije. Zato se morajo učni in testni podatki med seboj razlikovati!
Opomba: Naložiš lahko tudi svoje slike ter z njimi model učiš in testiraš. Tukaj najdeš dober in brezplačen vir najrazličnejših slik.
Znanost o podatkih, zlasti metode strojnega učenja, služijo kot katalizatorji sprememb na različnih področjih, kot so znanost, inženiring in tehnologija, ki pomembno vplivajo na naše vsakdanje življenje. Računalniške tehnike, kot je na primer rudarjenje podatkov (ang. data mining), s katerimi je mogoče presejati obsežne nize podatkov, identificirati zanimive vzorce in konstruirati napovedne modele, postajajo vseprisotne. Vendar ima le nekaj strokovnjakov temeljno razumevanje znanosti o podatkih, še manj jih je aktivno vključenih v izgradnjo modelov iz svojih podatkov. V dobi, ko AI tiho oblikuje naš svet, se morajo vsi zavedati njenih zmogljivosti, prednosti in potencialnih tveganj. Vzpostaviti moramo metode za učinkovito komuniciranje in poučevanje konceptov, povezanih s podatkovno znanostjo, širokemu občinstvu. Načela in tehnike strojnega učenja, znanosti o podatkih in umetne inteligence morajo postati splošno znana.
Rudarjenja podatkov se lahko lotimo tako, da začnemo z vprašanjem, poiščemo ustrezne podatke in nato odgovorimo na vprašanje z iskanjem ustreznih podatkovnih vzorcev in modelov. V projektu Pumice razvijamo izobraževalne aktivnosti, s katerimi lahko obogatimo različne šolske predmete. Uporabljamo podatke, povezane s predmetom, in jih raziskujemo z uporabo AI in pristopov strojnega učenja. V sodelovanju z učitelji smo razvili učne predloge in razlage ozadja za učitelje in učence.
Aktivnosti in usposabljanje projekta Pumice podpira Orange, program za strojno učenje, ki ima intuitiven vmesnik, interaktivne vizualizacije in vizualno programiranje. Ključ do enostavnosti, ki je potrebna pri usposabljanju, in vsestranskosti za pokrivanje večine osrednjih tem in prilagajanje različnim področjem uporabe je konstrukcija analitičnih cevovodov, podobna kockam Lego, in interaktivnost vseh komponent (glej sliko). Za nadaljnjo podporo poučevanju in osredotočenost na koncepte namesto na osnovno mehaniko, Orange izvaja enostaven dostop do podatkov, ponovljivost s shranjevanjem potekov dela z vsemi različnimi nastavitvami in izbirami, ki temeljijo na uporabniku, ter enostavno prilagajanje z oblikovanjem novih komponent. Kritični vidik usposabljanja vključuje pripovedovanje zgodb s pregledovanjem potekov dela in specializiranimi funkcijami za eksperimentiranje, kot je risanje nizov eksperimentalnih podatkov ali učenje o prekomernem prilagajanju polinomske linearne regresije. Orange je na voljo kot odprtokodna programska oprema in jo dopolnjuje jedrnat videoposnetek za usposabljanje.