Učenje predstavitev pokrajin za razlago kakovosti stohastičnih optimizacijskih algoritmov
Oznaka in naziv projekta
N2-0239 Učenje predstavitev pokrajin za razlago kakovosti stohastičnih optimizacijskih algoritmov
N2-0239 Representation Learning of Landscape Spaces for Explainable Performance of Stochastic Optimization Algorithms
Logotipi ARRS in drugih sofinancerjev
Projektna skupina
Vodja projekta: doc. dr. Tome Eftimov
Sodelujoče raziskovalne organizacije: Povezava na SICRIS
Sestava projektne skupine: Povezava na SICRIS
Vsebinski opis projekta
Pri evolucijskem računanju (ER), delu računalniške inteligence, so glavne raziskave osredotočene na razvoj algoritmov za globalno optimizacijo, ki se zgledujejo po biološki evoluciji. Raziskovalci dokazujejo njihovo inovativnost z uporabo teorije primerjalne analize (angl. benchmarking theory), ki omogoča analizo delovanja algoritmov na osnovi izbranih performančnih mer kakovosti glede na zbirko instanc primerjalnih problemov. Čeprav so se ti algoritmi izkazali kot zelo učinkoviti pri reševanju številnih problemov, ostaja njihov inkrementalni razvoj še zmeraj odprt raziskovalni problem.
Glavna naloga primerjalne analize v evolucijskem računanju zajema oceno uspešnosti algoritma (zlasti na novo uvedenega) v primerjavi z drugimi algoritmi. Pri tem se pojavijo tri pomembna vprašanja, ki jih je potrebno previdno obravnavati: i) katere instance problema je potrebno izbrati za primerjalno študijo (tj. raziskovanje prostora problema), ii) kako oblikovati eksperimente, ki vodijo do ponovljivosti in ponovljivih rezultatov (tj. raziskovanje relacij med algoritmom, problemom in prostorom uspešnosti) in iii) katere mere uspešnosti je potrebno analizirati in s katerim statističnim pristopom (tj. raziskovanje podatkov o prostoru uspešnosti).
Primerjalna analiza je v ER ključna pri ovrednotenju uspešnosti (novo uvedenega) optimizacijskega algoritma napram drugim algoritmom. Teorija primerjalne analize vključuje tri glavna vprašanja: i) katere probleme je treba izbrati za primerjalno analizo, ii) kako nastaviti poskuse in iii) kako ovrednotiti uspešnost. Predlagani projekt se bo osredotočil na metodologije, ki se uporabljajo za ustrezen nepristranski izbor optimizacijskih problemov, ki bodo uporabljeni za nadaljnjo analizo.
Čeprav je bil s predlaganimi bolj robustnimi statističnimi metodologijami za primerjalno analizo v evolucijskem računanju dosežen velik uspeh in so bili narejeni pomembni koraki, je potrebno poudariti, da lahko izbira instanc primerjalnih problemov (tj. zbirka primerjalnih vzorcev), ki bodo vključeni v analizo ima velik vpliv na zasnovo eksperimenta (tj. drugo vprašanje) in statistično analizo (tretjo vprašanje), opravljeno z uporabo podatkov o uspešnosti. Lahko se zgodi, da isti nabor algoritmov (tj. nabor instanc algoritmov), ovrednoten na različnih naborih instanc primerjalnih problemov, določi različne zmagovalne algoritme. To pomeni, da lahko izbira instanc primerjalnega problema privede do analize pristranskosti uspešnosti (tj. izbira instanc primerjalnega problema v korist zmagovalnega algoritma). Torej to raziskovalcem omogoča, da predstavijo rezultate, zaradi katerih je njihov na novo razviti algoritem videti boljši od ostalih. Še več različnih izbir instanc problema lahko vodi do različnih konfiguracij (tj. parametrov) istega razreda algoritmov (tj. različnih instanc algoritmov), ki so najboljše, kar zmanjša posploševanje dobljenih rezultatov.
Glavni cilj projekta RESPONSE je zmanjšati pristranskost pri primerjalni analizi v evolucijskem računanju z iznajdbo, razvojem, izvajanjem, in ovrednotenjem ogrodja za poglobljeno analizo pokrajine optimizacije, ki bo sestavljena iz metodologij za raziskovanje izraznosti in robustnosti značilk prostora, z namenom odkritja koristnih predstavitev instanc problema (tj. nabora značilk). S tem bomo preprečili izumljanje novih in novih, sicer enakovrednih algoritmov tipa »črne škatle« za zvezno optimizacijo. Metodologije za poglobljeno analizo pokrajine bojo temeljili na sinergizmu med učenjem predstavitev, strojnim učenjem in statistiko. Razvoj tovrstnih metodologij je močno motiviran s stalno rastjo optimizacijskih problemov v industriji, kar zahteva prenosljivost pridobljenega znanja iz primerjalnih študij v industrijsko okolje. Z novo instanco industrijskega optimizacijskega problema, ki bi ga bilo treba rešiti na podlagi njegove predstavitve pokrajine (tj. lastnosti), lahko najdemo najbolj podobne že obstoječe instance problema, za katere vemo, kateri so najbolj uspešni. Poleg tega nam tovrstno znanje (tj. pretekli eksperimentalni podatki) omogoča uporabo pristopov metaučenja, s čimer lahko najdemo najprimernejšo instanco algoritma za nove (še neznane) industrijske probleme (tj. problem izbire algoritma).
Osnovni podatki sofinanciranja so dostopni na spletni strani SICRIS.
Faze projekta in opis njihove realizacije
Projekt RESPONSE bo s svojimi prispevki uvedel inovacije prek naslednjih temeljnih ciljev:
1. Cilj': Razviti semantični podatkovni model (tj. ontologijo) za opis podatkov o pokrajini (tj. prostora problema), ki bo omogočil učinkovito shranjevanje podatkov glede na „Smernice o ponovljivosti raziskav umetne inteligence“, kar bo omogočilo ponovno uporabo v nadaljnjih raziskovalnih študijah.
2. Cilj': Razviti metodologije za analizo občutljivosti ELA značilk, ki bodo omogočile oceno njihove izraznosti in robustnosti glede na različne strategije vzorčenja in velikosti vzorcev, uporabljene za njihov izračun ter transformacije, opravljene v prostoru problemov (tj. premikanje, skaliranje in rotacija) .
3. Cilj': Razviti metodologije za učenje predstavitev (angl. representations) instance problema, ki temeljijo na metodah predstavitvenega učenja (angl. representation learning) (RepL), kar bo nadalje omogočilo analizo komplementarnosti različnih instanc primerjalnih problemov, s ciljem zmanjšanja pristranskosti pri izvajanju študije primerjalne analize.
4. Cilj': Izvesti vse predlagane metodologije kot spletno storitev, ki bo vključena v javno dostopno spletno platformo, imenovano DSCTool (http://ws.ijs.si/dsc/, trenutno v razvoju na IJS).
5. Cilj': Prenos uporabnosti metodologije na druga raziskovalna področja, poleg evolucijskega računanja, zlasti v področje strojnega učenja, tako da se kot učne naloge preuči klasifikacija z več oznakami in metode RepL na osnovi grafov.