Suradničko učenje čovjek-stroj

Vadim Tschernezki, Moin Nabi i Tassilo Klein (ML Research Berlin)

Ušli smo u novu eru u kojoj bilježimo stalno i snažno poboljšanje računalne snage, pohrane i dostupnosti velikih podataka. Duboko učenje pokazalo se kao idealna tehnika iskorištavanja tih trendova, etablirajući se kao de facto standard u nadgledanom učenju. Međutim, ova vrsta učenja zahtijeva da se podaci obilježe, što u pravilu uključuje znatne troškove pri prikupljanju podataka. Stoga se pojavljuju alternativne paradigme koje omogućuju maksimaliziranje potencijala ogromne količine informacija na novi i različit način. U ovom postu objavljujemo koncept koji na kolaborativni način kombinira snage ljudi i strojeva. No prije nego što uđemo u više detalja, započnimo s pričom koja pokazuje prednosti ovog pristupa.

Godine 1997. Garry Kasparov poražen je od superračunala (Deep Blue) u šahovskom meču prema propisima turnira. Bio je to vrlo važan događaj, gdje je vodeći svjetski prvak u šahu poražen od stroja. Dok se Kasparov još oporavljao od ovog iskustva, inspiraciju je crpio i iz Deep Blue-a. Zapitao se: "Što ako bih mogao igrati protiv računala - s drugim računalom pored mene - kombinirajući naše snage, ljudsku intuiciju plus proračunski stroj, ljudsku strategiju, taktiku stroja, ljudsko iskustvo, memoriju stroja?"

Kasparov je ideja o suradnji čovjek-stroj u šahu uspješno realizirala 2005. godine na računalnom potpomognutom online šahovskom turniru na kojem su se velemajstovi udružili sa superračunalima. Rezultat je bio prilično neočekivan: pobjednici su bili par amaterskih američkih šahista koji su istovremeno upravljali s tri obična računala. Čini se da je u ovom slučaju igračeva sposobnost za vođenje računala igrala vrlo važnu ulogu. To postavlja pitanje može li se takva vrsta suradnje koristiti i za druge zadatke. Sljedeći odlomci osvjetlit će nove pristupe u ovom kontekstu.

Pristupi i trendovi

Strojevi kao suradnici, ne samo Alati

Kada se uspoređuju ljudi i strojevi, vidljivo je da obje strane imaju vrlo jedinstvene karakteristike i snage. Ljudi sjajno donose intuitivne i kreativne odluke na temelju svog znanja. Računala su dobra u obradi ogromne količine podataka za dobivanje skraćenih značajnih informacija za dobivanje novih znanja i donošenje boljih odluka. Iskorištavanje sinergije tih karakterističnih snaga čini se da je prirodni sljedeći korak.

U istraživanju su se takve kombinacije dublje istraživale proteklih godina i postepeno doživljavaju sve veći zamah. Mintz i sur. Su predložili jedan pristup. koristeći neobilježene podatke za poboljšanje modela vađenja odnosa putem daljinskog nadzora. Konkretno, koriste bazu podataka utemeljenu od ljudi da bi dizajnirali funkciju heurističkog označavanja i uključili je u postupak obuke klasifikatora. Klasifikator je tada u mogućnosti izvući uzorke visoke preciznosti za relativno velik broj odnosa. Budući da istraživači dizajniraju funkciju označavanja koja aproksimira ponašanje označavanja ljudskog annotatora, nadzor čini "udaljenim".

Druga tehnika koju su razvili Wang i sur. u području računalnog vida, poboljšava otkrivanje predmeta s neobilježenih slika putem Samoprovođenja uzoraka uzoraka. Važan dio ove metode zasniva se na automatskom otkrivanju i pseudo-označavanju prijedloga pouzdanih regija za poboljšanje detektora objekata. To se postiže lijepljenjem ovih prijedloga u različite označene slike radi cjelovite procjene vrijednosti njihove konzistentnosti u različitim kontekstima slike. Iako su ove slike pseudo označene, učinkovito doprinose poboljšanju točnosti otkrivanja i robusnosti u odnosu na bučne uzorke. Na kraju, oba opisana pristupa automatski označavaju neoznačene podatke i na taj način smanjuju količinu ljudskog nadzora u trenažnom procesu.

Uključivanje ljudskog usmjeravanja u aktivno učenje

U usporedbi s prethodnim konceptom, gdje se skup podataka proširuje strojno zabilježenim podacima, možemo također pustiti učenika da odabere teške uzorke i tražiti od ljudskog trenera da ga napiše, otuda i ime aktivnog učenja. Metoda se pokazala vrlo učinkovitom, posebno u situacijama s ograničenom dostupnošću proračuna za obuku uzoraka - stručnjaci se mogu usredotočiti na zahtjevne slučajeve, dok stroj preuzima većinu uzoraka koje je obično lako riješiti.

Da biste objasnili intuiciju koja stoji iza aktivnog učenja, razmislite o jednostavnom zadatku označavanja slika pasa s obzirom na pasmine. Započinjemo s baznim podacima koji sadrže označene slike pasa. Ovaj skup podataka može predstavljati izazov za obuku na nekoliko načina: Sadrži uglavnom slike pasa okrenutih prema kameri, čime bi se trenirani model učinio invarijantnim psima prikazanim sa strane. Također može sadržavati neuravnoteženu količinu uzoraka za svaku pasminu. Ili može sadržavati slične pasmine poput belgijskog Malinoisa i njemačkog ovčara. U takvim će slučajevima i ljudi i strojevi trebati više primjera svake pasmine da bi naučili ispravno klasificirati pse. Aktivno učenje pomaže u rješavanju takvih problema.

Zamislite da bismo mogli postići točnost od 80% s modelom obučenim na određenom baznom skupu podataka. Dobivamo proračun za označavanje do 100 novih slika od 1000 neobilježenih i cilj nam je pametno iskoristiti taj proračun, jer je stručna podrška za označavanje skupa. Stoga, umjesto da odaberemo 100 uzoraka nasumično, radije pustimo da naš polaznik stroja odabere najteže uzorke ili one koji najbolje zabilježe temeljnu raspodjelu podataka i minimiziraju suvišnost. Pustimo model da stručnjacima za etiketiranje predloži tih 100 uzoraka za koje će on dodjeljivati ​​etikete s malim povjerenjem ili velikom nesigurnošću. Na taj se način točnost našeg strojnog učenika može povećati na 95% nakon treninga umjesto na 90% u postavi u kojoj su korišteni nasumično označeni uzorci. Alternativno, mogli bismo jednostavno smanjiti količinu označenih podataka i, stoga, obučiti model s istim 90% točnosti, ali s manje troškova.

Adversarni trening: Kombinacija najboljeg od oba

Za kombiniranje aktivnog učenja i postupnog poboljšanja automatskog označavanja potreban nam je strojni učenik koji se sastoji od dva modela. Prvo, diskriminirajući model mjerenja nesigurnosti u pogledu točnosti predviđanja za dane uzorke (aktivno učenje) i drugo, generativni model za predviđanje pseudo-osnovne istine za uzorke (automatsko označavanje). Kako bismo povećali učinkovitost obuke učenika, cilj nam je zajednička optimizacija oba modela putem kontraverznog treninga. Na taj se način diskriminirajući model također može koristiti za postavljanje nesigurnosti predviđanjima generativnog modela i zauzvrat povećava točnost predviđanja. Vrhunski model koji je stekao snažan ugled u istraživačkoj zajednici i udovoljava navedenim zahtjevima zove se Generative Adversarial Network (GAN).

Suradničko učenje čovjek-stroj s GAN-ovima

S obzirom na okvir prikazan na gornjoj slici, prvo koristimo generator (G) za predviđanje pseudo-osnovne istine za podatke koji nisu zabilježeni. Budući da je diskriminator (D) u stanju dodijeliti ne samo neizvjesnosti pravoj temeljnoj istini, već i onu koju je predvidio G, neoznačene uzorke možemo razvrstati po poteškoći ili nesigurnosti D. Definiramo uzorke čija distribucija nije u potpunosti obuhvaćena modelu još uvijek kao težak i dopustite da ih D predloži ljudskom komentatoru. Ostale jednostavne uzorke s malom nesigurnošću koristimo za stvaranje automatski zabilježenih podataka s G. Ljudski vodič rezultira snažnijim D koji je prilagođen zahtjevima zadatka koji odredi učitelj (aktivno učenje). Zauzvrat, poboljšani D potaknut će G da predvidi istodobno visoku kvalitetu pseudo zemlje (automatska napomena). Zbog ovog iterativnog poboljšanja, GAN predstavljaju prirodni okvir za kombiniranje čovjeka i stroja u jedan zajednički optimizirani postupak obuke.

Iako je znanstvena fantastika prepuna strojeva i robota koji prijete čovječanstvu i stvaraju atmosferu sumnje, koncept ljudsko-kolaborativnog učenja s protivničkim postupcima pokazuje kako strojevi mogu razumno dopuniti naš rad i život na pozitivan način. Zapravo, opisani pristup ima snažni potencijal transformirati mnoštvo aplikacija, na primjer, u zdravstvenom sektoru. Konkretno, naš tim trenutno razvija pristup za segmentaciju 3D kardiovaskularne magnetske rezonancije (MR), što je važan preduvjet za stvaranje bolesnika specifičnih modela srca, a time i za liječenje složenih srčanih bolesti. Naš je cilj stvoriti model koji uči iz samo-generiranih segmentacija i stručnjacima aktivno predlaže teške MR slike za ručnu segmentaciju. To bi moglo značajno smanjiti troškove i vrijeme provedeno na ovom složenom postupku, tako da radiolozi mogu posvetiti više vremena njezi pacijenata. Iako ovaj specifičan primjer lijepo pokazuje pozitivan utjecaj koncepta na društvo, postoji mnoštvo područja primjene izvan zdravstvenog sektora koja će imati koristi od rezultata istraživanja u ovom polju.

Kompletni istraživački rad za MIDL 2019 potražite ovdje: Semantička segmentacija vođena neizvjesnošću pomoću kolaborativnog učenja između čovjeka i stroja