Metoder för att upptäcka okänd data utan inlärning

Machine Learning (ML) och speciellt Deep Learning (DL) har visat sig vara mycket effektiva och kraftfulla för att lära sig att känna igen mönster, beteende och egenskaper.

En känd egenskap hos ML är att algoritmerna kan vara extremt bra på data som finns inom den rymd som använts för träning, men extremt dåliga på data som ligger utanför träningsrymden. De är alltså bra på att generalisera, men sämre på att extrapolera. För att detektera data som ligger utanför träningsrymden, tränas ofta nätverk som lära sig se skillnad på ”känd data” och ”okänd data”, genom att presentera exempel från båda klasserna. Problemet är dock att det dels finns många dimensioner i datat (speciellt när indata är bilder) och dels blir det snabbt opraktiskt att samla data på objekt som inte är relevanta för nätverket.

Forskare från Georgia Tech och Samsung, har nyligen publicerat en artikel kring hur nätverk kan tränas, utan att använda data data som ligger utanför träningsrymden [1].

Artikeln presenterar en metod som använder sig av signaler som finns inne i ML nätverken. De skapar sannolikhesfördelningar över hur signalerna beter sig för de olika kända klasserna. Genom att jämföra dessa fördelningar med hur signalerna ser ut för ny data som presenteras för nätverket, lyckas de med hög säkerhet avgöra om den nya datan kommer ifrån den kända eller okända datarymden.

Egen kommentar

Denna metodik har studerats inom Vinnova FFI projektet SMILE II även där med stor framgång [2].

Källor

[1] Hsu, Yen-Chang, et al. ”Generalized ODIN: Detecting Out-of-distribution Image without Learning from Out-of-distribution Data.” arXiv preprint arXiv:2002.11297 (2020).

[2] Slutrapport SMILE II https://www.vinnova.se/globalassets/mikrosajter/ffi/dokument/slutrapporter-ffi/elektronik-mjukvara-och-kommunikation-rapporter/2017-03066eng.pdf