Anta att du försöker navigera i en okänd del av en storstad och att du använder ett visst kluster av skyskrapor som referenspunkt. Trafiken och enkelriktade gator tvingar dig att några oplanerade svängar och till slut tappar du bort din referenspunkt. När du får syn på skyskraporna igen måste du kunna identifiera dem som samma byggnader som du såg innan samt veta din orientering i förhållande till dem för att kunna använda dem för navigering.
Den här typen av re-identifiering är en självklarhet för människor, men det är svårt för datorer. I juni kommer en grupp forskare från MIT att presentera en ny algoritm som gör re-identifieringen enklare.
I ett första steg uppskattar algoritmen orienteringen av enskilda punkter i en scen. Orienteringen av dessa punkter mappas sedan till ytan av en sfär. I nästa steg används en iterativ process (samma princip som en linjär regression) för att hitta en uppsättning av linjer inbäddade i sfären som passar bäst dessa punkter. När en robot förflyttas kommer den att observera en sfär som roterar och bestämma sin egen orientering i förhållande till linjerna i sfären. När roboten svänger kommer den veta vilken av dessa linjer och landmärken som den svänger mot.
Samma algoritm kan användas för att förenkla problemet med plansegmentering, dvs. att avgöra vilka delar av en visuell scen ligger i vilket plan. Plansegmentering möjliggör för en dator att bygga 3D-modeller av objekten i scenen som den i sin tur kan matcha mot lagrade 3D-modeller av kända objekt.
Egen kommentar
Algoritmen är avsedd för att hjälpa robotar att navigera i okända byggnader och inte för att hjälpa förare och fordon att navigera i obekanta städer, men principen är densamma.
Källor
[1] Hardesty, L. MIT News. Orienteering for robots. 2014-04-04. Länk