Granice nowoczesnych możliwości

Project Oxford: Od rozpoznawania twarzy do rozpoznawania emocji

Marek Hoffmann Autor, Hemd & Hoodie

Pamiętacie okulary Google Glass? Sprowokowały wyjątkowo dramatyczną reakcję: aż 72 procent ankietowanych powiedziało im “nie”, uznając tę technologię za zagrożenie dla prywatności. Aparat fotograficzny wbudowany w okulary firmy Google okazał się zarówno ich największą zaletą, jak i największą wadą, wywołując obawy o tajny nadzór, akty naruszenia prywatności oraz wykorzystania danych do celów przestępczych.

Reakcje rynku nie spowodowały jednak zarzucenia projektów dotyczących rozpoznawania twarzy przez inne firmy. Tematem tym zajmuje się kilka technologicznych gigantów, od firm Apple i Facebook po Google i Intel (warto tu wymienić zwłaszcza kamerę Intel RealSense oraz oprogramowanie do zarządzania hasłami True Key).

Microsoft również ma swoje ambicje w tym obszarze, jednak robi krok dalej i przechodzi od rozpoznawania twarzy do rozpoznawania emocji. Redmond nazywa to przedsięwzięcie Project Oxford.

Maszyna ucząca się, która wie, kiedy się złościsz

W uproszczeniu Microsoft Project Oxford to zestaw narzędzi, dzięki którym komputer może identyfikować emocje na zdjęciach, korzystając z technologii rozpoznawania twarzy.

Oprogramowanie jest w stanie odróżnić gniew, pogardę, wstręt, strach, radość, smutek i zaskoczenie, a także „neutralny” stan emocjonalny. Każdemu skanowanemu zdjęciu przypisywany jest wynik od 0 do 1 dla każdej z tych ośmiu możliwości, gdzie 0 oznacza całkowity brak opisywanej emocji, a 1 mocną emocjonalną reakcję.

Jak to działa można zobaczyć na dwóch poniższych zdjęciach.

twarze

„Ekscytujące jest zainteresowanie, jakim cieszy się ten projekt i towarzyszące mu zróżnicowane reakcje” — mówi Ryan Galgon, Senior Program Manager projektu Oxford Project.

Różne reakcje są jak najbardziej uzasadnione. Microsoft zaznacza, że technologia rozpoznawania emocji jest „eksperymentalna, a wyniki analizy nie zawsze odpowiadają prawdzie” — narzędzie zwraca na przykład inny wynik dla tego samego zdjęcia w dwóch różnych rozmiarach.

Niemniej jednak system rozpoznawania emocji to inteligentna maszyna ucząca się, zaprojektowana w sposób umożliwiający samodoskonalenie — im więcej danych przetworzy, tym lepsze będą wyniki.

Mając to na uwadze, układ może zostać wyszkolony z wykorzystaniem przykładowych zdjęć do rozpoznawania specyficznych cech, właściwości i wyróżników twarzy. Tę wiedzę można następnie zastosować podczas analizy nowych zdjęć oraz wykorzystać do poprawienia zdolności systemu do rozpoznawania tych cech poprzez ciągłe dostosowywanie.

Microsoft zademonstrował już jak efektywne jest podejście „ucz się przez działanie” na przykładzie tłumacza w czasie rzeczywistym dla aplikacji Skype i osobistej asystentki systemu Windows 10 — Cortany.

 

Rozpoznawanie emocji w sektorze handlu

Rodzi się pytanie, jakim użytecznym celom może służyć rozpoznawanie emocji? W końcu można by dyskutować, czy ludzie są w stanie zinterpretować emocje wyrażone na zdjęciu szybciej (na tę chwilę) i dokładniej niż komputer.

Ryan Galgon z firmy Microsoft uważa, że szczególnie ważną potencjalną grupę docelową stanowi sektor handlu detalicznego. Wierzy, że rozpoznawanie emocji może być wykorzystywane w środowiskach handlowych do oceny reakcji konsumentów na produkty lub reklamy prezentowane na sklepowych wystawach.

gorlan

Galgon dostrzega również potencjał wykorzystania tej funkcji w narzędziach do przesyłania wiadomości, które mogłyby proponować różne opcje w zależności od wyrazu twarzy, jaki rozpoznają na wymienianych zdjęciach.

Idąc krok dalej tym tokiem rozumowania, narzędzie do rozpoznawania emocji może przydać się do ujawnienia nastroju osoby, z którą się rozmawia, po zeskanowaniu jej twarzy za pomocą aparatu w smartfonie. Aplikacja musiałaby oczywiście najpierw uzyskać zgodę na korzystanie z aparatu!

how old net2

Microsoft nie pierwszy raz zajmuje się technologią rozpoznawania twarzy. Niektórzy pewnie pamiętają aplikację HowOldRobot AI, która odgadywała wiek na podstawie fotografii. Wciąż można ją wypróbować na stronie how-old.net (chociaż wyniki często daleko odbiegają od prawdy i są zabawne).

Podobnie zróżnicowanych wyników można oczekiwać od technologii rozpoznawania emocji.

Czemu jednak nie przekonać się na własne oczy? System rozpoznawania emocji firmy Microsoft, Project Oxford jest dostępny BEZPŁATNIE. Wystarczy przesłać zdjęcie (o rozmiarze przynajmniej 36 × 36 pikseli, mniejsze niż 4 MB, w formacie JPEG, PNG, GIF lub BMP) i poczekać, aż narzędzie określi liczbę twarzy na zdjęciu i przypisze emocjonalny wynik każdej z nich.

Wokół każdej rozpoznanej twarzy pojawi się niebieska ramka. Po najechaniu kursorem na twarz wyświetli się wynik emocjonalny (zaokrąglony do pięciu miejsc po przecinku). Działa? Podzielcie się z nami wrażeniami w komentarzach!

Zdjęcie okładkowe i fot. 3: Microsoft Blog
Fot. 1 i 2: Microsoft — Project Oxford
Fot. 4: How-old.net

Udostępnij ten artykuł

Podobne tematy

Innowacje techniczne

Przeczytaj w następnej kolejności

Read Full Story