Alexa w kuchni – doświadczenia Polaka, który przez dwa tygodnie rozmawiał z głośnikiem

Artykuł/Sprzęt 27.07.2016
Alexa w kuchni – doświadczenia Polaka, który przez dwa tygodnie rozmawiał z głośnikiem

Alexa w kuchni – doświadczenia Polaka, który przez dwa tygodnie rozmawiał z głośnikiem

Alexa to mechanizm, który stoi za urządzeniami Amazon Echo. Echo to tylko sprzęt, czyli głośniki, mikrofony i prosty komputer zapakowane w tubę z metalu. Kiedy rozmawiamy z Echo, to, co powiemy, przetwarzane jest gdzieś daleko na serwerach Amazona przez system o nazwie Alexa.

Alexa towarzyszyła mi przez 2 tygodnie. Stała w kuchni na lodówce. Ten tekst to zapis moich przemyśleń na temat rozwiązania i szerzej na temat interfejsów głosowych.

Interakcja i Skillsy

Alexa zaczyna słuchać dopiero kiedy powiemy „Alexa”. Zapala się wtedy światełko, które pokazuje, z której strony Alexa została wezwana. Trochę tak, jakby człowiek, który usłyszał swoje imię, zwrócił głowę, w kierunku dobiegającego głosu. Od tego momentu, dopóki światełko nie zgaśnie, Alexa słucha.

amazon echo alexa

Normalna rozmowa z Alexą wygląda tak:

Ja: Alexa, która jest  godzina?

Alexa: Jest 9:30 rano.

Alexa jest jak smartfon. Po rozpakowaniu z pudełka ma tylko podstawowe funkcje: kalkulator, kalendarz, itp. Pokemony i inne aplikacje trzeba sobie doinstalować ze sklepu. Alexa obsługuje nasz kalendarz, zna godzinę, ma budzik, pogodę. Można na niej słuchać muzyki z Amazona, jeśli ktoś ma tam konto. Aplikacje w nazewnictwie Alexy nazywają się skillsami, czyli umiejętnościami. Możemy doinstalować sobie Spotify, Ubera i kilka innych mniej lub bardziej potrzebnych skilli. Jeśli chcemy skorzystać z usługi dostarczanej przez skilla, trzeba się do niego zwrócić.

Ja: Alexa, poproś Spotify o puszczenie 2Paca.

Alexa: Gra 2Pac – All eyez On Me.

Sprawa Polska i międzynarodowa

W tej chwili (Q3 2016) jest produktem w fazie rozbiegowej. Dostępna jest tylko w Stanach. Patrząc na gigantyczny rozmach i środki ładowane w rozwój Alexy można się jednak domyślać, że Amazon chce ją rozwijać na całym świecie, a Stany są po prostu pierwszym rynkiem. Sklep ze skillami jest w powijakach, ale skilli jest coraz więcej.

Alexa obsługuje tylko lokalizację w Stanach Zjednoczony i jeden język – angielski. Jeśli znasz angielski, ale mieszkasz w Polsce, to niewiele pomoże, bo nie dowiesz się od Alexy jaka jest pogoda w Polsce, ani która jest godzina.

Dopóki rozumianym językiem będzie tylko angielski, dopóty funkcjonalność Alexy w innych kręgach kulturowych będzie upośledzona. Przykłady? Proszę bardzo:

  • Nie poprosisz o przeczytanie artykułu z Wikipedii o Lechu Wałęsie, bo nie wiesz, jak po angielsku przeczytać Lech Wałęsa. Alexa nie rozumie, kiedy po polsku czytamy Lech Wałęsa.
  • Jeśli chciałbyś puścić ze Spotify Kult, Fisza czy Leszka Możdżera to powodzenia.

Głos – konsumpcja, nie kreacja

Rozmowa jest czasami wygodniejsza, niż interakcja przez komórkę, czy komputer, jednak z reguły jest znacznie wolniejsza. Dlatego nadaje się do prostych zadań. Można przypuszczać, że Alexa będzie częściej służyć do konsumpcji treści, niż do ich tworzenia. Nie wyobrażam sobie dyktowania maila do Alexy bez możliwości spojrzenia na jego treść i wprowadzania poprawek. Jest pewien zestaw czynności, które zazwyczaj robimy na komórce, kiedy jesteśmy zajęci albo z jakiegoś innego powodu nie jest nam wygodnie sięgać po telefon. Przykłady:

  • Mam ręce w mące, chcę dopisać coś do listy zakupów: Alexa, dodaj do mojej listy zakupów mleko.
  • Rozmawiamy z żoną na temat tego czy jechać jutro do pracy autem, czy na rowerach: Alexa, jaka będzie jutro pogoda?
  • Ranek, przygotowuję śniadanie, przed wyjściem do pracy pytam: Alexa, co mam dzisiaj w kalendarzu?
  • Bawię się z dziećmi, padło hasło, że będziemy tańczyć do Ryszarda Rynkowksiego – Jedzie pociąg z daleka. Nie szukam telefonu, czy komputera, tylko mówię: Alexa, poproś Spotify o… (o Ryszarda nie poproszę, dopóki nie będzie polskiego).

Z czego chciałbym korzystać.

  • Napisz SMS-a do Ani: „dzisiaj wrócę później z pracy, będę pewnie gdzieś w okolicach 20, trzymaj się”.
  • Puść radio (polskie stacje).
  • Podaj aktualne wiadomości z Tok FM, albo podaj briefing z Pulsu Biznesu.
  • Zamawianie Ubera lub taksówki, gdybym jeździł częściej taksówkami.

Z czego raczej nie będę korzystał:

  • Czytanie maili – bo skanuję, nie czytam, interakcja byłaby męcząca. Szybciej ogarnę wzrokiem na telefonie lub komputerze.
  • Słuchanie podcastów – bo słucham na telefonie w samotności.
  • Zamawianie jedzenia, chyba że coś na szybko. Lubię wybierać, a nie wyobrażam sobie wybierania na Alexie np. z tylu opcji ile dostępnych jest na PizzaPortal. To musiałoby być skrócone: Pizza, kebab, czy sushi? Czy może być DaGrasso? Czy może być Margherita? Duża będzie ok? Do domu, czy podasz inny adres?
  • Kupowanie. W moim życiu jest mało rzeczy, które kupuję zawsze takie same. Dlatego nie wyobrażam sobie kupowania np. jedzenia, czy ubrania głosowo.

Głos – autosugestie i wiele możliwości wyboru

Korzystając z Alexy docenisz, jak często korzystasz z podpowiedzi podczas wpisywania i jak wiele one dają. Z Alexą niczego nie widzisz, nie masz żadnych dodatkowych informacji. Bez nich niektóre czynności są niezmiernie trudne. Przykład: Chciałem puścić sobie piosenkę Alicii Keys o Nowym Yorku. Pamiętałem że nazywa się “New York state of mind”. Z interfejsem graficznym znalazłbym ją w 2 sekundy. Z Alexą dowiedziałem się, że nie istnieje piosenka o tytule, który podałem, później puściłem Alicię i zmieniałem piosenka po piosence. Na szczęście przypomniałem sobie poprawny tytuł. Poszukiwania zajęły 2 minuty.

echo amazon alexa

Popularyzacja interfejsów głosowych oznacza poważną zmianę dla projektantów UX/UI. Mając kontakt z Alexą, użytkownik nie wie, co może z nią zrobić. Zastanów się, jak wygodnie zamówić pizzę z Pizza Portalu, żeby odczytywanie menu nie zajęło godziny. Jeśli interesujesz się UX/UI spójrz na 10 heurystyk Nielsena albo inne złote zasady projektowania. Okazuje się, że niektóre z nich są nie do osiągnięcia, a inne bardzo trudne. Szykują się zmiany. Możliwe, że będziemy bardziej polegać na rekomendacji maszyn podczas wyboru z wielu możliwości,  np. pizza czy muzyka.

Głos – Posłuchaj jeszcze chwilkę

Normalna rozmowa z Alexą wygląda tak:

Ja: Alexa, zrób coś tam.

Ona: Zrobiłam.

Gdyby po odpowiedzi “zrobiłam” Alexa poczekała jeszcze chwilkę, czy nie chce jej czegoś powiedzieć, to byłoby super. Możliwe, że powiedziałbym “dzięki”. Możliwe, że nie powiedziałbym niczego.  Możliwe też, że po puszczeniu piosenki z Spotify chciałbym zmienić ją na inną. To byłoby ułatwienie, szczególnie gdy:

  • Nie zrozumiemy się
  • Kiedy robię coś wymagającego wielu komend.

Super sprawą byłoby też, gdyby w przypadku drugiego i następnych poleceń w ciągu Alexa pamiętała jakiego skilla może dotyczyć prośba:

Ja: Alexa, poproś Listonic o dodanie mleka do listy zakupów.

Alexa: Dodałam mleko.

Ja: Co mam teraz na liście (Zamiast: Alexa, poproś Listonic o powiedzenie co mam na liście.)

Alexa: Masz już mleko, chleb i śmietanę.

Głos – Rozpoznawanie głosu domowników

Tej funkcji jeszcze nie ma, ale zdziwiłbym się gdyby Amazon nad nią nie pracował. Na pytanie “Co mam w kalendarzu na dzisiaj?” Alexa powinna odpowiadać z sensem zarówno mi, jak i żonie. Mając rozpoznawanie domowników otwiera się wiele nowych możliwości dla twórców skilli: banki, komunikacja, kto wie co jeszcze.

Głos – odrobina ludzkości

Kiedy wchodzę do domu aż chce się zagadać do Alexy, choćby zapytać “jak tam?”. Taki ludzki odruch. Podczas niezobowiązującej rozmowy Alexa mogłaby dowiedzieć się o mnie więcej, żeby w przyszłości być bardziej pomocną.

Więcej proszę i przepraszam – niby to maszyna i nie ma uczuć, ale złapałem się na tym, że na początku dziękowałem jej, kiedy coś zrobiła. Później przestałem, bo nie reagowała na podziękowania. Któregoś dnia żona zauważyła: “mówisz do niej jak do psa”.

Podsumowanie

Interfejsy głosowe są moim zdaniem bliską przyszłością, bliższą niż samochody elektryczne. Amazon nie jest jedyny na tym polu, inne firmy też pracują nad podobnymi rozwiązaniami, np. Google Home. Sprzęt jest tani, rozpoznawanie głosu działa ok, opinie pierwszych użytkowników są bardzo dobre.

amazon echo

Na ten moment możliwości jeszcze nie zwalają z nóg, ale liczba skilli dostępnych w sklepie bardzo szybko rośnie – widać, że twórcy oprogramowania zauważyli potencjał. Skille, które teraz są dostępne, wyglądają jak pierwsze aplikacje na Andoida – niby działają, ale są niedopracowane, zaprojektowane na szybko i widać po nich, że autor woli iPhone’a . Oba problemy szybko uleczy czas.

Są innowacje, które trwają dziesiątki, setki i tysiące lat: koło, samochód, krzesło, komputer czy smartfon. Myślę, że interfejsy głosowe, ciągle słuchające, wszechobecne, są innowacją porównywalnego kalibru. W obliczu takiej zmiany trzeba pochylić głowę i przyznać, że tylko czas może pokazać prawdziwe zastosowania. Dla mnie, po pierwszych doświadczeniach stało się oczywiste, że kiedyś Alexa będzie w kuchni, salonie, ogrodzie i w samochodzie.

Dołącz do dyskusji

Advertisement