Przyszłość asystentów głosowych tworzona jest w Polsce. Odwiedzamy dział R&D Amazonu

Relacja/Technologie 06.12.2016
Przyszłość asystentów głosowych tworzona jest w Polsce. Odwiedzamy dział R&D Amazonu

Przyszłość asystentów głosowych tworzona jest w Polsce. Odwiedzamy dział R&D Amazonu

Niewiele osób zdaje sobie sprawę, że prócz centrów logistycznych Amazon ma w Polsce także swój dział R&D. Miałem ostatnio przyjemność zwiedzić to miejsce i zobaczyć, jak tworzy się przyszłość asystentów głosowych.

Dział Research&Development Amazonu mieści się w gdańskim Olive Business Centre, gdzie w ciszy i skupieniu pracują programiści, inżynierowie oraz językoznawcy związani z bardzo ważnym dla rozwoju Internetu Rzeczy projektem giganta Jeffa Bezosa – Amazon Alexa. Są tu pracownicy z całego świata, choć trzon oczywiście stanowią Polacy.

Czym jest Alexa? O asystentce pisaliśmy już kilka razy na Spider’s Web, a też niebawem przeczytacie kolejny materiał o tym, co potrafi. Spodziewajcie się też w niedalekiej przyszłości znacznie szerszej demonstracji, gdyż Alexa trafiła właśnie do nas na testy, zaklęta w urządzenie Echo Dot.

Dość powiedzieć, że to bardzo potężne narzędzie, którego opracowanie wymaga ścisłej współpracy między zespołami programistycznymi, inżynierami dźwięku, którzy tworzą oprawę dla Alexy, oraz językoznawcami, którzy upewniają się, że Alexa komunikuje się we właściwym tonie.

Jak zatem prezentują się biura działu R&D Amazonu?

W wejściu witają nas dodatkowe bramki i kontrola tożsamości. Co dzieje się w dziale R&D, zostaje w dziale R&D.

amazon-rd-1

Po centrum R&D oprowadził nas Rafał Kukliński. Zaczęliśmy od… kuchni, która jest dużą, otwartą przestrzenią z pięknym widokiem na las.

amazon-rd-2

W centrum uwagi znajduje się tablica z najważniejszymi informacjami.

amazon-rd-4

Nad nią – zegary z różnymi strefami czasowymi. Żeby zawsze było wiadomo, czy już wypada zadzwonić do oddziałów po drugiej stronie Globu.

amazon-rd-9

Na tablicy wisi też ciekawa pamiątka – plakat z podpisami wszystkich osób, które pracowały przy stworzeniu Amazon Echo i Alexy.

amazon-rd-7

Jak na dział R&D przystało, szczególną uwagę przywiązuje się tu do bezpieczeństwa. Zarówno tego cyfrowego…

amazon-rd-11

…jak i cielesnego.

amazon-rd-10

W tej samej części znajdziemy strefę relaksu: piłkarzyki oraz konsolę Xbox One podłączoną do telewizora.

amazon-rd-5

Zacznijmy zwiedzanie. Ten mały, niepozorny pokoik służy głównie… rekrutacji nowych pracowników. Gdy jest pusty, pracują w nim czasem inżynierowie dźwięku.

amazon-rd-14

Korytarz w każdej ze stref biura ma inny kolor. Tam, gdzie widać programistę w oddali, już nie mogliśmy robić zdjęć.

amazon-rd-13

Główny hol biura został urządzony tak, by podkreślać pracę nad… głosem. Stąd struny, reprezentujące ludzki narząd mowy.

amazon-rd-12

Na korytarzach co chwila natrafiamy na motywujące cytaty. Sądząc po sukcesach Amazonu – działają.

amazon-rd-18

Co zwróciło moją uwagę – programiści pracują tu w bardzo ergonomicznych warunkach. Odpowiednie fotele, podkładki pod mysz z żelowym wkładem, gdzieniegdzie migają ergonomiczne klawiatury. Oczywiście w całym dziale dominują komputery Apple.

amazon-rd-17

Zostawcie gustowne tabliczki wystawom. Tutaj każdy dział opisany jest… na ścianie.

amazon-rd-21

W każdym zakątku biura wiszą te zegary. To mus, gdy pracuje się z oddziałami w innych strefach czasowych.

amazon-rd-19

Rafał wytłumaczył nam, dlaczego praca w Amazonie jest wyjątkowa – tu każdy ma prawo do własnej opinii i nikt nie jest za to karany. Każdy z każdym może się nie zgodzić. Dotyczy to zarówno szefów, jak i zwykłych pracowników.

amazon-rd-20

Czuć to też przechadzając się tymi korytarzami. Nie panuje tu atmosfera nerwowego napięcia, jaką często widać w korporacjach.

amazon-rd-6

Amazon to nie tylko Alexa. Są tu także “głosy” systemów “Text-to-Speech”, w tym i Jacek, czyli pierwszy głos, tworzony jeszcze przez polską firmę IVONA, którą nabył Amazon.

amazon-rd-23

Jest też Mizuki – pierwszy japoński głos Amazonu. To osiągnięcie, z którego pracownicy są bardzo dumni. Jak sami mówią, skoro opanowali japońskiego lektora, są w stanie poradzić sobie z każdym językiem.

amazon-rd-22

Jest też głos… islandzki. Choć to bardzo niewielka grupa docelowa, Amazon kładzie duży nacisk na pomoc osobom niepełnosprawnym przez swoje narzędzia. Więc Islandii nie mogło zabraknąć.

amazon-rd-24

Zajrzeliśmy też do studia, w którym nagrywa się najważniejszy z głosów – Alexa.

amazon-rd-26

Po tej stronie zasiada tylko “talent głosowy” (którego tożsamość objęta jest ścisłą tajemnicą), nagrywając generowane przez algorytm zdania, wyświetlane na iPadzie.

amazon-rd-27

Sami mogliśmy się przekonać, jakie zdania muszą odczytywać lektorzy i lektorki. Czasem to sensowne językowo, ale bezsensowne znaczeniowo frazy, a czasem… cytaty, np. z Dr House’a

amazon-rd-30

Algorytm wybiera takie zdania, które zawierają najwięcej fonemów, z których będzie można następnie składać inne konstrukcje.

amazon-rd-29

Nagrania lądują następnie w ProToolsie, gdzie inżynier dźwięku odpowiednio je obrabia i kataloguje. Szkoda, że nie mogliście posłuchać “bloopersów”. Jeszcze większa, że nie trafiają one jako easter-eggi do finalnej wersji Alexy (przynajmniej nie wszystkie).

amazon-rd-28

Każdorazowo w nagraniach bierze udział lektor, językoznawca, oraz… trener wokalny, który dba o utrzymanie jednakowej kondycji głosu przez cały czas nagrań.

amazon-rd-25

A wszystko po to, byśmy mogli potem rozmawiać z Alexą, zamkniętą w głośniku Amazon Echo…

amazon-rd-31

…lub przystawce Amazon Echo Dot, którą możemy połączyć z własnymi głośnikami.

amazon-rd-32

O Alexie dowiecie się niebawem dużo więcej. To fascynująca technologia, która jest o wiele bardziej skomplikowana, niż się wydaje i potrafi znacznie więcej, niż można by się spodziewać.

amazon-rd-33

Tymczasem możecie zajrzeć na Instagram gdańskiego oddziału Amazonu. Fajnie, że tak istotne, globalne technologie rozwijane są właśnie u nas.

amazon-rd-8

Dołącz do dyskusji

Advertisement