Naukowcy stworzyli algorytm zamieniający myśli w mowę. Radzi sobie z wypowiadaniem pełnych zdań

Artykuł/Nauka 25.04.2019
Naukowcy stworzyli algorytm zamieniający myśli w mowę. Radzi sobie z wypowiadaniem pełnych zdań

Naukowcy stworzyli algorytm zamieniający myśli w mowę. Radzi sobie z wypowiadaniem pełnych zdań

To, co jeszcze kilkadziesiąt lat temu zostałoby uznane za cud, dziś staje się możliwe dzięki rozwojowi nauki. W tym przypadku (nomen omen) mowa o bezpośredniej zamianie myśli w mowę.

Prototyp urządzenia do zamiany myśli w mowę powstał na University of California w San Francisco i chociaż potrafi przetwarzać już całe zdania, nie jest jeszcze na tyle dokładny, żeby korzystać z niego poza laboratorium. Przynajmniej na razie.

Zamiana myśli w mowę możliwa dzięki sztucznej inteligencji

Naukowcy już wcześniej wykorzystywali sztuczną inteligencję do tłumaczenia pojedynczych słów, najczęściej jednosylabowych, na podstawie analizy aktywności mózgu. Jednak w porównaniu do przetwarzania pełnych, wielosylabowych zdań, te początkowe eksperymenty można by określić jako prymitywne. Dlatego też dopiero w tym przypadku możemy mówić o jakimkolwiek przełomie, powstałym dzięki badaniom naukowców z University of California w San Francisco kierowanych przez dra Edwarda Changa.

Zacznijmy jednak od początku. Żeby móc liczyć na jakiekolwiek szansy powodzenia tak wymagającego projektu, trzeba było znaleźć najpierw odpowiednich ochotników. Zespół Changa zaprosił do udziału w swoim eksperymencie pięciu pacjentów, którym wszczepiono elektrody na powierzchni mózgu w ramach leczenia padaczki. Oprócz możliwości terapeutycznych, umieszczone w ten sposób elektrody pozwalają na dokładne monitorowanie i rejestrowanie aktywności mózgu uczestników. Był to kluczowy warunek.

Dysponując takim połączeniem, pacjenci zostali poproszeni o przeczytanie na głos kilkuset zdań. W trakcie czytania, zespół Changa skupił się na analizie aktywności mózgowej odpowiedzialnej za sterowanie aparatem mowy.

Tutaj wypada zrobić krótką dygresję na temat tego, że ruchy wykonywane przez nasz aparat głosowy (usta, strony głosowe, wydychanie powietrza, etc.) sterowane są oczywiście bezpośrednio z mózgu. Oznacza to, że odczytując odpowiednio dokładny sygnał z wszczepionych pacjentom elektrod, naukowcy byli w stanie uzyskać wzór dzięki któremu dane słowo wypowiadane jest na głos.

Po zbudowaniu odpowiednio dużej bazy danych, naukowcy przystąpili do finalnego etapu eksperymentu. Pacjenci zostali poproszenie o… pomyślenie o wypowiadaniu tych samych zdań, bez wypowiadania ich na głos.

Efektów można posłuchać

Metoda nie sprawdzi się w każdym przypadku

Nie twierdzę oczywiście, że algorytm opracowany przez dra Changa, przez swoje ograniczenia nie nadaje się kompletnie do niczego. Na pewno jednak nie każdy będzie w stanie porozumiewać się za jego pomocą bez poruszania ustami. Pamiętajmy bowiem, że zasada działania dekodera wymaga od użytkownika w pełni wytrenowanego aparatu głosowego. Ta sama sztuczka, w przypadku osoby, która nigdy nie była w stanie mówić samodzielnie nie zadziała – jej mózg bowiem nie ma żadnego pojęcia o tym, w jaki sposób kontrolować aparat głosowy, tak aby za jego pomocą formułować słowa i pełne zdania.

Nie oznacza to jednak, że urządzenie jest bezużyteczne. Skorzysta z niego na pewno wiele osób, które utraciły zdolność mówienia. Obecne aparaty, umożliwiające im porozumiewanie się wymagają od nich wykonywania niewielkich ruchów kontrolujących kursor, który wybiera litery lub słowa na ekranie. Sławnym przykładem był brytyjski fizyk Stephen Hawking, który korzystał urządzenia do generowania mowy aktywowanego przez mięśnie policzkowe.

Komunikowanie się w ten sposób posiada swoje poważne ograniczenia. Chociażby ze względu na szybkość takiej syntetycznej mowy. Oferowane obecnie aparaty pozwalają na wypowiedzenie ok. dziesięciu słów na minutę. W porównaniu do naszego naturalnego tempa, czyli wypowiadania ok. 150 słów/min. nie jest to zbyt wiele.

Nie zapominajmy również o zastosowaniu komercyjnym. Pomyślcie tylko o biurowych implantach, dzięki którym pisanie na klawiaturze stałoby się kompletnie zbędne. Już teraz zresztą kilka osób w naszej redakcji pisze czasami teksty, dyktując je swojemu smartfonowi lub komputerowi. Rozwiązanie to raczej nie sprawdziłoby się w stacjonarnej redakcji, więc taki implant miałby jak najbardziej sens.

Musisz przeczytać:

Dołącz do dyskusji