Twoje wpisy na Twitterze powiedzą kiedy zachorujesz na grypę

Artykuł/Nauka 14.11.2013
Twoje wpisy na Twitterze powiedzą kiedy zachorujesz na grypę

Czy algorytm stworzony przez grupę naukowców z Uniwersytetu w Rochester jest w stanie przewidzieć zachorowania na grypę na podstawie wyposażonych w geotagi wpisów na Twitterze?

Od wielu lat ambicją lekarzy było nie tylko leczyć choroby. Próbowali też przewidywać rozprzestrzenianie się ich. Oczywiście szybko zauważono że niektóre choroby są zakaźne – i kontakt z chorymi może spowodować zachorowanie. Pierwszą teorią, którą tłumaczono przenoszenie chorób, była tzw. teoria miazmatyczna – czyli po prostu wiara w morowe powietrze. Teoria ta, choć nieprawidłowa, była podstawa wielu poprawnych zachowań higienicznych – np. aby pozbyć się miazmatów, wietrzono pokoje chorych i szpitale.

John Snow wykrywa źródło cholery

W XIX. wieku pojawiła się konkurencyjna teoria patogenezy: teoria drobnoustrojowa. Nie od razu przekonała do siebie wszystkich – wielu lekarzy nie było przekonanych do niewidocznych organizmów, które przenoszą choroby. Eksperymenty (np. doświadczenia Ludwika Pasteura) nie do wszystkich przemawiały. Potrzebny był jakiś spektakularny przykład zastosowania jej w praktyce. Przydarzył się on w latach 50-tych XIX wieku, kiedy londyński lekarz John Snow zaczął… zaznaczać miejsca mieszkania i pracy pacjentów chorych na cholerę na mapie. Dzięki temu po analizie ich położenia mógł ustalić jedno konkretne źródło zakażenia: publiczna pompa na Broad Street, która jak się okazało zawierała wodę zanieczyszczoną ściekami. Tego teoria miazmatyczna nie potrafiła wyjaśnić. Ale to już kompletnie inna historia.

Mapa zachorowań na cholerę stworzona przez Johna Snowa, Wikipedia
Mapa zachorowań na cholerę stworzona przez Johna Snowa, Wikipedia

SocialHealth zbada nasze tweety

Metoda pracy Johna Snow – zaznaczanie chorych na mapie – stała się podstawą współczesnej epidemiologii. Bezpośredni kontakt w bliskości geograficznej okazuje się być doskonałym wyznacznikiem prawdopodobieństwa zarażenia. Henry Kautz z Uniwerstytetu w Rochester stworzył zespół (nazwany SocialHealth), który analizuje wpisy na Twitterze pod kątem opisów samopoczucia, starając się wyciągnąć z tego użyteczne dane o rozprzestrzenianiu się chorób. Jakie tweety szczególnie ich interesują? Takie, które wyposażone są w geotag (informację o lokalizacji użytkownika) oraz równocześnie informują o złym samopoczuciu piszącego. Analizowane są wpisy w języku angielskim. Zastosowano kilka metod, które minimalizują błędną identyfikację (false positives) wpisów – np. gdy ktoś napisze „I’m sick of homework” to tak naprawdę nie chodzi mu o chorobę na jaką zapadł.

Zespół zaczął od analizowania zameldowań się (check-in) w nowojorskich restauracjach, po których następowały informacje o wymiotach i bólu brzucha – tym sposobem byli w stanie wykryć około 480 przypadków zatrucia żywnością! Kolejnym przedsięwzięciem zespołu SocialHealth była zaś próba przewidzenia kiedy użytkownik wchodzi w interakcje z osobami chorymi na grypę – i tym samym naraża się na zachorowanie.

Gdy zidentyfikowano takich wpisów odpowiednio dużo (kilka milionów), zaczęto analizować interakcje między osobami piszącymi. Założono dwa podstawowe typy interakcji:

  • Typ pierwszy: Ktoś jest w twojej bezpośredniej geograficznej bliskości (tweetował z sąsiedztwa w przeciągu 30 minut od innej osoby) i pisał że źle się czuje.
  • Typ drugi: Twój przyjaciel pisze że źle się czuł. Przyjęto że przyjaciel to osoba z którą wzajemnie się śledzicie na Twitterze – faktem jest, że wiele osób z Twittera znamy tylko z Internetu, jednak istnieje jakiś procent przyjaciół z „prawdziwego życia” których obserwujemy. Założono że jeśli dziesięciu z Twoich znajomych pisało że czuje się źle – są podstawy aby podejrzewać że miałeś z nimi styczność również „na żywo”.
Wizualizacja wpisu z geotagiem, z raportu opublikowanego przez SocialHealth
Wizualizacja wpisu z geotagiem, z raportu opublikowanego przez SocialHealth

Wiemy, że zachorujesz

Według raportu opublikowanego przez zespół SocialHealth, po połączeniu tych dwóch faktów byli w stanie przewidzieć fakt zachorowania w niedalekiej przyszłości z prawdopodobieństwem 90%! Czyli: jeśli byłeś na lotnisku, gdzie wiele osób wspominało że choruje, i jednocześnie wielu z twoich Twitterowych znajomych oznajmiało fakt złego samopoczucia, to prawie na pewno w przeciągu kilku dni Ty również napiszesz że źle się czujesz.

Innymi słowy: jesteśmy w stanie z publicznie dostępnych danych wymodelować wpływ trybu życia na zdrowie!

To odkrycie daje niesamowite możliwości wykorzystania do np. wczesnego ostrzegania przed zachorowaniem. Wyobraźmy sobie że aplikacja na naszym smartphonie dysponuje tymi danymi i wyświetla nam powiadomienie jeśli wchodzimy na teren dworca, domu towarowego, czy też lotniska na terenie którego przebywa dużo osób chorych.

Nie ma tu również mowy o naruszeniu prywatności: każdy z analizowanych tweetów jest publicznie dostępny i został napisany z własnej woli. Jak widać analiza nawet powszechnie dostępnych, wydawałoby się, banalnych wpisów na społecznościowym mikroblogu, może przynieść ogromną ilość nowych informacji.

Źródła: University Of Rochester (pdf), SocialHealth Project, Smithsonian Magazine

Obraz Networking pochodzi z serwisu Shutterstock.

Advertisement

Dołącz do dyskusji

Advertisement
Advertisement