Sztuczna sieć neuronowa może ujawnić wzorce w ogromnej ilości danych dotyczących ekspresji genów, i odkryć grupy genów związanych z chorobą. Zostało to wykazane w nowym badaniu prowadzonym przez naukowców z Uniwersytetu w Linköping, opublikowanym w Nature Communications. Naukowcy mają nadzieję, że metoda ta może być ostatecznie zastosowana w medycynie precyzyjnej i leczeniu zindywidualizowanym.
W przypadku korzystania z mediów społecznościowych często zdarza się, że platforma sugeruje ludzi, których można dodać jako przyjaciół. Sugestia ta opiera się na tym, że Ty i ta druga osoba macie wspólne kontakty, co wskazuje na to, że możecie się poznać. W podobny sposób naukowcy tworzą mapy sieci biologicznych w oparciu o to, jak różne białka lub geny oddziałują na siebie. Naukowcy stojący za nowym badaniem wykorzystują sztuczną inteligencję, SI, do zbadania, czy możliwe jest odkrycie sieci biologicznych za pomocą głębokiego uczenia się, w których jednostki znane jako "sztuczne sieci neuronowe" są szkolone przez dane eksperymentalne. Ponieważ sztuczne sieci neuronowe są doskonałe w uczeniu się znajdowania wzorców w ogromnej ilości złożonych danych, są one wykorzystywane w takich zastosowaniach, jak rozpoznawanie obrazu. Jednak ta metoda uczenia maszynowego do tej pory rzadko była wykorzystywana w badaniach biologicznych.
"Po raz pierwszy użyliśmy głębokiej nauki, aby znaleźć geny związane z chorobą. Jest to bardzo skuteczna metoda w analizie ogromnych ilości informacji biologicznych, czyli "dużych danych" - mówi Sanjiv Dwivedi, postdoc w Katedrze Fizyki, Chemii i Biologii (IFM) na Uniwersytecie w Linköping.
Naukowcy korzystali z dużej bazy danych zawierającej informacje o wzorcach ekspresji 20 000 genów u dużej liczby osób. Informacje te były "niesortowane" w tym sensie, że naukowcy nie podawali sztucznej sieci neuronowej informacji o tym, które wzorce ekspresji genów pochodzą od osób z chorobami, a które od osób zdrowych. Model SI został następnie przeszkolony w zakresie znajdowania wzorców ekspresji genów.
Jednym z wyzwań uczenia maszynowego jest to, że nie można dokładnie zobaczyć, jak sztuczna sieć neuronowa rozwiązuje dane zadanie. AI jest czasami opisywana jako "czarna skrzynka" - widzimy tylko informacje, które wkładamy do skrzynki i wynik, który ona generuje. Nie widzimy kroków pomiędzy nimi. Sztuczne sieci neuronowe składają się z kilku warstw, w których informacja jest przetwarzana matematycznie. Sieć składa się z warstwy wejściowej i wyjściowej, które dostarczają wynik przetwarzania informacji prowadzonego przez system. Pomiędzy tymi dwoma warstwami znajduje się kilka warstw ukrytych, w których przeprowadzane są obliczenia. Kiedy naukowcy szkolili sztuczną sieć neuronową, zastanawiali się, czy można, w pewnym sensie, podnieść pokrywę czarnej skrzynki i zrozumieć, jak ona działa. Czy projekty sieci neuronowej i znanych sieci biologicznych są podobne?
"Kiedy analizowaliśmy naszą sieć neuronową, okazało się, że pierwsza ukryta warstwa reprezentowała w dużej mierze interakcje pomiędzy różnymi białkami. Głębiej w modelu, w przeciwieństwie do tego, na trzecim poziomie, znaleźliśmy grupy różnych typów komórek. To niezwykle interesujące, że ten rodzaj biologicznie istotnych grup jest tworzony automatycznie, biorąc pod uwagę, że nasza sieć zaczęła się od niesklasyfikowanych danych dotyczących ekspresji genów," mówi Mika Gustafsson, starszy wykładowca IFM i lider badania.
Następnie naukowcy zbadali, czy ich model ekspresji genów mógłby zostać użyty do określenia, które wzorce ekspresji genów są związane z chorobą, a które są normalne. Potwierdzili, że model ten znajduje istotne wzorce, które dobrze współgrają z biologicznymi mechanizmami w organizmie. Ponieważ model został przeszkolony z wykorzystaniem niesklasyfikowanych danych, możliwe jest, że sztuczna sieć neuronowa znalazła zupełnie nowe wzorce. Badacze planują teraz zbadać, czy takie, wcześniej nieznane wzorce są istotne z biologicznego punktu widzenia.
"Wierzymy, że kluczem do postępu w tej dziedzinie jest zrozumienie sieci neuronowej. To może nas nauczyć nowych rzeczy na temat kontekstów biologicznych, takich jak choroby, w których wiele czynników wchodzi w interakcję. I wierzymy, że nasza metoda daje modele, które są łatwiejsze do uogólnienia i które mogą być wykorzystane do wielu różnych rodzajów informacji biologicznych" - mówi Mika Gustafsson.
Mika Gustafsson ma nadzieję, że ścisła współpraca z badaczami medycyny pozwoli mu na zastosowanie opracowanej w badaniach metody w medycynie precyzyjnej. Możliwe jest na przykład ustalenie, które grupy pacjentów powinny otrzymać dany rodzaj leku, lub zidentyfikowanie pacjentów, którzy są najbardziej dotknięci chorobą.
Badanie otrzymało wsparcie finansowe od Szwedzkiej Fundacji Badań Strategicznych (SSF) i Szwedzkiej Rady Badań.