Bioinformatyka w służbie genetyki

Najnowocześniejsze technologie genetyczne wymagają analizy ogromnej ilości danych, stąd konieczne są narzędzia informatyczne wspomagające pracę naukowców. Dzięki ogólnodostępnym bazom danych możliwa jest współpraca oraz wymiana danych w środowisku naukowym.

W latach 2017/2018 w IGC PAN powołano grupę bioinformatyczną i rozpoczęto tworzenie baz danych RNA i narzędzi bioinformatycznych oraz wykorzystywanie narzędzi bioinformatycznych w zakresie szeroko pojętej bioinformatyki strukturalnej RNA. W pracach tych wykorzystuje się programowanie w języku Python do badania biologii strukturalnej RNA.

W wyniku tych prac przygotowano aktualną i przyjazną dla użytkownika bazę danych sekwencji i struktur cząsteczek tRNA pod nazwą T-psi-C. Unikatową cechą bazy T-psi-C jest możliwość dodawania wpisów przez każdego naukowca zajmującego się tematyką tRNA. Po weryfikacji przez autorów wpis taki zostanie umieszczony w bazie. Takie rozwiązanie zapewnia jej ciągłą aktualizację. Opracowano ponadto program RNAlign2D do porównania wielu cząsteczek RNA w oparciu o ich strukturę drugorzędową, który korzysta z autorskiego rozwiązania naszego zespołu, tzw. pseudo-aminokwasowej matrycy podstawień. Program ten pozwala na zapisanie sekwencji wraz ze strukturą drugorzędową RNA jako sekwencji pseudo-aminokwasów i przyrównywanie wielu sekwencji białkowych. Zwiększa to szybkość działań, szczególnie przy analizie dużej liczby sekwencji.