Nowy serwer bioinformatyczny NanoForms
W wyniku realizacji projektu „Technologia Oxford Nanopore: optymalizacja enzymów oraz analizy danych genomicznych pod kątem zastosowań komercyjnych” Politechnika Rzeszowska wzbogaciła się o nowy serwer do analizy danych genomicznych. Projekt był realizowany od stycznia do września 2020 r. przez zespół w składzie: mgr inż. Anna Czmil, mgr Małgorzata Semik, dr Marta Sochacka-Piętal, mgr Magdalena Rogóż, mgr inż. Michał Ćmil, dr Michał Piętal, dr inż. Dominik Strzałka, mgr inż. Michał Wroński.
Ze względu na epidemię COVID-19 początkowo realizacja projektu napotkała pewne utrudnienia, ale pod koniec maja 2020 r. udało się zrealizować niezbędne prace przygotowujące do pierwszego w Rzeszowie eksperymentu sekwencjonowania nowej generacji przy użyciu technologii Oxford Nanopore. Wykonanie tego eksperymentu powierzono Pracowni Sekwencjonowania DNA i Syntezy Oligonukleotydów Instytutu Biochemii i Biofizyki PAN z Warszawy. Sekwencjonowanie odbyło się w dwóch etapach, dzięki osobistemu zaangażowaniu mgr. Jana Gawora, głównej osoby realizującej eksperyment. Dwie jego części – doświadczalna oraz bioinformatyczna realizowane były odpowiednio w Katedrze Biotechnologii i Bioinformatyki Wydziału Chemicznego oraz w Zakładzie Systemów Złożonych Wydziału Elektrotechniki i Informatyki. Sprawne przeprowadzenie sekwencjonowania, jak również prawidłową analizę bioinformatyczną uzyskanych danych nadzorował mgr J. Gawor. Niezbędnej pomocy organizacyjno-technicznej udzielił także prof. dr hab. inż. Mirosław Tyrka z Wydziału Chemicznego PRz. W części drugiej – bioinformatycznej wymagane było zaangażowanie pozostałej części zespołu projektowego. Eksperyment trwał pięć dni roboczych: pierwsze dwa dni dotyczyły pracy w laboratorium mokrym, pozostałe dni przeznaczono na prace o charakterze bioinformatycznym, w tym na analizy danych oraz ich przetwarzanie na serwerach Zakładu Systemów Złożonych.
Realizacja kolejnych serii eksperymentów sekwencjonowania odbywała się już tylko przez zespół projektowy, ale nie byłaby możliwa bez zakupów niezbędnego wyposażenia, tj. MinION Starter Pack wraz z wyposażeniem dodatkowym w postaci tzw. kits.: CN1398 First Release Rapid barcoding Kit, Native Barcoding Expansion 112, Native Barcoding Expansion 1324, RAP Top Up Kit, Flow Cell Priming Kit oraz SPOT ON FLOW CELL MK 1 R9 VERSION, Field Sequencing Kit, Flow Cell Priming Kit, użycia kaset Blue Pippin oraz urządzenia Blue Pippin. Sekwencjonowanie dostarczało kolejnych danych genomicznych, które pozwalały na dopracowanie przetwarzania na serwerze oraz optymalizację pipeline.
W czasie realizacji projektu wyhodowano nowe mutanty termotolerancyjnego szczepu Bacillus subtlis MSP4 otrzymane na drodze mutagenezy chemicznej z wykorzystaniem bromku etydyny. Dla otrzymanych mutantów wykonano proces sekwencjonowania metodą ONT. Uzyskano pulę kilkunastu mutantów o zmienionej sekwencji genów, kodujących enzymy o potencjalnym zastosowaniu komercyjnym, takich jak proteazy, desaturaza kwasów tłuszczowych, hydrolaza epoksydowa czy subtylizyna E. Na podstawie przeprowadzanych analiz bioinformatycznych (adnotacja uzyskanych sekwencji genomowych szczepu dzikiego oraz otrzymanych mutantów z wykorzystaniem narzędzi serwera RAST) do opatentowania wytypowano szczepy mutantów B.Subtilis MSP4, wytwarzających zmutowane enzymy.
Wykonano także wiele niezbędnych prac informatycznych pozwalających na implementacje zarówno od strony programowej, jak i sprzętowej serwera NanoForms do przetwarzania i analizy surowych danych bioinformatycznych. Przygotowany serwer (dostępny pod adresem http://nanoforms.tech) jest w stanie obsłużyć małe genomy (do 50 MB). Użytkownik serwera ładuje zarchiwizowany, pojedynczy plik sekwencji (fastq), następnie dane są wstępnie przetwarzane, a użytkownik na bieżąco wybiera dostępne opcje, co pozwala na uzyskanie sekwencji DNA/RNA w postaci pliku fasta. Dla serwera NanoForms opracowano autorski algorytm pipeline przetwarzania danych z ONT. W czasie budowy serwera ponadplanowo rozszerzono jego funkcjonalność o tzw. złożenie hybrydowe (wraz z danymi z urządzenia Illumina), co znacząco poprawia ostateczną jakość sekwencjonowania.
Projekt był finansowany przez Podkarpackie Centrum Innowacyjności w ramach grantu nr F3_116 (umowa nr 05/PRZ/1/DG/PCI/2019).