De novo sastavljanje genoma i metagenoma

Trajanje projekta: 2018 - 2022

FinanciranjeHrvatska zaklada za znanost   

Suradnja: Niranjan Nagarajan (A*STAR GIS, Singapore)

Prvi moderni alat za sastavljanje genoma proizvela je Celera 2001. godine za sastavljanje prve verzije ljudskog genoma. Od tada su mnoge metode za sastavljanje genoma razvijene i korištene, ali konačni genomi visoke preciznosti još uvijek zahtijevaju dugotrajan angažman istraživačkih skupina i dugotrajno ručno provjeravanje i prepravljanje. Najveći izazov u proizvodnji visoko preciznih i neprekinutih sastavljenih genoma su dugi nizovi ponavljajući regija. Nove i nadolazeće tehnologije za sekvenciranje tvrtki Pacific Biosciences i Oxford Nanopore Technologies daju nam nadu da je automatizacija postupka sastavljaja genoma moguća. Nove tehnologije proizvode očitanja velike duljine, ali i velikog postotka pogreške. Duljina proizvedenih očitanja može premašiti i nekoliko stotina tisuća nukleotida, što bi trebalo biti dovoljno za ispravnu rekonstrukciju većine ponavljajućih dijelova genoma. Međutim, znanstvena zajednica još uvijek ima značajne poteškoće prilikom sastavljanja većih genoma (genoma životinja i biljaka) te prilikom sastavljanja genoma mikrobnih zajednica. Metode za sastavljanje obično koriste pristup utemeljen na grafovima. Grafovi se grade spajajući očitanja koja se preklapaju, a zatim se heurističkim metodama traži put kroz graf koji će svako očitanje obići samo jednom. To je često nemoguće zbog petlji u grafu, uzrokovanih neispravnim preklapanjima i ponavljajućim djelovima genoma. To je posebno izraženo kod dugih genoma koji se sastoje od većeg broja kromosoma te kod metagenomeskih uzoraka koji sadrže od desetak pa do nekoliko stotina organizama. Glavni cilj ovog projekta jest razviti metode pomoću kojih koje će se proizvesti (i) potpuni i precizni dugi genomi te (ii) genomi organizama iz metagenomskog uzorka. Da bi to postigli planiramo razviti nekoliko metoda utemeljenih na grafovima i strojnom učenju pomoću kojih ćemo detektirati neispravna preklapanja.

Projektni tim

Članovi projekta:

  • Prof. dr. sc. Mile Šikić - voditelj
  • Izv. prof. dr. sc. Igor Mekterović
  • Doc. dr.sc. Krešimir Križanović
  • Dr. sc. Niranjan Nagarajan (A*STAR GIS, Singapore)
  • Dr. sc. Nino Antulov-Fantulin (ETH Zurich)
  • Robert Vaser - doktorand

Suradnici sa drugih institucija: 

  • Prof. Jianjun Liu, Genome Institute of Singapore, A*STAR Singapore
  • Prof. Ken Wing Kin Sung, National University of Singapore
  • Dr. Hwee Kuan Lee, Bioinformatics Institute, A*STAR Singapore
  • Dr. Mike Vella, NVIDIA
  • Prof. Christophe Dessimoz (University of Lausanne)
  • Prof. Marc Robinson-Rechavi (University of Lausanne)
  • Izv. prof. Petra Korać (Sveučilište u Zagrebu, Prirodoslovno-matematički fakultet, Biološki odsjek)
  • Prof. Karin Kovačević Ganić (Sveučilište u Zagrebu, Prehrambeno-biotehnološki fakultet)
  • Izv. prof. Antonio Starćević (Sveučilište u Zagrebu, Prehrambeno-biotehnološki fakultet)

Publikacije

Radovi u znanstvenim časopisima:

Izlaganja na znanstvenim skupovima:

  • Robert Vaser i Mile Šikić, Yet another de novo genome assembler, 2019, 11th International Symposium on Image and Signal Processing and Analysis (ISPA)
  • Sara Bakić, Luka Požega, Robert Vaser i Mile Šikić, Assessing sequencing data for genome assembly, 2019, 27th Conference on Intelligent Systems for Molecular Biology and the 18th European Conference on Computational Biology, poster
  • Marić, J.; Šikić, M. Approaches to metagenomic classification and assembly // MIPRO, Biomedical Engineering, Opatija: IEEE, 2019.
  • Vrček, Lovro; Šikić, Mile; Supervised learning approach to long read classification // Fourth International Workshop on Data Science Abstract Book Zagreb, Hrvatska, 2019. str. 71-72, poster

Doktorske disertacije:

Diplomski i završni radovi:

  • Floreani, F. Classification of 1D-Signal Types Using Deep Learning (2019)
  • Lipovac, J. Ocjena alata za identifikaciju vrsta u metagenomskim uzorcima (2019)
  • Batić, D. Mapiranje slijeda na graf (2019)
  • Pongračić, K. Mapiranje dugačkih očitanja (2019)
  • Pavlić, S. Mapiranje kratkih očitanja (2019)
  • Penić, R. J. Izgradnja biblioteke za poravnavanje parova dugačkih RNA očitanja (2019)
  • Kosier, S. Pronalaženje varijanti gena iz podataka dobivenih sekvenciranjem (2019)
  • Relić, B. Klasifikacija očitanja koristeći metode dubokog učenja (2019)
  • Bakić, S. De novo sastavljanje genoma vođeno referencom (2019)
  • Vrček, L. Poliranje DNA slijeda koristeći metode dubokog učenja (2019)
  • Požega, L. Gornja granica u sastavljanju genoma (2019)