Algorithmic Problems in Bioinformatics
Bioinformatics
Metagenomics
connectome
Data Mining
Informatika D. I./Információs rendszerek
bioinformatika
metagenomika
agygráf
adatbányászat
Absztrakt:
A biológiai kutatások gyakran nagyon sok adatot eredményeznek. Hatékony számítógépes algoritmusok nélkül nem lenne lehetséges ezeknek az adathalmazoknak az elemzése.
Ez a munka a matematika és informatika alkalmazásait demonstrálja a biológia több területén. Az első fejezet az ismert k-means algoritmust általánosítja nem-euklideszi adatpontokra. Ezt az általánosítást azóta több más kutató is felhasználta.
Az asszociációsszabály-bányászat egy alkalmazása az Alzheimer-kórral kapcsolatban is bemutatásra kerül. Több mint 6000 alany 11 gyógyszerkísérletből származó adatait elemeztük, hogy kapcsolatot találjunk biomarkerek kombinációi és a demencia közt. Az eredmények azt mutatják, hogy bizonyos korcsoportokban még az egyszerű kombinációk is pontosan jelezhetik az alacsony pontszámokat kognitív teszteken.
Diabéteszes és nem diabéteszes alanyok bélflórájának metagenomját elemezve megmutattuk, hogy a max. 9 hosszú DNS szakaszok gyakorisága társítható a diabéteszhez. Ez lehet az egyik első alkalom, hogy ilyen hosszúságú szekvenciák kapcsolatba lettek hozva egy betegséggel.
Az új generációs szekvenálási módszerek lehetővé teszik, hogy tenyésztés nélkül nyerjünk adatot mikroorganizmusokról. Ezzel a módszerrel homológ géneket is találhatunk egy metagenomban. A "metagenomikai teleszkóp" nevű eljárásról szóló fejezetben egy rejtett Markov-modellt "dúsítunk fel" metagenomokból származó génekkel, hogy aztán ismeretlen funkciójú géneket jellemezzünk modellorganizmusok genomjában.
Az emberi agy kisebb területek, ROI-k (regions of interest) hálózata. Az idegrostok által összekötött ROI-k gráfja MR-felvételek feldolgozásával állítható elő. Az ilyen típusú gráfokat gráfelméleti módszerekkel elemeztük. Szignifikáns különbségeket találtunk a nők és férfiak agygráfja között. Egy interaktív 3D agygráfot megjelenítő webalkalmazást (Budapest Reference Connectome) is kifejlesztettünk.
A Human Connectome Project MR-felvételek mellett más adatot is közölt, pl. kogníciós és érzelmi tesztek eredményét, valamint demográfiai adatokat. Ezekből korrelációkat számoltunk, amelyekből a legfontosabbakat egy maximális feszítőfa módszerrel próbáltuk kiemelni. Ezt a módszert mi használtuk először biológiai adatokra. A feszítőfánk alkalmazásai közé tartozik például az érzelmi állapotok statisztikailag megalapozott klaszterezése.