Mining social and cryptocurrency networks
dynamic graphs
network centrality
node embeddings
cryptocurrency network analysis
dinamikus gráfok
gráf központiság
csomópont-beágyazás
kriptopénz hálózatelemzés
Absztrakt:
A gráfadatokkal kapcsolatos egyik fő probléma az, hogy a klasszikus gépi tanuló módszerekbe történő betáplálásuk nem egyértelmű feladat. Az olyan algoritmusok, mint a logisztikus regresszió vagy döntési fák csak táblázatos adatokkal működnek jól. A csúcs szomszédságok eltérő mérete miatt a nyers hálózati adatok nem tekinthetők táblázatosnak. A közelmúltban számos statikus csomópont-beágyazási módszert javasoltak a hálózati csúcsok vektortér-reprezentációjának megtanulására a downstream gépi tanulási feladatokhoz.
Számos adatintenzív feladatnál, ahol a hálózati résztvevők közötti interakciók az idő múlásával folyamatosan érkeznek, elengedhetetlen a kiszolgálást végző hálózatelemző eljárások újratanítása. A statikus algoritmusok újratanítása nagyméretű gráf pillanatképek esetén jelentős késéshez vezethet az előrejelzésben. Ezekben a feladatokban éppen ezért az online gráfelemző eljárásokat részesítik előnyben.
Kutatásom során közösségi és kriptopénz hálózatok felhasználói interakcióit elemeztem, valamint a kapcsolódó metaadatok segítségével felügyelt módon értékeltem ki a vizsgált gráfelemző eljárásokat. Disszertációm célja többek között az alábbi kérdések megválaszolása:
(1) Melyek az online hálózatelemzési technikák fő előnyei a nagyméretű közösségi hálózatok statikus modelljeivel szemben, és hogyan lehet a legjobban összehasonlítani teljesítményüket? Kutatásunkban a gráfközpontiság és a csomópont-beágyazó technikákra koncentrálunk és három online algoritmust dolgozunk ki a kapcsolódó problémák megoldására.
(2) Az újszerű gráfelemző eljárások milyen formában nyújtanak segítségek a kriptoökonómia és az adatvédelem területén felmerülő nyitott kérdéseket megválaszolásában?
Különféle új Twitter-és kriptovaluta adathalmazok gyűjtésével, számos hálózati alkalmazásban az elsők között elemeztük a csúcs-beágyazó módszerek teljesítményét, például az oltásszkeptikus tartalmak felismerésében vagy az Ethereum-címek deanonimizálásában.