Naslov Web aplikacija za vizualizaciju hijerarhijskih podataka
Autor Mario Bošnjak
Mentor Ivica Nakić (mentor)
Član povjerenstva Ivica Nakić (predsjednik povjerenstva)
Član povjerenstva Rudi Mrazović (član povjerenstva)
Član povjerenstva Marko Erceg (član povjerenstva)
Član povjerenstva Zlatko Drmač (član povjerenstva)
Ustanova koja je dodijelila akademski / stručni stupanj Sveučilište u Zagrebu Prirodoslovno-matematički fakultet (Matematički odsjek) Zagreb
Datum i država obrane 2019-09-25, Hrvatska
Znanstveno / umjetničko područje, polje i grana PRIRODNE ZNANOSTI Matematika
Sažetak Web aplikacija za vizualizaciju hijerarhijskih podataka je razvijana kako bi se olakšalo vizualizaciju podataka u kojima postoji relacija ili hijerarhija. Mogućnost različitih prostornih raspoređivanja čvorova daje dodatni uvid podatke. Tako Breadthfirstsearch layout omogućava pregled hijerarhije unutar usmjerenog grafa, te jednostavnu izolaciju jednog ili više korijena, ako postoje unutar grafa. Izolacijom predaka pojedinog čvora možemo dobiti sve izravne prethodnike nekog čvora te tako izolirati podgraf koji sadrži samo one čvorove i bridove koji su bitni u kontekstu odabranog čvora. Filtriranje po kategorijama čvorova pruža uvid u to kakve veze postoje unutar nekog podskupa podataka s danim obilježjem, to jest kategorijom. Postoji veliki skup raznovrsnih podataka koji se mogu prilagoditi i prikazati pomoću ovakve aplikacije, a to može biti kao što je prikazano u primjeru, skup znanja iz nekog udžbenika. Dodatno se mogu prikazati skupovi podataka poput prometne, telekomunikacijske, plinske, vodovodne ili električne mreže. Osim toga može se koristiti u razvoju softvarea za prikaz Entity-Relationship\(^1\) modela ili kao dijagram da se vide međuovisnosti pojedinih biblioteka ili paketa koji su potrebni za razvoj aplikacije. Tu svakako spada i mogućnost kreiranja grafa povezanosti između web stranica pa bi to bilo izrazito zanimljivo napraviti za Wikipediu, koja ima mnoštvo poveznica između stranica koje bi predstavljale čvorove. Aplikacija se može koristiti i za kreiranje skupa podataka tako da se korištenjem sučelja kreiraju novi projekti, grafovi, informacije i veze među njima koje se potom automatski spremaju u strukturu koja se može vizualizirati, a isto tako i uređivati i nadograđivati. Prostor za širenje funkcionalnosti aplikacije postoji na svim razinama. Od optimizacije koda, do dodavanja novih funkcionalnosti koje se mogu koristiti za bolju vizualizaciju skupa podataka. Prostor leži i u povezivanju aplikacije s metodama strojnog učenja koje otvaraju jednu novu dimenziju. Primjer bi bio određeni skup pojmova, te klasični tekst bez ikakvih posebnih tagova. Tada bi se korištenjem tehnika vezanih za NLP\(^2\) mogla napraviti obrada teksta te vizualizirati povezanost danih pojmova unutar teksta. Izazovi za ovakvu aplikaciju su prvenstveno u veličini podataka i njihovoj pripremi. Ostaju otvorena pitanja kako bi se aplikacija ponašala u slučaju vizualizacije grafova koji sadrže milijune čvorova te još više bridova. Skup podataka nad kojim bi se mogla provesti takva testiranja i proučavanja je Wikipedia, koja je javno dostupna za preuzimanje u obliku komprimirane xml datoteke. 1: https://en.wikipedia.org/wiki/Entity-relationship_model 2: https://en.wikipedia.org/wiki/Natural_language_processing
Sažetak (engleski) Web application for visualization of hierarchically structured data was developed in order to enable visualization of any data that is structured in relational or hierarchical order. By using different graph layouts user can get an extra insight in the data. Breadthfirstsearch layout enables one to see if there is a hierarchy inside the directed graph and to isolate all root nodes inside it, if there is any. By isolating ancestors of one node, application can show all direct predecessors and by doing so user can see the subgraph that contains only the nodes and edges important for the chosen node. Filtering data by categories will enable user to see if there are any connections inside a specific subset of data. There is a vast array of different data sets that can be adapted and visualized by using an application such as this, and it can be done in the same way as it was shown in example by adapting the knowledge set from schoolbook. But it can also visualize data from traffic, telco, gas, electrical or water grid, or in software development for visualization of Entity-Relationship model, or as a diagram for modules dependency in software. There is also a potential for visualization of web, showing web pages and links between them and it would be extremely interesting to test on Wikipedia, as it has millions of articles and many more millions of links. Application can also be used for creation of data through user interface by creating projects, graphs, nodes, edges and categories that will be automatically saved in relational or hierarchical structure that can be visualized, updated or upgraded. There are many other functionalities that could be implemented in different parts of application and it is spread from optimizing code to adding new options for visualization. Other direction for improvement is connecting the application with machine learning solutions. For example, one could use a given set of data without any connections, and then create connections by extracting them with NLP from text. This would enable user to create edges between existing nodes, and by doing so build a new graph structure. There are also many challenges for application such as this one and they are primarily in size od data set and in preparation of that data set for use in application. There are still some open questions, some of them are directly related to visualization of data sets with millions of nodes and edges. Those questions could be answered by processing Wikipedia, which can be downloaded and processed.
Ključne riječi
web aplikacija
vizualizacija hijerarhijskih podataka
Ključne riječi (engleski)
web application
visualization of hierarchically structured data
Jezik hrvatski
URN:NBN urn:nbn:hr:217:483880
Studijski program Naziv: Računarstvo i matematika Vrsta studija: sveučilišni Stupanj studija: diplomski Akademski / stručni naziv: magistar/magistra računarstva i matematike (mag. inf. et math.)
Vrsta resursa Tekst
Način izrade datoteke Izvorno digitalna
Prava pristupa Otvoreni pristup
Uvjeti korištenja
Datum i vrijeme pohrane 2020-01-13 12:19:49