RawVis: Visual Exploration over Raw Data
17th Hellenic Data Management Symposium (HDMS’19)
2019
Συνέδριο/Workshop
- Πληροφορίες: Γιώργος Παπαστεφανάτος , Νίκος Μπικάκης , Σταύρος Μαρούλης , Παναγιώτης Βασιλειάδης
- Σχετικό ερευνητικό έργο: VisualFacts
Περίληψη.
Τα συστήματα διαδραστικής εξερεύνησης και οπτικής αναλυτικής δεδομένων,
εμπεριέχουν μεγάλη πρακτική σημασία στο πλαίσιο της Ανοιχτής Επιστήμης, όπου
επιστήμονες/χρήστες χωρίς εξειδικευμένες τεχνικές γνώσεις ή εξειδικευμένο
υπολογιστικό εξοπλισμό, επιθυμούν να πλοηγηθούν σε μεγάλα πρωτογενή αρχεία
πειραματικών αποτελεσμάτων. Στην παρούσα ερευνητική εργασία, παρουσιάζουμε
το σύστημα RawVis, που παρέχει στο χρήστη τη δυνατότητα να πλοηγηθεί άμεσα και
διαδραστικά σε πρωτογενή δεδομένα μεγάλου όγκου, χωρίς να απαιτείται από αυτόν
να αφιερώσει πολύ χρόνο για την παραμετροποίηση και φόρτωση των δεδομένων σε
μια βάση δεδομένων, αλλά ούτε και εξειδικευμένες γνώσεις. Το σύστημα αυτό
βασίζεται σε μια πολυδιάστατη δομή δεικτοδότησης αποτελούμενη από tiles
(multidimensional tile-based index). Η δομή αυτή, η οποία διατηρείται στην κύρια
μνήμη κι έχει ελαφρύ υπολογιστικό αποτύπωμα (lightweight), κατασκευάζεται με το
πρώτο ερώτημα του χρήστη πάνω σε ένα πρωτογενές αρχείο δεδομένων, και
προσαρμόζεται σταδιακά με κάθε ερώτημα.
Η βασική συνεισφορά της παρούσας εργασίας είναι η ελαχιστοποίηση του χρόνου
αρχικοποίησης του συστήματος αποφεύγοντας τη φόρτωση, συντακτική ανάλυση και
δεικτοδότηση του συνόλου των δεδομένων προς ανάλυση όπως συμβαίνει στα
περισσότερα παραδοσιακά συστήματα βάσεων δεδομένων (κατανεμημένα και μη),
και η εισαγωγή δυναμικών δομών δεικτοδότησης που θα δημιουργούνται σταδιακά
και θα προσαρμόζονται στα εκάστοτε ερωτήματα. Η πειραματική μελέτη του
συστήματος σε σχέση με τρία ανταγωνιστικά συστήματα, αποδεικνύει ότι η μέθοδος
μας παρουσιάζει καλύτερη απόδοση όσον αφορά τόσο στο χρόνο απόκρισης στα
ερωτήματα, όσο και στην κατανάλωση μνήμης.
[H Εργασία περιλαμβάνεται στα Proceedings of the 22nd European Conference on Advances in
Databases and Information Systems, και παρουσιάστηκε στο ADBIS 2018 όπου και έλαβε το βραβείο καλύτερης εργασίας.]