Προέλευση και διατήρηση δεδομένων

Τελευταία έχει δοθεί μεγάλη προσοχή στη προέλευση (provenance) και διατήρηση (preservation) των δεδομένων. Η προέλευση έχει να κάνει με την ανίχνευση της αρχικής πηγής των δεδομένων και των μετασχηματισμών στους οποίους υπεβλήθησαν, προκειμένου να αξιολογήσουμε την ποιότητά τους. Η διατήρηση έχει να κάνει με την εξασφάλιση ότι τα δεδομένα θα συντηρούνται και θα είναι πάντα διαθέσιμα, ανεξάρτητα από μεταβολές στη φύση τους ή από τεχνολογικές εξελίξεις στον τρόπο φύλαξής τους. Από την σκοπιά ενός πληροφοριακού συστήματος, η προέλευση και η διατήρηση είναι στενά συσχετιζόμενες έννοιες, καθώς συνδέονται και οι δύο με την έννοια της μεταβολής: η προέλευση μπορεί να χρησιμοποιηθεί για την ερμηνεία των δεδομένων, στοιχείο σημαντικό για την διατήρηση της γνώσης.

Στόχος μας είναι η διαχείριση πληροφορίας σε συσχετιζόμενες αποθήκες δεδομένων που εξελίσσονται παράλληλα και αυτόνομα, με τρόπο ώστε να είναι πάντα δυνατό να γυρίσει κανείς προς τα πίσω (υποστήριξη εξελισσόμενου σχήματος και δεδομένων) και να εξετάσει πως και γιατί έλαβε χώρα κάθε αλλαγή (υποστήριξη προέλευσης). Αυτό είναι ιδιαίτερα σημαντικό για αποθήκες δεδομένων που δημοσιεύονται στον Ιστό, στοιχεία των οποίων αντιγράφονται ή δεικτοδοτούνται από άλλες αποθήκες δεδομένων, σχηματίζοντας έτσι έναν ιστό από αλληλεξαρτώμενα εξελισσόμενα συστήματα. Τέτοιες αποθήκες δεδομένων μπορούν να περιέχουν, για παράδειγμα, επιστημονικά δεδομένα (όπως οι βιολογικές αποθήκες δεδομένων UniProt, Rfam, IUPHAR), και είναι πολύ σημαντικές μια και καταγράφουν την εξέλιξη της αντίστοιχης επιστημονικής περιοχής.

Για να υποστηρίξουμε προέλευση και διατήρηση σε τέτοια συστήματα χρειαζόμαστε μοντέλα δεδομένων που να υποστηρίζουν και να καταγράφουν τις μεταβολές στη πληροφορία, γλώσσες ερωτήσεων που να αποκαλύπτουν τα ίχνη της πορείας των δεδομένων, και εργαλεία που να μπορούν να προσαρμοστούν σε υπάρχοντα συστήματα.

Σχετική ερευνητική δραστηριότητα στο ΙΠΣΥ: C2D