Techniques for the integration of semantic geospatial data Full text

Thomas Maroulis
Diploma Thesis, School of Electrical and Computer Engineering, National Technical University of Athens, Greece
2013
Διπλωματική Εργασία
Περίληψη.

Τα πρόσφατα χρόνια, οι τεχνολογίες και μεθοδολογίες του Σημασιολογικού Ιστού έχουν ισχυροποιήσει τη θέση τους στο πεδίο της διαχείρισης δεδομένων και γνώσης. Πρότυπα για την οργάνωση και επερώτηση σημασιολογικής πληροφορίας όπως τα RDF(S) και SPARQL έχουν υιοθετηθεί από μεγάλες ακαδημαϊκές κοινότητες, ενώ εταιρικοί πάροχοι υιοθετούν σημασιολογικές τεχνολογίες για να οργανώσουν, εκθέσουν, ανταλλάξουν και ανακτήσουν τα δεδομένα τους. Παράλληλα, οι γεωγραφικές βάσεις δεδομένων είναι μερικές από τις μεγαλύτερες υπαρκτές βάσεις και έχουν μεγάλη σημασία σε ένα εύρος καθημερινών εφαρμογών. Τέτοιου είδους δεδομένα απεικονίζονται και χειραγωγούνται με χρήση Συστημάτων Γεωγραφικής Πληροφορίας – Geographic Information Systems (GIS), όμως η ολοκλήρωση εξωτερικών σετ δεδομένων σε αυτά τα συστήματα είναι χρονοβόρα και πολύπλοκη. Σε αυτό το πλαίσιο, που συντίθεται αφενός από τις αδυναμίες των υπαρχόντων GIS συστημάτων και αφετέρου από τις καλά τεκμηριωμένες δυνατότητες και οφέλη των τεχνολογιών σημασιολογικού ιστού, μία δύσκολη όσο και ενδιαφέρουσα πρόκληση είναι η αποτελεσματική ολοκλήρωση εννοιών και τεχνολογιών από τη διαχείριση γεωχωρικών δεδομένων με τον Σημασιολογικό Ιστό.

Στο πλαίσιο της παρούσας διπλωματικής αναπτύξαμε το Geosm, ένα εργαλείο για το μετασχηματισμό δεδομένων χαρτογράφησης από το OpenStreetMap σε RDF γράφους σε συμφωνία με το OGC GeoSPARQL πρότυπο. Για την ανάπτυξη του εργαλείου βασιστήκαμε στο υπάρχον εργαλείο Osmosis και στη βιβλιοθήκη Apache Jena, ενώ για τη διατήρηση της συμβατότητας με το LinkedGeoData project κάναμε χρήση των ίδιων RDF λεξιλογίων. Αναλύσαμε το θέμα της διασύνδεσης γεωχωρικών σημασιολογικών δεδομένων, εξετάζοντας τις δυνατότητες υπαρχόντων μετρικών ομοιότητας, σχεδιάζοντας νέες μετρικές προσαρμοσμένες στις απαιτήσεις των δεδομένων μας και τέλος εκτελώντας ένα ευρύ φάσμα πειραμάτων σε δεδομένα που συλλέξαμε για την ανάλυση της επίδοσης των μετρικών.