Ανταλλαγή Δεδομένων σε Αδόμητα Δίκτυα Ομότιμων Κόμβων με χρήση Οντολογιών Full text

Κωνσταντίνος Καρανάσος
Διπλωματική Εργασία, Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών , ΕΜΠ
2008
Διπλωματική Εργασία
Περίληψη. Η παρούσα διπλωματική εργασία εξετάζει αδόμητα συστήματα ομότιμων κόμβων στα οποία οι κόμβοι ανταλλάσουν δομημένα δεδομένα. Κάθε κόμβος διαθέτει μια τοπική βάση δεδομένων και αντιστοιχίσεις μεταξύ του σχήματος της βάσης του και των σχημάτων των κόμβων με τους οποίους είναι απευθείας συνδεδεμένος. Οι κόμβοι θέτουν ερωτήματα στο δίκτυο ή επανεγγράφουν στο τοπικό τους σχήμα ερωτήματα που τους απευθύνονται. Όμως, οι τυπικοί αλγόριθμοι επανεγγραφής ερωτημάτων, που θεωρούν μόνο ερωτήματα που μπορούν να επανεγγραφούν πλήρως σε ένα τοπικό σχήμα, δεν είναι επαρκείς για ένα περιβάλλον όπου οι κόμβοι αναζητούν και ικανοποιούνται με πληροφορία που είναι σημασιολογικά σχετική, αλλά όχι απαραίτητα ταυτόσημη με τις απαιτήσεις τους. Ουσιώδες πρόβλημα σε τέτοια συστήματα είναι ότι οι κόμβοι δεν μπορούν να κρίνουν με ευκολία τη σημασιολογική ομοιότητα μεταξύ του δικού τους ενδιαφέροντος και της πληροφορίας των υπόλοιπων κόμβων. Επιπροσθέτως, οι κόμβοι δεν μπορούν να αξιολογήσουν τη σημασιολογική σχετικότητα των απαντήσεων που δέχονται στα ερωτήματα που θέτουν στο δίκτυο.
Σκοπός της διπλωματικής είναι η ανάπτυξη ενός συστήματος στο οποίο να υπάρχει η δυνατότητα προσδιορισμού του βαθμού ομοιότητας των σχημάτων των κόμβων, καθώς και των ερωτημάτων που προκύπτουν από τη διαδικασία επανεγγραφής σε σχέση με τα αρχικά. Στα πλαίσια αυτά, θεωρούμε την ύπαρξη μιας οντολογίας η οποία περιγράφει το πεδίο ενδιαφέροντος των κόμβων. Η οντολογία χρησιμοποιείται για να επισημειώνεται σημασιολογικά κάθε κόμβος, με αποτέλεσμα να περιγράφεται με σαφήνεια η πληροφορία που παρέχεται από αυτόν. Το μέτρο ομοιότητας στο οποίο βασίζεται το σύστημα υιοθετεί τις έννοιες της ευστοχίας και της ακρίβειας από το πεδίο της ανάκτησης πληροφοριών και λαμβάνει υπόψη τις σημασιολογικές επισημειώσεις των κόμβων, τις αντιστοιχίσεις των σχημάτων και το εκάστοτε ερώτημα. Υλοποιήθηκαν αλγόριθμοι που υπολογίζουν τη σημασιολογική ομοιότητα των κόμβων με βάση τα κριτήρια αυτά. Η υλοποίηση βασίστηκε σε εργαλεία ανοικτού κώδικα, όπως το Jena και το Pellet. Για την πειραματική αξιολόγηση του συστήματος χρησιμοποιήθηκαν δεδομένα από τη βάση ταινιών IMDb.