Εργαλείο Συλλογής και Οργάνωσης Γνώσης με Μηχανισμούς Μετα-Αναζήτησης στον Ιστό Full text

Αργύρης Κόλλιας
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, ΕΜΠ
2009
Διπλωματική Εργασία
Περίληψη. Η συγκεκριμένη διπλωματική εργασία αφορά στην ανάπτυξη μίας εφαρμογής συλλογής και οργάνωσης γνώσης με μηχανισμούς μετα-αναζήτησης στον Ιστό, βασισμένη στο λογισμικό ανοικτού κώδικα FreeMind (http://freemind.sourceforge.net/) το οποίο ειδικεύεται στην χαρτογράφηση σκέψεων (mind-mapping). Κατά την δημιουργία ενός χάρτη σκέψεων, ιδεών ή / και εργασιών που συνδέονται μεταξύ τους (mind-map), ο χρήστης θα είναι πλέον σε θέση να αναζητά πληροφορίες, για ένα συσχετιζόμενο με τον γράφο θέμα, από τον παγκόσμιο ιστό, και να προσθέτει στοιχεία, εμπλουτίζοντας κατά αυτόν τον τρόπο το διάγραμμά του. Η αναζήτηση μπορεί να προσαρμοστεί στις ανάγκες του χρήστη και πιο συγκεκριμένα, μπορεί να γίνει επιλογή του επιθυμητού τύπου των αποτελεσμάτων (π.χ. ιστοσελίδες ή papers), ενώ ειδική μέριμνα λαμβάνεται για τις επιστημονικές δημοσιεύσεις, χάριν των οποίων έχει συσταθεί μία Βάση Δεδομένων – πιστό αντίγραφο εκείνης του DBLP, προκειμένου η τελική πληροφόρηση να είναι ακόμα πιο έγκυρη και πληρέστερη. Πρέπει να σημειωθεί ότι η εφαρμογή μας λαμβάνει αποτελέσματα από διάφορες δημοφιλείς μηχανές αναζήτησης, καθώς και από εξειδικευμένες μηχανές, ενώ στο τέλος παρουσιάζει τα αποτελέσματα συγχωνευμένα και ταξινομημένα σύμφωνα με τον «δημοκρατικό» αλγόριθμο weighted Borda-Fuse. Επιπροσθέτως, έχει ενσωματωθεί ένας Mozilla-based web-browser, ο οποίος πέρα από τις συνήθεις υπηρεσίες πλοήγησης στο Διαδίκτυο, αξιοποιεί την τεχνική του screen-scraping, προκειμένου σε συνδυασμό με ένα κατάλληλο .xml αρχείο (οι προδιαγραφές του οποίου αναφέρονται σε ένα λιτό .dtd αρχείο), να είναι σε θέση ακόμα και ο αρχάριος χρήστης να επεκτείνει το σύστημα, προσθέτοντας κι άλλες μηχανές αναζήτησης. Τέλος, η διαδικασία του wrapping μίας ιστοσελίδας αποτελεσμάτων της εκάστοτε νεοεγκαθιστάμενης μηχανής αναζήτησης συνοψίζεται στην πρόγνωση και σύνθεση του full search URL, την επισήμανση από μέρους του χρήστη των δομικών τμημάτων ενός αποτελέσματος (τίτλος – διαδικτυακός σύνδεσμος – περίληψη / περιγραφή) και την μηχανική εκμάθηση ανάγνωσης (βάσει της προηγούμενης υπόδειξης) των τριών μερών καθενός αποτελέσματος.