Ithaca: Από «Ανοιχτά Δεδομένα» σε «Ανοιχτά Διασυνδεδεμένα Δεδομένα»

1970737_732484526783121_1324048049_nΗ Εταιρεία Ελεύθερου Λογισμικού / Λογισμικού Ανοικτού Κώδικα (ΕΕΛ/ΛΑΚ, www.eellak.gr) στο πλαίσιο των δράσεών της για την προώθηση των Ανοιχτών Δεδομένων συμμετέχει με την Αποκεντρωμένη Διοίκηση Κρήτης και το Πανεπιστήμιο Κρήτης στο έργο HOMER–MED (Harmonizing Open data in the Mediterranean through better access and Reuse of public sector information)

Στο πλαίσιο του ευρωπαϊκού προγράμματος HOMER (Harmonizing Open data in the MEditerranean through better access and Reuse of public sector information) διοργανώθηκε ο μαραθώνιος διαγωνισμός Hack4Med όπου η εφαρμογή Ithaca έλαβε μέρος κερδίζοντας 3 βραβεία:

  • Τη 1η θέση στο βραβείο «Best Homer Federation Open Data reuse App»

  • Τη 2η θέση στο βραβείο «The most useful application for a public sector administration»

  • Τη 1η θέση στο βραβείο «Best solution for Crete»

 Η Ithaca είναι ένα εργαλείο που διαβάζει ανοιχτά δεδομένα που υπάρχουν στο διαδίκτυο σε διάφορες μορφές και τα μετατρέπει σε Ανοιχτά Διασυνδεδεμένα Δεδομένα (ΑΔΔ). Τα ΑΔΔ (Linked Open Data) είναι ένα σύνολο από τεχνικές και εργαλεία για τη δημοσίευση, ενσωμάτωση και διασύνδεση δεδομένων, δομημένης πληροφορίας και γνώσης στο σημασιολογικό ιστό με τη χρήση των προτύπων URI (Uniform resource identifier) και RDF (Resource Description Framework). Αποτελεί μια δημοφιλή μέθοδο που υιοθετείται από ετερογενείς παρόχους δεδομένων, όπως π.χ., δημόσιοι φορείς, ηλεκτρονικές βάσεις δεδομένων, ψηφιακές βιβλιοθήκες, χάρτες και εγκυκλοπαίδειες, κτλ, για την παροχή, διασύνδεση και σημασιολογική αξιοποίηση των δεδομένων τους στον ιστό.

Η ιδέα για την υλοποίηση αυτής της εφαρμογής γεννήθηκε από το πρόβλημα που αντιμετώπισαν οι προγραμματιστές που έλαβαν μέρος στο συγκεκριμένο διαγωνισμό να χρησιμοποιήσουν αποτελεσματικά τα διαθέσιμα ανοιχτά δεδομένα. Συγκεκριμένα, τα σύνολα ανοιχτών δεδομένων που μπορούσαν να χρησιμοποιηθούν προέρχονταν κυρίως από δημόσιους φορείς, όπως του τουρισμού, του πολιτισμού, της ενέργειας, της γεωργίας και του περιβάλλοντος. Όμως, αν και αυτά τα σύνολα δεδομένων είναι ανοιχτά, τα ίδια τα δεδομένα δεν είναι προσβάσιμα μέσω μιας διεπαφής προγραμματισμού εφαρμογών (API), αλλά αντίθετα υπάρχουν στο διαδίκτυο σε πολλές και διαφορετικές μορφές (π.χ. CSV, XML, PDF, Excel), χωρίς να υιοθετείται ένα κοινό πρότυπο για την αναπαράστασή τους. Αυτό έχει ως αποτέλεσμα ο προγραμματιστής να μην έχει άμεση πρόσβαση στα ίδια τα δεδομένα, να μη μπορεί να πλοηγηθεί σε αυτά, να μη μπορεί να δει αν και πως συνδέονται δεδομένα από διαφορετικά σύνολα δεδομένων, ούτε να συνδυάσει δεδομένα από διαφορετικές πηγές με σκοπό την ανάπτυξη μιας έξυπνης εφαρμογής.

 Η Ithaca επιλύει αυτό το πρόβλημα εκμεταλλεύοντας τη δυναμική, κατανεμημένη, σημασιολογική αλλά και πολυγλωσσική φύση των ΑΔΔ.

 Συγκεκριμένα, αρχικά σχεδιάστηκε μια OWL (Web Ontology Language) οντολογία για την αναπαράσταση τόσο των πηγών όσο και των ίδιων των δεδομένων. Στη συνέχεια, δημιουργήθηκε μια εφαρμογή η οποία διαβάζει τα δεδομένα από τις πηγές, και χρησιμοποιώντας την παραπάνω οντολογία αλλά και άλλα γνωστά λεξιλόγια για τη περιγραφή δεδομένων (όπως RDFS, DublinCore και FOAF), δημιουργεί RDF δεδομένα τα οποία φορτώνει σε μια αποθήκη δεδομένων (Data Warehouse).

 Τα δεδομένα είναι πλέον προσβάσιμα στον Παγκόσμιο Ιστό σε πρότυπη μορφή με χρήση της γλώσσας επερωτήσεων SPARQL. Εκμεταλλεύοντας την εκφραστική δύναμη της SPARQL, ο χρήστης/προγραμματιστής μπορεί να συνδυάσει δεδομένα που προέρχονται από διαφορετικά σύνολα δεδομένων αλλά και να αξιοποιήσει ΑΔΔ που είναι αποθηκευμένα σε άλλα – εξωτερικά – αποθετήρια RDF δεδομένων (πχ. DBpedia, Freebase, κτλ). Παραδείγματος χάριν, ένας χρήστης/προγραμματιστής μπορεί να εκτελέσει επερωτήσεις της μορφής:

«Επέστρεψε μου όλα τα οινοποιεία του νομού Ηρακλείου μαζί με μία περιγραφή τους στα Αγγλικά, τα οποία είναι προσβάσιμα με λεωφορείο και που σε απόσταση μικρότερη των 5 χιλιομέτρων υπάρχει τουλάχιστον ένα σημείο ενδιαφέροντος (πχ. μουσείο, αρχαιολογικός χώρος, κτλ.), και για κάθε τέτοιο σημείο ενδιαφέροντος επέστρεψε μου φωτογραφίες και περιγραφή του στα Αγγλικά».

 Η Ithaca υλοποιήθηκε από τον μεταπτυχιακό φοιτητή Μιχάλη Μουνταντωνάκη και τον διδακτορικό φοιτητή Παύλο Φαφαλιό, οι οποίοι φοιτούν στο τμήμα Επιστήμης Υπολογιστών του Πανεπιστημίου Κρήτης και είναι μεταπτυχιακοί υπότροφοι στο Εργαστήριο Πληροφοριακών Συστημάτων, του Ινστιτούτου Πληροφορικής, στο Ίδρυμα Τεχνολογίας και Έρευνας (FORTH-ICS). Η εφαρμογή θα παρουσιαστεί στη τελετή απονομής βραβείων που θα διεξαχθεί στο Τορίνο, 9-10 Ιουλίου 2014, όπου θα αναμετρηθεί με εφαρμογές που κέρδισαν το αντίστοιχο 1ο βραβείο σε άλλες ευρωπαϊκές χώρες.

 Στοιχεία εφαρμογής:

  • Running SPARQL Endpoint: http://62.217.127.118:8890/sparql (περιέχει δεδομένα που προέρχονται από περισσότερα από 25 σύνολα δεδομένων της ομοσπονδίας του HOMER)

  • RDF data browser: http://62.217.127.118/SparqlBrowser (για πλοήγηση στα δεδομένα)

Στοιχεία επικοινωνίας:

 Μιχάλης Μουνταντωνάκης και Παύλος Φαφαλιός

fafalios@ics.forth.gr, mountant@ics.forth.gr

http://users.ics.forth.gr/~fafalios

 combined_logo_med_-_horizontal

Αφήστε μια απάντηση