Τα ανοιχτά δημόσια δεδομένα και η δημοσιοποίησή τους.
Τα περισσότερα λογισμικά παράγουν δεδομένα. Οι ιδιοκτήτες των δεδομένων επί του παρόντος δημοσιοποιούν τα δεδομένα ως μέρος μιας ευρύτερης κίνησης που περιλαμβάνει ομάδες όπως Μη Κυβερνητικές Οργανώσεις, Ιδιώτες, Κοινότητες, και Εταιρίες.
Από το 2007, η πλατφόρμα Ushahidi έχει χρησιμεύσει ως τεχνολογία για την επικοινωνία κατά τη διάρκεια κρίσεων, από το σεισμό της Αϊτής το 2010 μέχρι τη μετεκλογική έκρηξη βίας στην Κένυα στις αρχές του 2013, επιτρέποντας στους ανθρώπους να στέλνουν ενημερώσεις μέσω γραπτών μηνυμάτων ή μέσω Διαδικτύου, τα οποία μετά απεικόνιζαν γραφικά σε διαδικτυακούς χάρτες. Το Ushahidi είναι ένας παγκόσμιος οργανισμός που ενδυναμώνει τους ανθρώπους να επιφέρουν σημαντικά αποτελέσματα χρησιμοποιώντας τεχνολογίες ανοιχτού κώδικα. Αποτελεί συνεργατική πλατφόρμα, που διαχειρίζεται την εισροή δεδομένων με άμεσες αναφορές, SMS, Twitter, Facebook και εξειδικευμένες πλατφόρμες συλλογής δεδομένων.
Οι δημιουργοί του Ushahidi εργαζόνται στη κατεύθυνση παροχής ανοιχτής πρόσβασης και δημοσίευσης με ανοιχτές άδειες των δεδομένων που παράγει η πλατφόρμα του λογισμικού υλοποίησής του . Αυτό επιτυγχάνεται, κυρίως γράφωντας κώδικα και δίνοντας ανοιχτό το API(application programming interface), συμμετέχοντας σε συλλογικές κοινοπραξίες όπως το Responsible Data Forum στο οποίο αναπτύσονται χρήσιμα εργαλεία και στρατηγικές με σκοπό την ασφάλεια και την προστασία της ιδιωτικής ζωής.
Το ερώτημα που προκύπτει από αυτή και παρόμοιες δράσεις, ειναι το πώς εξισορροπούνται τα πλεονεκτήματα που προέρχονται από τη δημοσίευση ευρύτερων ανοιχτών δεδομένων στο κοινονικό σύνολο με τους πιθανούς κινδύνους που συνδέονται με τη δημοσιοποίηση των ανοιχτών δεδομένων.
Η δημοσιοποιήση μια ομάδας ανοιχτών δεδομένων προϋποθέτει τη μη πρόκληση βλάβης στα άτομα που συνδέονται με τα δεδομένα αυτά. Eνώ η δημοσιοποίηση ενός ανοιχτού δεδομένου έχει μικρό κίνδυνο, πολλές από τις ομάδες δεδομένων περιλαμβάνουν πληροφορία που είναι προσωπική, που συχνά συλλέγεται κάτω από περίεργες περιστάσεις, και πιθανώς επικίνδυνη για τους συλλέκτες, ή τους διαχειριστές άλλων εφαρμογών που θα τα χρησιμοποιήσουν στο μέλλον ώς ανοιχτά δεδομένα .
Τύποι δεδομένων
Στο Ushahidi για παράδειγμα περιλαμβάνονται τύποι ανοιχτών δεδομένων όπως:
Άμεσες αναφορές: εισροή πληροφορίας μέσω μηνυμάτων. Το Ushahidi έχει συγκεκριμένα πεδία καταγραφής για τη πληροφορία (τίτλος, περιγραφή, κατηγορία κλπ), αλλά επίσης επιτρέπει τη δημιουργία προσαρμοσμένων πεδίων για να καταγράψει και άλλα αντικείμενα ειδικού ενδιαφέροντος.
Έμμεσες αναφορές: Μηνύματα που προέρχονται από άλλες εφαρμογές (Twitter, Facebook κτλ.) είτε από API’s είτε από crowdsourcers που τα καταγράφουν.
Γεωγραφικές πληροφορίες: Γεωγραφικό πλάτος και μήκος για κάθε ονομασία τοποθεσίας που βρίσκεται στη λίστα. Αυτά προστίθενται συνήθως από τους διαχειριστές του site, είτε αποτελούν αυτόματη πληροφορία χρησιμοποιώντας υπηρεσίες όπως το Nominatim, ένα εργαλείο για την αναζήτηση δεδομένων OSM με βάση το όνομα, τη διεύθυνση και την δημιουργία διευθύνσης των σημείων OSM με αντίστροφη γεωκωδικοποίηση.
Media: Εικόνες, video, αρχεία ήχου που επισυνάπτονται στις αναφορές.
Σε ποιον ανήκουν τα δεδομένα?
Η ιδιοκτησία των δεδομένων είναι ένα σημαντικό ζήτημα. Αν μια κοινότητα ατόμων προσθέτει αναφορές σε ένα δικτυακό τόπο και αυτός ο δικτυακός τόπος επίσης χρησιμοποιεί δεδομένα από κοινωνικά δίκτυα, τότε σε ποιον ανήκουν τα δεδομένα?
Τα δεδομένα τρίτων, όπως τα μηνύματα από το Twitter, έχουν περιορισμούς όσον αφορά την αποθήκευση και την ιδιοκτησία τους. Ακόμη και με την άδεια του αρχικού αποστολέα θα μπορούσε να γίνει παράνομη η διανομή ή διατήρηση των δεδομένων αυτών σε ένα τρίτο δικτυακό τόπο.
Ερωτήματα για την ιδιοκτησία έχουν τεθεί σε πολλά κοινωνικά δίκτυα σχετικά με τα ανοιχτά δεδομένα (για παράδειγμα οι μετακινήσεις των αδειών στο OpenStreetMap). Αν υπογράφεται από τους crowdsourcers μια συμφωνία συνεισφοράς, και αν υπάρχει άδεια χρήσης δεδομένων για κάθε σύνολο δεδομένων που δημοσιεύεται, αυτό είναι μόνο η αρχή.
Το ηθικό ζήτημα
Υπάρχουν θέματα ιδιωτικότητας για τους χρήστες των ανοιχτών δεδομένων (π.χ. κατά λάθος κοινοποίηση της τοποθεσίας και του τηλεφωνικού αριθμού), θέματα ασφάλειας που αναφέρουν συγκρούσεις, βία, κλπ – κίνδυνοι ασφάλειας που προκύπτουν από την αποκάλυψη ευαίσθητων τοποθεσιών π.χ. ιδιωτικές κατοικίες ή διευθύνσεις που πρέπει να μη δημοσιοποιούνται, θέματα ομαδικής ιδιωτικότητας και ασφάλειας πχ. διευθύνσεις email των διαχειριστών, δεδομένα δραστηριότητας μελών ομάδων κτλ.
Ηθική διαδικασία: Είναι η αξιολόγηση των πιθανών κινδύνων που προκύπτουν από τη δημοσιοποίηση ανοιχτών δεδομένων . Η επιλογή ποιων δεδομένων πρέπει και ποιων δε πρέπει να μοιραζόμαστε και η εξισορρόπηση πιθανών αρνητικών ζητημάτων που προκύπτουν από τη δημοσιοποίηση τους για να χρησιμοποιηθεί ενάντια στο κοινό όφελος.
Νομική διαδικασία: Είναι η συγγραφή συμφωνιών εμπιστευτικότητας και δεοντολογίας χρήσης των ανοιχτών δεδομένων. Μπορεί ο διαμοιρασμος των δεδομένων που είναι ήδη δημοσιοποιημένα, να παρέχει ασφάλεια επειδή τα δεδομένα είναι ήδη δημοσιευμένα, αλλά σε μερικές χώρες, η νομοθεσία για τη συκοφαντία και τη δυσφήμιση θα πρέπει να εξετάζεται σοβαρά. Για παράδειγμα, το GDELT Project, χρησιμοποιεί μερικούς από τους πιο εξελιγμένους αλγορίθμους εξόρυξης δεδομένων για την εξαγωγή «γεγονότων» που αφορούν δίκτυα ανθρώπων, οργανώσεων, τις θέσεις, θέματα, και τις μεταξύ τους σχέσεις αλληλεπίδρασης (GDELT)
Φυσική διαδικασία: Είναι η διαδικασία πού αφορά την αποθηκεύση νέων ανοιχτών δεδομένων και πώς αυτά γίνονται διαθέσιμα.Υπάρχουν πολλές αποθήκες δεδομένων που ειδικεύονται στη φιλοξενία κοινωνικά ορθών ανοιχτών δεδομένων: αυτές περιλαμβάνουν την Humanitarian Data Exchange (HDX), που ειδικεύεται σε δεδομένα που σχετίζονται με καταστροφές, το datahub.io του Open Knowledge Foundation, που αποτελεί μια ισχυρή πλατφόρμα διαχείρισης δεδομένων η οποία βασίζεται στο σύστημα διαχείρισης δεδομένων CKAN.
Τα δεδομένα που παράγονται από το Ushahidi μπορούν να διαμοιραστούν με τη δημοσιοποίησή τους σε ένα Ushahidi instance μέσω ένός API (π.χ crowdmap.com) ή σε μορφή CSV κατόπιν αιτήματος.
Το επίπεδο των μετα–δεδομένων
Η δημοσιοποίηση των ανοιχτών δεδομένων σε επίπεδο μεταδεδομένων εμπεριέχει ερωτήματα όπως: “Ποιος χρειάζεται αυτά τα δεδομένα;” και “πόσο ακριβή πρέπει να είναι τα δεδομένα για αυτούς που τα χρειάζονται;”
Στα ανοιχτά δεδομένα, είναι εξαιρετικά δύσκολο να προβλεφθούν όλοι οι τρόποι με τους οποίους θα χρησιμοποιηθούν, αλλά μερικά παραδείγματα χρηστών των ανοιχτών δεδμένων είναι:
Ακαδημαϊκοί: ανάλυση χρήσης των μέσων κοινωνικής δικτύωσης, της δυναμικής των ομάδων κλπ.
Άνθρωποι σε εταιρίες: για εκπαιδευτικές αναφορές, για απεικονίσεις και ανάλυση θεμάτων όπως είναι το πόσο συχνά έρχεται πληροφορία για επεξεργασία κλπ.
Πόσο γεωγραφικά ακριβή πρέπει να είναι τα δεδομένα που δημοσιεύονται? Για παράδειγμα θα ήταν εντάξει να δημοσιοποιούνται δεδομένα με χαμηλή γεωγραφική ακρίβεια (για παράδειγμα σε επίπεδο πόλης και όχι σε επίπεδο δρόμου);
Χρειάζεται να δημοσιοποιείται κάθε αναφορά? Επειδή οι περισσότερες υλοποιήσεις περιλαμβάνουν πολλά ανεπιθύμητα μηνύματα, θα πρέπει τα συγκεντρωτικά στοιχεία να ανταποκρίνονται ακριβώς στις ανάγκες των ατόμων που τα ζητούν; Για παράδειγμα αν χρειάζονται μόνο ημερομηνίες, τοποθεσίες και κατηγορίες, θα πρέπει να δημοσιεύτει και το κείμενο;
Χρόνος. Όταν δημοσιεύται ένα σύνολο ανοιχτών δεδομένων, θα πρέπει επίσης να υπάρχει και πλάνο για “απόσυρση των δεδομένων”, που σημαίνει ότι πρέπει να υπάρχει ημερομηνία που να δείχνει μέχρι πότε είναι διαθέσιμα τα δεδομένα για τελευταία φορά, και διαδικασία αρχειοθέτησης των δεδομένων και των σχόλιων που τα συνοδεύουν.
Συμπέρασμα
Σε πολλές περιπτώσεις συνόλα δεδομένων που πρέπει να παραμένουν ιδιωτικά, δημοσιοποιήθηκαν, όπως και αντίστροφα. Ως γενική ιδέα η απελευθέρωση των δεδομένων δε θα πρέπει καταρχήν να προκαλεί κάποια βλάβη στο κοινωνικό σύνολο, αλλά να συμβάλει στην ανάπτυξη κρίσιμων κοινωνικών ζητημάτων όπως στην ηλεκτρονική διακυβέρνηση με το άνοιγμα των δεδομένων να αυξάνει τη διαφάνεια, στη πολιτιστική έκφραση για μεγαλύτερη πρόσβαση σε περιεχόμενο και δρώμενα πολιτιστικού χαρακτήρα, στην έρευνα και στην οικονομία όπου τα ανοιχτά δεδομένα πρέπει να αποτελούν βάση για την ανάπτυξη καινοτόμων υπηρεσιών και εργαλείων.
Σχετικοί Σύνδεσμοι:
CrowdMap
https://www.theengineroom.org
https://responsibledata.io
http://opensource.com/business/15/2/open-crowdsourced-data
http://www.ushahidi.com
http://gdeltproject.org
http://www.openstreetmap.org
https://okfn.org