Εκατομμύρια εικόνες ελεύθερες δικαιωμάτων διαθέσιμες στο Flickr Commons

internet_archive_flickrΟ καθηγητής Kalev Leetaru στοχεύει να δημιουργήσει μία βάση δεδομένων με 12 εκατομμύρια αναξιοποίητες ιστορικές εικόνες, χωρίς περιορισμούς πνευματικών δικαιωμάτων, που προέρχονται από περισσότερες από 600 εκατομμύρια σελίδες βιβλίων που έχουν ήδη ψηφιοποιηθεί από το μη κερδοσκοπικό οργανισμό Internet Archive. Μέχρι στιγμής, σύμφωνα με την ανακοίνωση του Flickr, έχουν καταχωρηθεί 1,2 εκατομμύρια εικόνες στο λογαριασμό του Internet Archives στο Flickr Commons μέσω του ειδικού λογισμικού που δημιούργησε ο Kalev Leetaru για το συγκεκριμένο εγχείρημα.

Οι εικόνες προέρχονται από βιβλία δημόσιων βιβλιοθηκών που καλύπτουν τη χρονική περίοδο 1500-1920, τα οποία ψηφιοποιούνται τα τελευταία χρόνια από το Internet Archive και καταλήγουν σε μορφή PDF αρχείου ή απλού κειμένου, το οποίο, όμως, δεν παρείχε τη δυνατότητα αναζήτησης των φωτογραφιών που αποτελούσαν μέρος της εικονογράφησής τους. Οι εικόνες αυτές που χρονολογούνται έως το 1920 έχουν περάσει στο public domain και θεωρούνται κοινό κτήμα, χωρίς περιορισμούς στην χρήση τους.

Το λογισμικό που δημιούργησε ο Kalev Leetaru αξιοποιεί τη διαδικασία του λογισμικού οπτικής αναγνώρισης χαρακτήρων (OCR) που χρησιμοποίησε ο οργανισμός Internet Archive για την ψηφιοποίηση των βιβλίων, το οποίο παρέκαμπτε ό,τι αναγνώριζε ως εικόνα. Με αυτόν τον τρόπο, ο Kalev Leetaru, χρησιμοποίησε το λογισμικό του για να επιστρέψει στα αρχικά σκαναρίσματα των βιβλίων και να αποθηκεύσει σε μορφή αρχείου εικόνας Jpeg τα τμήματα που είχαν απορριφθεί από το λογισμικό OCR. Επιπλέον, έχει καταφέρει να συνοδεύει τα αρχεία εικόνας με επεξηγηματικό κείμενο υπό μορφή λεζάντας, επιλέγοντας το κείμενο που διάβασε το OCR πριν και μετά την φωτογραφία της σκαναρισμένης σελίδας, προσφέροντας ταυτόχρονα τη δυνατότητα αναζήτησης των εικόνων στο Flickr Commons με βάση σχετικές λέξεις-κλειδιά.

«Οι περισσότερες εικόνες που περιέχονται σε αυτά τα βιβλία δεν υπάρχουν σε κανένα μουσείο ανά τον κόσμο και τα περισσότερα πρωτότυπα αρχεία έχουν εξαφανιστεί», δηλώνει ο Kalev Leetaru, τονίζοντας ότι το εγχείρημα αυτό είναι σαν ταξίδι στο χρόνο, μία εικονογράφηση της ιστορίας που δίνει τη δυνατότητα να παρατηρήσει κανείς την αλλαγή στις απεικονίσεις των πραγμάτων και στις κοινωνικές αντιλήψεις για αυτά με την πάροδο του χρόνου.

Ο καθηγητής Kalev Leetaru δηλώνει πρόθυμος να διαθέσει ανοικτά τον κώδικα του λογισμικού που δημιούργησε σε βιβλιοθήκες ανά τον κόσμο, προκειμένου να εξάγουν και αυτές με τη σειρά τους τις εικόνες από τα βιβλία που επιχειρούν να ψηφιοποιήσουν, ενώ απώτερη φιλοδοξία του είναι να χρησιμοποιηθούν οι εικόνες αυτές από τους συντάκτες της Wikipedia, προκειμένου να εμπλουτίσουν και με οπτικό υλικό τα λήμματα , ειδικά εκείνα με ιστορικό περιεχόμενο.

Πηγή: http://www.bbc.com/news/technology-28976849

Αφήστε μια απάντηση