VoxForge, Ένα ακουστικό μοντέλο Ανοιχτού Κώδικα
Το VoxForge ιδρύθηκε για να συλλέξει μεταγραφή ομιλίας (transcription) για χρήση από εργαλεία Αναγνώρισης Ομιλίας του Ελεύθερου και Ανοικτού Κώδικα λογισμικού (Open Source) για Linux / Unix, Windows και Mac.
Θα διαθέσουν όλα τα αρχεία ήχου που έχουν υποβληθεί υπό την άδεια GPL, και στη συνέχεια θα τα συγκεντρώσουν σε Ακουστικά Μοντέλα για χρήση από λογισμικό Open Source για αναγνώρισης ομιλίας, όπως Sphinx, ISIP, Julius και HTK (σημείωση: το HTK έχει περιορισμούς διανομής)
Γιατί χρειαζόμαστε Ελεύθερα GPL αρχεία ομιλίας;
Τα περισσότερα Ακουστικά Μοντέλα που χρησιμοποιούνται από το λογισμικό Αναγνώρισης Ομιλίας (Speech-to-Text) Ανοιχτού Κώδικα είναι “closed source”.
Δεν παρέχουν πρόσβαση στα αρχεία ομιλίας και τις μεταγραφές που χρησιμοποιήθηκαν για να δημιουργήθει το ακουστικό μοντέλο (που ονομάζεται Speech Corpus ή Corpora).
Ο λόγος για αυτό είναι διότι δεν υπάρχουν ελεύθερα Speech Corpus σε μορφή που μπορεί εύκολα να χρησιμοποιηθούν για τη δημιουργία Ακουστικών Μοντέλων για την αναγνώριση ομιλίας.
Έτσι τα προγράμματα Ανοιχτου Λογισμικού χρειάζονται να αγοράσουν Speech Corpora τα οποία έχουν περιοριστικές άδειες χρήσης (δηλ. *δεν* επιτρέπεται να διανείμουν τα πηγαία αρχεία ήχου ομιλίας, αλλά μπορούν να διανείμουν τα “τελικά” Ακουστικά Μοντέλα).
Πώς Μπορώ να Βοηθήσω;
Κάντε κλικ στο εικονίδιο “Sumbit Speech Using Computer” για να μάθετε πώς να καταγράψετε την ομιλία σας στον υπολογιστή σας και να την αποστείλετε στο VoxForge.