Loading…
Screen Shot 2014-10-31 at 3.23.04 AM

Terrier: Μια εξαιρετικά ευέλικτη, αποδοτική και αποτελεσματική μηχανή αναζήτησης ανοιχτού κώδικα

terrier-logo-large-transparentΤο Terrier είναι μία πολύ ευέλικτη, αποτελεσματική και αποδοτική μηχανή αναζήτησης,  Aνοιχτού κώδικα, που αναπτύσσεται γρήγορα για μεγάλες συλλογές εγγράφων.

Υλοποιεί προηγμένες λειτουργίες ευρετηρίασης και ανάκτησης δεδομένων, και αποτελεί ιδανική πλατφόρμα για γρήγορη ανάπτυξη και αξιολόγηση αιτημάτων ανάκτησης μεγάλης κλίμακας.

Είναι λογισμικό ανοιχτού κώδικα (ΕΛ/ΛΑΚ) και είναι μια περιεκτική και ευέλικτη πλατφόρμα για έρευνα και πειραματισμό στην ανάκτηση κειμένου.  Η έρευνα διεξάγεται εύκολα σε standard TREC (Text Retrieval Conference και CLEF συλλογές δοκιμής.

Είναι υλοποιημένο σε Java, και έχει αναπτυχθεί στο School of Computing Science, University of Glasgow.

Υπάρχει διαθέσιμο εδώ  και η τελευταία έκδοση του terrier.org  4.0, κυκλοφόρησε στις 18/06/2014. για Unix/Linux/MacOS X  & για Windows

H πλήρης τεκμηρίωση της έκδοσης terrier 4.0 υπάρχει διαθέσιμη  εδώ , και εδώ .

Αν είστε δημιουργός λογισμικού ή προγραμματιστής, ως πλατφόρμα ανοικτού κώδικα το terrier.org δέχεται εισφορές επεκτάσεων και βελτιώσεων.

Παρουσιάζονται συνοπτικά τα χαρακτηριστικά του :

Αποδοτικό


Το Terrier μπορεί να κατατάσσει σε πίνακα (index) μεγάλο όγκο εγγράφων, και να παρέχει πολλαπλές στρατηγικές ευρετηρίασης όπως multipass, singlepass και ευρετηρίαση largescale MapReduce. Η ευρετηρίαση σε πραγματικό χρόνο για ροές εγγράφων υποστηρίζεται επίσης μέσω προσαρμόσιμων δομών πινάκων.

Αποτελεσματικό


Παρέχονται προηγμένες τεχνικές ανάκτησης, όπως Divergence From Randomness, BM25F, καθώς και term dependence proximity models. Επίσης υπάρχει ενσωματωμένη υποστήριξη για μοντέλα εποπτευόμενης κατάταξης μέσω Learning to Rank.

Ευέλικτο


Το Terrier είναι ιδανικό για την πραγματοποίηση πειραμάτων ανάκτησης πληροφορίας. Μπορεί να κατατάξει σε πίνακα και να εκτελέσει μαζικά πειράματα ανάκτησης για όλες τις γνωστές συλλογές TREC test. Περιλαμβάνονται επιπλέον εργαλεία για την αξιολόγηση των πειραμάτων.

Πολύγωσσο


Το Terrier χρησιμοποιεί εσωτερικά UTF και μπορεί να υποστηρίξει κείμενα που είναι γραμμένα σε γλώσσα διαφορετική από τα αγγλικά.

Επεκτάσιμο


Υποστηρίζει αρχιτεκτονική λογικής “plugin” , και είναι εύκολο να επεκταθεί για να αναπτύξει νέες τεχνικές ανάκτησης, να προσθέσει νέα χαρακτηριστικά κατάταξης, ή να πειραματιστεί με χαμηλού επιπέδου λειτουργικότητα, όπως συμπίεση πίνακα.

Διαδραστικό


Παρουσιάζει τα αποτελέσματα της αναζήτησής σας σε μία εύχρηστη εφαρμογή στην επιφάνεια εργασίας, online,  χρησιμοποιώντας JSP web interfaces, ή χρησιμοποιώντας μια διαθέσιμη εφαρμογή διαδικτυακής αναζήτησης.

 

 

Αφήστε μια απάντηση