Εθνικός Θησαυρός Ελληνικής Γλώσσας Ελληνικά  English  

ΣύνδεσηΣύνδεση   ΕγγραφήΕγγραφή

Εθνικός Θησαυρός Ελληνικής Γλώσσας (ΕΘΕΓ)™

ΑΝΑΚΟΙΝΩΣΕΙΣ

(30/10/2020) Διατίθεται από την Υποδομή Γλωσσικών Πόρων και Τεχνολογιών CLARIN:EL το Golden Corpus του ΕΘΕΓ, το οποίο είναι ένα υποσύνολο του ΕΘΕΓ, μεγέθους 100.000 λέξεων. Όλες οι λέξεις είναι αυτόματα επισημειωμένες μορφολογικά (ως προς το μέρος του λόγου και τη μορφολογική τους ταυτότητα) και η επισημείωση είναι διορθωμένη από γλωσσολόγο, ώστε το αποτέλεσμα να είναι απόλυτα σωστό.

(1/6/2020) Από τον Ιούνιο 2020 ο ΕΘΕΓ διατίθεται για ερευνητικούς σκοπούς ΔΩΡΕΑΝ προς όλους τους χρήστες. Το μόνο που απαιτείται είναι η εγγραφή, προκειμένου να μπορείτε να χρησιμοποιήσετε όλες τις λειτουργικότητες του ΕΘΕΓ.

Ο Εθνικός Θησαυρός της Ελληνικής Γλώσσας (ΕΘΕΓ) είναι ένα ολοκληρωμένο περιβάλλον που έχει αναπτυχθεί από το Ινστιτούτο Επεξεργασίας του Λόγου (ΙΕΛ) / Ε.Κ. "Αθηνά", το οποίο προσφέρει στον μελετητή της γλώσσας το γλωσσικό υλικό (Σώμα Κειμένων) και υπολογιστικά εργαλεία για την επεξεργασία του.

Τι προσφέρει ο ΕΘΕΓ

  • Ο ΕΘΕΓ προσφέρει Σώμα Κειμένων γραπτού λόγου, με σχεδόν 97.000.000 λέξεις. Περισσότερες λεπτομέρειες για το υλικό μπορείτε να βρείτε στη σελίδα Πληροφορίες
  • Ο χρήστης μπορεί:
    • να χρησιμοποιήσει όλο το υλικό ή να επιλέξει κείμενα για να ορίσει υποσύνολο με βάση φίλτρα.
    • να κάνει αναζήτηση στο γλωσσικό υλικό με βάση συγκεκριμένες λέξεις, λήμματα ή μέρη του λόγου. Το σύστημα επιστρέφει τις προτάσεις στις οποίες απαντούν τα αντικείμενα της αναζήτησής του.
    • να κάνει ανάλυση κάποιας λέξης και να πάρει πληροφορίες για τη συχνότητα εμφάνισης της λέξης, με ποιες λέξεις συντάσσεται κ.ά.
    • να δει πληροφορίες για τη συνεμφάνιση δύο λέξεων.

Οι παραπάνω λειτουργικότητες είναι διαθέσιμες στους εγγεγραμμένους χρήστες. Οι επισκέπτες χρήστες έχουν πρόσβαση μόνο στο εργαλείο της Αναζήτησης. Περισσότερες λεπτομέρειες για τα εργαλεία ανάλυσης του ΕΘΕΓ μπορείτε να βρείτε στη σελίδα Βοήθεια.

Το Golden Tagged Corpus

Το Golden Corpus του ΕΘΕΓ είναι ένα υποσύνολο του ΕΘΕΓ, μεγέθους 100.000 λέξεων. Όλες οι λέξεις είναι αυτόματα επισημειωμένες μορφολογικά ως προς το μέρος του λόγου και τη μορφοσυντακτική τους ταυτότητα (όπως όλα τα κείμενα του ΕΘΕΓ), αλλά στο Golden Corpus η επισημείωση και η λημματοποίηση είναι διορθωμένη από γλωσσολόγο, ώστε το αποτέλεσμα να είναι απόλυτα σωστό.

Το Golden Corpus του ΕΘΕΓ διατίθεται ελεύθερα από την Υποδομή Γλωσσικών Πόρων και Τεχνολογιών CLARIN:EL, σε δύο μορφές:

Τα ονόματα "Εθνικός Θησαυρός Ελληνικής Γλώσσας"™ και "Hellenic National Corpus"™ αποτελούν Trademarks (™) του Ινστιτούτου Επεξεργασίας του Λόγου. Η υπηρεσία του ΕΘΕΓ αποτελεί πνευματική ιδιοκτησία του ΙΕΛ/ ΕΚ "Αθηνά" και παρέχεται στον τελικό χρήστη με την επιφύλαξη παντός δικαιώματος.


x
Αυτός ο ιστότοπος χρησιμοποιεί cookies για να σας προσφέρει την καλύτερη εμπειρία χρήσης. Θεωρούμε ότι αποδέχεστε την αποθήκευση όλων των cookies πατώντας το κουμπί "Αποδοχή"
Πολιτική Απορρήτου Πολιτική cookies Αποδοχή