Εκδηλώσεις

Περισσότερα »


Greek Corpus 20

Το πρόγραμμα Διαχρονικό σώμα ελληνικών κειμένων του 20ού αιώνα, που χρηματοδοτείται στο πλαίσιο της πράξης ΑΡΙΣΤΕΙΑ από το Ευρωπαϊκό Κοινωνικό Ταμείο και από Εθνικούς Πόρους (Γενική Γραμματεία Έρευνας και Τεχνολογίας), περιλαμβάνει τη συγκρότηση και ανάλυση ενός διαχρονικού σώματος κειμένων (corpus) της Ελληνικής του 20ού αιώνα. Η Ελληνική, σε αντίθεση με άλλες γλώσσες, δεν έχει επωφεληθεί επαρκώς έως τώρα από τις τεράστιες προόδους στο ευρύτερο ερευνητικό πεδίο της ανάπτυξης και αξιοποίησης γλωσσικών σωμάτων κειμένων. Το πρόγραμμα στοχεύει να καλύψει αυτό το κενό με την ανάπτυξη ενός σώματος κειμένων της Ελληνικής 20 εκατ. λέξεων, που θα ενσωματωθεί στο προϋπάρχον Σώμα Ελληνικών Κειμένων (ΣΕΚ, μέγεθος: 30 εκατ. λέξεις, περιλαμβάνει κείμενα από το 1990 έως το 2010).

 

Ευχαριστίες:

Σταματία Κουτσουλέλου-Μίχου (ΕΚΠΑ)

Μαριάννα Σμαραγδή (Lund University)