Υπολογιστική γλωσσολογία. Στην Ελλάδα; Με ανάλυση προσωπικότητας μέσω των κειμένων; Και εφαρμογές το εγκληματολογικό profiling (ανάλυση προφίλ) υπόπτων, όπως έχουμε συνηθίσει να βλέπουμε σε αμερικάνικες αστυνομικές σειρές; Στο Πανεπιστήμιο Αθηνών η βάση έχει μπει. Και είναι εκπληκτικό πού μπορούν να σε ταξιδέψουν οι λέξεις.

Ο Γιώργος Μικρός είναι καθηγητής Υπολογιστικής και Ποσοτικής Γλωσσολογίας στο Πανεπιστήμιο Αθηνών, διευθύνει το Εργαστήριο Υπολογιστικής Υφολογίας, κάνει έρευνα σε συνεργασία με μεγάλα γλωσσολογικά κέντρα του κόσμου και σαν Σέρλοκ Χολμς των λέξεων μπορεί να καταλάβει τα περισσότερα απ’ όσα σκεφτόμαστε μόνο μέσα από το γραπτό μας.

Για την ακρίβεια, αναπτύσσει υπολογιστικές μεθόδους ανάλυσης της γλώσσας και αυτόματης εξαγωγής συμπερασμάτων σχετικά με την ταυτότητα των συγγραφέων, τα χαρακτηριστικά τους (φύλο, ηλικία) ή ακόμα και το ψυχολογικό τους προφίλ με βάση τα κείμενά τους.

Το εργαστήριο του Γιώργου Μικρού και η ερευνητική του ομάδα είναι σήμερα ένα διεθνώς αναγνωρισμένο κέντρο ανάλυσης γλωσσικών δεδομένων με σύγχρονες μεθόδους υπολογιστικής και ποσοτικής επεξεργασίας και εφαρμογές από την εκπαίδευση και την εγκληματολογία έως την επίλυση προβλημάτων πατρότητας κειμένων στη λογοτεχνία και τη θεολογία!

«Τα κείμενα μιλάνε για τον συγγραφέα πολλές φορές περισσότερο από ό,τι ο ίδιος ο συγγραφέας για τον εαυτό του» λέει ο Γιώργος Μικρός. Και συνεχίζει: «Την ώρα που γράφουμε επικεντρωνόμαστε στο θέμα μας και την πληροφορία που θέλουμε να μεταδώσουμε, αλλά ταυτόχρονα σε ένα ασυνείδητο επίπεδο μεταδίδουμε πληροφορίες για την ταυτότητά μας, το φύλο μας, την ηλικία μας, την προσωπικότητά μας, ακόμα και για την πολιτική μας ιδεολογία».

Οι εφαρμογές αυτών των μεθόδων είναι εντυπωσιακές. Το 2012 ο Γιώργος Μικρός σε συνεργασία με τις καθηγήτριες Ξανθίππη Δημητρούλια και Ελένη Πολίτου Μαρμαρινού ανέλυσαν για πρώτη φορά με μεθόδους τεχνητής νοημοσύνης αυτόγραφα κείμενα του Παπαδιαμάντη καθώς και τις μεταφράσεις που ο ίδιος έχει κάνει. Το ευφυές υπολογιστικό σύστημα που αναπτύχθηκε ανέλυσε για πρώτη φορά ανώνυμες μεταφράσεις της εποχής και αποφάνθηκε ότι έχουν γίνει από τον μεγάλο λογοτέχνη, διευρύνοντας τη γνωστή εργογραφία του. Η ίδια μέθοδος το 2017 εφαρμόστηκε σε ένα διεθνές λογοτεχνικό μυστήριο, την αποκάλυψη της ταυτότητας του πραγματικού συγγραφέα πίσω από το ψευδώνυμο Ελενα Φεράντε (επιτυχημένη ιταλίδα συγγραφέας του 20ού αιώνα). Μια διεθνής ομάδα γλωσσολόγων, μεταξύ των οποίων και ο Γιώργος Μικρός, ανέλυσαν τα έργα της και κατέληξαν στο ίδιο πρόσωπο: τον ιταλό δημοσιογράφο και λόγιο Domenico Starnone.

Στο Εργαστήριο Υπολογιστικής Υφολογίας όμως η ανάλυση των κειμένων προχωράει και σε άλλες κατευθύνσεις. Οπως η πρόβλεψη διαστάσεων της προσωπικότητας ή και της ιδεολογίας του συγγραφέα. «Μπορούμε να εντοπίσουμε τον ψυχολογικό τύπο του συγγραφέα ή ακόμα και την πολιτική του τοποθέτηση με ακρίβεια που ξεπερνά το 80% εάν έχουμε στη διάθεσή μας μεγάλα κείμενα» δηλώνει ο Γιώργος Μικρός.

Το εργαστήριο συμμετέχει σε μια εθελοντική πρωτοβουλία ψηφιοποίησης και ανάλυσης ελληνικών κοινοβουλευτικών κειμένων σε συνεργασία με τη Βουλή των Ελλήνων και με μια μεγάλη ομάδα πολιτικών επιστημόνων, γλωσσολόγων και επιστημόνων της πληροφορικής στην Ελλάδα και το εξωτερικό.

Ο Γιώργος Μικρός αντιπροσωπεύει την Ελλάδα στο μεγαλύτερο ευρωπαϊκό πρόγραμμα στις Ψηφιακές Ανθρωπιστικές Επιστήμες και σε συνεργασία με την Εθνική Βιβλιοθήκη της Ελλάδος έχει ξεκινήσει την ψηφιοποίηση του μεγαλύτερου σώματος κειμένων νεοελληνικής λογοτεχνίας της περιόδου 1840-1920 σε συνεργασία με ερευνητικά ινστιτούτα από 23 ευρωπαϊκές χώρες, τις ΗΠΑ και την Αυστραλία.

Διδάσκει και σε πανεπιστήμια των ΗΠΑ, όμως πιστεύει ακράδαντα στην Ελλάδα. «Ο χώρος των ανθρωπιστικών σπουδών είναι προνομιακό πεδίο αριστείας για τους έλληνες επιστήμονες» δηλώνει.

Γλωσσάρι

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ

Ο όρος αναφέρεται στον κλάδο της επιστήμης υπολογιστών με αντικείμενο τη σχεδίαση και την υλοποίηση υπολογιστικών συστημάτων που μιμούνται στοιχεία της ανθρώπινης συμπεριφοράς, τα οποία υπονοούν στοιχειώδη ευφυΐα.

ΥΠΟΛΟΓΙΣΤΙΚΗ ΓΛΩΣΣΟΛΟΓΙΑ

Διεπιστημονικός κλάδος που συνδυάζει τη γλωσσολογία και την πληροφορική για να αναπτύξει μεθόδους επεξεργασίας της γλώσσας με τη βοήθεια υπολογιστών. Η υπολογιστική γλωσσολογία υποστηρίζει ένα ευρύ φάσμα εφαρμογών.

ΥΠΟΛΟΓΙΣΤΙΚΗ ΥΦΟΛΟΓΙΑ

Διεπιστημονικός κλάδος που συνδυάζει υπολογιστική γλωσσολογία, τεχνητή νοημοσύνη και ψηφιακές ανθρωπιστικές επιστήμες για να αναλύσει υπολογιστικά το ύφος των κειμένων και να εξαγάγει συμπεράσματα σχετικά με την ταυτότητα και το προφίλ του συγγραφέα.

Τι λέει η «νέα γενιά»

ΑΝΔΡΙΑΝΑ ΚΟΡΑΣΙΔΗ

Οταν αποφοίτησα από το πανεπιστήμιο, η σκέψη να φύγω στο εξωτερικό έγινε εμμονική. Τότε, κάπου εκεί, έμαθα για το διεπιστημονικό μεταπτυχιακό στον κλάδο της υπολογιστικής γλωσσολογίας. Στους κόλπους του ήρθα σε επαφή με τον εξαιρετικά ενδιαφέροντα κλάδο της υφομετρίας. Αποφάσισα λοιπόν να ενταχθώ σ’ αυτό και εκπονώ σήμερα διδακτορική διατριβή ενάντια στις δυσοίωνες προβλέψεις.

* Υποψήφια διδάκτορας

ΔΗΜΗΤΡΗΣ ΜΠΙΛΙΑΝΟΣ

Βασική μου επιδίωξη ήταν να καταφέρω να παραμείνω στην Ελλάδα, χωρίς όμως να χρειαστεί να εγκαταλείψω την έρευνα. Αυτό κατέστη δυνατό χάρη στο εργαστήριό μας, το οποίο μου παρέχει όχι μόνο τον χώρο και τα εργαλεία που χρειάζομαι για την έρευνά μου, αλλά και την εξίσου σημαντική καθημερινή επαφή με τα μέλη της ακαδημαϊκής κοινότητας.

* Υποψήφιος διδάκτορας