Midjourney, Stable Diffusion, Craiyon, DALL-E. Αγνωστα στους περισσότερους, τα προγράμματα αυτά βρίσκονται πίσω από τις εικόνες που έχουν πλημμυρίσει το τελευταίο διάστημα τα μέσα κοινωνικής δικτύωσης και μοιάζουν με ρεαλιστικές φωτογραφίες, ενώ στην πραγματικότητα δεν είναι τίποτε άλλο παρά δημιουργήματα αλγορίθμων τεχνητής νοημοσύνης (AI). Από τις εικόνες της υποτιθέμενης σύλληψης του Ντόναλντ Τραμπ μέχρι τη φωτογραφία του Πάπα με εντυπωσιακό λευκό μπουφάν, η… πραγματική εικονική πραγματικότητα εξαπλώνεται ραγδαία και δημιουργεί σύγχυση.
«Τα προγράμματα αυτά χρησιμοποιούνται για την επεξεργασία και τη δημιουργία εικόνων και κινούμενων σχεδίων, με σκοπό τη βελτίωση της ποιότητας και της ρεαλιστικότητάς τους. Η χρήση τεχνητής νοημοσύνης – και ιδιαίτερα της βαθιάς μάθησης – τους επιτρέπει να αναγνωρίζουν και να αντιλαμβάνονται χαρακτηριστικά των εικόνων και των σχεδίων και να τα αναπαράγουν με μεγαλύτερη ακρίβεια και φυσικότητα», εξηγεί στα «ΝΕΑ» ο Σταύρος Καπερώνης, του Τμήματος Επικοινωνίας, Μέσων και Πολιτισμού του Παντείου Πανεπιστημίου.
Εκπαιδεύονται να μας εξαπατούν
«Ουσιαστικά όσο περισσότερο τα “εκπαιδεύεις” και τα τροφοδοτείς με δεδομένα, τόσο πιο λεπτομερή εικόνα σου δίνουν», σημειώνει, από την πλευρά του, ο ερευνητής του Αστεροσκοπείου Αθηνών Μάνος Σαριδάκης, ο οποίος παρομοιάζει τα προγράμματα τεχνητής νοημοσύνης με τα μικρά παιδιά που μαθαίνουν να αναγνωρίζουν αντικείμενα και πρόσωπα. Σύμφωνα με τον ίδιο, αφού «εκπαιδευτούν» με όλη την πληροφορία που υπάρχει στο Διαδίκτυο, μπορούν ακαριαία να συνθέσουν μία εικόνα σε τόσο ακριβή βαθμό που να είναι αδύνατον να γίνει αντιληπτό ότι δεν είναι πραγματική.
Το Midjourney, για παράδειγμα, είναι πρόγραμμα που χρησιμοποιείται για τη δημιουργία εικόνων υψηλής ανάλυσης και συγκεκριμένα για την επεξεργασία τους με τη χρήση ενός αλγορίθμου που ονομάζεται Progressive Growing of GANs (Generative Adversarial Networks). Ο αλγόριθμος αυτός επιτρέπει να δημιουργούνται εικόνες υψηλής ανάλυσης με αυξανόμενη ακρίβεια καθώς επαναλαμβάνεται η διαδικασία της εκπαίδευσης του αλγορίθμου. Το πρόγραμμα λειτουργεί μέσω της πλατφόρμας Discord. Από την άλλη, το DALL-E είναι πρόγραμμα που αναπτύχθηκε από την OpenAI – όπως και το γνωστό chatGPT – και χρησιμοποιείται για τη δημιουργία εικόνων με βάση περιγραφές κειμένου. Ο αλγόριθμός του, δηλαδή, μπορεί να μετατρέψει περιγραφές κειμένου σε εικόνες, χρησιμοποιώντας έναν συνδυασμό τεχνητής νοημοσύνης και βαθιάς μάθησης.Το Stable Diffusion είναι πρόγραμμα που χρησιμοποιείται για την παραγωγή εικόνων με τη χρήση ενός αλγορίθμου αντίστροφης διάχυσης. «Η αντίστροφη διάχυση είναι η διαδικασία επαναφοράς μιας εικόνας στην αρχική της κατάσταση, πριν υποστεί επεξεργασία μέσω διάχυσης δηλαδή», διευκρινίζει ο Σταύρος Καπερώνης και προσθέτει ότι ο αλγόριθμος λειτουργεί παρόμοια με την αντίστροφη συνέλιξη, που χρησιμοποιείται συνήθως για την αποκατάσταση εικόνας και επιτρέπει στο πρόγραμμα να δημιουργεί εικόνες υψηλής ποιότητας και ρεαλιστικότητας. Για τη δημιουργία κινούμενων σχεδίων μπορεί κανείς να χρησιμοποιήσει το Craiyon.
Χρήστες σε σύγχυση
Η ολοένα και πιο συχνή εμφάνιση εικόνων στο Διαδίκτυο, που ενώ είναι προϊόντα τεχνητής νοημοσύνης χαρακτηρίζονται από υψηλό βαθμό αληθοφάνειας, προκαλεί σύγχυση στους χρήστες του Διαδικτύου και απειλεί να οδηγήσει σε μια συνολικότερη αμφισβήτηση της αλήθειας. Τι πρέπει, λοιπόν, να προσέχουμε κάθε φορά για να μην πέφτουμε θύματα ψηφιακών απατών.
Για τον Σταύρο Καπερώνη «η καλύτερη προσέγγιση είναι να είμαστε επιφυλακτικοί και να διερευνούμε πάντα την ακρίβεια των πληροφοριών που λαμβάνουμε πριν τις υιοθετήσουμε». Εάν μια εικόνα μάς φαίνεται ύποπτη ή αμφίβολη, «μπορούμε να κάνουμε report (αναφορά) στη δημοσίευση, να μην προχωρήσουμε σε αναδημοσίευση και να γνωστοποιήσουμε στους διαδικτυακούς μας φίλους ότι πρόκειται για κακόβουλο υλικό».
Υπάρχουν, όμως, και μέθοδοι που επιτρέπουν να αναγνωρίσουμε εάν μία φωτογραφία είναι πραγματική ή προϊόν επεξεργασίας σε πλατφόρμα ΑΙ. Μεταξύ άλλων, προτείνεται να επιβεβαιώνουμε την πηγή της εικόνας και τα γεγονότα που περιγράφονται σε αυτήν και να αναζητούμε άλλες φωτογραφίες από τα συμβάντα προκειμένου να συγκρίνουμε.
Μια άλλη επιλογή είναι η αναστροφή εικόνας (Reverse Image Search). «Εισάγοντάς την σε μηχανές αναζήτησης μπορούμε να διαπιστώσουμε αν έχει εμφανιστεί ξανά στο παρελθόν, αν χρησιμοποιείται σε λάθος πλαίσιο και να βρούμε το άτομο που τη δημιούργησε», εξηγεί ο Θεόφιλος Μπλουδάνης, fact checker για το Γαλλικό Πρακτορείο Ειδήσεων. «Ας παρατηρήσουμε τις λεπτομέρειές της. Ενα από τα μεγάλα προβλήματα αυτών των λογισμικών είναι ότι δυσκολεύονται να δημιουργήσουν ρεαλιστικά χέρια», σημειώνει. Βέβαια η τεχνολογία εξελίσσεται και σύντομα ούτε στις λεπτομέρειες θα βλέπουμε διαφορά… Με τα παραπάνω συμφωνεί και ο Μάνος Σαριδάκης, που προειδοποιεί ότι μέσα στα επόμενα 20 χρόνια οι αλλαγές θα είναι μεγάλες. «Η τεχνητή νοημοσύνη μπορεί να παίξει εξαιρετικά αρνητικό αλλά και εξαιρετικά θετικό ρόλο στην καθημερινότητά μας. Αλλωστε, ήδη δηλώνει παρούσα και μάλιστα πιο γρήγορα από ό,τι φανταζόμασταν. Οπως άλλαξε κάποτε η ζωή μας με το Διαδίκτυο, το ίδιο θα συμβεί και τώρα με τα προγράμματα αυτά», καταλήγει.