Τεχνητή νοημοσύνη: Τι μπορεί να την «τινάξει στον αέρα»

Ειδικοί της τεχνητής νοημοσύνης προειδοποιούν ότι οι επιθέσεις εναντίον συνόλων δεδομένων που χρησιμοποιούνται για την εκπαίδευση εργαλείων μηχανικής μάθησης είναι ανησυχητικά φθηνές και θα μπορούσαν να έχουν σημαντικές συνέπειες.

TANEA Newsroom 04/06/2023, 22:10

Τελευταία Νέα

Ειδικοί Τεχνητής Νοημοσύνης (AI) και μηχανικής μάθησης προειδοποιούν για τον κίνδυνο επιθέσεων δηλητηρίασης δεδομένων που μπορούν να λειτουργήσουν ενάντια στα σύνολα δεδομένων μεγάλης κλίμακας που χρησιμοποιούνται συνήθως για την εκπαίδευση των μοντέλων βαθιάς μάθησης σε πολλές υπηρεσίες AI.

Η δηλητηρίαση δεδομένων συμβαίνει όταν οι εισβολείς παραβιάζουν τα δεδομένα εκπαίδευσης που χρησιμοποιούνται για τη δημιουργία μοντέλων βαθιάς μάθησης. Αυτή η ενέργεια σημαίνει ότι είναι δυνατό να επηρεαστούν οι αποφάσεις που παίρνει η τεχνητή νοημοσύνη με τρόπο που είναι δύσκολο να εντοπιστεί.

Μεταβάλλοντας κρυφά τις πληροφορίες πηγής που χρησιμοποιούνται για την εκπαίδευση αλγορίθμων μηχανικής μάθησης, οι επιθέσεις δηλητηρίασης δεδομένων έχουν τη δυνατότητα να είναι εξαιρετικά ισχυρές επειδή η τεχνητή νοημοσύνη θα μαθαίνει από λανθασμένα δεδομένα και θα μπορούσε να λάβει «λανθασμένες» αποφάσεις με σημαντικές συνέπειες.

Προς το παρόν δεν υπάρχουν στοιχεία για επιθέσεις στον πραγματικό κόσμο που να περιλαμβάνουν δηλητηρίαση συνόλων δεδομένων κλίμακας ιστού. Αλλά τώρα μια ομάδα ερευνητών τεχνητής νοημοσύνης και μηχανικής μάθησης από την Google, το ETH Zurich, τη NVIDIA και τη Robust Intelligence σε μελέτη που δημοσίευσε το Πανεπιστήμιο Cornell λένε ότι έχουν αποδείξει την πιθανότητα επιθέσεων δηλητηρίασης που «εγγυώνται» ότι κακόβουλα παραδείγματα θα εμφανιστούν σε σύνολα δεδομένων κλίμακας ιστού που χρησιμοποιούνται για εκπαίδευση από τα μεγαλύτερα μοντέλα μηχανικής μάθησης.

«Ενώ τα μεγάλα μοντέλα βαθιάς μάθησης είναι ανθεκτικά στον τυχαίο θόρυβο, ακόμη και ελάχιστες ποσότητες αντίθετου θορύβου σε προπονητικά σετ (δηλαδή επίθεση δηλητηρίασης) αρκούν για να εισάγουν στοχευμένα λάθη στη συμπεριφορά του μοντέλου», προειδοποιούν οι ερευνητές.

Οι ερευνητές ανέφεραν ότι χρησιμοποιώντας τις τεχνικές που επινόησαν για να εκμεταλλευτούν τον τρόπο με τον οποίο λειτουργούν τα σύνολα δεδομένων, θα μπορούσαν να έχουν δηλητηριάσει το 0,01% των σημαντικών συνόλων δεδομένων βαθιάς μάθησης με λίγη προσπάθεια και με χαμηλό κόστος. Ενώ το 0,01% δεν ακούγεται σαν πολλά σύνολα δεδομένων, οι ερευνητές προειδοποιούν ότι είναι «αρκετό για να δηλητηριάσει ένα μοντέλο».

«Δηλητηρίαση διαχωρισμένης άποψης»

Αυτή η επίθεση είναι γνωστή ως «δηλητηρίαση διαχωρισμένης άποψης». Εάν ένας εισβολέας μπορούσε να αποκτήσει τον έλεγχο ενός πόρου στο διαδίκτυο που έχει ενταχθεί σε ευρετήριο από ένα συγκεκριμένο σύνολο δεδομένων, θα μπορούσε να δηλητηριάσει τα δεδομένα που συλλέγονται, καθιστώντας τα ανακριβή, με τη δυνατότητα να επηρεάσει αρνητικά ολόκληρο τον αλγόριθμο.

Ένας τρόπος με τον οποίο οι εισβολείς μπορούν να επιτύχουν αυτόν τον στόχο είναι αγοράζοντας απλώς ληγμένους ιστότοπους-domain names. Οι ιστότοποι λήγουν σε τακτική βάση και στη συνέχεια μπορούν να αγοραστούν από κάποιον άλλο — που είναι μια τέλεια ευκαιρία για κάποιον που θέλει να δηλητηριάσει δεδομένα. Οι μελετητές δείχνουν ότι με λιγότερο από $10.000 μπορούν να αγοράσουν ικανό ποσοστό κάποιου ληγμένου ιστότοπου για να αλλοιώσουν τα δεδομένα αρκετά για τον σκοπό τους.

«Ο αντίπαλος δεν χρειάζεται να γνωρίζει την ακριβή ώρα κατά την οποία οι πελάτες θα κάνουν λήψη του πόρου στο μέλλον: με την κατοχή του τομέα, ο αντίπαλος εγγυάται ότι οποιαδήποτε μελλοντική λήψη θα συλλέγει δηλητηριασμένα δεδομένα», είπαν οι ερευνητές.

Οι ερευνητές επισημαίνουν ότι η αγορά ενός τέτοιου ιστότοπου και η εκμετάλλευσή του για κακόβουλους σκοπούς δεν είναι μια νέα ιδέα – οι εγκληματίες του κυβερνοχώρου το χρησιμοποιούν για να βοηθήσουν στη διάδοση κακόβουλου λογισμικού. Αλλά οι επιτιθέμενοι με διαφορετικές προθέσεις θα μπορούσαν ενδεχομένως να δηλητηριάσουν ένα εκτεταμένο σύνολο δεδομένων.

Διαπίστωσαν επίσης ότι υπάρχει άμεση σχέση μεταξύ της παλαιότητας ενός συνόλου δεδομένων και πόσο εύκολο είναι να δηλητηριαστεί. Παλαιότερα σύνολα δεδομένων είναι πιο πιθανό να περιέχουν τομείς που έχουν λήξει, και επομένως ένας αντίπαλος μπορεί να αγοράσει μεγαλύτερο μέρος του συνόλου δεδομένων.

Πρωτογενής δηλητηρίαση

Επιπλέον, οι ερευνητές έχουν περιγράψει λεπτομερώς έναν δεύτερο τύπο επίθεσης που αποκαλούν πρωτογενή δηλητηρίαση.

Σε αυτήν την περίπτωση, ο εισβολέας δεν έχει τον πλήρη έλεγχο του συγκεκριμένου συνόλου δεδομένων — αλλά είναι σε θέση να προβλέψει με ακρίβεια πότε θα γίνει πρόσβαση σε έναν πόρο του διαδικτύου για συμπερίληψη σε ένα στιγμιότυπο δεδομένων. Με αυτή τη γνώση, ο εισβολέας μπορεί να δηλητηριάσει το σύνολο δεδομένων λίγο πριν συλλεχθούν οι πληροφορίες.

Ακόμα κι αν οι πληροφορίες επανέλθουν στην αρχική, μη επεξεργασμένη μορφή μετά από λίγα μόλις λεπτά, το σύνολο δεδομένων θα εξακολουθεί να είναι λανθασμένο στο στιγμιότυπο που τραβήχτηκε όταν ήταν ενεργή η κακόβουλη επίθεση.

Ένας πόρος στον οποίο βασίζεται σε μεγάλο βαθμό για την προμήθεια δεδομένων κατάρτισης μηχανικής μάθησης είναι η Wikipedia. Αλλά η φύση της Wikipedia σημαίνει ότι ο καθένας μπορεί να την επεξεργαστεί — και σύμφωνα με τους ερευνητές, ένας εισβολέας “μπορεί να δηλητηριάσει ένα εκπαιδευτικό σύνολο που προέρχεται από τη Wikipedia κάνοντας κακόβουλες επεξεργασίες”.

Τα σύνολα δεδομένων της Wikipedia δεν βασίζονται στη ζωντανή σελίδα, αλλά στιγμιότυπα που λαμβάνονται σε μια συγκεκριμένη στιγμή — πράγμα που σημαίνει ότι οι εισβολείς που χρονομετρούν σωστά την παρέμβασή τους θα μπορούσαν να επεξεργαστούν κακόβουλα τη σελίδα και να αναγκάσουν το μοντέλο να συλλέξει ανακριβή δεδομένα, τα οποία θα αποθηκευτούν μόνιμα στο σύνολο δεδομένων .

“Ένας εισβολέας που μπορεί να προβλέψει πότε θα γίνει απόξεση μιας σελίδας της Wikipedia για συμπερίληψη στο επόμενο στιγμιότυπο, μπορεί να πραγματοποιήσει δηλητηρίαση αμέσως πριν από την απόξεση. Ακόμα κι αν η επεξεργασία επανέλθει γρήγορα στη ζωντανή σελίδα, το στιγμιότυπο θα περιέχει το κακόβουλο περιεχόμενο — για πάντα, ” έγραψαν στην μελέτη οι ερευνητές.

Ο τρόπος με τον οποίο η Wikipedia χρησιμοποιεί ένα καλά τεκμηριωμένο πρωτόκολλο για την παραγωγή στιγμιότυπων σημαίνει ότι είναι δυνατό να προβλεφθούν οι χρόνοι στιγμιότυπων μεμονωμένων άρθρων με υψηλή ακρίβεια. Οι ερευνητές προτείνουν ότι είναι δυνατό να εκμεταλλευτεί αυτό το πρωτόκολλο για να δηλητηριάσει τις σελίδες της Wikipedia με ποσοστό επιτυχίας 6,5%.

Αυτό το ποσοστό μπορεί να μην ακούγεται υψηλό, αλλά ο τεράστιος αριθμός σελίδων της Wikipedia και ο τρόπος με τον οποίο χρησιμοποιούνται για την εκπαίδευση συνόλων δεδομένων μηχανικής εκμάθησης σημαίνει ότι θα ήταν δυνατό να τροφοδοτηθούν ανακριβείς πληροφορίες στα μοντέλα.

Οι ερευνητές σημειώνουν ότι δεν επεξεργάστηκαν καμία ζωντανή σελίδα της Wikipedia και ότι ειδοποίησαν τη Wikipedia για τις επιθέσεις και τα πιθανά μέσα άμυνας εναντίον τους ως μέρος της διαδικασίας υπεύθυνης αποκάλυψης.

Οι ερευνητές σημειώνουν επίσης ότι ο σκοπός της δημοσίευσης της εργασίας είναι να ενθαρρύνει άλλους στον χώρο ασφαλείας να διεξάγουν τη δική τους έρευνα για το πώς να υπερασπιστούν την τεχνητή νοημοσύνη και τα συστήματα μηχανικής μάθησης από κακόβουλες επιθέσεις.

«Η δουλειά μας είναι μόνο ένα σημείο εκκίνησης για την κοινότητα να αναπτύξει μια καλύτερη κατανόηση των κινδύνων που συνεπάγεται η δημιουργία μοντέλων από δεδομένα κλίμακας ιστού», ανέφερε η μελέτη.

Πηγή: ΟΤ

Σχόλια

Τελευταία Νέα

Δείτε επίσης

Θεσσαλονίκη: Δώρο ζωής από 64χρονο δότη που νοσηλευόταν στο «Γ. Παπανικολάου»

Μαύρη Σελήνη: Η νύχτα που το φεγγάρι εξαφανίζεται – Το σπάνιο φαινόμενο που θα μας αφήσει στο σκοτάδι

Bloomberg για Βενεζουέλα: Για να ανθίσει ο πετρελαϊκός τομέας θα απαιτηθεί σταθερότητα

Επιστήμη & Τεχνολογία

Έρευνα σοκ: Στην πιο προηγμένη χώρα του κόσμου τις μαθητικές εργασίες τις κάνει όλες το Α.Ι.

Σχεδόν 95% των μαθητών γυμνασίου και λυκείου στη Σεούλ έχουν χρησιμοποιήσει εργαλεία τεχνητής νοημοσύνης (AI), σύμφωνα με έρευνα που δημοσιεύθηκε στις 11 Ιανουαρίου, ενώ πάνω από το 90% των εκπαιδευτικών εκφράζουν ανησυχία για την αυξανόμενη εξάρτηση των μαθητών από τέτοιες τεχνολογίες. Η μελέτη του Ινστιτούτου Ερευνών και Πληροφόρησης Εκπαίδευσης της Σεούλ, που πραγματοποιήθηκε τον Ιούλιο του […]

11/01/2026 16:45

Έρευνα σοκ: Στην πιο προηγμένη χώρα του κόσμου τις μαθητικές εργασίες τις κάνει όλες το Α.Ι.

Υγεία

Μονόδρομος η επιστροφή στο παρελθόν για την προσωπική μας εξέλιξη

Η δύναμη της επιστροφής δεν ταυτίζεται με την απλή επανάληψη. Η επανάληψη είναι μηχανική· κάνουμε το ίδιο πράγμα περιμένοντας το ίδιο αποτέλεσμα. Η επιστροφή, αντίθετα, είναι ένας διάλογος — φέρνουμε όσα έχουμε γίνει πίσω σε ό,τι κάποτε νομίζαμε ότι γνωρίζαμε. Κάθε επιστροφή προσθέτει ένα νέο στρώμα εμπειρίας. Όχι επειδήη στιγμή έχουν αλλάξει, αλλά επειδή εμείς […]

11/01/2026 16:25

Μονόδρομος η επιστροφή στο παρελθόν για την προσωπική μας εξέλιξη

Επιστήμη & Τεχνολογία

Τεχνητή νοημοσύνη: Ο νέος Προμηθέας για την ανθρωπότητα που δεν καταλαβαίνει τι κάνει

Τεχνητή νοημοσύνη και συνείδηση φαίνεται να συγκλίνουν σε μια νέα εποχή, όπου τα όρια ανάμεσα στον άνθρωπο και τη μηχανή επαναπροσδιορίζονται. Πολλοί αναφέρουν ότι νιώθουν περισσότερο κατανοητοί από τα μεγάλα γλωσσικά μοντέλα παρά από τον σύντροφο ή τον θεραπευτή τους. Το φαινόμενο αυτό αποτυπώνει μια βαθιά πολιτισμική και ψυχολογική μετατόπιση που θα ήταν αδιανόητη πριν […]

11/01/2026 16:13

Τεχνητή νοημοσύνη: Ο νέος Προμηθέας για την ανθρωπότητα που δεν καταλαβαίνει τι κάνει

Επιστήμη & Τεχνολογία

Έρχεται η «Σελήνη του Χιονιού»: Πότε κορυφώνεται η πιο «παγωμένη» πανσέληνος του χρόνου

Η Πανσέληνος του Φεβρουαρίου είναι γνωστή ως «Σελήνη του Χιονιού», ονομασία που προέρχεται από το χιόνι που καλύπτει συνήθως το έδαφος αυτή την εποχή. Ορισμένες φυλές ιθαγενών της Βόρειας Αμερικής την αποκαλούσαν και «Σελήνη της Πείνας» ή «Σελήνη της Αρκούδας». Η Σελήνη του Χιονιού τα επόμενα χρόνια Το 2026, η Σελήνη του Χιονιού θα κορυφωθεί […]

11/01/2026 14:58

Έρχεται η «Σελήνη του Χιονιού»: Πότε κορυφώνεται η πιο «παγωμένη» πανσέληνος του χρόνου

Επιστήμη & Τεχνολογία 3

Νέο γιγαντιαίο ανακόντα στον Αμαζόνιο: Η στιγμή που επιστήμονες το εντόπισαν (video)

Σπάνιο οπτικό υλικό δείχνει τη στιγμή της ανακάλυψης νέου είδους – Κρίσιμα συμπεράσματα για τη βιοποικιλότητα και τη ρύπανση

Γιώργος Μαζιάς

11/01/2026 13:08

Τεχνητή νοημοσύνη: Τι μπορεί να την «τινάξει στον αέρα»

«Δηλητηρίαση διαχωρισμένης άποψης»

Πρωτογενής δηλητηρίαση

Δείτε επίσης

Θεσσαλονίκη: Δώρο ζωής από 64χρονο δότη που νοσηλευόταν στο «Γ. Παπανικολάου»

Μαύρη Σελήνη: Η νύχτα που το φεγγάρι εξαφανίζεται – Το σπάνιο φαινόμενο που θα μας αφήσει στο σκοτάδι

Bloomberg για Βενεζουέλα: Για να ανθίσει ο πετρελαϊκός τομέας θα απαιτηθεί σταθερότητα

Δημοφιλή

Κληρονομιά χωρίς μπελάδες: Τέλος τα «αδελφομοίρια»ι αλλάζει για συζύγους, παιδιά και συντρόφους

Νέο γιγαντιαίο ανακόντα στον Αμαζόνιο: Η στιγμή που επιστήμονες το εντόπισαν (video)

Η διαθήκη-παγίδα: Το μυστικό που δεν θέλουν να μάθουν οι κληρονόμοι

Δώρα Ζέμπερη: Με σχεδόν 150.000 ευρώ θα αποζημιώσει ο Δήμος Αθηναίων τον πατέρα της δολοφονημένης γυναίκαςο έ

Συνταξιούχοι, τσεκάρετε τους λογαριασμούς: Έρχονται αναδρομικά έως 8.000€ - Οι τρεις κατηγορίες δικαιούχωνΑ

«Πείτε στον Τραμπ να ξεχάσει τις αμερικανικές βάσεις στην Ευρώπη»ι προτείνει Αμερικανός αρχιστράτηγος

«Χρυσά» τρακτέρ

Τέλος τα κενά: Η ελεύθερη συμβίωση αποκτά δικαιώματα κληρονομιάς!

Κηφισιά: Πώς μια ψεύτικη διαρροή ρεύματος οδήγησε σε ληστεία μισού εκατομμυρίου από ζευγάρι ηλικιωμένων

Συγκλονίζει η Λόρα από το «Μικρό Σπίτι στο Λιβάδι»: Ήμουν παιδί, με ανάγκασαν να τον φιλήσω στα γυρίσματα

Έρευνα σοκ: Στην πιο προηγμένη χώρα του κόσμου τις μαθητικές εργασίες τις κάνει όλες το Α.Ι.

Μονόδρομος η επιστροφή στο παρελθόν για την προσωπική μας εξέλιξη

Τεχνητή νοημοσύνη: Ο νέος Προμηθέας για την ανθρωπότητα που δεν καταλαβαίνει τι κάνει

Έρχεται η «Σελήνη του Χιονιού»: Πότε κορυφώνεται η πιο «παγωμένη» πανσέληνος του χρόνου

Νέο γιγαντιαίο ανακόντα στον Αμαζόνιο: Η στιγμή που επιστήμονες το εντόπισαν (video)

Ιδιοκτησία

Μέλος

Όλα τα θέματα