Δευτέρα 23/12/2024

Με ποιο βιβλίο τα βρίσκει σκούρα η Τεχνητή Νοημοσύνη;

TANEA Newsroom 25/05/2023, 19:52

Διαβάστε Επίσης

Ευρώπη: Οι περιφέρειες με τα περισσότερα… άδεια πορτοφόλια

Ποιες αποφάσεις θα πάρει ο Μητσοτάκης στα βουνά της Κρήτης

Αγορές: Για «Santa rally» ελπίζουν οι επενδυτές καθώς οι μετοχές ρίχνουν ταχύτητα

Η Αθήνα απαντά με χάρτες στα τουρκικά τρικ στη Μεσόγειο

Επιστήμη & Τεχνολογία

Με ποιο βιβλίο τα βρίσκει σκούρα η Τεχνητή Νοημοσύνη;

Οι ερευνητές ισχυρίζονται ότι τα εργαλεία τους μπορούν να συνομιλούν σε περισσότερες από 1.000 γλώσσες

Σκούρα φαίνεται να τα βρίσκουν τα μοντέλα τεχνητής νοημοσύνης της Meta τα οποία «εκπαιδεύονται» με τη Βίβλο ώστε να αναγνωρίζουν και να παράγουν ομιλία για περισσότερες από 1.000 γλώσσες.

Η εταιρεία κυκλοφορεί τα νέα της μοντέλα γλώσσας μέσω της υπηρεσίας GitHub, έτσι ώστε οι προγραμματιστές που εργάζονται σε διαφορετικές γλώσσες να μπορούν να δημιουργήσουν νέες, πιο ποικίλες εφαρμογές ομιλίας.

Τα νέα μοντέλα εκπαιδεύτηκαν σε δύο σύνολα δεδομένων: ένα που περιέχει ηχογραφήσεις της Καινής Διαθήκης σε 1.107 γλώσσες και ένα άλλο που περιέχει ηχογραφήσεις -χωρίς κατηγοριοποίηση- της Καινής Διαθήκης σε 3.809 γλώσσες.

Στην συνέχεια, η ομάδα επεξεργάστηκε τον ήχο ομιλίας και τα δεδομένα κειμένου για να βελτιώσει την ποιότητά του προτού εκτελέσει έναν αλγόριθμο σχεδιασμένο να ευθυγραμμίζει τις ηχογραφήσεις με το συνοδευτικό κείμενο. Η διαδικασία επανελήφθη με έναν δεύτερο αλγόριθμο εκπαιδευμένο στα πρόσφατα ευθυγραμμισμένα δεδομένα. Με αυτή τη μέθοδο, οι ερευνητές μπόρεσαν να διδάξουν τον αλγόριθμο να μαθαίνει μια νέα γλώσσα πιο εύκολα, ακόμη και χωρίς το συνοδευτικό κείμενο.

Η εταιρεία ελπίζει τώρα ότι αυτοί οι αλγόριθμοι θα βοηθήσουν στη διατήρηση γλωσσών που κινδυνεύουν να εξαφανιστούν.

7.000 γλώσσες περιμένουν

Οι ερευνητές ισχυρίζονται τώρα ότι τα μοντέλα τους μπορούν να συνομιλούν σε περισσότερες από 1.000 γλώσσες, αλλά αναγνωρίζουν περισσότερες από 4.000.

Ωστόσο, υπάρχουν 7.000 γλώσσες παγκοσμίως τις οποίες δεν «καλύπτει» όλρε το εργαλείο της Meta. Αυτό συμβαίνει επειδή αυτού του είδους τα μοντέλα τείνουν να απαιτούν τεράστιες ποσότητες δεδομένων εκπαίδευσης με κατηγοριοποίηση, τα οποία είναι διαθέσιμα μόνο για έναν μικρό αριθμό γλωσσών, συμπεριλαμβανομένων των Αγγλικών, Ισπανικών και Κινέζων.

«Μπορούμε να χρησιμοποιήσουμε αυτό που έμαθε αυτό το μοντέλο για να κατασκευάσουμε γρήγορα συστήματα ομιλίας με πολύ, πολύ λίγα δεδομένα», δήλωσε ο Michael Auli, ερευνητής στη Meta που εργάστηκε στο έργο. «Για τα αγγλικά, έχουμε πολλά καλά σύνολα δεδομένων και τα έχουμε για μερικές ακόμη γλώσσες, αλλά απλώς δεν τα έχουμε για γλώσσες που ομιλούνται, ας πούμε, από 1.000 άτομα».

Επιπλέον, σε σύγκριση με μοντέλα από άλλες εταιρείες, συμπεριλαμβανομένου του OpenAI Whisper, η έκδοση του Meta είχε το μισό ποσοστό σφαλμάτων, παρόλο που κάλυπτε 11 φορές περισσότερες γλώσσες.

Το πρόβλημα με τη Βίβλο

Ωστόσο, η ομάδα προειδοποιεί ότι το μοντέλο εξακολουθεί να κινδυνεύει να μεταγράψει λάθος ορισμένες λέξεις ή φράσεις, κάτι που θα μπορούσε να οδηγήσει σε ανακριβείς ή δυνητικά προσβλητικές ετικέτες.

Αναγνωρίζουν επίσης ότι τα μοντέλα αναγνώρισης ομιλίας τους απέδωσαν περισσότερες μεροληπτικές λέξεις από άλλα μοντέλα, αν και μόνο 0,7% περισσότερες.

Αν και το εύρος της έρευνας είναι εντυπωσιακό, η χρήση θρησκευτικών κειμένων για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης μπορεί να είναι αμφιλεγόμενη, λέει ο Chris Emezue, ερευνητής στο Masakhane, έναν οργανισμό που εργάζεται στην επεξεργασία φυσικής γλώσσας για αφρικανικές γλώσσες, ο οποίος δεν συμμετείχε στο πρότζεκτ της Meta. «Η Βίβλος έχει πολλές μεροληψίες και παραποιήσεις», λέει.

Με πληροφορίες από MIT Technology Review

Τελευταία Νέα

Δείτε επίσης

BadBox: 192.000 συσκευές Android μολύνθηκαν με κακόβουλο λογισμικό

Χειμερινό ηλιοστάσιο: Πότε είναι η μεγαλύτερη νύχτα του χρόνου;

Αυτά είναι τα 5 ευφυέστερα ζώα στον πλανήτη

Διαβάστε περισσότερα

Μουσική

Η επιστήμη εξηγεί γιατί τα χριστουγεννιάτικα τραγούδια είναι τόσο «κολλητικά»

Τα χριστουγεννιάτικα τραγούδια -είτε τα λατρεύουμε, είτε τα μισούμε- έχουν το χάρισμα να μας κολλάνε στο κεφάλι. Γιατί όμως συμβαίνει αυτό;

18/12/2024 22:52

Επιστήμη & Τεχνολογία

Το μεγαλύτερο παγόβουνο της Γης έσπασε ξανά… και ταξιδεύει

Το παγόβουνο είναι γνωστό στους επιστήμονες με την ονομασία A23a και είναι διπλάσιο σε μέγεθος από το Λονδίνο.

17/12/2024 13:02

Επιστήμη & Τεχνολογία

Πόσο εξοικειωμένοι είναι οι Έλληνες με την Τεχνητή Νοημοσύνη – Οι φόβοι και οι προσδοκίες

17/12/2024 08:09

Επιστήμη & Τεχνολογία

Μόνο επτά χώρες στον κόσμο αναπνέουν καθαρό αέρα – Τρεις από αυτές είναι στην Ευρώπη

14/12/2024 17:50

Επιστήμη & Τεχνολογία

Διαβάστε Επίσης

Με ποιο βιβλίο τα βρίσκει σκούρα η Τεχνητή Νοημοσύνη;

Οι ερευνητές ισχυρίζονται ότι τα εργαλεία τους μπορούν να συνομιλούν σε περισσότερες από 1.000 γλώσσες

7.000 γλώσσες περιμένουν

Το πρόβλημα με τη Βίβλο

Δείτε επίσης

BadBox: 192.000 συσκευές Android μολύνθηκαν με κακόβουλο λογισμικό

Χειμερινό ηλιοστάσιο: Πότε είναι η μεγαλύτερη νύχτα του χρόνου;

Αυτά είναι τα 5 ευφυέστερα ζώα στον πλανήτη

Δημοφιλή

Καζαντζίδης - Νικολόπουλος : Η μεγάλη ρήξη

Η Αθήνα απαντά με χάρτες στα τουρκικά τρικ στη Μεσόγειο

Η Μαρινέλλα ήταν η μεγάλη αγάπη του Στέλιου Καζαντζίδη

Οι λύκοι επέστρεψαν στον Ταΰγετο έναν αιώνα μετά

Μαγδεμβούργο: Έπινε μπύρες 24 ώρες πριν από το μακελειό

Ο ευρωπαίος ηγέτης που ο Πούτιν δέχεται ευχάριστα στο Κρεμλίνο

Ετοιμάζεται να καλπάσει η γερμανική Ακροδεξιά

Το ποίημα του 1823 που άλλαξε για πάντα τα Χριστούγεννα

Οι Τούρκοι επέστρεψαν στο Αιγαίο

Η ανθεκτικότητα της ΝΔ, η κάμψη του ΠΑΣΟΚ και ο Κασσελάκηςα 5 πολιτικά παράδοξα και οι εξηγήσεις τους

Διαβάστε περισσότερα

Η επιστήμη εξηγεί γιατί τα χριστουγεννιάτικα τραγούδια είναι τόσο «κολλητικά»

Το μεγαλύτερο παγόβουνο της Γης έσπασε ξανά… και ταξιδεύει

Πόσο εξοικειωμένοι είναι οι Έλληνες με την Τεχνητή Νοημοσύνη – Οι φόβοι και οι προσδοκίες

Μόνο επτά χώρες στον κόσμο αναπνέουν καθαρό αέρα – Τρεις από αυτές είναι στην Ευρώπη

Η Μαντόνα αγκαλιά με… τον Πάπα – Οι φωτογραφίες που προκάλεσαν πανικό!

Βόλτα στο διάστημα μέσω… Μεγάλης Ελλάδας από την Virgin Galactic

Βρετανία, Ιταλία και Ιαπωνία αναπτύσσουν προηγμένο μαχητικό stealth

Όλα τα θέματα

Ελλάδα

Πολιτική

Οικονομία

Κόσμος

Ομάδα

Γνώμες

Αγγλική έκδοση

Nσυν

By The Book

Επιστήμη & Τεχνολογία

Υγεία

Γυναίκα

Παιδί

Πρόσωπα & Ιστορίες

Συνεντεύξεις

Auto Νέα

Σκίτσα

Info graphics

Media

Όλα τα θέματα