Οι μηχανικοί της OpenAI διέγραψαν κατά λάθος σημαντικά δεδομένα σχετικά με την υπόθεση των New York Times και Daily News κατά της εταιρείας.

Σύμφωνα με επιστολή που κατατέθηκε στο Περιφερειακό Δικαστήριο των ΗΠΑ για τη Νότια Περιφέρεια της Νέας Υόρκης, οι μηχανικοί της OpenAI διέγραψαν κατά λάθος σημαντικά δεδομένα έρευνας που σχετίζονται με τη νομική διαμάχη της εταιρείας με τους New York Times και Daily News.

Όπως αναφέρουν οι δικηγόροι των εκδοτών, η OpenAI είχε συμφωνήσει νωρίτερα το φθινόπωρο να παράσχει δύο virtual machines για την αναζήτηση περιεχομένου με πνευματικά δικαιώματα στα σύνολα δεδομένων εκπαίδευσης της τεχνητής νοημοσύνης. Οι νομικοί σύμβουλοι και οι ειδικοί των εκδοτών αφιέρωσαν περισσότερες από 150 ώρες από την 1η Νοεμβρίου για την έρευνα των δεδομένων.

Στις 14 Νοεμβρίου, σύμφωνα με την επιστολή, οι μηχανικοί της OpenAI διέγραψαν όλα τα δεδομένα αναζήτησης των εκδοτών που ήταν αποθηκευμένα σε ένα από τα δύο virtual machines. Παρόλο που η εταιρεία κατάφερε να ανακτήσει το μεγαλύτερο μέρος των δεδομένων, η δομή των φακέλων και τα ονόματα των αρχείων χάθηκαν "ανεπανόρθωτα", καθιστώντας αδύνατο τον προσδιορισμό του τρόπου χρήσης των άρθρων στην εκπαίδευση των μοντέλων.

Οι δικηγόροι των Times και Daily News τονίζουν ότι αναγκάστηκαν να ξεκινήσουν από την αρχή την έρευνά τους, απαιτώντας σημαντικό χρόνο και υπολογιστική ισχύ. Ωστόσο, διευκρινίζουν ότι δεν υπάρχει λόγος να πιστεύουν ότι η διαγραφή ήταν σκόπιμη.

Η OpenAI, η οποία αρνήθηκε να σχολιάσει το περιστατικό, υποστηρίζει σταθερά ότι η εκπαίδευση μοντέλων χρησιμοποιώντας δημόσια διαθέσιμα δεδομένα αποτελεί θεμιτή χρήση. Παράλληλα, η εταιρεία έχει συνάψει συμφωνίες αδειοδότησης με διάφορους εκδοτικούς οίκους, συμπεριλαμβανομένων των Associated Press, Axel Springer, Financial Times και News Corp.

Αξιοσημείωτο είναι ότι μία από τις συμφωνίες, συγκεκριμένα με την Dotdash Meredith, φέρεται να αποφέρει στον εκδότη τουλάχιστον 16 εκατομμύρια δολάρια ετησίως. Η OpenAI δεν έχει επιβεβαιώσει ούτε διαψεύσει εάν χρησιμοποίησε συγκεκριμένα έργα με πνευματικά δικαιώματα χωρίς άδεια για την εκπαίδευση των συστημάτων της.

  • Haha 13