Η OpenAI ισχυρίζεται ότι εντόπισε στοιχεία που δείχνουν ότι η κινεζική startup τεχνητής νοημοσύνης DeepSeek χρησιμοποίησε τα μοντέλα της για την εκπαίδευση του δικού της.

Στοιχεία που υποδεικνύουν ότι η κινεζική εταιρεία DeepSeek χρησιμοποίησε παράνομα τα μοντέλα της για την εκπαίδευση του ανταγωνιστικού της συστήματος, παρουσίασε η OpenAI στους Financial Times. Η δημιουργός του ChatGPT εντόπισε ενδείξεις της τεχνικής "απόσταξης" (distillation) στα μοντέλα της DeepSeek, πρακτική που παραβιάζει ευθέως τους όρους χρήσης της πλατφόρμας. Πριν λίγες ημέρες, ο CEO της Open ai, Sam Altman, είχε δηλώσει το θαυμασμό του για το νέο κινεζικό LLM.

Η τεχνική της απόσταξης επιτρέπει στους προγραμματιστές να βελτιώσουν την απόδοση μικρότερων μοντέλων χρησιμοποιώντας δεδομένα από μεγαλύτερα και πιο ικανά συστήματα, πετυχαίνοντας παρόμοια αποτελέσματα με πολύ μικρότερο κόστος. Σύμφωνα με πηγή προσκείμενη στην OpenAI, παρότι η πρακτική είναι συνηθισμένη στον κλάδο, το πρόβλημα προκύπτει όταν χρησιμοποιείται για τη δημιουργία ανταγωνιστικών μοντέλων εκτός της πλατφόρμας.

Οι όροι χρήσης της OpenAI απαγορεύουν ρητά την "αντιγραφή" των υπηρεσιών της ή τη "χρήση των αποτελεσμάτων για την ανάπτυξη ανταγωνιστικών μοντέλων". Η Microsoft και η OpenAI είχαν ήδη εντοπίσει και αποκλείσει πέρυσι λογαριασμούς που πιστεύεται ότι ανήκαν στην DeepSeek, λόγω ύποπτης χρήσης του API για distillation.

Το μοντέλο R1 της DeepSeek προκάλεσε έκπληξη στην αγορά και τη Silicon Valley, καθώς πέτυχε υψηλές επιδόσεις με περιορισμένους πόρους. Ο αντίκτυπος ήταν τέτοιος που προκάλεσε πτώση 17% στη μετοχή της Nvidia τη Δευτέρα, με απώλειες 589 δισεκατομμυρίων δολαρίων στην αξία της, λόγω ανησυχιών για τη μελλοντική ζήτηση ακριβού εξοπλισμού AI.

Ο David Sacks, πρώην σύμβουλος AI του προέδρου Trump, δήλωσε στο Fox News ότι "υπάρχουν ουσιαστικές ενδείξεις" πως η DeepSeek "απομύζησε" γνώση από τα μοντέλα της OpenAI, χωρίς ωστόσο να παρουσιάσει συγκεκριμένα αποδεικτικά στοιχεία.

Η κινεζική εταιρεία υποστηρίζει ότι χρησιμοποίησε μόλις 2.048 κάρτες γραφικών Nvidia H800 και δαπάνησε 5,6 εκατομμύρια δολάρια για την εκπαίδευση του μοντέλου V3 με 671 δισεκατομμύρια παραμέτρους. Ειδικοί του κλάδου επισημαίνουν ότι οι αποκρίσεις του μοντέλου υποδηλώνουν εκπαίδευση με δεδομένα από το GPT-4 της OpenAI.

Σύμφωνα με τον Ritwik Gupta, υποψήφιο διδάκτορα AI στο Πανεπιστήμιο της Καλιφόρνια στο Berkeley, η χρήση δεδομένων από εμπορικά μοντέλα για την εκπαίδευση νέων συστημάτων αποτελεί κοινή πρακτική στον κλάδο. "Μέσω αυτής της μεθόδου, οι εταιρείες αποκτούν δωρεάν το στάδιο ανθρώπινης ανατροφοδότησης, που είναι ιδιαίτερα δαπανηρό και χρονοβόρο", εξηγεί.

Η OpenAI τόνισε στην πιο πρόσφατη ανακοίνωσή της ότι συνεργάζεται στενά με την αμερικανική κυβέρνηση για την προστασία των πιο προηγμένων μοντέλων από προσπάθειες ανταγωνιστών να οικειοποιηθούν την αμερικανική τεχνολογία.

Παράλληλα, η ίδια η OpenAI αντιμετωπίζει αγωγές από τους New York Times και επιφανείς συγγραφείς, οι οποίοι την κατηγορούν για χρήση του περιεχομένου τους χωρίς άδεια στην εκπαίδευση των μοντέλων της.

  • Like 1
  • Haha 28