Προς το περιεχόμενο

Προτεινόμενες αναρτήσεις

Δημοσ.

Η OpenAI ισχυρίζεται ότι εντόπισε στοιχεία που δείχνουν ότι η κινεζική startup τεχνητής νοημοσύνης DeepSeek χρησιμοποίησε τα μοντέλα της για την εκπαίδευση του δικού της.

Στοιχεία που υποδεικνύουν ότι η κινεζική εταιρεία DeepSeek χρησιμοποίησε παράνομα τα μοντέλα της για την εκπαίδευση του ανταγωνιστικού της συστήματος, παρουσίασε η OpenAI στους Financial Times. Η δημιουργός του ChatGPT εντόπισε ενδείξεις της τεχνικής "απόσταξης" (distillation) στα μοντέλα της DeepSeek, πρακτική που παραβιάζει ευθέως τους όρους χρήσης της πλατφόρμας. Πριν λίγες ημέρες, ο CEO της Open ai, Sam Altman, είχε δηλώσει το θαυμασμό του για το νέο κινεζικό LLM.

Η τεχνική της απόσταξης επιτρέπει στους προγραμματιστές να βελτιώσουν την απόδοση μικρότερων μοντέλων χρησιμοποιώντας δεδομένα από μεγαλύτερα και πιο ικανά συστήματα, πετυχαίνοντας παρόμοια αποτελέσματα με πολύ μικρότερο κόστος. Σύμφωνα με πηγή προσκείμενη στην OpenAI, παρότι η πρακτική είναι συνηθισμένη στον κλάδο, το πρόβλημα προκύπτει όταν χρησιμοποιείται για τη δημιουργία ανταγωνιστικών μοντέλων εκτός της πλατφόρμας.

Οι όροι χρήσης της OpenAI απαγορεύουν ρητά την "αντιγραφή" των υπηρεσιών της ή τη "χρήση των αποτελεσμάτων για την ανάπτυξη ανταγωνιστικών μοντέλων". Η Microsoft και η OpenAI είχαν ήδη εντοπίσει και αποκλείσει πέρυσι λογαριασμούς που πιστεύεται ότι ανήκαν στην DeepSeek, λόγω ύποπτης χρήσης του API για distillation.

Το μοντέλο R1 της DeepSeek προκάλεσε έκπληξη στην αγορά και τη Silicon Valley, καθώς πέτυχε υψηλές επιδόσεις με περιορισμένους πόρους. Ο αντίκτυπος ήταν τέτοιος που προκάλεσε πτώση 17% στη μετοχή της Nvidia τη Δευτέρα, με απώλειες 589 δισεκατομμυρίων δολαρίων στην αξία της, λόγω ανησυχιών για τη μελλοντική ζήτηση ακριβού εξοπλισμού AI.

Ο David Sacks, πρώην σύμβουλος AI του προέδρου Trump, δήλωσε στο Fox News ότι "υπάρχουν ουσιαστικές ενδείξεις" πως η DeepSeek "απομύζησε" γνώση από τα μοντέλα της OpenAI, χωρίς ωστόσο να παρουσιάσει συγκεκριμένα αποδεικτικά στοιχεία.

Η κινεζική εταιρεία υποστηρίζει ότι χρησιμοποίησε μόλις 2.048 κάρτες γραφικών Nvidia H800 και δαπάνησε 5,6 εκατομμύρια δολάρια για την εκπαίδευση του μοντέλου V3 με 671 δισεκατομμύρια παραμέτρους. Ειδικοί του κλάδου επισημαίνουν ότι οι αποκρίσεις του μοντέλου υποδηλώνουν εκπαίδευση με δεδομένα από το GPT-4 της OpenAI.

Σύμφωνα με τον Ritwik Gupta, υποψήφιο διδάκτορα AI στο Πανεπιστήμιο της Καλιφόρνια στο Berkeley, η χρήση δεδομένων από εμπορικά μοντέλα για την εκπαίδευση νέων συστημάτων αποτελεί κοινή πρακτική στον κλάδο. "Μέσω αυτής της μεθόδου, οι εταιρείες αποκτούν δωρεάν το στάδιο ανθρώπινης ανατροφοδότησης, που είναι ιδιαίτερα δαπανηρό και χρονοβόρο", εξηγεί.

Η OpenAI τόνισε στην πιο πρόσφατη ανακοίνωσή της ότι συνεργάζεται στενά με την αμερικανική κυβέρνηση για την προστασία των πιο προηγμένων μοντέλων από προσπάθειες ανταγωνιστών να οικειοποιηθούν την αμερικανική τεχνολογία.

Παράλληλα, η ίδια η OpenAI αντιμετωπίζει αγωγές από τους New York Times και επιφανείς συγγραφείς, οι οποίοι την κατηγορούν για χρήση του περιεχομένου τους χωρίς άδεια στην εκπαίδευση των μοντέλων της.


Διαβάστε ολόκληρο το άρθρο

Δημοσ.
18 minutes ago, techon1 said:

Οι κινέζοι; Να κλέβουν; Με τίποτα!

Αυτοί κλέβουν οι άλλοι κάνουν έρευνα δανείζονται τα δεδομένα από όλους για να μας προσφέρουν κάτι καλό για εμάς.

  • Like 4
  • Haha 2
Δημοσ.

Το κακό στην υπόθεση αν βέβαια έχω καταλάβει καλά είναι ότι δεν είναι ολόκληρο το μοντέλο και source code διαθέσιμο για download. Πιστεύω να κάνω λάθος έτσι ώστε το κέρδος από την εκατέρωθεν κλοπή δεδομένα να επιστρέψει στους ανθρώπους.

  • Like 1
Δημοσ.

Εντωμεταξύ, όσο η OpenAI σκέφτεται πως θα σταματήσει νομικά το DeepSeek, η Alibaba αποκάλυψε ένα ανταγωνιστικό μοντέλο, το Qwen2.5-Max το οποίο υποστηρίζει ότι είναι ακόμα περισσότερο ενεργιακά αποδοτικό απο το DeepSeek.

Ετσι είναι. Ο σωστός τρόπος για να είσαι πρώτος είναι να είσαι ο καλύτερος και όχι να κρατάς τους άλλους κάτω. Για την ώρα πάντως εγώ χρησιμοποιώ το chatgpt, κάνει καλύτερα αυτά που θέλω.

  • Like 3
Δημοσ.
1 ώρα πριν, kinitos είπε

Αυτοί κλέβουν οι άλλοι κάνουν έρευνα δανείζονται τα δεδομένα από όλους για να μας προσφέρουν κάτι καλό για εμάς.

/s να υποθέσω; Σε παρακαλώ.

Δημοσ.
15 λεπτά πριν, fast8 είπε

Εντωμεταξύ, όσο η OpenAI σκέφτεται πως θα σταματήσει νομικά το DeepSeek, η Alibaba αποκάλυψε ένα ανταγωνιστικό μοντέλο, το Qwen2.5-Max το οποίο υποστηρίζει ότι είναι ακόμα περισσότερο ενεργιακά αποδοτικό απο το DeepSeek.

Ετσι είναι. Ο σωστός τρόπος για να είσαι πρώτος είναι να είσαι ο καλύτερος και όχι να κρατάς τους άλλους κάτω. Για την ώρα πάντως εγώ χρησιμοποιώ το chatgpt, κάνει καλύτερα αυτά που θέλω.

Θα είναι πράγματι συναρπαστική η εξέλιξη, για το καλό όλων. 

 

Μδλλον φούσκες θα σπάσουν.

 

Δημοσ.

... ωραία, έχουμε chatGPT, Gemini, Claude, Mistral, Llama...απο προχθές DeepSeek, ξεπετάγεται το Ali με την δική του υλοποίηση στην ιστορία/γωνία....μια ωραία ατμόσφαιρα είμαστε, τι όχι? 

Εντάξει ο ανταγωνισμός πάντα βοηθάει αλλά εγώ σαν τελικός χρήστης/προϊόν "έχω χαθεί" λίγο.

  • Like 1

Παρακαλούμε συνδεθείτε για να σχολιάσετε

Θα είστε σε θέση να αφήσετε σχόλιο αφού συνδεθείτε



Συνδεθείτε τώρα

  • Δημιουργία νέου...