Η DeepSeek παρουσίασε μια νέα σειρά μοντέλων τεχνητής νοημοσύνης Janus-Pro που, σύμφωνα με την εταιρεία, ξεπερνούν σε επιδόσεις το DALL-E 3 της OpenAI.

Η κινεζική εταιρεία τεχνητής νοημοσύνης DeepSeek, που πρόσφατα έγινε viral, ανακοίνωσε την κυκλοφορία μιας νέας οικογένειας πολυτροπικών μοντέλων AI με την ονομασία Janus-Pro. Σύμφωνα με την εταιρεία, τα νέα μοντέλα, που είναι διαθέσιμα για download στην πλατφόρμα Hugging Face, προσφέρουν καλύτερες επιδόσεις από το DALL-E 3 της OpenAI.

Τα μοντέλα Janus-Pro κυμαίνονται σε μέγεθος από 1 δισεκατομμύριο έως 7 δισεκατομμύρια παραμέτρους. Όπως αναφέρει η DeepSeek, οι παράμετροι αντιστοιχούν κατά προσέγγιση στις ικανότητες επίλυσης προβλημάτων ενός μοντέλου, με αυτά που διαθέτουν περισσότερες παραμέτρους να αποδίδουν γενικά καλύτερα.

Σημαντικό χαρακτηριστικό είναι ότι το Janus-Pro διατίθεται υπό άδεια MIT, επιτρέποντας την εμπορική χρήση χωρίς περιορισμούς. Η DeepSeek περιγράφει το Janus-Pro ως ένα μοντέλο που μπορεί τόσο να αναλύει όσο και να δημιουργεί νέες εικόνες.

image.png.3e1b70377899365a873faee7efedabeb.png


Σύμφωνα με τα στοιχεία που δημοσίευσε η εταιρεία, το μεγαλύτερο μοντέλο Janus-Pro-7B ξεπερνά σε επιδόσεις το DALL-E 3 καθώς και άλλα γνωστά μοντέλα όπως το PixArt-alpha, το Emu3-Gen και το Stable Diffusion XL της Stability AI σε δύο σημαντικά σημεία αξιολόγησης AI: το GenEval και το DPG-Bench.

Παρόλο που τα περισσότερα μοντέλα Janus-Pro μπορούν να αναλύσουν μόνο μικρές εικόνες με ανάλυση έως 384 x 384, η απόδοσή τους θεωρείται εντυπωσιακή δεδομένου του συμπαγούς μεγέθους τους. Όπως αναφέρει χαρακτηριστικά η DeepSeek στην ανάρτησή της στο Hugging Face, "το Janus-Pro ξεπερνά τα προηγούμενα ενοποιημένα μοντέλα και αντιστοιχεί ή υπερβαίνει την απόδοση των εξειδικευμένων μοντέλων".

Η DeepSeek, ένα κινεζικό εργαστήριο AI που χρηματοδοτείται κυρίως από την εταιρεία ποσοτικών συναλλαγών High-Flyer Capital Management, απέκτησε ευρεία αναγνωρισιμότητα αυτή την εβδομάδα όταν η εφαρμογή chatbot της ανέβηκε στην κορυφή των charts του Apple App Store. Τα γλωσσικά μοντέλα της DeepSeek, τα οποία εκπαιδεύτηκαν χρησιμοποιώντας αποδοτικές τεχνικές υπολογισμού, έχουν οδηγήσει πολλούς αναλυτές της Wall Street και τεχνολόγους να αμφισβητήσουν κατά πόσο οι ΗΠΑ μπορούν να διατηρήσουν το προβάδισμά τους στον αγώνα της τεχνητής νοημοσύνης και αν η ζήτηση για τσιπ AI θα διατηρηθεί.

  • Like 5