Η Anthropic ανακοίνωσε την κυκλοφορία του νέου μοντέλου τεχνητής νοημοσύνης Claude 3.7 Sonnet, το οποίο διαθέτει μια καινοτόμο δυνατότητα "εκτεταμένης σκέψης" που επιτρέπει στο σύστημα να επεξεργάζεται προβλήματα βήμα προς βήμα. Παράλληλα, η εταιρεία αποκάλυψε το Claude Code, ένα εργαλείο γραμμής εντολών με τεχνητή νοημοσύνη για προγραμματιστές, το οποίο διατίθεται προς το παρόν ως περιορισμένη ερευνητική προεπισκόπηση.
Το Claude 3.7 Sonnet χαρακτηρίζεται από την Anthropic ως το πρώτο "υβριδικό μοντέλο συλλογισμού" στην αγορά, προσφέροντας στους χρήστες τη δυνατότητα επιλογής μεταξύ γρήγορων απαντήσεων ή εκτεταμένης, ορατής αλυσιδωτής διαδικασίας σκέψης. Αυτή η προσέγγιση μοιάζει με τα μοντέλα της σειράς o1 και o3 της OpenAI, το Gemini 2.0 Flash Thinking της Google και το R1 της DeepSeek.
Όταν χρησιμοποιούν το API του Claude 3.7, οι προγραμματιστές μπορούν να καθορίσουν με ακρίβεια πόσα tokens θα χρησιμοποιήσει το μοντέλο για τη διαδικασία σκέψης, έως το όριο των 128.000 tokens. Αυτό δίνει στους χρήστες πρωτοφανή έλεγχο στη διαδικασία συλλογισμού του μοντέλου, επιτρέποντας προσαρμογή ανάλογα με την πολυπλοκότητα του προβλήματος.
Το νέο μοντέλο είναι διαθέσιμο σε όλα τα συνδρομητικά πακέτα του Claude, ενώ η λειτουργία εκτεταμένης σκέψης προσφέρεται σε όλα τα πακέτα εκτός από τη δωρεάν έκδοση. Η τιμολόγηση του API παραμένει αμετάβλητη στα 3 δολάρια ανά εκατομμύριο tokens εισόδου και 15 δολάρια ανά εκατομμύριο tokens εξόδου, με τα tokens σκέψης να συμπεριλαμβάνονται στην τιμολόγηση εξόδου.
Ένα ενδιαφέρον στοιχείο είναι ότι η Anthropic μείωσε τις περιττές αρνήσεις στο Claude 3.7 Sonnet κατά 45% σε σύγκριση με προηγούμενες εκδόσεις. Αυτό πρακτικά σημαίνει ότι το μοντέλο είναι πιο πιθανό να εκτελέσει αυτό που του ζητείται χωρίς να διαμαρτύρεται για ηθικά όρια, τα οποία μπορεί να εμφανίζονται σε αθώες περιπτώσεις όταν ερμηνεύονται λανθασμένα από το νευρωνικό δίκτυο.
Στις συγκριτικές αξιολογήσεις, το τελευταίο μοντέλο της Anthropic φαίνεται να διατηρεί το επίπεδό του και μάλιστα να διαπρέπει ιδιαίτερα στον προγραμματισμό. Ο προκάτοχός του, το Claude 3.5 Sonnet, ήταν ήδη εξαιρετικό σε προγραμματιστικές εργασίες συγκριτικά με άλλα μοντέλα τεχνητής νοημοσύνης, και σύμφωνα με την Anthropic, οι αρχικές δοκιμές δείχνουν εξαιρετική απόδοση σε αυτόν τον τομέα.
Η εταιρεία υποστηρίζει ότι το Claude 3.7 Sonnet πέτυχε κορυφαίες βαθμολογίες στο SWE-bench Verified, το οποίο αξιολογεί πώς τα μοντέλα τεχνητής νοημοσύνης χειρίζονται πραγματικά προβλήματα λογισμικού. Επίσης, διέπρεψε στο TAU-bench, το οποίο δοκιμάζει agents τεχνητής νοημοσύνης σε σύνθετες εργασίες με αλληλεπιδράσεις χρήστη και εργαλείων.
Στοχεύοντας στους προγραμματιστές λογισμικού, η Anthropic έχει επεκτείνει την ενσωμάτωση του GitHub σε όλα τα πακέτα Claude, επιτρέποντας στους προγραμματιστές να συνδέουν αποθετήρια κώδικα (repositories) απευθείας στο Claude για διορθώσεις bugs, ανάπτυξη χαρακτηριστικών και εργασίες documentation.
Παρά τις εντυπωσιακές δυνατότητες του μοντέλου, πολλοί χρήστες αντιμετωπίζουν περιορισμούς χρήσης. Μέχρι στιγμής, η Anthropic δεν έχει ανακοινώσει νέο πακέτο συνδρομής πέραν του υπάρχοντος "Claude Pro" (20 δολάρια/μήνα) που θα μπορούσε να επεκτείνει αυτούς τους περιορισμούς. Αυτό αποτελεί πρόκληση για προγραμματιστές που βασίζονται όλο και περισσότερο στο συγκεκριμένο μοντέλο για τις καθημερινές τους εργασίες.
Το 2025 έχει χαρακτηριστεί μέχρι στιγμής ως το έτος τόσο των μοντέλων συλλογισμού (όπως το R1 και το o3) όσο και των εργαλείων τεχνητής νοημοσύνης με δυνατότητες agent. Η Anthropic εισέρχεται σε αυτή την αγορά με το πρώτο της εργαλείο πράκτορα, το Claude Code.
Το Claude Code λειτουργεί απευθείας από τερματικό κονσόλας και είναι ένας αυτόνομος βοηθός προγραμματισμού. Επιτρέπει στο Claude να αναζητά μέσα σε βάσεις κώδικα, να διαβάζει και να επεξεργάζεται αρχεία, να γράφει και να εκτελεί δοκιμές, να δεσμεύει και να κάνει push κώδικα σε GitHub repositories, και να εκτελεί εργαλεία γραμμής εντολών, ενημερώνοντας παράλληλα τους προγραμματιστές καθ' όλη τη διαδικασία.
Η Anthropic στοχεύει επίσης στη χρήση του Claude Code ως βοηθού για εργασίες debugging και refactoring κώδικα. Η εταιρεία ισχυρίζεται ότι κατά τη διάρκεια εσωτερικών δοκιμών, το Claude Code ολοκλήρωσε εργασίες σε μία μόνο συνεδρία που κανονικά θα απαιτούσαν πάνω από 45 λεπτά χειροκίνητης εργασίας.
Η Anthropic έχει αναφέρει ότι σχεδιάζει να συνεχίσει να βελτιώνει τόσο το Claude 3.7 Sonnet όσο και το Claude Code βάσει των σχολίων των χρηστών με την πάροδο του χρόνου. Το Claude 3.7 Sonnet διατίθεται άμεσα μέσω του ιστότοπου Claude, της εφαρμογής Claude, του Anthropic API, του Amazon Bedrock και του Vertex AI της Google Cloud, ενώ το Claude Code παραμένει σε preview έκδοση με περιορισμένη πρόσβαση.
-
1
ΣΧΟΛΙΑ (21)
Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε
Πρέπει να είστε μέλος για να αφήσετε σχόλιο
Δημιουργία λογαριασμού
Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!
Δημιουργία νέου λογαριασμούΣύνδεση
Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.
Συνδεθείτε τώραΔημοσίευση ως Επισκέπτης
· Αποσύνδεση