Τα Claude 3.7 Sonnet και Claude Code αλλάζουν το τοπίο στην τεχνητή νοημοσύνη για προγραμματιστές

Axlmon · 24 Φεβρουαρίου

Η Anthropic παρουσίασε το νέο μοντέλο τεχνητής νοημοσύνης Claude 3.7 Sonnet, το οποίο προσφέρει στους χρήστες πρωτοφανή έλεγχο στο χρόνο "σκέψης" της AI.

Η Anthropic ανακοίνωσε την κυκλοφορία του νέου μοντέλου τεχνητής νοημοσύνης Claude 3.7 Sonnet, το οποίο διαθέτει μια καινοτόμο δυνατότητα "εκτεταμένης σκέψης" που επιτρέπει στο σύστημα να επεξεργάζεται προβλήματα βήμα προς βήμα. Παράλληλα, η εταιρεία αποκάλυψε το Claude Code, ένα εργαλείο γραμμής εντολών με τεχνητή νοημοσύνη για προγραμματιστές, το οποίο διατίθεται προς το παρόν ως περιορισμένη ερευνητική προεπισκόπηση.

Το Claude 3.7 Sonnet χαρακτηρίζεται από την Anthropic ως το πρώτο "υβριδικό μοντέλο συλλογισμού" στην αγορά, προσφέροντας στους χρήστες τη δυνατότητα επιλογής μεταξύ γρήγορων απαντήσεων ή εκτεταμένης, ορατής αλυσιδωτής διαδικασίας σκέψης. Αυτή η προσέγγιση μοιάζει με τα μοντέλα της σειράς o1 και o3 της OpenAI, το Gemini 2.0 Flash Thinking της Google και το R1 της DeepSeek.

Όταν χρησιμοποιούν το API του Claude 3.7, οι προγραμματιστές μπορούν να καθορίσουν με ακρίβεια πόσα tokens θα χρησιμοποιήσει το μοντέλο για τη διαδικασία σκέψης, έως το όριο των 128.000 tokens. Αυτό δίνει στους χρήστες πρωτοφανή έλεγχο στη διαδικασία συλλογισμού του μοντέλου, επιτρέποντας προσαρμογή ανάλογα με την πολυπλοκότητα του προβλήματος.

Το νέο μοντέλο είναι διαθέσιμο σε όλα τα συνδρομητικά πακέτα του Claude, ενώ η λειτουργία εκτεταμένης σκέψης προσφέρεται σε όλα τα πακέτα εκτός από τη δωρεάν έκδοση. Η τιμολόγηση του API παραμένει αμετάβλητη στα 3 δολάρια ανά εκατομμύριο tokens εισόδου και 15 δολάρια ανά εκατομμύριο tokens εξόδου, με τα tokens σκέψης να συμπεριλαμβάνονται στην τιμολόγηση εξόδου.

Ένα ενδιαφέρον στοιχείο είναι ότι η Anthropic μείωσε τις περιττές αρνήσεις στο Claude 3.7 Sonnet κατά 45% σε σύγκριση με προηγούμενες εκδόσεις. Αυτό πρακτικά σημαίνει ότι το μοντέλο είναι πιο πιθανό να εκτελέσει αυτό που του ζητείται χωρίς να διαμαρτύρεται για ηθικά όρια, τα οποία μπορεί να εμφανίζονται σε αθώες περιπτώσεις όταν ερμηνεύονται λανθασμένα από το νευρωνικό δίκτυο.

Στις συγκριτικές αξιολογήσεις, το τελευταίο μοντέλο της Anthropic φαίνεται να διατηρεί το επίπεδό του και μάλιστα να διαπρέπει ιδιαίτερα στον προγραμματισμό. Ο προκάτοχός του, το Claude 3.5 Sonnet, ήταν ήδη εξαιρετικό σε προγραμματιστικές εργασίες συγκριτικά με άλλα μοντέλα τεχνητής νοημοσύνης, και σύμφωνα με την Anthropic, οι αρχικές δοκιμές δείχνουν εξαιρετική απόδοση σε αυτόν τον τομέα.

Η εταιρεία υποστηρίζει ότι το Claude 3.7 Sonnet πέτυχε κορυφαίες βαθμολογίες στο SWE-bench Verified, το οποίο αξιολογεί πώς τα μοντέλα τεχνητής νοημοσύνης χειρίζονται πραγματικά προβλήματα λογισμικού. Επίσης, διέπρεψε στο TAU-bench, το οποίο δοκιμάζει agents τεχνητής νοημοσύνης σε σύνθετες εργασίες με αλληλεπιδράσεις χρήστη και εργαλείων.

Στοχεύοντας στους προγραμματιστές λογισμικού, η Anthropic έχει επεκτείνει την ενσωμάτωση του GitHub σε όλα τα πακέτα Claude, επιτρέποντας στους προγραμματιστές να συνδέουν αποθετήρια κώδικα (repositories) απευθείας στο Claude για διορθώσεις bugs, ανάπτυξη χαρακτηριστικών και εργασίες documentation.

Παρά τις εντυπωσιακές δυνατότητες του μοντέλου, πολλοί χρήστες αντιμετωπίζουν περιορισμούς χρήσης. Μέχρι στιγμής, η Anthropic δεν έχει ανακοινώσει νέο πακέτο συνδρομής πέραν του υπάρχοντος "Claude Pro" (20 δολάρια/μήνα) που θα μπορούσε να επεκτείνει αυτούς τους περιορισμούς. Αυτό αποτελεί πρόκληση για προγραμματιστές που βασίζονται όλο και περισσότερο στο συγκεκριμένο μοντέλο για τις καθημερινές τους εργασίες.

Το 2025 έχει χαρακτηριστεί μέχρι στιγμής ως το έτος τόσο των μοντέλων συλλογισμού (όπως το R1 και το o3) όσο και των εργαλείων τεχνητής νοημοσύνης με δυνατότητες agent. Η Anthropic εισέρχεται σε αυτή την αγορά με το πρώτο της εργαλείο πράκτορα, το Claude Code.

Το Claude Code λειτουργεί απευθείας από τερματικό κονσόλας και είναι ένας αυτόνομος βοηθός προγραμματισμού. Επιτρέπει στο Claude να αναζητά μέσα σε βάσεις κώδικα, να διαβάζει και να επεξεργάζεται αρχεία, να γράφει και να εκτελεί δοκιμές, να δεσμεύει και να κάνει push κώδικα σε GitHub repositories, και να εκτελεί εργαλεία γραμμής εντολών, ενημερώνοντας παράλληλα τους προγραμματιστές καθ' όλη τη διαδικασία.

Η Anthropic στοχεύει επίσης στη χρήση του Claude Code ως βοηθού για εργασίες debugging και refactoring κώδικα. Η εταιρεία ισχυρίζεται ότι κατά τη διάρκεια εσωτερικών δοκιμών, το Claude Code ολοκλήρωσε εργασίες σε μία μόνο συνεδρία που κανονικά θα απαιτούσαν πάνω από 45 λεπτά χειροκίνητης εργασίας.

Η Anthropic έχει αναφέρει ότι σχεδιάζει να συνεχίσει να βελτιώνει τόσο το Claude 3.7 Sonnet όσο και το Claude Code βάσει των σχολίων των χρηστών με την πάροδο του χρόνου. Το Claude 3.7 Sonnet διατίθεται άμεσα μέσω του ιστότοπου Claude, της εφαρμογής Claude, του Anthropic API, του Amazon Bedrock και του Vertex AI της Google Cloud, ενώ το Claude Code παραμένει σε preview έκδοση με περιορισμένη πρόσβαση.

Διαβάστε ολόκληρο το άρθρο

Diavolos666 · 25 Φεβρουαρίου

Πάντως το grok 3 στις κατηγορίες που του βάλανε βαθμό τους πάτησε στα αυτιά όλους.

cpc464 · 25 Φεβρουαρίου

Αυτό το σύστημα με τα Tokens ακούγεται γελοίο, όταν τελειώνουν δηλαδή τι θα λέει η AI;, "Δεν μπορώ να σκεφτώ, μου τελείωσαν οι μονάδες";.

Diavolos666 · 25 Φεβρουαρίου

12 minutes ago, cpc464 said:

Αυτό το σύστημα με τα Tokens ακούγεται γελοίο, όταν τελειώνουν δηλαδή τι θα λέει η AI;, "Δεν μπορώ να σκεφτώ, μου τελείωσαν οι μονάδες";.

Αν τελειώσουν σε πηγαίνει στο δωρεάν

Για παράδειγμα στο chatgpt με 20 ευρώ τον μήνα έχεις συγκεκριμένα token ανά 3 ώρες, αν τελειώσουν πας στο δωρεάν 3ο. Έχεις 50 μηνύματα ανά 3 ώρες (όσο μεγάλα κι αν είναι τα μηνύματα), μόλις τα φας σου λέει ότι σου τελείωσαν και πας στο δωρεάν, μετά από λίγη ώρα ανανεώνονται και είσαι πάλι στο πληρωμένο.

Τώρα το συγκεκριμένο του άρθρου αν είναι πληρωμή με token με ή χωρίς χρονικό περιθώριο δεν ξέρω. Δηλαδή έτσι που το λέει είναι σαν να αγοράζεις τα token και να τα τρως όποτε θέλεις, για κάποιον που κάνει λίγη χρήση αυτό είναι αρκετά καλό. Λογικά μόλις τελειώσουν σου το λέει και θα σε πηγαίνει στο δωρεάν μοντέλο όπως και όλα τα άλλα.

~~~
Ο λόγος γενικά που βάζουν περιορισμό στα τόκεν είναι γιατί αλλιώς θα μπορούσε να έχει ένας συνδρομή και να το χρησιμοποιούν 100 άτομα, ενώ έτσι περιορίζει το πόσα μηνύματα μπορείς να χρησιμοποιήσεις.

Στο δε chatgpt υπάρχει επαγγελματικό μοντέλο για επιχειρήσεις με 200 ευρώ τον μήνα που είναι απεριόριστη χρήση, εκεί αν έχεις 100 εργαζόμενους και το χρησιμοποιούν όλοι τότε συμφέρει.

Επεξ/σία 25 Φεβρουαρίου από Diavolos666

zazoum · 25 Φεβρουαρίου

Δεν βαλανε κατηγορια prompt adherence στην οποια το Grok τα εχει ξεσκισει ολα.

Vassein · 25 Φεβρουαρίου

15 λεπτά πριν, zazoum είπε

Δεν βαλανε κατηγορια prompt adherence στην οποια το Grok τα εχει ξεσκισει ολα.

Εχεις καποιο προσφατο benchmark για αυτο;

zazoum · 25 Φεβρουαρίου

Την εμπειρια μου.

Επεξ/σία 25 Φεβρουαρίου από zazoum

SeaLion · 25 Φεβρουαρίου

πΟλΥ κΑΛό το Grok 3!!!

Επεξ/σία 25 Φεβρουαρίου από SeaLion

Ukforthemoment · 25 Φεβρουαρίου

44 λεπτά πριν, cpc464 είπε

Αυτό το σύστημα με τα Tokens ακούγεται γελοίο, όταν τελειώνουν δηλαδή τι θα λέει η AI;, "Δεν μπορώ να σκεφτώ, μου τελείωσαν οι μονάδες";.

jmirko15 · 25 Φεβρουαρίου

54 minutes ago, zazoum said:

Δεν βαλανε κατηγορια prompt adherence στην οποια το Grok τα εχει ξεσκισει ολα.

Μη ρε συ. Τώρα θα έρθουν οι κλασσικοί 3-4 να σχολιάσουν και εδώ..

Too little too late

Επεξ/σία 25 Φεβρουαρίου από jmirko15

zazoum · 25 Φεβρουαρίου

10 minutes ago, jmirko15 said:

Μη ρε συ. Τώρα θα έρθουν οι κλασσικοί 3-4 να σχολιάσουν και εδώ..

Δεν πολυκαταλαβαινω ποιοι ειναι οι κλασσικοι 3-5. Μπορει να ειναι παλιο το ακαουντ μου αλλα δεν το παρακολουθουσα επι χρονια το φορουμ.

Δεν έχω άμεση πρόσβαση στα δεδομένα του insomnia.gr για να σου πω ακριβώς ποιοι είναι οι "κλασικοί 3-4" που σχολιάζουν εναντίον κάποιου, καθώς αυτό εξαρτάται από το context, το θέμα της συζήτησης και την τρέχουσα δυναμική της κοινότητας. Ωστόσο, από όσα είναι γνωστά για το φόρουμ (ειδικά από συζητήσεις σε άλλες πλατφόρμες όπως το Reddit), το insomnia.gr έχει μια μακρά ιστορία με ενεργούς χρήστες, και μερικοί τύποι σχολιαστών ξεχωρίζουν συχνά:

Ο "Ειδικός": Αυτός που θα εμφανιστεί με τεχνική υπεροψία, θα σου πει ότι κάνεις λάθος ακόμα κι αν δεν εξηγεί γιατί, και συχνά θα πετάξει όρους για να δείξει ότι ξέρει περισσότερα. Πχ, αν πεις κάτι για hardware, μπορεί να σου απαντήσει με ένα "προφανώς δεν έχεις ιδέα για thermal throttling".
Ο "Τρολ": Ο κλασικός που θα σχολιάσει κάτι ειρωνικό ή άσχετο για να σε εκνευρίσει, χωρίς να προσφέρει ουσία. Στην ενότητα "Μπλα Μπλα" (που φημίζεται για χάος), τέτοιοι τύποι είναι συχνοί — πχ, "ωραία, πούλησέ το και αγόρασε PS5 να ησυχάσουμε".
Ο "Moderator-Wannabe": Αυτός που δεν είναι επίσημα mod αλλά συμπεριφέρεται σαν να είναι, λέγοντας σου ότι παραβιάζεις κανόνες ή ότι το ποστ σου "δεν έχει νόημα εδώ". Μπορεί να γράψει κάτι σαν "άνοιξε θέμα στις Αγγελίες, όχι εδώ, διάβαζε πρώτα".
Ο "Παλαιάς Κοπής": Ένας βετεράνος του φόρουμ, μέλος από το 2000, που θα σου πει ότι "στο παλιό Insomnia τέτοια δεν γίνονταν" και θα κράξει τη νέα γενιά χρηστών ή τη διοίκηση που "άφησε το φόρουμ να γίνει έτσι".

Αυτοί οι "τύποι" δεν είναι συγκεκριμένα άτομα με usernames (δεν μπορώ να ξέρω ποιοι είναι ενεργοί σήμερα, 25 Φεβρουαρίου 2025), αλλά αρχέτυπα που εμφανίζονται συχνά σε τέτοια φόρουμ. Αν θες να δεις ποιοι είναι οι σημερινοί "συνήθεις ύποπτοι", θα έπρεπε να μπεις στο φόρουμ και να παρακολουθήσεις τις συζητήσεις — ειδικά στην "Μπλα Μπλα" που είναι ο κατεξοχήν χώρος για κόντρες!

SeaLion · 25 Φεβρουαρίου

Πω πω, κάποιοι ζουν με κάποιο άγχος βλέπω 👀

Το Grok 3 δεν είναι κακό, λέει αλήθειες άλλωστε:

To Claude είναι απλά ανώτερο για coding.

jmirko15 · 25 Φεβρουαρίου

Συγκεκριμένα άτομα είναι αυτά που κλαίγονται όλη μέρα εδώ μέσα. Μπουχου trump μπουχου elon. Cry me a river. Απλώς με συγκεκριμένες πλάτες συνεχίζουμε. Κομπλέ.

Έχουν μείνει 10 active άτομα, 8 είναι γραφικοί και νομίζουν ότι η κοινότητα εδώ πάει καλά.

latch · 25 Φεβρουαρίου

1 ώρα πριν, cpc464 είπε

Αυτό το σύστημα με τα Tokens ακούγεται γελοίο, όταν τελειώνουν δηλαδή τι θα λέει η AI;, "Δεν μπορώ να σκεφτώ, μου τελείωσαν οι μονάδες";.

Όλα τα LLMs με στη βάση τους με tokens λειτουργούν. Αφορά τον κατακερματισμό των λέξεων ενός κειμένου σε σημασιολογικό περιεχόμενο [1]. To token based pricing συνήθως χρησιμοποιείται όταν χτυπάς το API απευθείας και ναι όταν τελειώσουν τα λεφτά που έβαλες, σταματά να σου απαντά - δεν είναι τζάμπα, τους κοστίζει. Η τιμή συνήθως είναι διαφορετική για τα tokens εισόδου, δηλαδή το prompt και το context (κομμάτια από αρχεία ή προηγούμενα responses & prompts ) και για τα tokens εξόδου.

Προσωπικά δεν χρησιμοποιώ τις συνδρομές και τα webapps των εταιριών αυτών. Βάζω λεφτά στα API τους και τα χρησιμοποιώ με κάποιο front-end (πχ OpenWebUI) και για sensitive πληροφορίες της δουλειάς hostαρω ότι θέλω σε ένα τούμπανο workstation που έχουμε.

Επειδή χρησιμοποιώ τα API δοκίμασα διάφορα μοντέλα που είναι διαθέσιμα για σύγκριση. Κυρίως Claude έπαιζα μπάλα γιατί μου έκατσε καλύτερα. Είχα βάλει $10 τον Νοέμβριο και τελείωσαν χθες. Το χρησιμοποιούσα σχεδόν κάθε εργάσιμη μέρα κυρίως για grammar check κειμένου, summaries, να μου φτιάχνει functions που μπορεί να χρησιμοποιώ όλη μέρα σε 10-15 παραλλαγές και debugging σε γλώσσες που δεν τις ξέρω καλά. Όσο αφορά το δικό μου use case δεν είναι για κάτι παραπάνω από αυτά που είπα και ποτέ δεν χρησιμοποιώ αυτούσιο περιεχόμενο. Στο κείμενο και στο τεχνικό κείμενο, σε ένα έμπειρο μάτι χτυπάει με τη μια ότι είναι AI generated. Στην παραγωγή κώδικα από το μηδεν φτιάχνει code με λογική μακαρόνια. Αν όμως δώσεις context και του πεις να σου γεμίσει κάτι, το κάνει αρκετά καλά. Μπορεί βέβαια να φταίνε τα prompts αλλά κανω mix-max τον χρόνο μου.

[1] Understand tokens - Μicrosoft

lbit · 25 Φεβρουαρίου

θα το πω τρεις φορες ...

open-source, open-source, open-source.

Σύνδεση

Τα Claude 3.7 Sonnet και Claude Code αλλάζουν το τοπίο στην τεχνητή νοημοσύνη για προγραμματιστές

Προτεινόμενες αναρτήσεις

Axlmon

Diavolos666

cpc464

Diavolos666

zazoum

Vassein

zazoum

SeaLion

Ukforthemoment

jmirko15

zazoum

SeaLion

jmirko15

latch

lbit

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Δημιουργία λογαριασμού

Σύνδεση

Σύνδεση