Η OpenAI έκανε ένα σημαντικό βήμα στην εξέλιξη της τεχνητής νοημοσύνης με την κυκλοφορία του Operator, ενός προηγμένου AI agent που μπορεί να εκτελεί αυτόνομα διάφορες εργασίες.

Η OpenAI παρουσίασε τον Operator, ένα AI Αγεντ που φιλοδοξεί να επαναπροσδιορίσει την καθημερινή διάδραση με το διαδίκτυο. Μέσω ενός ενσωματωμένου browser, ο Operator μπορεί να εκτελεί αυτόνομα πληθώρα διαδικτυακών εργασιών, από απλή συμπλήρωση φορμών μέχρι πολύπλοκες αλληλουχίες ενεργειών.

Το νέο μοντέλο Computer-Using Agent (CUA) που τροφοδοτεί τον Operator συνδυάζει τις εξελιγμένες οπτικές δυνατότητες του GPT-4o με προηγμένη λογική επεξεργασία μέσω ενισχυτικής μάθησης. Χρησιμοποιώντας στιγμιότυπα οθόνης (screenshots), ο agent "βλέπει" και αλληλεπιδρά με διάφορα UI, αξιοποιώντας όλες τις δυνατότητες ποντικιού και πληκτρολογίου χωρίς την ανάγκη ειδικών διασυνδέσεων API.

Η ασφάλεια διαρθρώνεται σε τρία επίπεδα: έλεγχος χρήστη, διαχείριση απορρήτου και προστασία από κακόβουλες ιστοσελίδες. Ο Operator απαιτεί έγκριση για κάθε κρίσιμη ενέργεια και μεταβιβάζει αυτόματα τον έλεγχο στον χρήστη για χειρισμό ευαίσθητων πληροφοριών, όπως διαπιστευτήρια σύνδεσης ή στοιχεία πληρωμών.

Εταιρείες κολοσσοί όπως DoorDash, Instacart, OpenTable, Priceline και Uber έχουν ήδη συνάψει συνεργασίες με την OpenAI για τη βελτιστοποίηση του Operator στις πλατφόρμες τους. Ο Daniel Danker, Chief Product Officer της Instacart, υπογράμμισε τη δυναμική του εργαλείου στην απλοποίηση καθημερινών διαδικασιών όπως οι διαδικτυακές αγορές τροφίμων. 

Η λειτουργία προσαρμογής επιτρέπει στους χρήστες να ορίσουν ειδικές οδηγίες ανά ιστοσελίδα και να αποθηκεύσουν συχνά χρησιμοποιούμενες εντολές. Επιπλέον, υποστηρίζεται η παράλληλη εκτέλεση πολλαπλών εργασιών μέσω διαφορετικών συνομιλιών, προσομοιάζοντας τη χρήση πολλαπλών καρτελών σε ένα browser.

Η OpenAI επεκτείνει τη συνεργασία της και στον δημόσιο τομέα, με χαρακτηριστικό παράδειγμα την πόλη του Stockton. Όπως δήλωσε ο Jamil Niazi, Διευθυντής Πληροφορικής της πόλης, ο Operator θα διευκολύνει την πρόσβαση των πολιτών σε δημοτικές υπηρεσίες και προγράμματα. Προς το παρόν, η πρόσβαση στον Operator περιορίζεται σε Pro χρήστες στις ΗΠΑ μέσω του operator.chatgpt.com, με σχεδιασμό επέκτασης σε Plus, Team και Enterprise συνδρομητές. Παράλληλα, η OpenAI προετοιμάζει την ενσωμάτωση των δυνατοτήτων του Operator στο ChatGPT.

Για τους προγραμματιστές, η επικείμενη διάθεση του μοντέλου CUA μέσω API θα επιτρέψει την ανάπτυξη εξειδικευμένων πρακτόρων χρήσης υπολογιστή. Η OPENAI δεσμεύεται για συνεχή βελτίωση των δυνατοτήτων του Operator, με έμφαση στην ασφάλεια και την αξιοπιστία σε μεγάλη κλίμακα.

Τα πρώτα στατιστικά στοιχεία δείχνουν ότι το 95% των χρηστών της δοκιμαστικής έκδοσης αναφέρουν εξοικονόμηση τουλάχιστον 30 λεπτών ημερησίως στις διαδικτυακές τους εργασίες.

  • Like 1
  • Haha 2