Αναζήτηση στην κοινότητα
Εμφάνιση αποτελεσμάτων για τις ετικέτες 'Gemini'.
52 αποτελέσματα
-
Η Google διευρύνει την παρουσία της στην ελληνική αγορά τεχνητής νοημοσύνης με την κυκλοφορία του Gemini Live στα ελληνικά, προσφέροντας πλέον στους χρήστες τη δυνατότητα φυσικής συνομιλίας με τον ΑΙ βοηθό τους στη μητρική τους γλώσσα. Η πλατφόρμα, διαθέσιμη ήδη σε συσκευές Android και με επικείμενη κυκλοφορία σε iOS, φέρνει μαζί της ένα ολοκληρωμένο οικοσύστημα λειτουργιών που μεταμορφώνει τον τρόπο αλληλεπίδρασης των χρηστών με την τεχνολογία. Το νέο σύστημα υποστηρίζει παράλληλη χρήση δύο γλωσσών στην ίδια συσκευή, επιτρέποντας στους χρήστες να εναλλάσσονται μεταξύ τους ανάλογα με τις ανάγκες τους. Η διαδικασία ρύθμισης των γλωσσικών προτιμήσεων πραγματοποιείται μέσω ενός απλοποιημένου μενού στις ρυθμίσεις της εφαρμογής Google, καθιστώντας την προσαρμογή προσιτή σε όλους τους χρήστες. Η ενσωμάτωση των Επεκτάσεων (Extensions) αποτελεί θεμελιώδη καινοτομία που μεταμορφώνει το Gemini Live σε κεντρικό άξονα ψηφιακής παραγωγικότητας. Οι χρήστες αποκτούν άμεση πρόσβαση σε υπηρεσίες όπως το Gmail, οι Χάρτες, το YouTube, το Ημερολόγιο Google, το Tasks και το Keep, με δυνατότητα αυτοματοποίησης πολύπλοκων εργασιών και διαχείρισης πληροφοριών μεταξύ εφαρμογών. Όπως αναφέρει η Google, η τεχνολογική υποδομή του Gemini Live βασίζεται σε προηγμένους αλγορίθμους μηχανικής μάθησης που επιτρέπουν την αναγνώριση και επεξεργασία πολλαπλών τύπων δεδομένων. Το σύστημα μπορεί να αναλύει εικόνες, να επεξεργάζεται φυσική γλώσσα και να συνδυάζει πληροφορίες από διαφορετικές πηγές για την παροχή ολοκληρωμένων απαντήσεων. Οι δυνατότητες πρακτικής εφαρμογής εκτείνονται από την απλή οργάνωση καθημερινών δραστηριοτήτων μέχρι την υποστήριξη επαγγελματικών εργασιών. Το Gemini Live μπορεί να βοηθήσει στη δημιουργία παρουσιάσεων, την ανάλυση δεδομένων, την οργάνωση εκδηλώσεων και τη διαχείριση προσωπικών πληροφοριών με τρόπο που προσαρμόζεται στις ιδιαίτερες ανάγκες κάθε χρήστη. Στο τεχνικό επίπεδο, η πλατφόρμα ενσωματώνει προηγμένες λειτουργίες διαχείρισης συσκευών, συμπεριλαμβανομένου του ελέγχου πολυμέσων και βασικών ρυθμίσεων συστήματος. Το Βοηθητικό πρόγραμμα (Utilities) επιτρέπει τον έλεγχο λειτουργιών όπως φωτισμός, ήχος, συνδεσιμότητα και χρονοπρογραμματισμός. Η Google έχει δεσμευτεί για συνεχή βελτίωση και επέκταση των δυνατοτήτων του Gemini Live, με προγραμματισμένες αναβαθμίσεις που θα εισάγουν νέες λειτουργίες και θα βελτιστοποιήσουν την απόδοση του συστήματος. Η εταιρεία σχεδιάζει επίσης την προσθήκη υποστήριξης για περισσότερες γλώσσες και εφαρμογές στο μέλλον. Η ασφάλεια και η προστασία των προσωπικών δεδομένων αποτελούν βασικές προτεραιότητες, με το σύστημα να ενσωματώνει προηγμένα πρωτόκολλα κρυπτογράφησης και ελέγχου πρόσβασης. Οι χρήστες διατηρούν πλήρη έλεγχο των δεδομένων τους και μπορούν να διαχειρίζονται τις ρυθμίσεις απορρήτου μέσω ενός εύχρηστου περιβάλλοντος. Αξιοσημείωτο είναι ότι το Gemini Live θα υποστηρίζει μελλοντικά και διασύνδεση με τρίτες εφαρμογές, διευρύνοντας περαιτέρω τις δυνατότητες του οικοσυστήματος και δημιουργώντας νέες ευκαιρίες για ανάπτυξη καινοτόμων υπηρεσιών. Διαβάστε ολόκληρο το άρθρο
-
Η πλατφόρμα, διαθέσιμη ήδη σε συσκευές Android και με επικείμενη κυκλοφορία σε iOS, φέρνει μαζί της ένα ολοκληρωμένο οικοσύστημα λειτουργιών που μεταμορφώνει τον τρόπο αλληλεπίδρασης των χρηστών με την τεχνολογία. Το νέο σύστημα υποστηρίζει παράλληλη χρήση δύο γλωσσών στην ίδια συσκευή, επιτρέποντας στους χρήστες να εναλλάσσονται μεταξύ τους ανάλογα με τις ανάγκες τους. Η διαδικασία ρύθμισης των γλωσσικών προτιμήσεων πραγματοποιείται μέσω ενός απλοποιημένου μενού στις ρυθμίσεις της εφαρμογής Google, καθιστώντας την προσαρμογή προσιτή σε όλους τους χρήστες. Η ενσωμάτωση των Επεκτάσεων (Extensions) αποτελεί θεμελιώδη καινοτομία που μεταμορφώνει το Gemini Live σε κεντρικό άξονα ψηφιακής παραγωγικότητας. Οι χρήστες αποκτούν άμεση πρόσβαση σε υπηρεσίες όπως το Gmail, οι Χάρτες, το YouTube, το Ημερολόγιο Google, το Tasks και το Keep, με δυνατότητα αυτοματοποίησης πολύπλοκων εργασιών και διαχείρισης πληροφοριών μεταξύ εφαρμογών. Όπως αναφέρει η Google, η τεχνολογική υποδομή του Gemini Live βασίζεται σε προηγμένους αλγορίθμους μηχανικής μάθησης που επιτρέπουν την αναγνώριση και επεξεργασία πολλαπλών τύπων δεδομένων. Το σύστημα μπορεί να αναλύει εικόνες, να επεξεργάζεται φυσική γλώσσα και να συνδυάζει πληροφορίες από διαφορετικές πηγές για την παροχή ολοκληρωμένων απαντήσεων. Οι δυνατότητες πρακτικής εφαρμογής εκτείνονται από την απλή οργάνωση καθημερινών δραστηριοτήτων μέχρι την υποστήριξη επαγγελματικών εργασιών. Το Gemini Live μπορεί να βοηθήσει στη δημιουργία παρουσιάσεων, την ανάλυση δεδομένων, την οργάνωση εκδηλώσεων και τη διαχείριση προσωπικών πληροφοριών με τρόπο που προσαρμόζεται στις ιδιαίτερες ανάγκες κάθε χρήστη. Στο τεχνικό επίπεδο, η πλατφόρμα ενσωματώνει προηγμένες λειτουργίες διαχείρισης συσκευών, συμπεριλαμβανομένου του ελέγχου πολυμέσων και βασικών ρυθμίσεων συστήματος. Το Βοηθητικό πρόγραμμα (Utilities) επιτρέπει τον έλεγχο λειτουργιών όπως φωτισμός, ήχος, συνδεσιμότητα και χρονοπρογραμματισμός. Η Google έχει δεσμευτεί για συνεχή βελτίωση και επέκταση των δυνατοτήτων του Gemini Live, με προγραμματισμένες αναβαθμίσεις που θα εισάγουν νέες λειτουργίες και θα βελτιστοποιήσουν την απόδοση του συστήματος. Η εταιρεία σχεδιάζει επίσης την προσθήκη υποστήριξης για περισσότερες γλώσσες και εφαρμογές στο μέλλον. Η ασφάλεια και η προστασία των προσωπικών δεδομένων αποτελούν βασικές προτεραιότητες, με το σύστημα να ενσωματώνει προηγμένα πρωτόκολλα κρυπτογράφησης και ελέγχου πρόσβασης. Οι χρήστες διατηρούν πλήρη έλεγχο των δεδομένων τους και μπορούν να διαχειρίζονται τις ρυθμίσεις απορρήτου μέσω ενός εύχρηστου περιβάλλοντος. Αξιοσημείωτο είναι ότι το Gemini Live θα υποστηρίζει μελλοντικά και διασύνδεση με τρίτες εφαρμογές, διευρύνοντας περαιτέρω τις δυνατότητες του οικοσυστήματος και δημιουργώντας νέες ευκαιρίες για ανάπτυξη καινοτόμων υπηρεσιών.
-
Η Google ετοιμάζεται να φέρει τον ψηφιακό βοηθό Gemini Live στη γραμμή εργασιών των Windows, σύμφωνα με νέα στοιχεία που εντοπίστηκαν στον κώδικα του Chromium. Σύμφωνα με αποκλειστικό ρεπορτάζ του Windows Latest, η Google σχεδιάζει να ενσωματώσει τον ψηφιακό βοηθό Gemini Live στη γραμμή εργασιών (taskbar) των Windows 10 και Windows 11. Η ανακάλυψη προέρχεται από ένα patch στον κώδικα του Chromium που υποδεικνύει την προσθήκη μιας νέας λειτουργικότητας με την ονομασία "floaty detach on Windows". Το Gemini Live, που αυτή τη στιγμή είναι διαθέσιμο μόνο μέσω της γραμμής διευθύνσεων του Chrome και των εφαρμογών για Android και iOS, σχεδιάστηκε για να προσφέρει φυσικές συνομιλίες με τεχνητή νοημοσύνη, παρόμοιες με αυτές του ChatGPT Advance Voice Mode. Η υπηρεσία μπορεί να κατανοήσει το περιεχόμενο και τον τόνο της συνομιλίας, προσφέροντας εξατομικευμένες απαντήσεις στους χρήστες. Ο κώδικας που εντοπίστηκε αναφέρεται στο "GLIC" (Gemini Live in Chrome) και υποδεικνύει την ανάπτυξη ενός αιωρούμενου πάνελ που θα φιλοξενεί το Gemini Live στον browser. Η προσέγγιση θυμίζει την εξέλιξη του Microsoft Copilot, που ξεκίνησε ως πλευρική μπάρα στον Edge και στη συνέχεια έγινε αυτόνομη εφαρμογή. Η τεχνική υλοποίηση φαίνεται να επιτρέπει στο Gemini Live να λειτουργεί ως ανεξάρτητος βοηθός, προσβάσιμος απευθείας από τη γραμμή εργασιών των Windows. Οι χρήστες θα μπορούν να ανοίγουν το Gemini Live με ένα κλικ, διατηρώντας διακρτικά το παράθυρό του ως popup, ενώ εργάζονται σε άλλες εφαρμογές. Η ενσωμάτωση αναμένεται να προσφέρει βαθύτερη διασύνδεση με το οικοσύστημα της Google, συμπεριλαμβανομένων υπηρεσιών όπως το Gmail και συσκευών Android. Ωστόσο, υπάρχουν προβληματισμοί σχετικά με την επίδραση στην απόδοση του συστήματος, δεδομένου ότι ο Chrome είναι ήδη απαιτητικός σε πόρους, καθώς και ζητήματα προστασίας προσωπικών δεδομένων που θα πρέπει να αντιμετωπιστούν. Η κίνηση αυτή εντάσσεται στη στρατηγική της Google να καταστήσει το Gemini ευρέως διαθέσιμο και να ανταγωνιστεί αποτελεσματικότερα τη Microsoft και άλλους παρόχους υπηρεσιών τεχνητής νοημοσύνης στην αγορά των ψηφιακών βοηθών. Διαβάστε ολόκληρο το άρθρο
-
Σύμφωνα με αποκλειστικό ρεπορτάζ του Windows Latest, η Google σχεδιάζει να ενσωματώσει τον ψηφιακό βοηθό Gemini Live στη γραμμή εργασιών (taskbar) των Windows 10 και Windows 11. Η ανακάλυψη προέρχεται από ένα patch στον κώδικα του Chromium που υποδεικνύει την προσθήκη μιας νέας λειτουργικότητας με την ονομασία "floaty detach on Windows". Το Gemini Live, που αυτή τη στιγμή είναι διαθέσιμο μόνο μέσω της γραμμής διευθύνσεων του Chrome και των εφαρμογών για Android και iOS, σχεδιάστηκε για να προσφέρει φυσικές συνομιλίες με τεχνητή νοημοσύνη, παρόμοιες με αυτές του ChatGPT Advance Voice Mode. Η υπηρεσία μπορεί να κατανοήσει το περιεχόμενο και τον τόνο της συνομιλίας, προσφέροντας εξατομικευμένες απαντήσεις στους χρήστες. Ο κώδικας που εντοπίστηκε αναφέρεται στο "GLIC" (Gemini Live in Chrome) και υποδεικνύει την ανάπτυξη ενός αιωρούμενου πάνελ που θα φιλοξενεί το Gemini Live στον browser. Η προσέγγιση θυμίζει την εξέλιξη του Microsoft Copilot, που ξεκίνησε ως πλευρική μπάρα στον Edge και στη συνέχεια έγινε αυτόνομη εφαρμογή. Η τεχνική υλοποίηση φαίνεται να επιτρέπει στο Gemini Live να λειτουργεί ως ανεξάρτητος βοηθός, προσβάσιμος απευθείας από τη γραμμή εργασιών των Windows. Οι χρήστες θα μπορούν να ανοίγουν το Gemini Live με ένα κλικ, διατηρώντας διακρτικά το παράθυρό του ως popup, ενώ εργάζονται σε άλλες εφαρμογές. Η ενσωμάτωση αναμένεται να προσφέρει βαθύτερη διασύνδεση με το οικοσύστημα της Google, συμπεριλαμβανομένων υπηρεσιών όπως το Gmail και συσκευών Android. Ωστόσο, υπάρχουν προβληματισμοί σχετικά με την επίδραση στην απόδοση του συστήματος, δεδομένου ότι ο Chrome είναι ήδη απαιτητικός σε πόρους, καθώς και ζητήματα προστασίας προσωπικών δεδομένων που θα πρέπει να αντιμετωπιστούν. Η κίνηση αυτή εντάσσεται στη στρατηγική της Google να καταστήσει το Gemini ευρέως διαθέσιμο και να ανταγωνιστεί αποτελεσματικότερα τη Microsoft και άλλους παρόχους υπηρεσιών τεχνητής νοημοσύνης στην αγορά των ψηφιακών βοηθών.
-
Η Google επεκτείνει τις δυνατότητες του Gemini AI με την προσθήκη νέας λειτουργικότητας για την ανάλυση αρχείων PDF στην εφαρμογή Files by Google για Android. Δημοσίευμα του Android Police αναφέρει ότι η Google προχωρά στην ενσωμάτωση νέας λειτουργικότητας του Gemini AI που επιτρέπει στους χρήστες να θέτουν ερωτήσεις σχετικά με αρχεία PDF μέσω της εφαρμογής Files by Google. Η νέα δυνατότητα "Ask about this PDF" είχε αρχικά παρουσιαστεί κατά τη διάρκεια του Google I/O 2024 τον Μάιο, μαζί με άλλες λειτουργίες όπως το "Ask about this screen" και "Ask about this video". Όπως αναφέρει ο Mishaal Rahman στο Reddit (r/Android), η νέα λειτουργία ξεκίνησε να διατίθεται σταδιακά στους χρήστες, αν και προς το παρόν δεν είναι διαθέσιμη σε όλους τους χρήστες του Gemini. Σημαντική προϋπόθεση για τη χρήση της νέας λειτουργίας είναι η συνδρομή στο Gemini Advanced, η ρύθμιση του Gemini ως προεπιλεγμένου βοηθού στο Android τηλέφωνο, καθώς και η χρήση συσκευής με λειτουργικό σύστημα Android 15. Η λειτουργικότητα εμφανίζεται ως "Ask about this PDF" πάνω από το overlay του Gemini, παρόμοια με την ενσωμάτωση του Gemini στο YouTube. Οι χρήστες μπορούν να ενεργοποιήσουν τη λειτουργία είτε κρατώντας πατημένο το κουμπί λειτουργίας είτε χρησιμοποιώντας τη φωνητική εντολή "Hey Google" ενώ προβάλλουν ένα αρχείο PDF στην εφαρμογή Files by Google. Η νέα αυτή δυνατότητα έρχεται σε συνέχεια της πρόσφατης προσθήκης ενός ενσωματωμένου PDF viewer στην εφαρμογή Files by Google. Η λειτουργία αναμένεται να διευκολύνει σημαντικά τους χρήστες και τους οργανισμούς που χρειάζεται να επεξεργάζονται πολλαπλά έγγραφα καθημερινά, επιτρέποντάς τους να λαμβάνουν άμεσες απαντήσεις σε ερωτήσεις σχετικά με το περιεχόμενο των PDF αρχείων τους. Προς το παρόν, πολλοί χρήστες εξακολουθούν να βλέπουν μόνο το "Ask about this screen" κατά την προβολή PDF αρχείων, το οποίο περιορίζεται στη λήψη στιγμιότυπου οθόνης της τρέχουσας σελίδας και δεν μπορεί να αναλύσει το πλήρες περιεχόμενο του εγγράφου. Διαβάστε ολόκληρο το άρθρο
-
Δημοσίευμα του Android Police αναφέρει ότι η Google προχωρά στην ενσωμάτωση νέας λειτουργικότητας του Gemini AI που επιτρέπει στους χρήστες να θέτουν ερωτήσεις σχετικά με αρχεία PDF μέσω της εφαρμογής Files by Google. Η νέα δυνατότητα "Ask about this PDF" είχε αρχικά παρουσιαστεί κατά τη διάρκεια του Google I/O 2024 τον Μάιο, μαζί με άλλες λειτουργίες όπως το "Ask about this screen" και "Ask about this video". Όπως αναφέρει ο Mishaal Rahman στο Reddit (r/Android), η νέα λειτουργία ξεκίνησε να διατίθεται σταδιακά στους χρήστες, αν και προς το παρόν δεν είναι διαθέσιμη σε όλους τους χρήστες του Gemini. Σημαντική προϋπόθεση για τη χρήση της νέας λειτουργίας είναι η συνδρομή στο Gemini Advanced, η ρύθμιση του Gemini ως προεπιλεγμένου βοηθού στο Android τηλέφωνο, καθώς και η χρήση συσκευής με λειτουργικό σύστημα Android 15. Η λειτουργικότητα εμφανίζεται ως "Ask about this PDF" πάνω από το overlay του Gemini, παρόμοια με την ενσωμάτωση του Gemini στο YouTube. Οι χρήστες μπορούν να ενεργοποιήσουν τη λειτουργία είτε κρατώντας πατημένο το κουμπί λειτουργίας είτε χρησιμοποιώντας τη φωνητική εντολή "Hey Google" ενώ προβάλλουν ένα αρχείο PDF στην εφαρμογή Files by Google. Η νέα αυτή δυνατότητα έρχεται σε συνέχεια της πρόσφατης προσθήκης ενός ενσωματωμένου PDF viewer στην εφαρμογή Files by Google. Η λειτουργία αναμένεται να διευκολύνει σημαντικά τους χρήστες και τους οργανισμούς που χρειάζεται να επεξεργάζονται πολλαπλά έγγραφα καθημερινά, επιτρέποντάς τους να λαμβάνουν άμεσες απαντήσεις σε ερωτήσεις σχετικά με το περιεχόμενο των PDF αρχείων τους. Προς το παρόν, πολλοί χρήστες εξακολουθούν να βλέπουν μόνο το "Ask about this screen" κατά την προβολή PDF αρχείων, το οποίο περιορίζεται στη λήψη στιγμιότυπου οθόνης της τρέχουσας σελίδας και δεν μπορεί να αναλύσει το πλήρες περιεχόμενο του εγγράφου.
-
Η Google κυκλοφόρησε την εφαρμογή Gemini για iPhone, προσφέροντας άμεση πρόσβαση στον AI chatbot της εταιρείας μέσω φωνητικών εντολών και κειμένου. Η νέα εφαρμογή Gemini της Google έκανε την εμφάνισή της στο App Store παγκοσμίως αυτή την εβδομάδα, σηματοδοτώντας μια σημαντική επέκταση στην προσβασιμότητα της τεχνητής νοημοσύνης της εταιρείας. Η δωρεάν εφαρμογή προσφέρει μια απλή και άμεση διεπαφή επικοινωνίας με το chatbot. Σύμφωνα με τις πληροφορίες, η εφαρμογή διαθέτει ένα παράθυρο συνομιλίας και μια λίστα με το ιστορικό των προηγούμενων συνομιλιών. Οι χρήστες μπορούν να αλληλεπιδράσουν με το Gemini χρησιμοποιώντας κείμενο, φωνή ή την κάμερα του τηλεφώνου τους. Η λειτουργικότητα είναι πανομοιότυπη με αυτή που προσφέρει η ενότητα Gemini στην κύρια εφαρμογή της Google ή στην ιστοσελίδα του Gemini. Ένα σημαντικό νέο χαρακτηριστικό είναι η πρόσβαση στο Gemini Live, την πιο διαδραστική λειτουργία συνομιλίας που μοιάζει με τη φωνητική λειτουργία του ChatGPT. Το Gemini Live, που ήταν διαθέσιμο στο Android για μερικές εβδομάδες, εμφανίζεται τώρα για πρώτη φορά στο iPhone τόσο στο Dynamic Island όσο και στην οθόνη κλειδώματος. Η Google στοχεύει στην εύκολη πρόσβαση στο Gemini μέσω του εικονιδίου στην αρχική οθόνη και τη δυνατότητα ανάθεσής του στο Action Button ή σε άλλα σημεία γρήγορης πρόσβασης του τηλεφώνου. Η εταιρεία επισημαίνει ότι οι χρήστες μπορούν να ξεκινήσουν μια συνομιλία με το bot με ένα άγγιγμα και μισό δευτερόλεπτο. Ωστόσο, όπως και άλλα chatbots εκτός του Siri, το Gemini έχει περιορισμούς στο iPhone. Δεν μπορεί να αλλάξει ρυθμίσεις ή να έχει πρόσβαση σε άλλες εφαρμογές. Παρόλα αυτά, διαθέτει το πλεονέκτημα της διασύνδεσης με άλλες εφαρμογές της Google, όπως το YouTube Music και το Google Maps, προσφέροντας μια πρώτη γεύση από το μέλλον της διαδραστικότητας στα κινητά τηλέφωνα. Διαβάστε ολόκληρο το άρθρο
-
Η Google ανακοίνωσε την κυκλοφορία του νέου μοντέλου τεχνητής νοημοσύνης Gemini 2.0, με σημαντικές βελτιώσεις και νέες δυνατότητες. Η Google παρουσίασε σήμερα το νέο μοντέλο τεχνητής νοημοσύνης Gemini 2.0, περίπου 10 μήνες μετά την κυκλοφορία της έκδοσης 1.5. Σύμφωνα με τον Demis Hassabis, CEO της Google DeepMind και επικεφαλής των προσπαθειών ΤΝ της εταιρείας, το νέο μοντέλο αποτελεί σημαντικό ορόσημο στην εξέλιξη της τεχνητής νοημοσύνης. Το Gemini 2.0 προσφέρει σημαντικές βελτιώσεις σε σχέση με την προηγούμενη έκδοση, συμπεριλαμβανομένης της δυνατότητας δημιουργίας ήχου και εικόνων, καθώς και νέες πολυτροπικές λειτουργίες. Όπως αναφέρει ο Hassabis, η έκδοση 2.0 Flash είναι εξίσου ισχυρή με το τρέχον μοντέλο Pro, προσφέροντας καλύτερη απόδοση με την ίδια αποτελεσματικότητα κόστους. Η Google παρουσιάζει επίσης νέα πειραματικά projects που βασίζονται στο Gemini 2.0, συμπεριλαμβανομένου του Project Mariner, ενός Chrome plugin που μπορεί να χρησιμοποιήσει τον browser για λογαριασμό του χρήστη, και του Jules, ενός agent που βοηθά τους προγραμματιστές στην εύρεση και διόρθωση προβληματικού κώδικα. Σύμφωνα με τον Hassabis, το 2025 θα σηματοδοτήσει την πραγματική έναρξη της εποχής των AI agents, με το Gemini 2.0 να αποτελεί το θεμέλιο αυτής της εξέλιξης. Η εταιρεία σχεδιάζει να ενσωματώσει το Gemini 2.0 σε όλα τα προϊόντα της, συμπεριλαμβανομένης της Αναζήτησης Google, του Workspace και άλλων υπηρεσιών. Ωστόσο, η Google αναγνωρίζει τις προκλήσεις ασφαλείας που συνδέονται με τους AI agents. Ο Hassabis τονίζει την ανάγκη για νέες λύσεις ασφαλείας, όπως οι δοκιμές σε ενισχυμένα περιβάλλοντα sandbox, για την αντιμετώπιση πιθανών κινδύνων. Το Gemini 2.0 είναι ήδη διαθέσιμο σε πειραματικό στάδιο μέσω της διαδικτυακής εφαρμογής Gemini, ενώ αναμένεται η ευρύτερη διάθεσή του στις αρχές του επόμενου έτους. Διαβάστε ολόκληρο το άρθρο
-
Η Google ανακοίνωσε χθες το Gemini 2.0 και παρουσίασε πώς τα AI agents μπορούν να κατανοήσουν τους κανόνες των βιντεοπαιχνιδιών για να βοηθήσουν τους gamers. Η εταιρεία αποκάλυψε τη νέα έκδοση του Gemini 2.0, παρουσιάζοντας παράλληλα πώς οι AI agents που βασίζονται σε αυτή την τεχνολογία μπορούν να κατανοήσουν και να αναλύσουν τους κανόνες των βιντεοπαιχνιδιών σε πραγματικό χρόνο. Όπως αναφέρουν σε σχετικό blog post ο CEO της Google DeepMind, Demis Hassabis, και ο CTO Koray Kavukcuoglu, οι agents έχουν τη δυνατότητα να "αναλύουν το παιχνίδι βασιζόμενοι αποκλειστικά στη δράση που εμφανίζεται στην οθόνη και να προσφέρουν προτάσεις για τις επόμενες κινήσεις μέσω συζήτησης σε πραγματικό χρόνο". Επιπλέον, οι agents μπορούν να αξιοποιούν το Google Search για να συνδέσουν τους παίκτες με την πληθώρα γνώσεων σχετικά με τα παιχνίδια που υπάρχουν στο διαδίκτυο. Η Google διεξάγει δοκιμές των agents σε δημοφιλή παιχνίδια όπως το Clash of Clans και το Hay Day της Supercell, εξετάζοντας την ικανότητά τους να ερμηνεύουν κανόνες και προκλήσεις. Ωστόσο, το σύστημα βρίσκεται ακόμη σε πρώιμο στάδιο, με αρκετά ερωτήματα να παραμένουν σχετικά με την πρακτική χρησιμότητα των συμβουλών που προσφέρει. Παράλληλα με αυτή την εξέλιξη, η Google επενδύει και σε άλλους τομείς σύνδεσης της τεχνητής νοημοσύνης με τα βιντεοπαιχνίδια. Συγκεκριμένα, η εταιρεία παρουσίασε πρόσφατα το Genie 2, ένα "foundation world model" που μπορεί να δημιουργήσει gaming εικονικούς κόσμους από μια εικόνα-οδηγό. Ωστόσο, και αυτή η τεχνολογία βρίσκεται σε αρχικό στάδιο, καθώς μπορεί να παράγει συνεπείς κόσμους για gameplay διάρκεια έως ενός λεπτού. Η πρωτοβουλία αυτή εντάσσεται στο ευρύτερο πλαίσιο των προσπαθειών της Google να ενσωματώσει την τεχνητή νοημοσύνη στην gaming εμπειρία, αν και προς το παρόν η πρακτική αξία των εφαρμογών παραμένει υπό αξιολόγηση. Διαβάστε ολόκληρο το άρθρο
-
Η εταιρεία αποκάλυψε τη νέα έκδοση του Gemini 2.0, παρουσιάζοντας παράλληλα πώς οι AI agents που βασίζονται σε αυτή την τεχνολογία μπορούν να κατανοήσουν και να αναλύσουν τους κανόνες των βιντεοπαιχνιδιών σε πραγματικό χρόνο. Όπως αναφέρουν σε σχετικό blog post ο CEO της Google DeepMind, Demis Hassabis, και ο CTO Koray Kavukcuoglu, οι agents έχουν τη δυνατότητα να "αναλύουν το παιχνίδι βασιζόμενοι αποκλειστικά στη δράση που εμφανίζεται στην οθόνη και να προσφέρουν προτάσεις για τις επόμενες κινήσεις μέσω συζήτησης σε πραγματικό χρόνο". Επιπλέον, οι agents μπορούν να αξιοποιούν το Google Search για να συνδέσουν τους παίκτες με την πληθώρα γνώσεων σχετικά με τα παιχνίδια που υπάρχουν στο διαδίκτυο. Η Google διεξάγει δοκιμές των agents σε δημοφιλή παιχνίδια όπως το Clash of Clans και το Hay Day της Supercell, εξετάζοντας την ικανότητά τους να ερμηνεύουν κανόνες και προκλήσεις. Ωστόσο, το σύστημα βρίσκεται ακόμη σε πρώιμο στάδιο, με αρκετά ερωτήματα να παραμένουν σχετικά με την πρακτική χρησιμότητα των συμβουλών που προσφέρει. Παράλληλα με αυτή την εξέλιξη, η Google επενδύει και σε άλλους τομείς σύνδεσης της τεχνητής νοημοσύνης με τα βιντεοπαιχνίδια. Συγκεκριμένα, η εταιρεία παρουσίασε πρόσφατα το Genie 2, ένα "foundation world model" που μπορεί να δημιουργήσει gaming εικονικούς κόσμους από μια εικόνα-οδηγό. Ωστόσο, και αυτή η τεχνολογία βρίσκεται σε αρχικό στάδιο, καθώς μπορεί να παράγει συνεπείς κόσμους για gameplay διάρκεια έως ενός λεπτού. Η πρωτοβουλία αυτή εντάσσεται στο ευρύτερο πλαίσιο των προσπαθειών της Google να ενσωματώσει την τεχνητή νοημοσύνη στην gaming εμπειρία, αν και προς το παρόν η πρακτική αξία των εφαρμογών παραμένει υπό αξιολόγηση.
-
Η Google παρουσίασε σήμερα το νέο μοντέλο τεχνητής νοημοσύνης Gemini 2.0, περίπου 10 μήνες μετά την κυκλοφορία της έκδοσης 1.5. Σύμφωνα με τον Demis Hassabis, CEO της Google DeepMind και επικεφαλής των προσπαθειών ΤΝ της εταιρείας, το νέο μοντέλο αποτελεί σημαντικό ορόσημο στην εξέλιξη της τεχνητής νοημοσύνης. Το Gemini 2.0 προσφέρει σημαντικές βελτιώσεις σε σχέση με την προηγούμενη έκδοση, συμπεριλαμβανομένης της δυνατότητας δημιουργίας ήχου και εικόνων, καθώς και νέες πολυτροπικές λειτουργίες. Όπως αναφέρει ο Hassabis, η έκδοση 2.0 Flash είναι εξίσου ισχυρή με το τρέχον μοντέλο Pro, προσφέροντας καλύτερη απόδοση με την ίδια αποτελεσματικότητα κόστους. Η Google παρουσιάζει επίσης νέα πειραματικά projects που βασίζονται στο Gemini 2.0, συμπεριλαμβανομένου του Project Mariner, ενός Chrome plugin που μπορεί να χρησιμοποιήσει τον browser για λογαριασμό του χρήστη, και του Jules, ενός agent που βοηθά τους προγραμματιστές στην εύρεση και διόρθωση προβληματικού κώδικα. Σύμφωνα με τον Hassabis, το 2025 θα σηματοδοτήσει την πραγματική έναρξη της εποχής των AI agents, με το Gemini 2.0 να αποτελεί το θεμέλιο αυτής της εξέλιξης. Η εταιρεία σχεδιάζει να ενσωματώσει το Gemini 2.0 σε όλα τα προϊόντα της, συμπεριλαμβανομένης της Αναζήτησης Google, του Workspace και άλλων υπηρεσιών. Ωστόσο, η Google αναγνωρίζει τις προκλήσεις ασφαλείας που συνδέονται με τους AI agents. Ο Hassabis τονίζει την ανάγκη για νέες λύσεις ασφαλείας, όπως οι δοκιμές σε ενισχυμένα περιβάλλοντα sandbox, για την αντιμετώπιση πιθανών κινδύνων. Το Gemini 2.0 είναι ήδη διαθέσιμο σε πειραματικό στάδιο μέσω της διαδικτυακής εφαρμογής Gemini, ενώ αναμένεται η ευρύτερη διάθεσή του στις αρχές του επόμενου έτους.
-
Η νέα εφαρμογή Gemini της Google έκανε την εμφάνισή της στο App Store παγκοσμίως αυτή την εβδομάδα, σηματοδοτώντας μια σημαντική επέκταση στην προσβασιμότητα της τεχνητής νοημοσύνης της εταιρείας. Η δωρεάν εφαρμογή προσφέρει μια απλή και άμεση διεπαφή επικοινωνίας με το chatbot. Σύμφωνα με τις πληροφορίες, η εφαρμογή διαθέτει ένα παράθυρο συνομιλίας και μια λίστα με το ιστορικό των προηγούμενων συνομιλιών. Οι χρήστες μπορούν να αλληλεπιδράσουν με το Gemini χρησιμοποιώντας κείμενο, φωνή ή την κάμερα του τηλεφώνου τους. Η λειτουργικότητα είναι πανομοιότυπη με αυτή που προσφέρει η ενότητα Gemini στην κύρια εφαρμογή της Google ή στην ιστοσελίδα του Gemini. Ένα σημαντικό νέο χαρακτηριστικό είναι η πρόσβαση στο Gemini Live, την πιο διαδραστική λειτουργία συνομιλίας που μοιάζει με τη φωνητική λειτουργία του ChatGPT. Το Gemini Live, που ήταν διαθέσιμο στο Android για μερικές εβδομάδες, εμφανίζεται τώρα για πρώτη φορά στο iPhone τόσο στο Dynamic Island όσο και στην οθόνη κλειδώματος. Η Google στοχεύει στην εύκολη πρόσβαση στο Gemini μέσω του εικονιδίου στην αρχική οθόνη και τη δυνατότητα ανάθεσής του στο Action Button ή σε άλλα σημεία γρήγορης πρόσβασης του τηλεφώνου. Η εταιρεία επισημαίνει ότι οι χρήστες μπορούν να ξεκινήσουν μια συνομιλία με το bot με ένα άγγιγμα και μισό δευτερόλεπτο. Ωστόσο, όπως και άλλα chatbots εκτός του Siri, το Gemini έχει περιορισμούς στο iPhone. Δεν μπορεί να αλλάξει ρυθμίσεις ή να έχει πρόσβαση σε άλλες εφαρμογές. Παρόλα αυτά, διαθέτει το πλεονέκτημα της διασύνδεσης με άλλες εφαρμογές της Google, όπως το YouTube Music και το Google Maps, προσφέροντας μια πρώτη γεύση από το μέλλον της διαδραστικότητας στα κινητά τηλέφωνα.
-
Η Google επεκτείνει τη λειτουργία "Help me write" στο Gmail για desktop χρήστες, προσφέροντας προηγμένες δυνατότητες σύνταξης email με την υποστήριξη της τεχνητής νοημοσύνης Gemini. Σε μια σημαντική αναβάθμιση των υπηρεσιών της, η Google ανακοίνωσε την επέκταση του εργαλείου τεχνητής νοημοσύνης "Help me write" στην έκδοση web του Gmail. Η νέα λειτουργικότητα έρχεται να συμπληρώσει την ήδη επιτυχημένη εφαρμογή της στις κινητές συσκευές, προσφέροντας στους χρήστες ένα ισχυρό εργαλείο για τη δημιουργία και επεξεργασία email. Η πρόσβαση στη νέα λειτουργία προϋποθέτει συνδρομή στο Google One AI Premium ή την απόκτηση του πρόσθετου Gemini για το Workspace. Οι χρήστες θα παρατηρήσουν την εμφάνιση της επιλογής κατά τη δημιουργία νέου μηνύματος, επιτρέποντάς τους να αξιοποιήσουν την τεχνητή νοημοσύνη για τη βελτίωση της επικοινωνίας τους. Ιδιαίτερη έμφαση δίνεται στη νέα συντόμευση "polish", η οποία εμφανίζεται αυτόματα σε πρόχειρα μηνύματα που ξεπερνούν τις 12 λέξεις. Οι χρήστες του desktop μπορούν να ενεργοποιήσουν τη λειτουργία είτε μέσω του εικονιδίου είτε χρησιμοποιώντας τη συντόμευση πληκτρολογίου Ctrl + H. Στις κινητές συσκευές, η εταιρεία προχώρησε σε ανασχεδιασμό της διεπαφής, αντικαθιστώντας την υπάρχουσα επιλογή "Refine my draft". Η νέα προσέγγιση απλοποιεί τη διαδικασία βελτίωσης του κειμένου, καθώς με μία κίνηση το σύστημα αναλαμβάνει την αυτόματη βελτιστοποίηση του μηνύματος. Το εργαλείο προσφέρει πολλαπλές δυνατότητες επεξεργασίας, συμπεριλαμβανομένης της επισημοποίησης του ύφους, της επέκτασης του περιεχομένου ή της συντόμευσης του μηνύματος. Η τεχνητή νοημοσύνη αναλύει το κείμενο και προτείνει βελτιώσεις που ταιριάζουν στο επιθυμητό αποτέλεσμα. Η Google υιοθετεί μια σταδιακή προσέγγιση στην παγκόσμια διάθεση της λειτουργίας, ξεκινώντας από επιλεγμένες αγορές και επεκτείνοντας σταδιακά τη διαθεσιμότητα. Αξίζει να σημειωθεί ότι η εταιρεία έχει ενσωματώσει προηγμένους αλγόριθμους ασφαλείας για την προστασία των προσωπικών δεδομένων των χρηστών κατά τη χρήση του εργαλείου. Διαβάστε ολόκληρο το άρθρο
-
Σε μια σημαντική αναβάθμιση των υπηρεσιών της, η Google ανακοίνωσε την επέκταση του εργαλείου τεχνητής νοημοσύνης "Help me write" στην έκδοση web του Gmail. Η νέα λειτουργικότητα έρχεται να συμπληρώσει την ήδη επιτυχημένη εφαρμογή της στις κινητές συσκευές, προσφέροντας στους χρήστες ένα ισχυρό εργαλείο για τη δημιουργία και επεξεργασία email. Η πρόσβαση στη νέα λειτουργία προϋποθέτει συνδρομή στο Google One AI Premium ή την απόκτηση του πρόσθετου Gemini για το Workspace. Οι χρήστες θα παρατηρήσουν την εμφάνιση της επιλογής κατά τη δημιουργία νέου μηνύματος, επιτρέποντάς τους να αξιοποιήσουν την τεχνητή νοημοσύνη για τη βελτίωση της επικοινωνίας τους. Ιδιαίτερη έμφαση δίνεται στη νέα συντόμευση "polish", η οποία εμφανίζεται αυτόματα σε πρόχειρα μηνύματα που ξεπερνούν τις 12 λέξεις. Οι χρήστες του desktop μπορούν να ενεργοποιήσουν τη λειτουργία είτε μέσω του εικονιδίου είτε χρησιμοποιώντας τη συντόμευση πληκτρολογίου Ctrl + H. Στις κινητές συσκευές, η εταιρεία προχώρησε σε ανασχεδιασμό της διεπαφής, αντικαθιστώντας την υπάρχουσα επιλογή "Refine my draft". Η νέα προσέγγιση απλοποιεί τη διαδικασία βελτίωσης του κειμένου, καθώς με μία κίνηση το σύστημα αναλαμβάνει την αυτόματη βελτιστοποίηση του μηνύματος. Το εργαλείο προσφέρει πολλαπλές δυνατότητες επεξεργασίας, συμπεριλαμβανομένης της επισημοποίησης του ύφους, της επέκτασης του περιεχομένου ή της συντόμευσης του μηνύματος. Η τεχνητή νοημοσύνη αναλύει το κείμενο και προτείνει βελτιώσεις που ταιριάζουν στο επιθυμητό αποτέλεσμα. Η Google υιοθετεί μια σταδιακή προσέγγιση στην παγκόσμια διάθεση της λειτουργίας, ξεκινώντας από επιλεγμένες αγορές και επεκτείνοντας σταδιακά τη διαθεσιμότητα. Αξίζει να σημειωθεί ότι η εταιρεία έχει ενσωματώσει προηγμένους αλγόριθμους ασφαλείας για την προστασία των προσωπικών δεδομένων των χρηστών κατά τη χρήση του εργαλείου.
-
Η Google αποκάλυψε ότι τα συστήματα τεχνητής νοημοσύνης παράγουν πλέον περισσότερο από το 25% του νέου κώδικα στα προϊόντα της, σύμφωνα με ανακοίνωση του CEO της εταιρείας. Η αποκάλυψη έγινε κατά τη διάρκεια της παρουσίασης των οικονομικών αποτελεσμάτων του τρίτου τριμήνου του 2024, με τον Σουντάρ Πιτσάι να τονίζει πως οι μηχανικοί λογισμικού της εταιρείας επιβλέπουν και εγκρίνουν τον παραγόμενο κώδικα. Η εξέλιξη αυτή αντικατοπτρίζει μια ευρύτερη τάση στον κλάδο της ανάπτυξης λογισμικού. Σύμφωνα με πρόσφατη έρευνα της Stack Overflow, περισσότεροι από τρεις στους τέσσερις προγραμματιστές χρησιμοποιούν ή σχεδιάζουν να χρησιμοποιήσουν εργαλεία τεχνητής νοημοσύνης στη διαδικασία ανάπτυξης εφαρμογών. Η επανάσταση στον προγραμματισμό με τη βοήθεια της τεχνητής νοημοσύνης ξεκίνησε ουσιαστικά το 2021 με το GitHub Copilot, το οποίο βασίστηκε στο μοντέλο Codex της OpenAI. Έκτοτε, κορυφαίες εταιρείες όπως η Anthropic, η Meta και η Google έχουν αναπτύξει τις δικές τους λύσεις, διευρύνοντας τις δυνατότητες της τεχνολογίας αυτής. Ωστόσο, η αυξανόμενη χρήση της τεχνητής νοημοσύνης στον προγραμματισμό έχει εγείρει σημαντικές ανησυχίες. Έρευνα του Πανεπιστημίου Stanford το 2023 έδειξε ότι οι προγραμματιστές που χρησιμοποιούν βοηθούς τεχνητής νοημοσύνης τείνουν να εισάγουν περισσότερα σφάλματα στον κώδικα, παρότι οι ίδιοι πιστεύουν ότι ο κώδικάς τους είναι πιο ασφαλής. Η ιστορία του προγραμματισμού έχει δείξει ότι κάθε σημαντική καινοτομία αντιμετωπίζεται αρχικά με σκεπτικισμό. Από τη μετάβαση από τη γλώσσα assembly σε γλώσσες υψηλότερου επιπέδου μέχρι την υιοθέτηση του αντικειμενοστραφούς προγραμματισμού, κάθε αλλαγή συνάντησε αντιστάσεις. Η τεχνητή νοημοσύνη λειτουργεί ως ένα ακόμη εργαλείο που ενισχύει τις δυνατότητες των προγραμματιστών. Όπως ακριβώς το λογισμικό ηλεκτρονικού σχεδιασμού (EDA) βοηθά στη σχεδίαση ημιαγωγών, έτσι και η τεχνητή νοημοσύνη μπορεί να επιταχύνει την ανάπτυξη λογισμικού, πάντα υπό την επίβλεψη έμπειρων επαγγελματιών. Πρόσφατα, το GitHub ανακοίνωσε ότι οι προγραμματιστές θα μπορούν να χρησιμοποιούν μοντέλα όπως το Claude 3.5 της Anthropic και το Gemini 1.5 Pro της Google για την παραγωγή κώδικα, διευρύνοντας περαιτέρω τις επιλογές στον τομέα της υποβοηθούμενης από ΤΝ ανάπτυξης λογισμικού. Διαβάστε ολόκληρο το άρθρο
-
Η αποκάλυψη έγινε κατά τη διάρκεια της παρουσίασης των οικονομικών αποτελεσμάτων του τρίτου τριμήνου του 2024, με τον Σουντάρ Πιτσάι να τονίζει πως οι μηχανικοί λογισμικού της εταιρείας επιβλέπουν και εγκρίνουν τον παραγόμενο κώδικα. Η εξέλιξη αυτή αντικατοπτρίζει μια ευρύτερη τάση στον κλάδο της ανάπτυξης λογισμικού. Σύμφωνα με πρόσφατη έρευνα της Stack Overflow, περισσότεροι από τρεις στους τέσσερις προγραμματιστές χρησιμοποιούν ή σχεδιάζουν να χρησιμοποιήσουν εργαλεία τεχνητής νοημοσύνης στη διαδικασία ανάπτυξης εφαρμογών. Η επανάσταση στον προγραμματισμό με τη βοήθεια της τεχνητής νοημοσύνης ξεκίνησε ουσιαστικά το 2021 με το GitHub Copilot, το οποίο βασίστηκε στο μοντέλο Codex της OpenAI. Έκτοτε, κορυφαίες εταιρείες όπως η Anthropic, η Meta και η Google έχουν αναπτύξει τις δικές τους λύσεις, διευρύνοντας τις δυνατότητες της τεχνολογίας αυτής. Ωστόσο, η αυξανόμενη χρήση της τεχνητής νοημοσύνης στον προγραμματισμό έχει εγείρει σημαντικές ανησυχίες. Έρευνα του Πανεπιστημίου Stanford το 2023 έδειξε ότι οι προγραμματιστές που χρησιμοποιούν βοηθούς τεχνητής νοημοσύνης τείνουν να εισάγουν περισσότερα σφάλματα στον κώδικα, παρότι οι ίδιοι πιστεύουν ότι ο κώδικάς τους είναι πιο ασφαλής. Η ιστορία του προγραμματισμού έχει δείξει ότι κάθε σημαντική καινοτομία αντιμετωπίζεται αρχικά με σκεπτικισμό. Από τη μετάβαση από τη γλώσσα assembly σε γλώσσες υψηλότερου επιπέδου μέχρι την υιοθέτηση του αντικειμενοστραφούς προγραμματισμού, κάθε αλλαγή συνάντησε αντιστάσεις. Η τεχνητή νοημοσύνη λειτουργεί ως ένα ακόμη εργαλείο που ενισχύει τις δυνατότητες των προγραμματιστών. Όπως ακριβώς το λογισμικό ηλεκτρονικού σχεδιασμού (EDA) βοηθά στη σχεδίαση ημιαγωγών, έτσι και η τεχνητή νοημοσύνη μπορεί να επιταχύνει την ανάπτυξη λογισμικού, πάντα υπό την επίβλεψη έμπειρων επαγγελματιών. Πρόσφατα, το GitHub ανακοίνωσε ότι οι προγραμματιστές θα μπορούν να χρησιμοποιούν μοντέλα όπως το Claude 3.5 της Anthropic και το Gemini 1.5 Pro της Google για την παραγωγή κώδικα, διευρύνοντας περαιτέρω τις επιλογές στον τομέα της υποβοηθούμενης από ΤΝ ανάπτυξης λογισμικού.
-
Ένα νέο εργαλείο τεχνητής νοημοσύνης με την κωδική ονομασία "Project Jarvis" ετοιμάζεται να παρουσιάσει η Google τον Δεκέμβριο, σύμφωνα με αποκλειστικό ρεπορτάζ του The Information. Το νέο εργαλείο, που θα βασίζεται σε μελλοντική έκδοση του μοντέλου Gemini, στοχεύει στην αυτοματοποίηση καθημερινών διαδικτυακών εργασιών, από την έρευνα αγορών μέχρι την κράτηση αεροπορικών εισιτηρίων. Σύμφωνα με τρεις πηγές με άμεση γνώση του θέματος, το Project Jarvis έχει σχεδιαστεί ειδικά για τον Chrome browser και λειτουργεί αναλύοντας screenshots για να πραγματοποιεί ενέργειες όπως το πάτημα κουμπιών ή την εισαγωγή κειμένου. Στην τρέχουσα μορφή του, το σύστημα χρειάζεται μερικά δευτερόλεπτα μεταξύ των ενεργειών. Ο ανταγωνισμός στον τομέα των έξυπνων ψηφιακών βοηθών εντείνεται, καθώς όλες οι μεγάλες εταιρείες τεχνολογίας αναπτύσσουν παρόμοια εργαλεία. Η Microsoft έχει ήδη ανακοινώσει το Copilot Vision, που επιτρέπει στους χρήστες να αλληλεπιδρούν φωνητικά με ιστοσελίδες, ενώ η Apple σχεδιάζει να ενσωματώσει λειτουργίες τεχνητής νοημοσύνης που θα μπορούν να αναγνωρίζουν και να διαχειρίζονται το περιεχόμενο της οθόνης σε πολλαπλές εφαρμογές. Η Anthropic πρόσφατα παρουσίασε μια πειραματική έκδοση του Claude που μπορεί να ελέγχει μέρη του υπολογιστή, αν και σύμφωνα με αναφορές, η λειτουργία είναι ακόμη "δύσχρηστη και επιρρεπής σε σφάλματα". Παράλληλα, η OpenAI φημολογείται ότι αναπτύσσει μια παρόμοια λειτουργία για τα δικά της μοντέλα. Η εξέλιξη των ψηφιακών βοηθών αναμένεται να φέρει σημαντικές αλλαγές στον τρόπο που αλληλεπιδρούμε με τους υπολογιστές. Η αυτοματοποίηση καθημερινών εργασιών θα μπορούσε να εξοικονομήσει πολύτιμο χρόνο για τους χρήστες, ειδικά σε επαναλαμβανόμενες διαδικτυακές δραστηριότητες. Για την εξασφάλιση της αξιοπιστίας του συστήματος, η Google σχεδιάζει να διαθέσει το Project Jarvis αρχικά σε περιορισμένο αριθμό χρηστών για δοκιμές και εντοπισμό πιθανών προβλημάτων. Η στρατηγική αυτή αποσκοπεί στη βελτιστοποίηση της εμπειρίας χρήστη πριν την ευρύτερη διάθεση του εργαλείου. Η έμφαση στην ασφάλεια και την προστασία των προσωπικών δεδομένων αποτελεί βασική προτεραιότητα για την ανάπτυξη του Project Jarvis, καθώς το εργαλείο θα έχει πρόσβαση σε ευαίσθητες πληροφορίες κατά την εκτέλεση διαδικτυακών συναλλαγών. Το χρονοδιάγραμμα παρουσίασης του Project Jarvis τον Δεκέμβριο ενδέχεται να τροποποιηθεί, καθώς η Google επιδιώκει να διασφαλίσει την άρτια λειτουργία του συστήματος πριν την επίσημη ανακοίνωσή του. Διαβάστε ολόκληρο το άρθρο
- 23 απαντήσεις
-
- τεχνητή νοημοσύνη
-
(και 1 περισσότερα)
Ετικέτα με:
-
Το νέο εργαλείο, που θα βασίζεται σε μελλοντική έκδοση του μοντέλου Gemini, στοχεύει στην αυτοματοποίηση καθημερινών διαδικτυακών εργασιών, από την έρευνα αγορών μέχρι την κράτηση αεροπορικών εισιτηρίων. Σύμφωνα με τρεις πηγές με άμεση γνώση του θέματος, το Project Jarvis έχει σχεδιαστεί ειδικά για τον Chrome browser και λειτουργεί αναλύοντας screenshots για να πραγματοποιεί ενέργειες όπως το πάτημα κουμπιών ή την εισαγωγή κειμένου. Στην τρέχουσα μορφή του, το σύστημα χρειάζεται μερικά δευτερόλεπτα μεταξύ των ενεργειών. Ο ανταγωνισμός στον τομέα των έξυπνων ψηφιακών βοηθών εντείνεται, καθώς όλες οι μεγάλες εταιρείες τεχνολογίας αναπτύσσουν παρόμοια εργαλεία. Η Microsoft έχει ήδη ανακοινώσει το Copilot Vision, που επιτρέπει στους χρήστες να αλληλεπιδρούν φωνητικά με ιστοσελίδες, ενώ η Apple σχεδιάζει να ενσωματώσει λειτουργίες τεχνητής νοημοσύνης που θα μπορούν να αναγνωρίζουν και να διαχειρίζονται το περιεχόμενο της οθόνης σε πολλαπλές εφαρμογές. Η Anthropic πρόσφατα παρουσίασε μια πειραματική έκδοση του Claude που μπορεί να ελέγχει μέρη του υπολογιστή, αν και σύμφωνα με αναφορές, η λειτουργία είναι ακόμη "δύσχρηστη και επιρρεπής σε σφάλματα". Παράλληλα, η OpenAI φημολογείται ότι αναπτύσσει μια παρόμοια λειτουργία για τα δικά της μοντέλα. Η εξέλιξη των ψηφιακών βοηθών αναμένεται να φέρει σημαντικές αλλαγές στον τρόπο που αλληλεπιδρούμε με τους υπολογιστές. Η αυτοματοποίηση καθημερινών εργασιών θα μπορούσε να εξοικονομήσει πολύτιμο χρόνο για τους χρήστες, ειδικά σε επαναλαμβανόμενες διαδικτυακές δραστηριότητες. Για την εξασφάλιση της αξιοπιστίας του συστήματος, η Google σχεδιάζει να διαθέσει το Project Jarvis αρχικά σε περιορισμένο αριθμό χρηστών για δοκιμές και εντοπισμό πιθανών προβλημάτων. Η στρατηγική αυτή αποσκοπεί στη βελτιστοποίηση της εμπειρίας χρήστη πριν την ευρύτερη διάθεση του εργαλείου. Η έμφαση στην ασφάλεια και την προστασία των προσωπικών δεδομένων αποτελεί βασική προτεραιότητα για την ανάπτυξη του Project Jarvis, καθώς το εργαλείο θα έχει πρόσβαση σε ευαίσθητες πληροφορίες κατά την εκτέλεση διαδικτυακών συναλλαγών. Το χρονοδιάγραμμα παρουσίασης του Project Jarvis τον Δεκέμβριο ενδέχεται να τροποποιηθεί, καθώς η Google επιδιώκει να διασφαλίσει την άρτια λειτουργία του συστήματος πριν την επίσημη ανακοίνωσή του.
- 23 σχόλια
-
- 2
-
- τεχνητή νοημοσύνη
-
(και 1 περισσότερα)
Ετικέτα με:
-
Η Google διέθεσε παγκοσμίως το μοντέλο δημιουργίας εικόνων Imagen 3 σε όλους τους χρήστες του Gemini, υλοποιώντας την υπόσχεση που είχε δώσει τον Αύγουστο. Το Imagen 3, η τρίτη γενιά του μοντέλου που παρουσιάστηκε αρχικά τον Μάιο, προσφέρει σημαντικές βελτιώσεις στην ποιότητα των παραγόμενων εικόνων, με τον χρήστη να χρειάζεται απλά να περιγράψει την εικόνα που θέλει με κείμενο. Οι χρήστες του Gemini μπορούν πλέον να δημιουργούν εικόνες με πιο έντονες λεπτομέρειες, ζωηρότερα χρώματα και λιγότερες ατέλειες σε σύγκριση με τις προηγούμενες εκδόσεις, φτάνει να συνδεθούν στο gemini.google.com. Μία από τις πιο αξιοσημείωτες βελτιώσεις του Imagen 3 είναι η ικανότητά του να αποδίδει κείμενο με μεγαλύτερη ακρίβεια, ξεπερνώντας έτσι ένα σημαντικό εμπόδιο που αντιμετώπιζαν άλλα μοντέλα μετατροπής κειμένου σε εικόνα, όπως το DALL-E και το Adobe Firefly. Η Google προωθεί αυτή τη δυνατότητα ως ένα εργαλείο για τη δημιουργία εξατομικευμένων εικόνων που περιέχουν κείμενο, κατάλληλο για ευχετήριες κάρτες ή φωτογραφίες με ειδικά μηνύματα. Για να χρησιμοποιήσουν το Imagen 3, οι χρήστες μπορούν απλά να ανοίξουν το Gemini στο κινητό ή τον υπολογιστή τους και να ξεκινήσουν τις εντολές τους με λέξεις όπως "draw", "generate" ή "create", ακολουθούμενες από το επιθυμητό στυλ. Όσο περισσότερες λεπτομέρειες περιλαμβάνει η εντολή, τόσο καλύτερα το μοντέλο μπορεί να κατανοήσει και να υλοποιήσει το όραμα του χρήστη. Ωστόσο, υπάρχουν ορισμένοι περιορισμοί για τους δωρεάν χρήστες. Η δημιουργία εικόνων που περιέχουν ανθρώπους δεν είναι διαθέσιμη στην δωρεάν έκδοση. Για να αποκτήσουν πρόσβαση σε αυτή τη λειτουργία, οι χρήστες πρέπει να εγγραφούν στο Gemini Advanced, την επί πληρωμή υπηρεσία. Το Gemini Advanced προσφέρει επιπλέον πλεονεκτήματα, όπως: Πρόσβαση στο προηγμένο μοντέλο 1.5 Pro της Google Δυνατότητα επεξεργασίας κειμένων έως 1.500 σελίδων Προτεραιότητα πρόσβασης στις νεότερες λειτουργίες Εκτέλεση και επεξεργασία κώδικα Python απευθείας στο Gemini Advanced 2 TB αποθηκευτικού χώρου μέσω του Google One Ενσωμάτωση του Gemini σε υπηρεσίες όπως το Gmail και το Docs (διαθέσιμο σε επιλεγμένες γλώσσες) Παρά τις εντυπωσιακές δυνατότητες του Imagen 3, εγείρονται ανησυχίες σχετικά με την ανάγκη για σαφέστερη επισήμανση του περιεχομένου που δημιουργείται από τεχνητή νοημοσύνη. Η ραγδαία εξέλιξη των τεχνολογιών δημιουργίας εικόνων καθιστά επιτακτική την ανάγκη για ρυθμιστικό πλαίσιο που θα αποτρέπει τη διάδοση παραπληροφόρησης. Σε αυτό το πλαίσιο, η Ευρωπαϊκή Ένωση έχει ήδη κάνει βήματα προς αυτή την κατεύθυνση με τη δημιουργία του EU AI Pact. Πρόκειται για μια εθελοντική συμφωνία μεταξύ εταιρειών τεχνολογίας και της ΕΕ, που στοχεύει στην προώθηση της υπεύθυνης και ηθικής ανάπτυξης της τεχνητής νοημοσύνης. Ωστόσο, η αποτελεσματικότητα αυτής της πρωτοβουλίας παραμένει υπό αμφισβήτηση και θα κριθεί στην πράξη. Η Google έχει δηλώσει ότι σχεδιάζει να ενσωματώσει το Imagen 3 σε περισσότερες υπηρεσίες της στο εγγύς μέλλον, επεκτείνοντας τις δυνατότητες δημιουργίας εικόνων σε ένα ευρύτερο φάσμα εφαρμογών. Διαβάστε ολόκληρο το άρθρο
-
Το Imagen 3, η τρίτη γενιά του μοντέλου που παρουσιάστηκε αρχικά τον Μάιο, προσφέρει σημαντικές βελτιώσεις στην ποιότητα των παραγόμενων εικόνων, με τον χρήστη να χρειάζεται απλά να περιγράψει την εικόνα που θέλει με κείμενο. Οι χρήστες του Gemini μπορούν πλέον να δημιουργούν εικόνες με πιο έντονες λεπτομέρειες, ζωηρότερα χρώματα και λιγότερες ατέλειες σε σύγκριση με τις προηγούμενες εκδόσεις, φτάνει να συνδεθούν στο gemini.google.com. Μία από τις πιο αξιοσημείωτες βελτιώσεις του Imagen 3 είναι η ικανότητά του να αποδίδει κείμενο με μεγαλύτερη ακρίβεια, ξεπερνώντας έτσι ένα σημαντικό εμπόδιο που αντιμετώπιζαν άλλα μοντέλα μετατροπής κειμένου σε εικόνα, όπως το DALL-E και το Adobe Firefly. Η Google προωθεί αυτή τη δυνατότητα ως ένα εργαλείο για τη δημιουργία εξατομικευμένων εικόνων που περιέχουν κείμενο, κατάλληλο για ευχετήριες κάρτες ή φωτογραφίες με ειδικά μηνύματα. Για να χρησιμοποιήσουν το Imagen 3, οι χρήστες μπορούν απλά να ανοίξουν το Gemini στο κινητό ή τον υπολογιστή τους και να ξεκινήσουν τις εντολές τους με λέξεις όπως "draw", "generate" ή "create", ακολουθούμενες από το επιθυμητό στυλ. Όσο περισσότερες λεπτομέρειες περιλαμβάνει η εντολή, τόσο καλύτερα το μοντέλο μπορεί να κατανοήσει και να υλοποιήσει το όραμα του χρήστη. Ωστόσο, υπάρχουν ορισμένοι περιορισμοί για τους δωρεάν χρήστες. Η δημιουργία εικόνων που περιέχουν ανθρώπους δεν είναι διαθέσιμη στην δωρεάν έκδοση. Για να αποκτήσουν πρόσβαση σε αυτή τη λειτουργία, οι χρήστες πρέπει να εγγραφούν στο Gemini Advanced, την επί πληρωμή υπηρεσία. Το Gemini Advanced προσφέρει επιπλέον πλεονεκτήματα, όπως: Πρόσβαση στο προηγμένο μοντέλο 1.5 Pro της Google Δυνατότητα επεξεργασίας κειμένων έως 1.500 σελίδων Προτεραιότητα πρόσβασης στις νεότερες λειτουργίες Εκτέλεση και επεξεργασία κώδικα Python απευθείας στο Gemini Advanced 2 TB αποθηκευτικού χώρου μέσω του Google One Ενσωμάτωση του Gemini σε υπηρεσίες όπως το Gmail και το Docs (διαθέσιμο σε επιλεγμένες γλώσσες) Παρά τις εντυπωσιακές δυνατότητες του Imagen 3, εγείρονται ανησυχίες σχετικά με την ανάγκη για σαφέστερη επισήμανση του περιεχομένου που δημιουργείται από τεχνητή νοημοσύνη. Η ραγδαία εξέλιξη των τεχνολογιών δημιουργίας εικόνων καθιστά επιτακτική την ανάγκη για ρυθμιστικό πλαίσιο που θα αποτρέπει τη διάδοση παραπληροφόρησης. Σε αυτό το πλαίσιο, η Ευρωπαϊκή Ένωση έχει ήδη κάνει βήματα προς αυτή την κατεύθυνση με τη δημιουργία του EU AI Pact. Πρόκειται για μια εθελοντική συμφωνία μεταξύ εταιρειών τεχνολογίας και της ΕΕ, που στοχεύει στην προώθηση της υπεύθυνης και ηθικής ανάπτυξης της τεχνητής νοημοσύνης. Ωστόσο, η αποτελεσματικότητα αυτής της πρωτοβουλίας παραμένει υπό αμφισβήτηση και θα κριθεί στην πράξη. Η Google έχει δηλώσει ότι σχεδιάζει να ενσωματώσει το Imagen 3 σε περισσότερες υπηρεσίες της στο εγγύς μέλλον, επεκτείνοντας τις δυνατότητες δημιουργίας εικόνων σε ένα ευρύτερο φάσμα εφαρμογών.
-
Ο βοηθός τεχνητής νοημοσύνης Gemini Live της Google είναι πλέον διαθέσιμος δωρεάν σε όλους τους χρήστες Android συσκευών. Η εφαρμογή, που αρχικά προσφερόταν μόνο στους συνδρομητές του πακέτου Gemini Advanced έναντι 20 δολαρίων μηνιαίως, μπορεί πλέον να χρησιμοποιηθεί από οποιονδήποτε κατεβάσει την εφαρμογή Gemini. Προς το παρόν, η υπηρεσία είναι διαθέσιμη μόνο στην αγγλική γλώσσα. Οι κάτοχοι των τελευταίων μοντέλων της Google, όπως τα Pixel 9 και Pixel 9 Pro, μπορούν να αποκτήσουν πρόσβαση στο Gemini Live απλά ανοίγοντας την εφαρμογή Gemini και επιλέγοντας το εικονίδιο Live στην κάτω δεξιά γωνία της οθόνης. Το Gemini Live προσφέρει δέκα διαφορετικές φωνητικές επιλογές, με ονόματα εμπνευσμένα από αστέρια και αστερισμούς, επιτρέποντας στους χρήστες να επιλέξουν την αγαπημένη τους. Η λειτουργία του Gemini Live θυμίζει σε πολλά σημεία άλλους ψηφιακούς βοηθούς όπως το Google Assistant ή η Alexa. Ο AI βοηθός έχει τη δυνατότητα να κατανοεί καθημερινή γλώσσα και να συμπεριφέρεται με πιο ανθρώπινο τρόπο κατά τη διάρκεια των συνομιλιών. Μπορεί να κάνει εικασίες, να βοηθήσει στην ανταλλαγή ιδεών και ακόμη και να εκτελεί πολλαπλές εργασίες, διαχειριζόμενος τα αιτήματα του χρήστη ενώ παράλληλα συνεχίζει τη συνομιλία. Οι φωνητικές επιλογές ενισχύουν την ψευδαίσθηση της ανθρώπινης επαφής, καθώς είναι πιο εκφραστικές συναισθηματικά σε σύγκριση με προηγούμενα πρότυπα συνθετικής ομιλίας. Η κυκλοφορία του Gemini Live έρχεται σε μια περίοδο έντονου ανταγωνισμού στον χώρο των AI βοηθών. Η Google αντιμετωπίζει αυξανόμενο αριθμό ανταγωνιστών, συμπεριλαμβανομένης της λειτουργίας Advanced Voice Mode για το ChatGPT και του πρόσφατα αναβαθμισμένου Copilot AI της Microsoft με φωνητικές αλληλεπιδράσεις. Η Google, ακολουθώντας παρόμοια στρατηγική με τη Microsoft, ελπίζει ότι η δωρεάν διάθεση του Gemini Live θα το βοηθήσει να ξεχωρίσει στην αγορά. Η ενσωμάτωση με το λειτουργικό σύστημα του Android και το οικοσύστημα συσκευών της Google αναμένεται να συμβάλει σε αυτή την κατεύθυνση. Ωστόσο, η εταιρεία θα πρέπει να αντιμετωπίσει και τις επερχόμενες αναβαθμίσεις της Siri από την Apple, ως μέρος των νέων λειτουργιών Apple Intelligence που θα κυκλοφορήσουν σύντομα. Για τους χρήστες που έχουν εκφράσει δυσαρέσκεια με τους περιορισμούς των υπαρχόντων φωνητικών βοηθών, το Gemini Live αναμένεται να αποτελέσει μια σημαντική αναβάθμιση ωστόσο, μένει να φανεί πώς θα συγκριθεί με τους νέους ανταγωνιστές του. Είναι εμφανές ότι η Google επιδιώκει να διαφοροποιήσει το Gemini από τον Google Assistant, προσδίδοντάς του έναν πιο κεντρικό ρόλο στην καθημερινότητα των χρηστών, ιδιαίτερα στις κινητές συσκευές.Το Gemini Live προσφέρει στους χρήστες τη δυνατότητα να επιλέξουν μεταξύ δέκα διαφορετικών φωνητικών προφίλ, το καθένα με το δικό του μοναδικό χαρακτήρα και τόνο φωνής. Ενημέρωση 17:30 - Σύμφωνα με νεότερη ανακοίνωση της Google, το Gemini Live υποστηρίζει πλέον 40 γλώσσες, μεταξύ των οποίων και τα Ελληνικά. Διαβάστε ολόκληρο το άρθρο
-
Η εφαρμογή, που αρχικά προσφερόταν μόνο στους συνδρομητές του πακέτου Gemini Advanced έναντι 20 δολαρίων μηνιαίως, μπορεί πλέον να χρησιμοποιηθεί από οποιονδήποτε κατεβάσει την εφαρμογή Gemini. Προς το παρόν, η υπηρεσία είναι διαθέσιμη μόνο στην αγγλική γλώσσα. Οι κάτοχοι των τελευταίων μοντέλων της Google, όπως τα Pixel 9 και Pixel 9 Pro, μπορούν να αποκτήσουν πρόσβαση στο Gemini Live απλά ανοίγοντας την εφαρμογή Gemini και επιλέγοντας το εικονίδιο Live στην κάτω δεξιά γωνία της οθόνης. Το Gemini Live προσφέρει δέκα διαφορετικές φωνητικές επιλογές, με ονόματα εμπνευσμένα από αστέρια και αστερισμούς, επιτρέποντας στους χρήστες να επιλέξουν την αγαπημένη τους. Η λειτουργία του Gemini Live θυμίζει σε πολλά σημεία άλλους ψηφιακούς βοηθούς όπως το Google Assistant ή η Alexa. Ο AI βοηθός έχει τη δυνατότητα να κατανοεί καθημερινή γλώσσα και να συμπεριφέρεται με πιο ανθρώπινο τρόπο κατά τη διάρκεια των συνομιλιών. Μπορεί να κάνει εικασίες, να βοηθήσει στην ανταλλαγή ιδεών και ακόμη και να εκτελεί πολλαπλές εργασίες, διαχειριζόμενος τα αιτήματα του χρήστη ενώ παράλληλα συνεχίζει τη συνομιλία. Οι φωνητικές επιλογές ενισχύουν την ψευδαίσθηση της ανθρώπινης επαφής, καθώς είναι πιο εκφραστικές συναισθηματικά σε σύγκριση με προηγούμενα πρότυπα συνθετικής ομιλίας. Η κυκλοφορία του Gemini Live έρχεται σε μια περίοδο έντονου ανταγωνισμού στον χώρο των AI βοηθών. Η Google αντιμετωπίζει αυξανόμενο αριθμό ανταγωνιστών, συμπεριλαμβανομένης της λειτουργίας Advanced Voice Mode για το ChatGPT και του πρόσφατα αναβαθμισμένου Copilot AI της Microsoft με φωνητικές αλληλεπιδράσεις. Η Google, ακολουθώντας παρόμοια στρατηγική με τη Microsoft, ελπίζει ότι η δωρεάν διάθεση του Gemini Live θα το βοηθήσει να ξεχωρίσει στην αγορά. Η ενσωμάτωση με το λειτουργικό σύστημα του Android και το οικοσύστημα συσκευών της Google αναμένεται να συμβάλει σε αυτή την κατεύθυνση. Ωστόσο, η εταιρεία θα πρέπει να αντιμετωπίσει και τις επερχόμενες αναβαθμίσεις της Siri από την Apple, ως μέρος των νέων λειτουργιών Apple Intelligence που θα κυκλοφορήσουν σύντομα. Για τους χρήστες που έχουν εκφράσει δυσαρέσκεια με τους περιορισμούς των υπαρχόντων φωνητικών βοηθών, το Gemini Live αναμένεται να αποτελέσει μια σημαντική αναβάθμιση ωστόσο, μένει να φανεί πώς θα συγκριθεί με τους νέους ανταγωνιστές του. Είναι εμφανές ότι η Google επιδιώκει να διαφοροποιήσει το Gemini από τον Google Assistant, προσδίδοντάς του έναν πιο κεντρικό ρόλο στην καθημερινότητα των χρηστών, ιδιαίτερα στις κινητές συσκευές.Το Gemini Live προσφέρει στους χρήστες τη δυνατότητα να επιλέξουν μεταξύ δέκα διαφορετικών φωνητικών προφίλ, το καθένα με το δικό του μοναδικό χαρακτήρα και τόνο φωνής. Ενημέρωση 17:30 - Σύμφωνα με νεότερη ανακοίνωση της Google, το Gemini Live υποστηρίζει πλέον 40 γλώσσες, μεταξύ των οποίων και τα Ελληνικά.
-
Κρυμμένος κώδικας στην τελευταία έκδοση της εφαρμογής Android Auto υποδηλώνει την επικείμενη ενσωμάτωση της τεχνητής νοημοσύνης Gemini της Google στα συστήματα infotainment των αυτοκινήτων. Σύμφωνα με το Android Authority, που εντόπισε τον κώδικα, η Google ετοιμάζεται να φέρει τις προηγμένες δυνατότητες του Gemini στο ταμπλό των οχημάτων που υποστηρίζουν το Android Auto. Στον κώδικα εντοπίστηκαν αναφορές στο χαρακτηριστικό εικονίδιο σπινθήρα που συνοδεύει το Gemini σε διάφορες εφαρμογές της Google. Επιπλέον, βρέθηκε η λέξη "kitt", πιθανώς ως αναφορά στο διάσημο τηλεοπτικό αυτοκίνητο με τεχνητή νοημοσύνη της σειράς Knight Rider της δεκαετίας του '80. Άλλες ενδείξεις, όπως οι φράσεις "Start conversation" και "GeminiLiveAssistantAction", ενισχύουν την υπόθεση ότι το Gemini θα είναι σύντομα διαθέσιμο σε κάθε ταμπλό αυτοκινήτου που είναι συμβατό με το Android Auto. Η ενσωμάτωση του Gemini στο Android Auto αποτελεί μέρος της ευρύτερης στρατηγικής της Google να επεκτείνει τη χρήση της τεχνητής νοημοσύνης σε όλες τις πλατφόρμες και εφαρμογές της. Το Germini σταδιακά αντικαθιστά ή συνεργάζεται με το Google Assistant σε διάφορες συσκευές και υπηρεσίες. Παρόλο που η Google δεν έχει ανακοινώσει επίσημα την ενσωμάτωση του Gemini στο Android Auto, η εξέλιξη αυτή δεν προκαλεί έκπληξη, δεδομένου του ρυθμού με τον οποίο η εταιρεία ενσωματώνει την τεχνητή νοημοσύνη στα κινητά τηλέφωνα, τις διαδικτυακές εφαρμογές και άλλες πλατφόρμες της. Με την άφιξη του Gemini στο Android Auto, οι οδηγοί θα μπορούν να αλληλεπιδρούν με την τεχνητή νοημοσύνη όπως και σε άλλες πλατφόρμες, λαμβάνοντας εξατομικευμένες και ευφυείς απαντήσεις σε ένα νέο επίπεδο, πέρα από τις δυνατότητες του Google Assistant και τα όρια που αυτό έχει Ωστόσο, δεν είναι ακόμη σαφές ποιες λειτουργίες θα είναι διαθέσιμες δωρεάν και ποιες θα απαιτούν συνδρομή στο πρόγραμμα Google One AI Premium, το οποίο κοστίζει 20 δολάρια μηνιαίως. Η ενσωμάτωση του Gemini στο Android Auto εγείρει ερωτήματα σχετικά με την ασφάλεια και την αξιοπιστία της τεχνητής νοημοσύνης σε ένα περιβάλλον οδήγησης. Ένα πιθανό ζήτημα είναι οι λεγόμενες "παραισθήσεις" της τεχνητής νοημοσύνης, δηλαδή η παραγωγή εσφαλμένων ή παραπλανητικών πληροφοριών. Για την αντιμετώπιση αυτού του κινδύνου, είναι πιθανό το Gemini να συνδυαστεί με τα Google Maps για να διασφαλιστεί η ακρίβεια των οδηγιών πλοήγησης και να αποφευχθούν λάθη που θα μπορούσαν να οδηγήσουν σε επικίνδυνες καταστάσεις, όπως η οδήγηση σε λάθος κατεύθυνση ή η άφιξη σε λανθασμένο προορισμό. Η ενσωμάτωση προηγμένης τεχνητής νοημοσύνης στα συστήματα των αυτοκινήτων αποτελεί μέρος μιας ευρύτερης τάσης στην αυτοκινητοβιομηχανία. Καθώς τα οχήματα γίνονται όλο και πιο συνδεδεμένα και έξυπνα, η τεχνητή νοημοσύνη αναμένεται να παίξει σημαντικό ρόλο στη βελτίωση της εμπειρίας οδήγησης, της ασφάλειας και της αλληλεπίδρασης μεταξύ οδηγού και οχήματος. Διαβάστε ολόκληρο το άρθρο
-
Σύμφωνα με το Android Authority, που εντόπισε τον κώδικα, η Google ετοιμάζεται να φέρει τις προηγμένες δυνατότητες του Gemini στο ταμπλό των οχημάτων που υποστηρίζουν το Android Auto. Στον κώδικα εντοπίστηκαν αναφορές στο χαρακτηριστικό εικονίδιο σπινθήρα που συνοδεύει το Gemini σε διάφορες εφαρμογές της Google. Επιπλέον, βρέθηκε η λέξη "kitt", πιθανώς ως αναφορά στο διάσημο τηλεοπτικό αυτοκίνητο με τεχνητή νοημοσύνη της σειράς Knight Rider της δεκαετίας του '80. Άλλες ενδείξεις, όπως οι φράσεις "Start conversation" και "GeminiLiveAssistantAction", ενισχύουν την υπόθεση ότι το Gemini θα είναι σύντομα διαθέσιμο σε κάθε ταμπλό αυτοκινήτου που είναι συμβατό με το Android Auto. Η ενσωμάτωση του Gemini στο Android Auto αποτελεί μέρος της ευρύτερης στρατηγικής της Google να επεκτείνει τη χρήση της τεχνητής νοημοσύνης σε όλες τις πλατφόρμες και εφαρμογές της. Το Germini σταδιακά αντικαθιστά ή συνεργάζεται με το Google Assistant σε διάφορες συσκευές και υπηρεσίες. Παρόλο που η Google δεν έχει ανακοινώσει επίσημα την ενσωμάτωση του Gemini στο Android Auto, η εξέλιξη αυτή δεν προκαλεί έκπληξη, δεδομένου του ρυθμού με τον οποίο η εταιρεία ενσωματώνει την τεχνητή νοημοσύνη στα κινητά τηλέφωνα, τις διαδικτυακές εφαρμογές και άλλες πλατφόρμες της. Με την άφιξη του Gemini στο Android Auto, οι οδηγοί θα μπορούν να αλληλεπιδρούν με την τεχνητή νοημοσύνη όπως και σε άλλες πλατφόρμες, λαμβάνοντας εξατομικευμένες και ευφυείς απαντήσεις σε ένα νέο επίπεδο, πέρα από τις δυνατότητες του Google Assistant και τα όρια που αυτό έχει Ωστόσο, δεν είναι ακόμη σαφές ποιες λειτουργίες θα είναι διαθέσιμες δωρεάν και ποιες θα απαιτούν συνδρομή στο πρόγραμμα Google One AI Premium, το οποίο κοστίζει 20 δολάρια μηνιαίως. Η ενσωμάτωση του Gemini στο Android Auto εγείρει ερωτήματα σχετικά με την ασφάλεια και την αξιοπιστία της τεχνητής νοημοσύνης σε ένα περιβάλλον οδήγησης. Ένα πιθανό ζήτημα είναι οι λεγόμενες "παραισθήσεις" της τεχνητής νοημοσύνης, δηλαδή η παραγωγή εσφαλμένων ή παραπλανητικών πληροφοριών. Για την αντιμετώπιση αυτού του κινδύνου, είναι πιθανό το Gemini να συνδυαστεί με τα Google Maps για να διασφαλιστεί η ακρίβεια των οδηγιών πλοήγησης και να αποφευχθούν λάθη που θα μπορούσαν να οδηγήσουν σε επικίνδυνες καταστάσεις, όπως η οδήγηση σε λάθος κατεύθυνση ή η άφιξη σε λανθασμένο προορισμό. Η ενσωμάτωση προηγμένης τεχνητής νοημοσύνης στα συστήματα των αυτοκινήτων αποτελεί μέρος μιας ευρύτερης τάσης στην αυτοκινητοβιομηχανία. Καθώς τα οχήματα γίνονται όλο και πιο συνδεδεμένα και έξυπνα, η τεχνητή νοημοσύνη αναμένεται να παίξει σημαντικό ρόλο στη βελτίωση της εμπειρίας οδήγησης, της ασφάλειας και της αλληλεπίδρασης μεταξύ οδηγού και οχήματος.
-
Στην κυκλοφορία τα Gems και το Imagen 3, οι δύο νέες AI λειτουργίες που φέρνει της Google. Τα Gems, η νέα λειτουργία της Google που επιτρέπει στους χρήστες να δημιουργούν εξατομικευμένους συμβούλους Τεχνητής Νοημοσύνης, είναι πλέον διαθέσιμα για τους συνδρομητές των Gemini Advanced, Business και Enterprise. Η καινοτομία αυτή, που παρουσιάστηκε αρχικά στο συνέδριο Google I/O, φέρνει μια νέα εποχή στην εξατομικευμένη ψηφιακή βοήθεια. Συγκεκριμένα με τα Gems, οι χρήστες μπορούν να δημιουργήσουν ψηφιακούς βοηθούς εξειδικευμένους σε οποιοδήποτε θέμα επιθυμούν. Όπως αναφέρει η Google «Φανταστείτε έναν προσωπικό σεφ που σας προτείνει συνταγές βασισμένες στις διατροφικές σας προτιμήσεις, έναν οικονομικό σύμβουλο που σας καθοδηγεί στη διαχείριση των επενδύσεών σας, ή έναν προπονητή γιόγκα που προσαρμόζει το πρόγραμμά σας ανάλογα με το επίπεδό σας». Η διαδικασία δημιουργίας ενός Gem είναι απλή, με τον χρήστη να καλείται να περιγράψει τις επιθυμητές ιδιότητες και γνώσεις του ψηφιακού βοηθού και να του δώσει ένα όνομα. Το Gem μπορεί να απομνημονεύσει σύνθετες οδηγίες, εξοικονομώντας πολύτιμο χρόνο από επαναλαμβανόμενες ή πολύπλοκες εργασίες. Για να διευκολύνει τους χρήστες στα πρώτα τους βήματα, η Google προσφέρει μια σειρά από προκατασκευασμένα Gems. Για παράδειγμα, ο "Μέντορας Καριέρας" μπορεί να βοηθήσει στη χάραξη μιας επαγγελματικής πορείας, προτείνοντας δεξιότητες προς ανάπτυξη και στρατηγικές για την επίτευξη επαγγελματικών στόχων. Αντίστοιχα, ο "Δημιουργικός Σύμβουλος" μπορεί να προσφέρει φρέσκιες ιδέες για ένα θεματικό πάρτι ή να προτείνει το ιδανικό δώρο για μια επικείμενη γιορτή. Παράλληλα με τα Gems, η Google παρουσιάζει το Imagen 3, την τελευταία έκδοση του μοντέλου παραγωγής εικόνων της εταιρείας. Το Imagen 3 υπόσχεται να φέρει επανάσταση στον τρόπο που δημιουργούμε και επεξεργαζόμαστε εικόνες ψηφιακά. Με λίγες μόνο λέξεις, οι χρήστες μπορούν να παράγουν εικόνες υψηλής ποιότητας σε διάφορα στυλ, από φωτορεαλιστικά τοπία μέχρι ευφάνταστες σκηνές animation. Η Google δίνει ιδιαίτερη έμφαση στην ασφάλεια και την ηθική χρήση του Imagen 3. Το μοντέλο ενσωματώνει προηγμένα μέτρα προστασίας, ενώ η εταιρεία χρησιμοποιεί το SynthID, ένα εργαλείο για την υδατογράφηση εικόνων που παράγονται με Τεχνητή Νοημοσύνη. Επιπλέον, η Google έχει θέσει σαφείς περιορισμούς στη δημιουργία εικόνων, αποκλείοντας τη παραγωγή φωτορεαλιστικών απεικονίσεων αναγνωρίσιμων προσώπων, ανηλίκων, ή σκηνών με υπερβολική βία ή σεξουαλικό περιεχόμενο. Σύμφωνα με την Google, τα Gems είναι ήδη διαθέσιμα σε περισσότερες από 150 χώρες και στις περισσότερες γλώσσες, ενώ το Imagen 3 θα κυκλοφορήσει σταδιακά τις επόμενες ημέρες, με στόχο να είναι σύντομα προσβάσιμο σε περισσότερους χρήστες και γλώσσες. Διαβάστε ολόκληρο το άρθρο