Αναζήτηση στην κοινότητα
Εμφάνιση αποτελεσμάτων για τις ετικέτες 'Gemini'.
94 αποτελέσματα
-
Η Google ξεκινά σταδιακά το Personal Context ως προεπιλογή στο Gemini 2.5 Pro σε επιλεγμένες χώρες, μαζί με Temporary Chat και νέους ελέγχους δεδομένων, με στόχο πιο προσωποποιημένες και ελεγχόμενες εμπειρίες. Το Personal Context θα επιτρέπει στην εφαρμογή να “μαθαίνει” από παλαιότερες συνομιλίες και να παρέχει πιο σχετικές, εξατομικευμένες απαντήσεις. Η διάθεση ξεκινά από το Gemini 2.5 Pro και, όπως ανακοινώθηκε, θα επεκταθεί στο 2.5 Flash τις επόμενες εβδομάδες. Παράλληλα, οι χρήστες θα μπορούν να απενεργοποιούν το Personal Context οποιαδήποτε στιγμή. Σε προηγούμενες εκδόσεις, το βάρος έπεφτε στον χρήστη να υποδείξει στο μοντέλο το σχετικό νήμα διαλόγου για να αντλήσει προτιμήσεις, για παράδειγμα με αναφορά σε παλαιότερη συζήτηση. Ωστόσο, η Google επέλεξε πιο αργό ρυθμό κυκλοφορίας αυτών των λειτουργιών και, όπως αναφέρεται, δεν θα επιτρέπει την επεξεργασία ή τη διαγραφή των προτιμήσεων, σε αντίθεση με ανταγωνιστικές πλατφόρμες. Η κίνηση αυτή εντάσσεται στο σχέδιο για πιο προσωποποιημένη εμπειρία στο Gemini. Όπως σημείωσε σε ανάρτηση ο Michael Siliski, ανώτερος διευθυντής Product Management για την εφαρμογή Gemini, ο στόχος που παρουσιάστηκε στο I/O είναι ένας βοηθός που μαθαίνει και κατανοεί τον χρήστη, αντί να απαντά με γενικό τρόπο το ίδιο σε όλους. Στις νέες δυνατότητες περιλαμβάνεται και το Temporary Chat, που επιτρέπει συνομιλίες μίας χρήσης. Αυτές οι συζητήσεις δεν επηρεάζουν μελλοντικές αλληλεπιδράσεις και δεν αξιοποιούνται για εξατομίκευση ή για εκπαίδευση μοντέλων τεχνητής νοημοσύνης. Η Google ανακοίνωσε επίσης πρόσθετους ελέγχους δεδομένων. Η ρύθμιση είναι απενεργοποιημένη εξ ορισμού και, όπως περιγράφεται, δίνει τη δυνατότητα στους χρήστες να αποτρέπουν τη χρήση των δεδομένων τους σε μελλοντική εκπαίδευση μοντέλων της εταιρείας. Ταυτόχρονα, η Google διευκρινίζει ότι όταν αυτή η ρύθμιση είναι ενεργή, ένα δείγμα από μελλοντικές μεταφορτώσεις μπορεί να χρησιμοποιείται για τη βελτίωση των υπηρεσιών για όλους. Όσοι δεν επιθυμούν αυτή τη χρήση μπορούν να απενεργοποιήσουν τη ρύθμιση ή να αξιοποιούν Temporary Chats. Αν το Gemini Apps Activity είναι απενεργοποιημένο, το Keep Activity παραμένει απενεργοποιημένο και μπορεί να ενεργοποιηθεί οποτεδήποτε. Σε επίπεδο διατήρησης δεδομένων, οι εφαρμογές Gemini αποθηκεύουν συνομιλίες έως και 72 ώρες όταν η αποθήκευση δραστηριότητας είναι απενεργοποιημένη, ενώ διατίθεται αυτόματη διαγραφή άλλης δραστηριότητας ανά τρεις, 18 ή 36 μήνες. Η Google προσπαθεί να καλύψει το έδαφος έναντι των Anthropic και OpenAI, καθώς το πεδίο της μνήμης, της εξατομίκευσης και της προσαρμογής παραμένει σημείο αιχμής. Η OpenAI έχει εισαγάγει στο ChatGPT λειτουργίες όπως temporary chat, ιστορικό συνομιλιών και μνήμη από το 2024 και, μετά από αναβάθμιση τον Απρίλιο, το ChatGPT μπορεί να αναφέρεται σε όλες τις προηγούμενες συζητήσεις. Η Anthropic λάνσαρε το Styles τον Νοέμβριο του 2024 για να προσαρμόζει τον τρόπο αλληλεπίδρασης του Claude και μια πρόσφατη ενημέρωση επιτρέπει στο Claude να αναφέρεται σε όλα τα νήματα και όχι μόνο σε όσα υποδεικνύουν οι χρήστες. Αξίζει να σημειωθεί ότι, παρότι η Google είχε εισάγει εξατομίκευση στο Gemini 2.0, το μοντέλο μπορούσε να αντλήσει στοιχεία από προηγούμενες συνομιλίες μόνο εφόσον το ζητούσε ρητά ο χρήστης. Με το Personal Context ως προεπιλογή, μειώνεται η ανάγκη επανάληψης οδηγιών και προστίθεται μεγαλύτερη συνέπεια στις απαντήσεις. Η εξατομίκευση και ο έλεγχος δεδομένων διευκολύνουν τόσο μεμονωμένους χρήστες όσο και επιχειρήσεις να συνομιλούν με τα chatbots και να διατηρούν προτιμήσεις. Η σημασία είναι ακόμη μεγαλύτερη για έργα που βρίσκονται σε εξέλιξη σε εταιρικά περιβάλλοντα, όπου απαιτείται να “θυμούνται” στοιχεία όπως εταιρικό branding ή ύφος. Διαβάστε ολόκληρο το άρθρο
-
Το Personal Context θα επιτρέπει στην εφαρμογή να “μαθαίνει” από παλαιότερες συνομιλίες και να παρέχει πιο σχετικές, εξατομικευμένες απαντήσεις. Η διάθεση ξεκινά από το Gemini 2.5 Pro και, όπως ανακοινώθηκε, θα επεκταθεί στο 2.5 Flash τις επόμενες εβδομάδες. Παράλληλα, οι χρήστες θα μπορούν να απενεργοποιούν το Personal Context οποιαδήποτε στιγμή. Σε προηγούμενες εκδόσεις, το βάρος έπεφτε στον χρήστη να υποδείξει στο μοντέλο το σχετικό νήμα διαλόγου για να αντλήσει προτιμήσεις, για παράδειγμα με αναφορά σε παλαιότερη συζήτηση. Ωστόσο, η Google επέλεξε πιο αργό ρυθμό κυκλοφορίας αυτών των λειτουργιών και, όπως αναφέρεται, δεν θα επιτρέπει την επεξεργασία ή τη διαγραφή των προτιμήσεων, σε αντίθεση με ανταγωνιστικές πλατφόρμες. Η κίνηση αυτή εντάσσεται στο σχέδιο για πιο προσωποποιημένη εμπειρία στο Gemini. Όπως σημείωσε σε ανάρτηση ο Michael Siliski, ανώτερος διευθυντής Product Management για την εφαρμογή Gemini, ο στόχος που παρουσιάστηκε στο I/O είναι ένας βοηθός που μαθαίνει και κατανοεί τον χρήστη, αντί να απαντά με γενικό τρόπο το ίδιο σε όλους. Στις νέες δυνατότητες περιλαμβάνεται και το Temporary Chat, που επιτρέπει συνομιλίες μίας χρήσης. Αυτές οι συζητήσεις δεν επηρεάζουν μελλοντικές αλληλεπιδράσεις και δεν αξιοποιούνται για εξατομίκευση ή για εκπαίδευση μοντέλων τεχνητής νοημοσύνης. Η Google ανακοίνωσε επίσης πρόσθετους ελέγχους δεδομένων. Η ρύθμιση είναι απενεργοποιημένη εξ ορισμού και, όπως περιγράφεται, δίνει τη δυνατότητα στους χρήστες να αποτρέπουν τη χρήση των δεδομένων τους σε μελλοντική εκπαίδευση μοντέλων της εταιρείας. Ταυτόχρονα, η Google διευκρινίζει ότι όταν αυτή η ρύθμιση είναι ενεργή, ένα δείγμα από μελλοντικές μεταφορτώσεις μπορεί να χρησιμοποιείται για τη βελτίωση των υπηρεσιών για όλους. Όσοι δεν επιθυμούν αυτή τη χρήση μπορούν να απενεργοποιήσουν τη ρύθμιση ή να αξιοποιούν Temporary Chats. Αν το Gemini Apps Activity είναι απενεργοποιημένο, το Keep Activity παραμένει απενεργοποιημένο και μπορεί να ενεργοποιηθεί οποτεδήποτε. Σε επίπεδο διατήρησης δεδομένων, οι εφαρμογές Gemini αποθηκεύουν συνομιλίες έως και 72 ώρες όταν η αποθήκευση δραστηριότητας είναι απενεργοποιημένη, ενώ διατίθεται αυτόματη διαγραφή άλλης δραστηριότητας ανά τρεις, 18 ή 36 μήνες. Η Google προσπαθεί να καλύψει το έδαφος έναντι των Anthropic και OpenAI, καθώς το πεδίο της μνήμης, της εξατομίκευσης και της προσαρμογής παραμένει σημείο αιχμής. Η OpenAI έχει εισαγάγει στο ChatGPT λειτουργίες όπως temporary chat, ιστορικό συνομιλιών και μνήμη από το 2024 και, μετά από αναβάθμιση τον Απρίλιο, το ChatGPT μπορεί να αναφέρεται σε όλες τις προηγούμενες συζητήσεις. Η Anthropic λάνσαρε το Styles τον Νοέμβριο του 2024 για να προσαρμόζει τον τρόπο αλληλεπίδρασης του Claude και μια πρόσφατη ενημέρωση επιτρέπει στο Claude να αναφέρεται σε όλα τα νήματα και όχι μόνο σε όσα υποδεικνύουν οι χρήστες. Αξίζει να σημειωθεί ότι, παρότι η Google είχε εισάγει εξατομίκευση στο Gemini 2.0, το μοντέλο μπορούσε να αντλήσει στοιχεία από προηγούμενες συνομιλίες μόνο εφόσον το ζητούσε ρητά ο χρήστης. Με το Personal Context ως προεπιλογή, μειώνεται η ανάγκη επανάληψης οδηγιών και προστίθεται μεγαλύτερη συνέπεια στις απαντήσεις. Η εξατομίκευση και ο έλεγχος δεδομένων διευκολύνουν τόσο μεμονωμένους χρήστες όσο και επιχειρήσεις να συνομιλούν με τα chatbots και να διατηρούν προτιμήσεις. Η σημασία είναι ακόμη μεγαλύτερη για έργα που βρίσκονται σε εξέλιξη σε εταιρικά περιβάλλοντα, όπου απαιτείται να “θυμούνται” στοιχεία όπως εταιρικό branding ή ύφος.
-
Η Google ανακοίνωσε την κυκλοφορία μιας νέας δυνατότητας στο chatbot τεχνητής νοημοσύνης Gemini, η οποία επιτρέπει τη δημιουργία εικονογραφημένων ιστοριών με μια απλή περιγραφή. Η λειτουργία, που ονομάζεται Storybook, δημιουργεί ιστορίες 10 σελίδων, καθεμία με μια σύντομη παράγραφο κειμένου που το Gemini μπορεί να διαβάσει φωναχτά και μια αντίστοιχη εικονογράφηση. Σύμφωνα με τις πληροφορίες, οι χρήστες μπορούν να προσαρμόσουν την ιστορία τους ζητώντας από το Gemini να χρησιμοποιήσει συγκεκριμένα καλλιτεχνικά στυλ, όπως τεχνοτροπίες εμπνευσμένες από claymation, anime, κόμικς και άλλα. Η Google δίνει επίσης τη δυνατότητα μεταφόρτωσης φωτογραφιών ή άλλων εικόνων ως σημεία αναφοράς, όπως για παράδειγμα ένα παιδικό σκίτσο που μπορεί να αποτελέσει τη βάση για μια ολόκληρη ιστορία. Όπως αναφέρεται, δοκιμή της νέας λειτουργίας ξεκίνησε με την εντολή δημιουργίας μιας ιστορίας για έναν γουλιανό που δυσκολεύεται να κάνει φίλους σε ένα νέο ενυδρείο. Η πλοκή που προέκυψε αφορούσε τους κατοίκους της δεξαμενής που προσπαθούσαν να μετακινήσουν μια γυάλινη μπίλια, κάτι που κρίθηκε αρκετά αδύναμο ως αφήγηση. Ωστόσο, η εμπειρία έμοιαζε τυπική για μια παιδική ιστορία δημιουργημένη από τεχνητή νοημοσύνη — μέχρι που εμφανίστηκε μια εικονογράφηση στην οποία ένα από τα ψάρια είχε…ανθρώπινο χέρι. Ανάλογες ασυνέπειες εντοπίστηκαν και σε άλλες ιστορίες που παρήχθησαν μέσω της λειτουργίας. Σε μία περίπτωση, μια σελίδα με θέμα σάλτσα σπαγγέτι θύμιζε σκηνή εγκλήματος από καρτούν, ενώ σε άλλη, μια εικόνα μητέρας και γιου που παρακολουθούσαν τηλεόραση απεικόνιζε την οθόνη στην… λάθος πλευρά. Πέρα από αυτές τις ιδιαιτερότητες, δεν εντοπίστηκαν άλλες εμφανείς «παραξενιές» του AI σε ιστορίες που δημιουργήθηκαν στη συνέχεια. Ωστόσο, φάνηκε ότι το chatbot δεν συμμεριζόταν πλήρως την καλλιτεχνική αντίληψη του χρήστη όταν του μεταφορτώθηκε ένα σκίτσο καρτούν γάτας, το οποίο η AI απεικόνισε με αρκετές διαφορές. Το Storybook του Gemini είναι διαθέσιμο παγκοσμίως τόσο σε υπολογιστές όσο και σε κινητές συσκευές, υποστηρίζοντας όλες τις γλώσσες που είναι ήδη διαθέσιμες στην πλατφόρμα. Διαβάστε ολόκληρο το άρθρο
-
Η λειτουργία, που ονομάζεται Storybook, δημιουργεί ιστορίες 10 σελίδων, καθεμία με μια σύντομη παράγραφο κειμένου που το Gemini μπορεί να διαβάσει φωναχτά και μια αντίστοιχη εικονογράφηση. Σύμφωνα με τις πληροφορίες, οι χρήστες μπορούν να προσαρμόσουν την ιστορία τους ζητώντας από το Gemini να χρησιμοποιήσει συγκεκριμένα καλλιτεχνικά στυλ, όπως τεχνοτροπίες εμπνευσμένες από claymation, anime, κόμικς και άλλα. Η Google δίνει επίσης τη δυνατότητα μεταφόρτωσης φωτογραφιών ή άλλων εικόνων ως σημεία αναφοράς, όπως για παράδειγμα ένα παιδικό σκίτσο που μπορεί να αποτελέσει τη βάση για μια ολόκληρη ιστορία. Όπως αναφέρεται, δοκιμή της νέας λειτουργίας ξεκίνησε με την εντολή δημιουργίας μιας ιστορίας για έναν γουλιανό που δυσκολεύεται να κάνει φίλους σε ένα νέο ενυδρείο. Η πλοκή που προέκυψε αφορούσε τους κατοίκους της δεξαμενής που προσπαθούσαν να μετακινήσουν μια γυάλινη μπίλια, κάτι που κρίθηκε αρκετά αδύναμο ως αφήγηση. Ωστόσο, η εμπειρία έμοιαζε τυπική για μια παιδική ιστορία δημιουργημένη από τεχνητή νοημοσύνη — μέχρι που εμφανίστηκε μια εικονογράφηση στην οποία ένα από τα ψάρια είχε…ανθρώπινο χέρι. Ανάλογες ασυνέπειες εντοπίστηκαν και σε άλλες ιστορίες που παρήχθησαν μέσω της λειτουργίας. Σε μία περίπτωση, μια σελίδα με θέμα σάλτσα σπαγγέτι θύμιζε σκηνή εγκλήματος από καρτούν, ενώ σε άλλη, μια εικόνα μητέρας και γιου που παρακολουθούσαν τηλεόραση απεικόνιζε την οθόνη στην… λάθος πλευρά. Πέρα από αυτές τις ιδιαιτερότητες, δεν εντοπίστηκαν άλλες εμφανείς «παραξενιές» του AI σε ιστορίες που δημιουργήθηκαν στη συνέχεια. Ωστόσο, φάνηκε ότι το chatbot δεν συμμεριζόταν πλήρως την καλλιτεχνική αντίληψη του χρήστη όταν του μεταφορτώθηκε ένα σκίτσο καρτούν γάτας, το οποίο η AI απεικόνισε με αρκετές διαφορές. Το Storybook του Gemini είναι διαθέσιμο παγκοσμίως τόσο σε υπολογιστές όσο και σε κινητές συσκευές, υποστηρίζοντας όλες τις γλώσσες που είναι ήδη διαθέσιμες στην πλατφόρμα.
-
Η Google ανακοίνωσε αυτή την εβδομάδα την παροχή δωρεάν ετήσιας συνδρομής στο πλάνο AI Pro σε φοιτητές πέντε χωρών, παράλληλα με την κυκλοφορία νέας σειράς εργαλείων μάθησης στο Gemini. Οι φοιτητές στις Ηνωμένες Πολιτείες, την Ιαπωνία, την Ινδονησία, την Κορέα και τη Βραζιλία αποκτούν δωρεάν πρόσβαση στο συνδρομητικό πακέτο της εταιρείας που περιλαμβάνει μεταξύ άλλων και την κορυφαία έκδοση του Gemini chatbot, μια πρωτοβουλία που στοχεύει στην αξιοποίηση των δυνατοτήτων της τεχνητής νοημοσύνης στις σπουδές. Παράλληλα με την προσφορά, η εταιρεία κυκλοφόρησε μια νέα σειρά εργαλείων μάθησης στο Gemini, διαθέσιμα αυτή τη φορά σε όλους τους χρήστες. Τα νέα χαρακτηριστικά έχουν σχεδιαστεί για να ενισχύουν την κριτική σκέψη, να βαθαίνουν την κατανόηση και να κάνουν τη μελέτη αποδοτικότερη. Guided_Learning_full_length_high_resolution.mp4 Στο επίκεντρο των νέων εργαλείων βρίσκεται η λειτουργία Guided Learning, που λειτουργεί ως προσωπικός "ψηφιακός συνοδοιπόρος" στη μάθηση. Η συγκεκριμένη λειτουργία αναλύει προβλήματα βήμα-βήμα και προσαρμόζει τις εξηγήσεις στις ανάγκες κάθε χρήστη, αποκαλύπτοντας το "πώς" και το "γιατί" πίσω από κάθε έννοια. Επιπλέον, το Guided Learning επιτρέπει τη δημιουργία οδηγών μελέτης με βάση αρχεία μαθημάτων ή την επεξήγηση δύσκολων θεμάτων με χρήση βίντεο και οπτικών βοηθημάτων. Στόχος, σύμφωνα με την Google, είναι η πραγματική κατανόηση και όχι η απλή παροχή γρήγορων απαντήσεων, κάτι αντίστοιχο δηλαδή με το Study Mode της OpenAI και του ChatGPT. Visual_Learning.mp4 Η εμπειρία μάθησης στο Gemini εμπλουτίζεται με την αυτόματη ενσωμάτωση υψηλής ποιότητας εικόνων, διαγραμμάτων και βίντεο από το YouTube στις απαντήσεις. Όταν ο χρήστης υποβάλλει ερωτήματα για πολύπλοκα θέματα, όπως η διαδικασία της φωτοσύνθεσης ή τα μέρη ενός κυττάρου, το σύστημα προσθέτει σχετικές οπτικές αναπαραστάσεις, καθιστώντας την κατανόηση πιο άμεση και αποτελεσματική. Σημαντικό μέρος των καινοτομιών αποτελούν τα ειδικά εργαλεία για την προετοιμασία εξετάσεων. Οι χρήστες μπορούν να ζητήσουν από το Gemini να δημιουργήσει αυτόματα flashcards και οδηγούς μελέτης, βασισμένα είτε στα αποτελέσματα προηγούμενων τεστ είτε σε άλλο υλικό μαθημάτων. Σύμφωνα με την εταιρεία, η συγκεκριμένη δυνατότητα παρέχει έναν απλό και αποδοτικό τρόπο για επανάληψη βασικών εννοιών και ενίσχυση της μάθησης, βοηθώντας τους φοιτητές να οργανώσουν καλύτερα τη μελέτη τους πριν από τις εξετάσεις. Όπως αναφέρεται στην ανακοίνωση, όλα τα παραπάνω χαρακτηριστικά είναι ήδη διαθέσιμα, δίνοντας τη δυνατότητα στους φοιτητές και σε κάθε χρήστη του Gemini να αναβαθμίσει τον τρόπο που μελετά και να εμβαθύνει στις γνώσεις του με τη βοήθεια της τεχνητής νοημοσύνης. Διαβάστε ολόκληρο το άρθρο
-
Οι φοιτητές στις Ηνωμένες Πολιτείες, την Ιαπωνία, την Ινδονησία, την Κορέα και τη Βραζιλία αποκτούν δωρεάν πρόσβαση στο συνδρομητικό πακέτο της εταιρείας που περιλαμβάνει μεταξύ άλλων και την κορυφαία έκδοση του Gemini chatbot, μια πρωτοβουλία που στοχεύει στην αξιοποίηση των δυνατοτήτων της τεχνητής νοημοσύνης στις σπουδές. Παράλληλα με την προσφορά, η εταιρεία κυκλοφόρησε μια νέα σειρά εργαλείων μάθησης στο Gemini, διαθέσιμα αυτή τη φορά σε όλους τους χρήστες. Τα νέα χαρακτηριστικά έχουν σχεδιαστεί για να ενισχύουν την κριτική σκέψη, να βαθαίνουν την κατανόηση και να κάνουν τη μελέτη αποδοτικότερη. Guided_Learning_full_length_high_resolution.mp4 Στο επίκεντρο των νέων εργαλείων βρίσκεται η λειτουργία Guided Learning, που λειτουργεί ως προσωπικός "ψηφιακός συνοδοιπόρος" στη μάθηση. Η συγκεκριμένη λειτουργία αναλύει προβλήματα βήμα-βήμα και προσαρμόζει τις εξηγήσεις στις ανάγκες κάθε χρήστη, αποκαλύπτοντας το "πώς" και το "γιατί" πίσω από κάθε έννοια. Επιπλέον, το Guided Learning επιτρέπει τη δημιουργία οδηγών μελέτης με βάση αρχεία μαθημάτων ή την επεξήγηση δύσκολων θεμάτων με χρήση βίντεο και οπτικών βοηθημάτων. Στόχος, σύμφωνα με την Google, είναι η πραγματική κατανόηση και όχι η απλή παροχή γρήγορων απαντήσεων, κάτι αντίστοιχο δηλαδή με το Study Mode της OpenAI και του ChatGPT. Visual_Learning.mp4 Η εμπειρία μάθησης στο Gemini εμπλουτίζεται με την αυτόματη ενσωμάτωση υψηλής ποιότητας εικόνων, διαγραμμάτων και βίντεο από το YouTube στις απαντήσεις. Όταν ο χρήστης υποβάλλει ερωτήματα για πολύπλοκα θέματα, όπως η διαδικασία της φωτοσύνθεσης ή τα μέρη ενός κυττάρου, το σύστημα προσθέτει σχετικές οπτικές αναπαραστάσεις, καθιστώντας την κατανόηση πιο άμεση και αποτελεσματική. Σημαντικό μέρος των καινοτομιών αποτελούν τα ειδικά εργαλεία για την προετοιμασία εξετάσεων. Οι χρήστες μπορούν να ζητήσουν από το Gemini να δημιουργήσει αυτόματα flashcards και οδηγούς μελέτης, βασισμένα είτε στα αποτελέσματα προηγούμενων τεστ είτε σε άλλο υλικό μαθημάτων. Σύμφωνα με την εταιρεία, η συγκεκριμένη δυνατότητα παρέχει έναν απλό και αποδοτικό τρόπο για επανάληψη βασικών εννοιών και ενίσχυση της μάθησης, βοηθώντας τους φοιτητές να οργανώσουν καλύτερα τη μελέτη τους πριν από τις εξετάσεις. Όπως αναφέρεται στην ανακοίνωση, όλα τα παραπάνω χαρακτηριστικά είναι ήδη διαθέσιμα, δίνοντας τη δυνατότητα στους φοιτητές και σε κάθε χρήστη του Gemini να αναβαθμίσει τον τρόπο που μελετά και να εμβαθύνει στις γνώσεις του με τη βοήθεια της τεχνητής νοημοσύνης.
-
Η Google αρνείται ότι οι λειτουργίες τεχνητής νοημοσύνης μειώνουν την επισκεψιμότητα προς ιστοσελίδες, υποστηρίζοντας ότι ο συνολικός όγκος οργανικών κλικ από τη μηχανή αναζήτησής της παραμένει σταθερός σε ετήσια βάση. Η Liz Reid, αντιπρόεδρος και επικεφαλής της υπηρεσίας Αναζήτησης της Google, ανέφερε σε πρόσφατη ανάρτηση στο ιστολόγιο της εταιρείας ότι η ποιότητα των κλικ έχει βελτιωθεί ελαφρώς. Σύμφωνα με τα στοιχεία που παρουσιάζει η εταιρεία, οι χρήστες τείνουν να παραμένουν περισσότερο στις ιστοσελίδες στις οποίες μεταβαίνουν, χωρίς να επιστρέφουν γρήγορα πίσω στα αποτελέσματα αναζήτησης. Αυτή η τάση δείχνει ότι τα κλικ γίνονται πιο ουσιαστικά, παρόλο που η Google δεν δημοσιεύει συγκεκριμένα αριθμητικά δεδομένα για να στηρίξει αυτούς τους ισχυρισμούς. Πολλές έρευνες από τρίτους φορείς έχουν δείξει ότι η μετάβαση σε λειτουργίες αναζήτησης βασισμένες σε τεχνητή νοημοσύνη και η χρήση chatbot μειώνουν την κίνηση προς τις ιστοσελίδες εκδοτών. Ωστόσο, η Google αντικρούει αυτές τις εκτιμήσεις, χαρακτηρίζοντάς τες ως ανακριβείς λόγω ελαττωματικών μεθοδολογιών ή περιορισμένων παραδειγμάτων. Η Reid επισημαίνει ότι τέτοιες αναφορές συχνά βασίζονται σε αλλαγές που συνέβησαν πριν από την εισαγωγή των χαρακτηριστικών τεχνητής νοημοσύνης στην Αναζήτηση. Παρά τις διαβεβαιώσεις, η ίδια η Google παραδέχεται ότι οι τάσεις των χρηστών μετατοπίζουν την κίνηση προς διαφορετικές ιστοσελίδες. Ορισμένοι ιστότοποι βλέπουν μείωση στην επισκεψιμότητα, ενώ άλλοι αύξηση. Χωρίς συγκεκριμένα στοιχεία για τον αριθμό των επηρεαζόμενων ιστοσελίδων, η εικόνα παραμένει ασαφής. Για παράδειγμα, chatbot όπως το ChatGPT έχουν δει αύξηση στη χρήση τους, αλλά αυτό δεν αποκλείει τις δυσκολίες που αντιμετωπίζουν οι διαδικτυακοί εκδότες. Η εταιρεία έχει επενδύσει χρόνια στην αναβάθμιση της μηχανής αναζήτησης, προσφέροντας άμεσες απαντήσεις στα αποτελέσματα, τώρα ενισχυμένες με τεχνητή νοημοσύνη μέσω των "AI Overviews" που εμφανίζονται στην κορυφή. Οι χρήστες μπορούν επίσης να αλληλεπιδρούν με chatbot για ορισμένα ερωτήματα. Παρά αυτές τις αλλαγές, η Google ισχυρίζεται ότι το τοπίο της αναζήτησης δεν μεταβάλλεται δραστικά, αποδίδοντας τις μετατοπίσεις σε προτιμήσεις των χρηστών προς άλλες πλατφόρμες. Οι άνθρωποι στρέφονται όλο και περισσότερο σε ιστότοπους με φόρουμ, βίντεο, podcast και αναρτήσεις που προσφέρουν αυθεντικές απόψεις και προσωπικές εμπειρίες, εξηγεί η Reid. Η στροφή αυτή υποδηλώνει ότι η Google δεν είναι πλέον η πρώτη επιλογή για πολλούς χρήστες. Ήδη από το 2022, στέλεχος της εταιρείας, ο Prabhakar Raghavan, τότε επικεφαλής του τμήματος Γνώσης και Πληροφοριών, σημείωσε ότι σχεδόν το 40% των νέων ανθρώπων προτιμούν πλατφόρμες όπως το TikTok ή το Instagram για αναζητήσεις, όπως για μέρη φαγητού, αντί για το Google Maps ή την Αναζήτηση. Η ανησυχία της Google εκτείνεται και σε άλλους τομείς. Το Amazon.com έχει γίνει η κύρια επιλογή για αγορές online, ενώ το Reddit.com προτιμάται για έρευνα θεμάτων. Για να αντιμετωπίσει το γεγονός αυτό, η εταιρεία έχει αναπτύξει λειτουργίες όπως καλάθια αγορών, έλεγχο τοπικού αποθέματος, εύρεση προσφορών και αγορές από εικόνες προϊόντων. Από το 2020, οι καταχωρήσεις στο Google Shopping έγιναν δωρεάν για εμπόρους. Καθώς οι χρήστες παραπονιούνται για πτώση στην ποιότητα της Αναζήτησης, η Google ανταποκρίθηκε προσθέτοντας φίλτρο για αποτελέσματα από φόρουμ, αρχικά εστιασμένο στο Reddit λόγω υψηλής ζήτησης. Τώρα, η εστίαση μετατοπίζεται από τον απλό αριθμό κλικ, στην ποιότητά τους. Η εταιρεία δηλώνει ότι στέλνει ελαφρώς περισσότερα ποιοτικά κλικ, όπου οι χρήστες εμπλέκονται βαθύτερα. Τα "AI Overviews" παρουσιάζουν περισσότερους συνδέσμους, δημιουργώντας ευκαιρίες για κλικ, σύμφωνα με την Reid. Ωστόσο, μελέτες όπως αυτή της Similarweb δείχνουν αύξηση των αναζητήσεων χωρίς κλικ σε ειδησεογραφικούς ιστότοπους, από 56% τον Μάιο του 2024 σε 69% τον Μάιο του 2025. Η Google, αναγνωρίζοντας την τάση, λάνσαρε εργαλείο για εκδότες που βοηθά στην αποκόμιση κερδών μέσω μικροπληρωμών ή εγγραφών σε newsletter, μειώνοντας την εξάρτηση από διαφημίσεις. Η προσπάθεια της Google να πείσει ότι η τεχνητή νοημοσύνη δεν απειλεί την επισκεψιμότητα φαίνεται να αντανακλά ανησυχίες για το μέλλον. Παρά τις διαβεβαιώσεις, η εταιρεία συνεχίζει να στέλνει δισεκατομμύρια κλικ καθημερινά σε ιστοσελίδες. Πρόσφατα, η Google υπέγραψε συμφωνία 60 εκατομμυρίων δολαρίων με το Reddit για πρόσβαση σε δεδομένα σε πραγματικό χρόνο, ενισχύοντας την εκπαίδευση των μοντέλων τεχνητής νοημοσύνης της. Διαβάστε ολόκληρο το άρθρο
- 8 απαντήσεις
-
Η Liz Reid, αντιπρόεδρος και επικεφαλής της υπηρεσίας Αναζήτησης της Google, ανέφερε σε πρόσφατη ανάρτηση στο ιστολόγιο της εταιρείας ότι η ποιότητα των κλικ έχει βελτιωθεί ελαφρώς. Σύμφωνα με τα στοιχεία που παρουσιάζει η εταιρεία, οι χρήστες τείνουν να παραμένουν περισσότερο στις ιστοσελίδες στις οποίες μεταβαίνουν, χωρίς να επιστρέφουν γρήγορα πίσω στα αποτελέσματα αναζήτησης. Αυτή η τάση δείχνει ότι τα κλικ γίνονται πιο ουσιαστικά, παρόλο που η Google δεν δημοσιεύει συγκεκριμένα αριθμητικά δεδομένα για να στηρίξει αυτούς τους ισχυρισμούς. Πολλές έρευνες από τρίτους φορείς έχουν δείξει ότι η μετάβαση σε λειτουργίες αναζήτησης βασισμένες σε τεχνητή νοημοσύνη και η χρήση chatbot μειώνουν την κίνηση προς τις ιστοσελίδες εκδοτών. Ωστόσο, η Google αντικρούει αυτές τις εκτιμήσεις, χαρακτηρίζοντάς τες ως ανακριβείς λόγω ελαττωματικών μεθοδολογιών ή περιορισμένων παραδειγμάτων. Η Reid επισημαίνει ότι τέτοιες αναφορές συχνά βασίζονται σε αλλαγές που συνέβησαν πριν από την εισαγωγή των χαρακτηριστικών τεχνητής νοημοσύνης στην Αναζήτηση. Παρά τις διαβεβαιώσεις, η ίδια η Google παραδέχεται ότι οι τάσεις των χρηστών μετατοπίζουν την κίνηση προς διαφορετικές ιστοσελίδες. Ορισμένοι ιστότοποι βλέπουν μείωση στην επισκεψιμότητα, ενώ άλλοι αύξηση. Χωρίς συγκεκριμένα στοιχεία για τον αριθμό των επηρεαζόμενων ιστοσελίδων, η εικόνα παραμένει ασαφής. Για παράδειγμα, chatbot όπως το ChatGPT έχουν δει αύξηση στη χρήση τους, αλλά αυτό δεν αποκλείει τις δυσκολίες που αντιμετωπίζουν οι διαδικτυακοί εκδότες. Η εταιρεία έχει επενδύσει χρόνια στην αναβάθμιση της μηχανής αναζήτησης, προσφέροντας άμεσες απαντήσεις στα αποτελέσματα, τώρα ενισχυμένες με τεχνητή νοημοσύνη μέσω των "AI Overviews" που εμφανίζονται στην κορυφή. Οι χρήστες μπορούν επίσης να αλληλεπιδρούν με chatbot για ορισμένα ερωτήματα. Παρά αυτές τις αλλαγές, η Google ισχυρίζεται ότι το τοπίο της αναζήτησης δεν μεταβάλλεται δραστικά, αποδίδοντας τις μετατοπίσεις σε προτιμήσεις των χρηστών προς άλλες πλατφόρμες. Οι άνθρωποι στρέφονται όλο και περισσότερο σε ιστότοπους με φόρουμ, βίντεο, podcast και αναρτήσεις που προσφέρουν αυθεντικές απόψεις και προσωπικές εμπειρίες, εξηγεί η Reid. Η στροφή αυτή υποδηλώνει ότι η Google δεν είναι πλέον η πρώτη επιλογή για πολλούς χρήστες. Ήδη από το 2022, στέλεχος της εταιρείας, ο Prabhakar Raghavan, τότε επικεφαλής του τμήματος Γνώσης και Πληροφοριών, σημείωσε ότι σχεδόν το 40% των νέων ανθρώπων προτιμούν πλατφόρμες όπως το TikTok ή το Instagram για αναζητήσεις, όπως για μέρη φαγητού, αντί για το Google Maps ή την Αναζήτηση. Η ανησυχία της Google εκτείνεται και σε άλλους τομείς. Το Amazon.com έχει γίνει η κύρια επιλογή για αγορές online, ενώ το Reddit.com προτιμάται για έρευνα θεμάτων. Για να αντιμετωπίσει το γεγονός αυτό, η εταιρεία έχει αναπτύξει λειτουργίες όπως καλάθια αγορών, έλεγχο τοπικού αποθέματος, εύρεση προσφορών και αγορές από εικόνες προϊόντων. Από το 2020, οι καταχωρήσεις στο Google Shopping έγιναν δωρεάν για εμπόρους. Καθώς οι χρήστες παραπονιούνται για πτώση στην ποιότητα της Αναζήτησης, η Google ανταποκρίθηκε προσθέτοντας φίλτρο για αποτελέσματα από φόρουμ, αρχικά εστιασμένο στο Reddit λόγω υψηλής ζήτησης. Τώρα, η εστίαση μετατοπίζεται από τον απλό αριθμό κλικ, στην ποιότητά τους. Η εταιρεία δηλώνει ότι στέλνει ελαφρώς περισσότερα ποιοτικά κλικ, όπου οι χρήστες εμπλέκονται βαθύτερα. Τα "AI Overviews" παρουσιάζουν περισσότερους συνδέσμους, δημιουργώντας ευκαιρίες για κλικ, σύμφωνα με την Reid. Ωστόσο, μελέτες όπως αυτή της Similarweb δείχνουν αύξηση των αναζητήσεων χωρίς κλικ σε ειδησεογραφικούς ιστότοπους, από 56% τον Μάιο του 2024 σε 69% τον Μάιο του 2025. Η Google, αναγνωρίζοντας την τάση, λάνσαρε εργαλείο για εκδότες που βοηθά στην αποκόμιση κερδών μέσω μικροπληρωμών ή εγγραφών σε newsletter, μειώνοντας την εξάρτηση από διαφημίσεις. Η προσπάθεια της Google να πείσει ότι η τεχνητή νοημοσύνη δεν απειλεί την επισκεψιμότητα φαίνεται να αντανακλά ανησυχίες για το μέλλον. Παρά τις διαβεβαιώσεις, η εταιρεία συνεχίζει να στέλνει δισεκατομμύρια κλικ καθημερινά σε ιστοσελίδες. Πρόσφατα, η Google υπέγραψε συμφωνία 60 εκατομμυρίων δολαρίων με το Reddit για πρόσβαση σε δεδομένα σε πραγματικό χρόνο, ενισχύοντας την εκπαίδευση των μοντέλων τεχνητής νοημοσύνης της.
-
Νέα έρευνα από το METR αμφισβητεί τους ισχυρισμούς ότι τα εργαλεία κώδικα με τεχνητή νοημοσύνη αυξάνουν την παραγωγικότητα των προγραμματιστών. Μια νέα μελέτη που δημοσιεύτηκε την Πέμπτη από τον μη κερδοσκοπικό ερευνητικό οργανισμό τεχνητής νοημοσύνης METR θέτει υπό αμφισβήτηση το κατά πόσο τα σημερινά εργαλεία κώδικα με τεχνητή νοημοσύνη πραγματικά βελτιώνουν την παραγωγικότητα των έμπειρων προγραμματιστών. Τα τελευταία χρόνια, εργαλεία όπως το Cursor και το GitHub Copilot έχουν μεταμορφώσει τον τρόπο εργασίας των προγραμματιστών, υποσχόμενα αυξημένη παραγωγικότητα μέσω αυτόματης συγγραφής κώδικα, διόρθωσης σφαλμάτων και ελέγχου αλλαγών. Τα εργαλεία αυτά τροφοδοτούνται από μοντέλα τεχνητής νοημοσύνης από εταιρείες όπως η OpenAI, η Google DeepMind, η Anthropic και η xAI. Η METR διεξήγαγε μια τυχαία ελεγχόμενη δοκιμή, στρατολογώντας 16 έμπειρους προγραμματιστές ανοιχτού κώδικα και αναθέτοντάς τους 246 πραγματικές εργασίες σε μεγάλα αποθετήρια κώδικα στα οποία συνεισφέρουν τακτικά. Οι ερευνητές χαρακτήρισαν τυχαία περίπου τις μισές από αυτές τις εργασίες ως "επιτρεπόμενες με τεχνητή νοημοσύνη", δίνοντας στους προγραμματιστές την άδεια να χρησιμοποιούν προηγμένα εργαλεία κώδικα τεχνητής νοημοσύνης όπως το Cursor Pro, ενώ το άλλο μισό των εργασιών απαγόρευε τη χρήση εργαλείων τεχνητής νοημοσύνης. Πριν από την ολοκλήρωση των εργασιών τους, οι προγραμματιστές προέβλεψαν ότι η χρήση εργαλείων κώδικα τεχνητής νοημοσύνης θα μείωνε τον χρόνο ολοκλήρωσης κατά 24%. Ωστόσο, αυτό δεν συνέβη. "Εκπληκτικά, διαπιστώνουμε ότι η επιτρεπόμενη χρήση τεχνητής νοημοσύνης στην πραγματικότητα αυξάνει τον χρόνο ολοκλήρωσης κατά 19% - οι προγραμματιστές είναι πιο αργοί όταν χρησιμοποιούν εργαλεία τεχνητής νοημοσύνης", ανέφεραν οι ερευνητές. Αξιοσημείωτο είναι ότι μόνο το 56% των προγραμματιστών στη μελέτη είχαν εμπειρία με το Cursor, το κύριο εργαλείο τεχνητής νοημοσύνης που προσφέρθηκε στη μελέτη. Ενώ σχεδόν όλοι οι προγραμματιστές (94%) είχαν εμπειρία χρήσης κάποιων διαδικτυακών LLMs στο workflow τους, η μελέτη αυτή ήταν η αφορμή που ορισμένοι για πρώτη φορά χρησιμοποίησαν συγκεκριμένα το Cursor. Οι ερευνητές σημειώνουν ότι οι προγραμματιστές εκπαιδεύτηκαν στη χρήση του Cursor σε προετοιμασία για τη μελέτη. Οι ερευνητές της METR επισημαίνουν μερικούς πιθανούς λόγους για τους οποίους η τεχνητή νοημοσύνη καθυστέρησε τους προγραμματιστές αντί να επιταχύνει τη δουλειά τους. Πρώτον, οι προγραμματιστές ξοδεύουν πολύ περισσότερο χρόνο στην καθοδήγηση της τεχνητής νοημοσύνης και στην αναμονή για απάντηση παρά στον πραγματικό προγραμματισμό. Επιπλέον, η τεχνητή νοημοσύνη τείνει να δυσκολεύεται σε μεγάλες, περίπλοκες βάσεις κώδικα, όπως αυτές που χρησιμοποιήθηκαν σε αυτή τη δοκιμή. Οι συγγραφείς της μελέτης είναι προσεκτικοί στο να μην εξάγουν ισχυρά συμπεράσματα από αυτά τα ευρήματα, σημειώνοντας ρητά ότι δεν πιστεύουν πως τα σημερινά συστήματα τεχνητής νοημοσύνης αποτυγχάνουν να επιταχύνουν πολλούς ή τους περισσότερους προγραμματιστές λογισμικού. Άλλες μελέτες μεγάλης κλίμακας έχουν δείξει ότι τα εργαλεία κώδικα τεχνητής νοημοσύνης επιταχύνουν την παραγωγικότητα των προγραμματιστών. Επίσης, οι συγγραφείς επισημαίνουν ότι η πρόοδος της τεχνητής νοημοσύνης τα τελευταία χρόνια είναι σημαντική και ότι δεν θα περίμεναν τα ίδια αποτελέσματα ακόμη και τρεις μήνες από τώρα. Η METR έχει επίσης διαπιστώσει ότι τα εργαλεία προγραμματισμού με τεχνητή νοημοσύνη έχουν βελτιώσει σημαντικά την ικανότητά τους να ολοκληρώνουν περίπλοκες εργασίες μακροπρόθεσμου ορίζοντα τα τελευταία χρόνια. Ωστόσο, η έρευνα προσφέρει έναν ακόμη λόγο για να είμαστε σκεπτικοί απέναντι στα υποσχόμενα οφέλη των σχετικών εργαλείων προγραμματισμού. Άλλες μελέτες έχουν δείξει ότι τα σημερινά εργαλεία μπορούν να εισαγάγουν λάθη και, σε ορισμένες περιπτώσεις, σημαντικές ευπάθειες ασφαλείας. Διαβάστε ολόκληρο το άρθρο
- 35 απαντήσεις
-
- τεχνητή νοημοσύνη
- Github
-
(και 3 περισσότερα)
Ετικέτα με:
-
Μια νέα μελέτη που δημοσιεύτηκε την Πέμπτη από τον μη κερδοσκοπικό ερευνητικό οργανισμό τεχνητής νοημοσύνης METR θέτει υπό αμφισβήτηση το κατά πόσο τα σημερινά εργαλεία κώδικα με τεχνητή νοημοσύνη πραγματικά βελτιώνουν την παραγωγικότητα των έμπειρων προγραμματιστών. Τα τελευταία χρόνια, εργαλεία όπως το Cursor και το GitHub Copilot έχουν μεταμορφώσει τον τρόπο εργασίας των προγραμματιστών, υποσχόμενα αυξημένη παραγωγικότητα μέσω αυτόματης συγγραφής κώδικα, διόρθωσης σφαλμάτων και ελέγχου αλλαγών. Τα εργαλεία αυτά τροφοδοτούνται από μοντέλα τεχνητής νοημοσύνης από εταιρείες όπως η OpenAI, η Google DeepMind, η Anthropic και η xAI. Η METR διεξήγαγε μια τυχαία ελεγχόμενη δοκιμή, στρατολογώντας 16 έμπειρους προγραμματιστές ανοιχτού κώδικα και αναθέτοντάς τους 246 πραγματικές εργασίες σε μεγάλα αποθετήρια κώδικα στα οποία συνεισφέρουν τακτικά. Οι ερευνητές χαρακτήρισαν τυχαία περίπου τις μισές από αυτές τις εργασίες ως "επιτρεπόμενες με τεχνητή νοημοσύνη", δίνοντας στους προγραμματιστές την άδεια να χρησιμοποιούν προηγμένα εργαλεία κώδικα τεχνητής νοημοσύνης όπως το Cursor Pro, ενώ το άλλο μισό των εργασιών απαγόρευε τη χρήση εργαλείων τεχνητής νοημοσύνης. Πριν από την ολοκλήρωση των εργασιών τους, οι προγραμματιστές προέβλεψαν ότι η χρήση εργαλείων κώδικα τεχνητής νοημοσύνης θα μείωνε τον χρόνο ολοκλήρωσης κατά 24%. Ωστόσο, αυτό δεν συνέβη. "Εκπληκτικά, διαπιστώνουμε ότι η επιτρεπόμενη χρήση τεχνητής νοημοσύνης στην πραγματικότητα αυξάνει τον χρόνο ολοκλήρωσης κατά 19% - οι προγραμματιστές είναι πιο αργοί όταν χρησιμοποιούν εργαλεία τεχνητής νοημοσύνης", ανέφεραν οι ερευνητές. Αξιοσημείωτο είναι ότι μόνο το 56% των προγραμματιστών στη μελέτη είχαν εμπειρία με το Cursor, το κύριο εργαλείο τεχνητής νοημοσύνης που προσφέρθηκε στη μελέτη. Ενώ σχεδόν όλοι οι προγραμματιστές (94%) είχαν εμπειρία χρήσης κάποιων διαδικτυακών LLMs στο workflow τους, η μελέτη αυτή ήταν η αφορμή που ορισμένοι για πρώτη φορά χρησιμοποίησαν συγκεκριμένα το Cursor. Οι ερευνητές σημειώνουν ότι οι προγραμματιστές εκπαιδεύτηκαν στη χρήση του Cursor σε προετοιμασία για τη μελέτη. Οι ερευνητές της METR επισημαίνουν μερικούς πιθανούς λόγους για τους οποίους η τεχνητή νοημοσύνη καθυστέρησε τους προγραμματιστές αντί να επιταχύνει τη δουλειά τους. Πρώτον, οι προγραμματιστές ξοδεύουν πολύ περισσότερο χρόνο στην καθοδήγηση της τεχνητής νοημοσύνης και στην αναμονή για απάντηση παρά στον πραγματικό προγραμματισμό. Επιπλέον, η τεχνητή νοημοσύνη τείνει να δυσκολεύεται σε μεγάλες, περίπλοκες βάσεις κώδικα, όπως αυτές που χρησιμοποιήθηκαν σε αυτή τη δοκιμή. Οι συγγραφείς της μελέτης είναι προσεκτικοί στο να μην εξάγουν ισχυρά συμπεράσματα από αυτά τα ευρήματα, σημειώνοντας ρητά ότι δεν πιστεύουν πως τα σημερινά συστήματα τεχνητής νοημοσύνης αποτυγχάνουν να επιταχύνουν πολλούς ή τους περισσότερους προγραμματιστές λογισμικού. Άλλες μελέτες μεγάλης κλίμακας έχουν δείξει ότι τα εργαλεία κώδικα τεχνητής νοημοσύνης επιταχύνουν την παραγωγικότητα των προγραμματιστών. Επίσης, οι συγγραφείς επισημαίνουν ότι η πρόοδος της τεχνητής νοημοσύνης τα τελευταία χρόνια είναι σημαντική και ότι δεν θα περίμεναν τα ίδια αποτελέσματα ακόμη και τρεις μήνες από τώρα. Η METR έχει επίσης διαπιστώσει ότι τα εργαλεία προγραμματισμού με τεχνητή νοημοσύνη έχουν βελτιώσει σημαντικά την ικανότητά τους να ολοκληρώνουν περίπλοκες εργασίες μακροπρόθεσμου ορίζοντα τα τελευταία χρόνια. Ωστόσο, η έρευνα προσφέρει έναν ακόμη λόγο για να είμαστε σκεπτικοί απέναντι στα υποσχόμενα οφέλη των σχετικών εργαλείων προγραμματισμού. Άλλες μελέτες έχουν δείξει ότι τα σημερινά εργαλεία μπορούν να εισαγάγουν λάθη και, σε ορισμένες περιπτώσεις, σημαντικές ευπάθειες ασφαλείας.
- 35 σχόλια
-
- 5
-
-
-
-
- τεχνητή νοημοσύνη
- Github
-
(και 3 περισσότερα)
Ετικέτα με:
-
Η Google λανσάρει νέα λειτουργία στο Gemini AI που μετατρέπει φωτογραφίες σε βίντεο με τεχνητή νοημοσύνη, συμπεριλαμβανομένων ήχων και διαλόγων. Η νέα δυνατότητα μετατροπής φωτογραφιών σε βίντεο τροφοδοτείται από το μοντέλο Veo 3 της Google και μπορεί να μετατρέψει εικόνες αναφοράς σε βίντεο οκτώ δευτερολέπτων με ήχο που δημιουργείται από τεχνητή νοημοσύνη, συμπεριλαμβανομένων θορύβων περιβάλλοντος, ήχων και ομιλίας. H ενημέρωση βίντεο του Gemini είναι πλέον διαθέσιμη στους συνδρομητές Google AI Ultra και Pro στη web έκδοση και "σε επιλεγμένες περιοχές" στις οποίες δεν περιλαμβάνεται για την ώρα η χώρα μας. Οι χρήστες του Gemini μπορούν να αποκτήσουν πρόσβαση στη λειτουργία κάνοντας κλικ στην επιλογή "εργαλεία" στη γραμμή προτροπής, επιλέγοντας "βίντεο" και μεταφορτώνοντας τη φωτογραφία τους μαζί με μια περιγραφή κειμένου για το πώς θέλουν να κινηθεί. Μπορούν επίσης να συμπεριληφθούν περιγραφές ήχου για διαλόγους, ηχητικά εφέ και περιβαλλοντικό θόρυβο, τα οποία, όπως αναφέρει η Google, θα είναι "τέλεια συγχρονισμένα με τα οπτικά στοιχεία". Τα τελικά βίντεο παραδίδονται ως αρχεία MP4 με ανάλυση 720p και σε αναλογία 16:9. "Μπορείτε να γίνετε δημιουργικοί ζωντανεύοντας καθημερινά αντικείμενα, δίνοντας ζωή στα σχέδια και τους πίνακές σας ή προσθέτοντας κίνηση σε σκηνές της φύσης", αναφέρει η Google. "Όλες οι δημιουργίες βίντεο περιλαμβάνουν ένα ορατό υδατογράφημα που δείχνει ότι έχουν δημιουργηθεί από τεχνητή νοημοσύνη και ένα αόρατο ψηφιακό υδατογράφημα SynthID." Μια παρόμοια λειτουργία είναι ήδη διαθέσιμη στο Flow, το εργαλείο δημιουργίας ταινιών με τεχνητή νοημοσύνη που ανακοίνωσε η Google τον Μάρτιο, αλλά τώρα οι χρήστες του Gemini μπορούν να ζωντανέψουν τις φωτογραφίες τους χωρίς να χρειάζεται να ανοίξουν άλλη εφαρμογή. Η Google αναφέρει ότι το Flow θα κυκλοφορήσει επίσης "σε επιπλέον 75 χώρες" από σήμερα, παράλληλα με την κυκλοφορία της νέας λειτουργίας βίντεο του Gemini. Διαβάστε ολόκληρο το άρθρο
-
Η νέα δυνατότητα μετατροπής φωτογραφιών σε βίντεο τροφοδοτείται από το μοντέλο Veo 3 της Google και μπορεί να μετατρέψει εικόνες αναφοράς σε βίντεο οκτώ δευτερολέπτων με ήχο που δημιουργείται από τεχνητή νοημοσύνη, συμπεριλαμβανομένων θορύβων περιβάλλοντος, ήχων και ομιλίας. H ενημέρωση βίντεο του Gemini είναι πλέον διαθέσιμη στους συνδρομητές Google AI Ultra και Pro στη web έκδοση και "σε επιλεγμένες περιοχές" στις οποίες δεν περιλαμβάνεται για την ώρα η χώρα μας. Οι χρήστες του Gemini μπορούν να αποκτήσουν πρόσβαση στη λειτουργία κάνοντας κλικ στην επιλογή "εργαλεία" στη γραμμή προτροπής, επιλέγοντας "βίντεο" και μεταφορτώνοντας τη φωτογραφία τους μαζί με μια περιγραφή κειμένου για το πώς θέλουν να κινηθεί. Μπορούν επίσης να συμπεριληφθούν περιγραφές ήχου για διαλόγους, ηχητικά εφέ και περιβαλλοντικό θόρυβο, τα οποία, όπως αναφέρει η Google, θα είναι "τέλεια συγχρονισμένα με τα οπτικά στοιχεία". Τα τελικά βίντεο παραδίδονται ως αρχεία MP4 με ανάλυση 720p και σε αναλογία 16:9. "Μπορείτε να γίνετε δημιουργικοί ζωντανεύοντας καθημερινά αντικείμενα, δίνοντας ζωή στα σχέδια και τους πίνακές σας ή προσθέτοντας κίνηση σε σκηνές της φύσης", αναφέρει η Google. "Όλες οι δημιουργίες βίντεο περιλαμβάνουν ένα ορατό υδατογράφημα που δείχνει ότι έχουν δημιουργηθεί από τεχνητή νοημοσύνη και ένα αόρατο ψηφιακό υδατογράφημα SynthID." Μια παρόμοια λειτουργία είναι ήδη διαθέσιμη στο Flow, το εργαλείο δημιουργίας ταινιών με τεχνητή νοημοσύνη που ανακοίνωσε η Google τον Μάρτιο, αλλά τώρα οι χρήστες του Gemini μπορούν να ζωντανέψουν τις φωτογραφίες τους χωρίς να χρειάζεται να ανοίξουν άλλη εφαρμογή. Η Google αναφέρει ότι το Flow θα κυκλοφορήσει επίσης "σε επιπλέον 75 χώρες" από σήμερα, παράλληλα με την κυκλοφορία της νέας λειτουργίας βίντεο του Gemini.
-
Η Google αντιμετωπίζει καταγγελία από ανεξάρτητους εκδότες στην ΕΕ σχετικά με τις λειτουργίες AI Overviews που, σύμφωνα με τους καταγγέλλοντες, προκαλούν ανεπανόρθωτη ζημιά στον κλάδο τους, σύμφωνα με έγγραφο που έχει στην κατοχή του το Reuters. Η καταγγελία υποβλήθηκε από την Independent Publishers Alliance στις 30 Ιουνίου προς την Ευρωπαϊκή Επιτροπή, κατηγορώντας τη Google για κατάχρηση της κυρίαρχης θέσης της στην αγορά διαδικτυακής αναζήτησης. Τα AI Overviews της Google είναι περιλήψεις που δημιουργούνται από τεχνητή νοημοσύνη και εμφανίζονται πάνω από τους παραδοσιακούς υπερσυνδέσμους προς σχετικές ιστοσελίδες σε περισσότερες από 100 χώρες. Η εταιρεία ξεκίνησε να προσθέτει διαφημίσεις στα AI Overviews τον περασμένο Μάιο. Όπως αναφέρει το έγγραφο της καταγγελίας, "η βασική υπηρεσία μηχανής αναζήτησης της Google κάνει κατάχρηση του web περιεχομένου για τα AI Overviews της Google στην Αναζήτηση Google, τα οποία έχουν προκαλέσει και συνεχίζουν να προκαλούν σημαντική ζημιά στους ιδιοκτήτες ιστοσελίδων, συμπεριλαμβανομένων των ειδησεογραφικών εκδοτών, με τη μορφή απώλειας επισκεψιμότητας, αναγνωσιμότητας και εσόδων." Οι καταγγέλλοντες υποστηρίζουν ότι η Google τοποθετεί τα AI Overviews στην κορυφή της σελίδας αποτελεσμάτων της μηχανής αναζήτησης για να προβάλει τις δικές της περιλήψεις, οι οποίες δημιουργούνται χρησιμοποιώντας υλικό των εκδοτών, και ισχυρίζονται ότι αυτή η τοποθέτηση βάζει σε δεύτερη μοίρα το πρωτότυπο περιεχόμενο των εκδοτών. "Οι εκδότες που χρησιμοποιούν την Αναζήτηση της Google δεν έχουν την επιλογή να εξαιρεθούν από τη χρήση του υλικού τους για την εκπαίδευση του Gemini, του μοντέλου μεγάλης γλώσσας τεχνητής νοημοσύνης της Google ή/και από το να σαρώνονται για περιλήψεις, χωρίς να χάσουν τη δυνατότητα να εμφανίζονται στη σελίδα αποτελεσμάτων γενικής αναζήτησης της Google", αναφέρεται στην καταγγελία. Η Ευρωπαϊκή Επιτροπή αρνήθηκε να σχολιάσει, ενώ η βρετανική Αρχή Ανταγωνισμού και Αγορών επιβεβαίωσε την παραλαβή της καταγγελίας. Από την πλευρά της, η Google υποστήριξε ότι στέλνει δισεκατομμύρια κλικ σε ιστότοπους καθημερινά. "Οι νέες εμπειρίες τεχνητής νοημοσύνης στην Αναζήτηση επιτρέπουν στους ανθρώπους να θέτουν ακόμη περισσότερες ερωτήσεις, γεγονός που δημιουργεί νέες ευκαιρίες ανακάλυψης περιεχομένου και επιχειρήσεων", δήλωσε εκπρόσωπος της Google. Εκτός από την Independent Publishers Alliance, συνυπογράφοντες της καταγγελίας είναι το Movement for an Open Web, του οποίου τα μέλη περιλαμβάνουν ψηφιακούς διαφημιστές και εκδότες, καθώς και η βρετανική μη κερδοσκοπική Foxglove Legal Community Interest Company. Η συνδιευθύντρια της Foxglove, Rosa Curling, δήλωσε στο Reuters ότι οι δημοσιογράφοι και οι εκδότες αντιμετωπίζουν μια δεινή κατάσταση. "Η ανεξάρτητη ειδησεογραφία αντιμετωπίζει μια υπαρξιακή απειλή: τα AI Overviews της Google", είπε. "Γι' αυτό με αυτή την καταγγελία, η Foxglove και οι συνεργάτες μας προτρέπουμε την Ευρωπαϊκή Επιτροπή, μαζί με άλλους ρυθμιστικούς φορείς σε όλο τον κόσμο, να πάρουν θέση και να επιτρέψουν στην ανεξάρτητη δημοσιογραφία να εξαιρεθεί", πρόσθεσε η Curling. Οι τρεις ομάδες έχουν υποβάλει παρόμοια καταγγελία και αίτημα για προσωρινό μέτρο στη βρετανική αρχή ανταγωνισμού. Οι καταγγελίες ηχούν παρόμοια με μια αμερικανική αγωγή από μια εταιρεία εκπαιδευτικής τεχνολογίας, η οποία υποστήριξε ότι τα AI Overviews της Google διαβρώνουν τη ζήτηση για πρωτότυπο περιεχόμενο και υπονομεύουν την ικανότητα των εκδοτών να ανταγωνιστούν, με αποτέλεσμα τη μείωση των επισκεπτών και των συνδρομητών. Διαβάστε ολόκληρο το άρθρο
-
Η καταγγελία υποβλήθηκε από την Independent Publishers Alliance στις 30 Ιουνίου προς την Ευρωπαϊκή Επιτροπή, κατηγορώντας τη Google για κατάχρηση της κυρίαρχης θέσης της στην αγορά διαδικτυακής αναζήτησης. Τα AI Overviews της Google είναι περιλήψεις που δημιουργούνται από τεχνητή νοημοσύνη και εμφανίζονται πάνω από τους παραδοσιακούς υπερσυνδέσμους προς σχετικές ιστοσελίδες σε περισσότερες από 100 χώρες. Η εταιρεία ξεκίνησε να προσθέτει διαφημίσεις στα AI Overviews τον περασμένο Μάιο. Όπως αναφέρει το έγγραφο της καταγγελίας, "η βασική υπηρεσία μηχανής αναζήτησης της Google κάνει κατάχρηση του web περιεχομένου για τα AI Overviews της Google στην Αναζήτηση Google, τα οποία έχουν προκαλέσει και συνεχίζουν να προκαλούν σημαντική ζημιά στους ιδιοκτήτες ιστοσελίδων, συμπεριλαμβανομένων των ειδησεογραφικών εκδοτών, με τη μορφή απώλειας επισκεψιμότητας, αναγνωσιμότητας και εσόδων." Οι καταγγέλλοντες υποστηρίζουν ότι η Google τοποθετεί τα AI Overviews στην κορυφή της σελίδας αποτελεσμάτων της μηχανής αναζήτησης για να προβάλει τις δικές της περιλήψεις, οι οποίες δημιουργούνται χρησιμοποιώντας υλικό των εκδοτών, και ισχυρίζονται ότι αυτή η τοποθέτηση βάζει σε δεύτερη μοίρα το πρωτότυπο περιεχόμενο των εκδοτών. "Οι εκδότες που χρησιμοποιούν την Αναζήτηση της Google δεν έχουν την επιλογή να εξαιρεθούν από τη χρήση του υλικού τους για την εκπαίδευση του Gemini, του μοντέλου μεγάλης γλώσσας τεχνητής νοημοσύνης της Google ή/και από το να σαρώνονται για περιλήψεις, χωρίς να χάσουν τη δυνατότητα να εμφανίζονται στη σελίδα αποτελεσμάτων γενικής αναζήτησης της Google", αναφέρεται στην καταγγελία. Η Ευρωπαϊκή Επιτροπή αρνήθηκε να σχολιάσει, ενώ η βρετανική Αρχή Ανταγωνισμού και Αγορών επιβεβαίωσε την παραλαβή της καταγγελίας. Από την πλευρά της, η Google υποστήριξε ότι στέλνει δισεκατομμύρια κλικ σε ιστότοπους καθημερινά. "Οι νέες εμπειρίες τεχνητής νοημοσύνης στην Αναζήτηση επιτρέπουν στους ανθρώπους να θέτουν ακόμη περισσότερες ερωτήσεις, γεγονός που δημιουργεί νέες ευκαιρίες ανακάλυψης περιεχομένου και επιχειρήσεων", δήλωσε εκπρόσωπος της Google. Εκτός από την Independent Publishers Alliance, συνυπογράφοντες της καταγγελίας είναι το Movement for an Open Web, του οποίου τα μέλη περιλαμβάνουν ψηφιακούς διαφημιστές και εκδότες, καθώς και η βρετανική μη κερδοσκοπική Foxglove Legal Community Interest Company. Η συνδιευθύντρια της Foxglove, Rosa Curling, δήλωσε στο Reuters ότι οι δημοσιογράφοι και οι εκδότες αντιμετωπίζουν μια δεινή κατάσταση. "Η ανεξάρτητη ειδησεογραφία αντιμετωπίζει μια υπαρξιακή απειλή: τα AI Overviews της Google", είπε. "Γι' αυτό με αυτή την καταγγελία, η Foxglove και οι συνεργάτες μας προτρέπουμε την Ευρωπαϊκή Επιτροπή, μαζί με άλλους ρυθμιστικούς φορείς σε όλο τον κόσμο, να πάρουν θέση και να επιτρέψουν στην ανεξάρτητη δημοσιογραφία να εξαιρεθεί", πρόσθεσε η Curling. Οι τρεις ομάδες έχουν υποβάλει παρόμοια καταγγελία και αίτημα για προσωρινό μέτρο στη βρετανική αρχή ανταγωνισμού. Οι καταγγελίες ηχούν παρόμοια με μια αμερικανική αγωγή από μια εταιρεία εκπαιδευτικής τεχνολογίας, η οποία υποστήριξε ότι τα AI Overviews της Google διαβρώνουν τη ζήτηση για πρωτότυπο περιεχόμενο και υπονομεύουν την ικανότητα των εκδοτών να ανταγωνιστούν, με αποτέλεσμα τη μείωση των επισκεπτών και των συνδρομητών.
-
Τα συστήματα τεχνητής νοημοσύνης όπως το ChatGPT, Copilot, Claude και Gemini δεν είχαν σχεδόν καμία επίπτωση στους μισθούς ή στην αγορά εργασίας μέχρι στιγμής, σύμφωνα με πρόσφατη έρευνα. Το εύρημα αυτό θέτει υπό αμφισβήτηση τις τεράστιες κεφαλαιακές δαπάνες που απαιτούνται για τη δημιουργία και λειτουργία μοντέλων τεχνητής νοημοσύνης. Σε ερευνητική εργασία που δημοσιεύτηκε νωρίτερα αυτό το μήνα, οι οικονομολόγοι Anders Humlum και Emilie Vestergaard εξέτασαν τον αντίκτυπο των chatbots τεχνητής νοημοσύνης στην αγορά εργασίας για 11 επαγγέλματα, καλύπτοντας 25.000 εργαζόμενους και 7.000 χώρους εργασίας στη Δανία το 2023 και 2024. "Τα chatbots τεχνητής νοημοσύνης δεν είχαν σημαντικό αντίκτυπο στα εισοδήματα ή στις καταγεγραμμένες ώρες εργασίας σε κανένα επάγγελμα", αναφέρουν οι συγγραφείς στην εργασία τους. Παρά την εντυπωσιακά γρήγορη υιοθέτησή τους, τα οικονομικά αποτελέσματα δεν ήταν αξιοσημείωτα. Ο Humlum δήλωσε στο The Register: "Η υιοθέτηση αυτών των chatbots ήταν εντυπωσιακά γρήγορη. Οι περισσότεροι εργαζόμενοι στα εκτεθειμένα επαγγέλματα έχουν πλέον υιοθετήσει αυτά τα chatbots. Οι εργοδότες επίσης αλλάζουν στάση και τα ενθαρρύνουν ενεργά. Αλλά όταν εξετάζουμε τα οικονομικά αποτελέσματα, στην πραγματικότητα δεν έχουν επιφέρει αλλαγές." Ενώ οι επενδύσεις των εταιρειών στην τεχνητή νοημοσύνη ενίσχυσαν την υιοθέτηση εργαλείων ΤΝ – εξοικονομώντας χρόνο για το 64 έως 90 τοις εκατό των χρηστών – τα chatbots είχαν ανάμικτο αντίκτυπο στην ποιότητα και την ικανοποίηση από την εργασία. Σύμφωνα με τη μελέτη, οι χρήστες αναφέρουν μέση εξοικονόμηση χρόνου μόλις 2,8% των ωρών εργασίας από τη χρήση εργαλείων τεχνητής νοημοσύνης. Αυτό ισοδυναμεί με λίγο περισσότερο από μία ώρα ανά εργασιακή εβδομάδα 40 ωρών. Οι οικονομολόγοι διαπίστωσαν επίσης ότι "τα chatbots τεχνητής νοημοσύνης έχουν δημιουργήσει νέες εργασιακές υποχρεώσεις για το 8,4% των εργαζομένων, συμπεριλαμβανομένων ορισμένων που δεν χρησιμοποιούν οι ίδιοι τα εργαλεία". Με άλλα λόγια, η τεχνητή νοημοσύνη δημιουργεί νέα εργασία που ακυρώνει μέρος της πιθανής εξοικονόμησης χρόνου. "Ένα πολύ έντονο παράδειγμα που είναι κοντά σε μένα είναι ότι υπάρχουν πολλοί καθηγητές που τώρα λένε ότι περνούν χρόνο προσπαθώντας να εντοπίσουν αν οι μαθητές τους χρησιμοποιούν το ChatGPT για να κλέψουν στις εργασίες τους", εξήγησε ο Humlum. Επίσης παρατήρησε ότι πολλοί εργαζόμενοι αναφέρουν ότι τώρα περνούν χρόνο αξιολογώντας την ποιότητα των αποτελεσμάτων της τεχνητής νοημοσύνης ή γράφοντας προτροπές (prompts). Μόνο ένα μικρό μέρος των πιθανών κερδών παραγωγικότητας – μεταξύ 3 και 7% μεταφέρεται στους εργαζόμενους με τη μορφή υψηλότερων αποδοχών, σύμφωνα με τους ερευνητές. "Όσον αφορά τα οικονομικά αποτελέσματα, όταν εξετάζουμε συγκεκριμένες μετρήσεις - στα διοικητικά δεδομένα της αγοράς εργασίας για τα εισοδήματα, τους μισθούς - αυτά τα εργαλεία δεν έχουν κάνει πραγματική διαφορά μέχρι στιγμής", δήλωσε ο Humlum. "Οποιαδήποτε άποψη που υποστηρίζει ότι αυτά τα εργαλεία αλλάζουν τα πάντα, πρέπει να αντιμετωπίσει το γεγονός ότι τουλάχιστον δύο χρόνια μετά το λανσάρισμα των chatbots τεχνητής νοημοσύνης, δεν έχουν κάνει διαφορά στα οικονομικά αποτελέσματα." Διαβάστε ολόκληρο το άρθρο
- 58 απαντήσεις
-
- τεχνητή νοημοσύνη
- Gemini
-
(και 1 περισσότερα)
Ετικέτα με:
-
Η Google ανακοίνωσε ότι οι Ηχητικές Επισκοπήσεις (Audio Overviews) του NotebookLM είναι πλέον διαθέσιμες σε περισσότερες από 50 γλώσσες, συμπεριλαμβανομένης της ελληνικής. Μετά την επέκταση του NotebookLM σε περισσότερες από 200 χώρες πέρυσι, η Google προχωρά τώρα στο επόμενο βήμα, καθιστώντας τις Ηχητικές Επισκοπήσεις διαθέσιμες σε δεκάδες γλώσσες παγκοσμίως. Η αναβάθμιση αυτή επιτρέπει στους χρήστες να απολαμβάνουν τη λειτουργία στη γλώσσα της προτίμησής τους, από τα Αφρικανικά μέχρι τα Χίντι και τα Τουρκικά, συμπεριλαμβανομένων και των ελληνικών. Η τελευταία ενημέρωση προσθέτει επίσης μια νέα επιλογή "Γλώσσα Εξόδου" στις ρυθμίσεις του NotebookLM. Οι Ηχητικές Επισκοπήσεις δημιουργούνται πάντα στη γλώσσα που επιλέγει ο χρήστης, η οποία μπορεί να αλλάξει ανά πάσα στιγμή. Τόσο οι ηχητικές αναπαραγωγές όσο και οι απαντήσεις συνομιλίας προσαρμόζονται ανάλογα με την επιλεγμένη γλώσσα, διευκολύνοντας τη δημιουργία πολύγλωσσου περιεχομένου ή εκπαιδευτικού υλικού. Η Google παρουσιάζει ως παράδειγμα χρήσης έναν εκπαιδευτικό που προετοιμάζει μάθημα για το τροπικό δάσος του Αμαζονίου. Ο εκπαιδευτικός μπορεί να μοιραστεί υλικό σε διάφορες γλώσσες με τους μαθητές του, όπως ένα πορτογαλικό ντοκιμαντέρ, ένα ισπανικό ερευνητικό άρθρο και αγγλικές αναφορές μελέτης. Στη συνέχεια, οι μαθητές μπορούν να ανεβάσουν αυτά τα υλικά και να δημιουργήσουν μια Ηχητική Επισκόπηση με τα βασικά σημεία στη γλώσσα που επιθυμούν, καταργώντας έτσι τα γλωσσικά εμπόδια και καθιστώντας τις πληροφορίες πιο προσβάσιμες σε όλους. Η εταιρεία εκφράζει την ελπίδα ότι η προσθήκη περισσότερων γλωσσών στις Ηχητικές Επισκοπήσεις θα βοηθήσει τους χρήστες να ανακαλύψουν νέες γνώσεις και να κατανοήσουν καλύτερα τις πληροφορίες στη δική τους γλώσσα. Οι ενδιαφερόμενοι μπορούν να δοκιμάσουν τη λειτουργία άμεσα, επισκεπτόμενοι το notebook.google ενώ παρακάτω μπορείτε να ακούσετε μια δική μας δοκιμή podcast που βασίζεται στο συγκεκριμένο άρθρο. Κεντρικό θέμα ο κατάλληλος τρόπος για να δει κάποιος τις σειρές και τις ταινίες Star Wars με τη "σωστή σειρά" Optimal Star Wars Rewatch Orders.mp3 Διαβάστε ολόκληρο το άρθρο
- 9 απαντήσεις
-
- 1
-
-
Μετά την επέκταση του NotebookLM σε περισσότερες από 200 χώρες πέρυσι, η Google προχωρά τώρα στο επόμενο βήμα, καθιστώντας τις Ηχητικές Επισκοπήσεις διαθέσιμες σε δεκάδες γλώσσες παγκοσμίως. Η αναβάθμιση αυτή επιτρέπει στους χρήστες να απολαμβάνουν τη λειτουργία στη γλώσσα της προτίμησής τους, από τα Αφρικανικά μέχρι τα Χίντι και τα Τουρκικά, συμπεριλαμβανομένων και των ελληνικών. Η τελευταία ενημέρωση προσθέτει επίσης μια νέα επιλογή "Γλώσσα Εξόδου" στις ρυθμίσεις του NotebookLM. Οι Ηχητικές Επισκοπήσεις δημιουργούνται πάντα στη γλώσσα που επιλέγει ο χρήστης, η οποία μπορεί να αλλάξει ανά πάσα στιγμή. Τόσο οι ηχητικές αναπαραγωγές όσο και οι απαντήσεις συνομιλίας προσαρμόζονται ανάλογα με την επιλεγμένη γλώσσα, διευκολύνοντας τη δημιουργία πολύγλωσσου περιεχομένου ή εκπαιδευτικού υλικού. Η Google παρουσιάζει ως παράδειγμα χρήσης έναν εκπαιδευτικό που προετοιμάζει μάθημα για το τροπικό δάσος του Αμαζονίου. Ο εκπαιδευτικός μπορεί να μοιραστεί υλικό σε διάφορες γλώσσες με τους μαθητές του, όπως ένα πορτογαλικό ντοκιμαντέρ, ένα ισπανικό ερευνητικό άρθρο και αγγλικές αναφορές μελέτης. Στη συνέχεια, οι μαθητές μπορούν να ανεβάσουν αυτά τα υλικά και να δημιουργήσουν μια Ηχητική Επισκόπηση με τα βασικά σημεία στη γλώσσα που επιθυμούν, καταργώντας έτσι τα γλωσσικά εμπόδια και καθιστώντας τις πληροφορίες πιο προσβάσιμες σε όλους. Η εταιρεία εκφράζει την ελπίδα ότι η προσθήκη περισσότερων γλωσσών στις Ηχητικές Επισκοπήσεις θα βοηθήσει τους χρήστες να ανακαλύψουν νέες γνώσεις και να κατανοήσουν καλύτερα τις πληροφορίες στη δική τους γλώσσα. Οι ενδιαφερόμενοι μπορούν να δοκιμάσουν τη λειτουργία άμεσα, επισκεπτόμενοι το notebook.google ενώ παρακάτω μπορείτε να ακούσετε μια δική μας δοκιμή podcast που βασίζεται στο συγκεκριμένο άρθρο. Κεντρικό θέμα ο κατάλληλος τρόπος για να δει κάποιος τις σειρές και τις ταινίες Star Wars με τη "σωστή σειρά" Optimal Star Wars Rewatch Orders.mp3
-
Η τεχνητή νοημοσύνη δεν επηρέασε μισθούς και εργασία, αποκαλύπτει έρευνα
Crash24 δημοσίευσε ένα άρθρο στο Artificial Intelligence
Το εύρημα αυτό θέτει υπό αμφισβήτηση τις τεράστιες κεφαλαιακές δαπάνες που απαιτούνται για τη δημιουργία και λειτουργία μοντέλων τεχνητής νοημοσύνης. Σε ερευνητική εργασία που δημοσιεύτηκε νωρίτερα αυτό το μήνα, οι οικονομολόγοι Anders Humlum και Emilie Vestergaard εξέτασαν τον αντίκτυπο των chatbots τεχνητής νοημοσύνης στην αγορά εργασίας για 11 επαγγέλματα, καλύπτοντας 25.000 εργαζόμενους και 7.000 χώρους εργασίας στη Δανία το 2023 και 2024. "Τα chatbots τεχνητής νοημοσύνης δεν είχαν σημαντικό αντίκτυπο στα εισοδήματα ή στις καταγεγραμμένες ώρες εργασίας σε κανένα επάγγελμα", αναφέρουν οι συγγραφείς στην εργασία τους. Παρά την εντυπωσιακά γρήγορη υιοθέτησή τους, τα οικονομικά αποτελέσματα δεν ήταν αξιοσημείωτα. Ο Humlum δήλωσε στο The Register: "Η υιοθέτηση αυτών των chatbots ήταν εντυπωσιακά γρήγορη. Οι περισσότεροι εργαζόμενοι στα εκτεθειμένα επαγγέλματα έχουν πλέον υιοθετήσει αυτά τα chatbots. Οι εργοδότες επίσης αλλάζουν στάση και τα ενθαρρύνουν ενεργά. Αλλά όταν εξετάζουμε τα οικονομικά αποτελέσματα, στην πραγματικότητα δεν έχουν επιφέρει αλλαγές." Ενώ οι επενδύσεις των εταιρειών στην τεχνητή νοημοσύνη ενίσχυσαν την υιοθέτηση εργαλείων ΤΝ – εξοικονομώντας χρόνο για το 64 έως 90 τοις εκατό των χρηστών – τα chatbots είχαν ανάμικτο αντίκτυπο στην ποιότητα και την ικανοποίηση από την εργασία. Σύμφωνα με τη μελέτη, οι χρήστες αναφέρουν μέση εξοικονόμηση χρόνου μόλις 2,8% των ωρών εργασίας από τη χρήση εργαλείων τεχνητής νοημοσύνης. Αυτό ισοδυναμεί με λίγο περισσότερο από μία ώρα ανά εργασιακή εβδομάδα 40 ωρών. Οι οικονομολόγοι διαπίστωσαν επίσης ότι "τα chatbots τεχνητής νοημοσύνης έχουν δημιουργήσει νέες εργασιακές υποχρεώσεις για το 8,4% των εργαζομένων, συμπεριλαμβανομένων ορισμένων που δεν χρησιμοποιούν οι ίδιοι τα εργαλεία". Με άλλα λόγια, η τεχνητή νοημοσύνη δημιουργεί νέα εργασία που ακυρώνει μέρος της πιθανής εξοικονόμησης χρόνου. "Ένα πολύ έντονο παράδειγμα που είναι κοντά σε μένα είναι ότι υπάρχουν πολλοί καθηγητές που τώρα λένε ότι περνούν χρόνο προσπαθώντας να εντοπίσουν αν οι μαθητές τους χρησιμοποιούν το ChatGPT για να κλέψουν στις εργασίες τους", εξήγησε ο Humlum. Επίσης παρατήρησε ότι πολλοί εργαζόμενοι αναφέρουν ότι τώρα περνούν χρόνο αξιολογώντας την ποιότητα των αποτελεσμάτων της τεχνητής νοημοσύνης ή γράφοντας προτροπές (prompts). Μόνο ένα μικρό μέρος των πιθανών κερδών παραγωγικότητας – μεταξύ 3 και 7% μεταφέρεται στους εργαζόμενους με τη μορφή υψηλότερων αποδοχών, σύμφωνα με τους ερευνητές. "Όσον αφορά τα οικονομικά αποτελέσματα, όταν εξετάζουμε συγκεκριμένες μετρήσεις - στα διοικητικά δεδομένα της αγοράς εργασίας για τα εισοδήματα, τους μισθούς - αυτά τα εργαλεία δεν έχουν κάνει πραγματική διαφορά μέχρι στιγμής", δήλωσε ο Humlum. "Οποιαδήποτε άποψη που υποστηρίζει ότι αυτά τα εργαλεία αλλάζουν τα πάντα, πρέπει να αντιμετωπίσει το γεγονός ότι τουλάχιστον δύο χρόνια μετά το λανσάρισμα των chatbots τεχνητής νοημοσύνης, δεν έχουν κάνει διαφορά στα οικονομικά αποτελέσματα."- 58 σχόλια
-
- 3
-
-
- τεχνητή νοημοσύνη
- Gemini
-
(και 1 περισσότερα)
Ετικέτα με:
-
Η Google πληρώνει τεράστια ποσά στη Samsung κάθε μήνα για την προεγκατάσταση της εφαρμογής τεχνητής νοημοσύνης Gemini στα smartphones της, σύμφωνα με δημοσίευμα του Bloomberg. Η αποκάλυψη έγινε στο πλαίσιο υπάρχουσας αντιμονοπωλιακής υπόθεσης κατά της Google. Ο Peter Fitzgerald, αντιπρόεδρος πλατφορμών και συνεργασιών συσκευών της Google, κατέθεσε σε ομοσπονδιακό δικαστήριο ότι η εταιρεία ξεκίνησε να πληρώνει τη Samsung για αυτή την υπηρεσία τον Ιανουάριο όταν και το Gemini έγινε ο προκαθορισμένος φωνητικός βοηθός της σειράς Galaxy S25. Οι δύο εταιρείες έχουν συνάψει συμβόλαιο που θα διαρκέσει τουλάχιστον δύο χρόνια. Ο Fitzgerald δήλωσε στον δικαστή Amit Metha, ο οποίος επιβλέπει την υπόθεση, ότι η Google παρέχει στη Samsung τόσο σταθερές μηνιαίες πληρωμές όσο και ποσοστό των εσόδων που αποκομίζονται από διαφημιζόμενους μέσω της εφαρμογής Gemini. Τα ακριβή ποσά δεν έχουν γίνει γνωστά, αλλά ο δικηγόρος του Υπουργείου Δικαιοσύνης, David Dahlquist, τα χαρακτήρισε ως "τεράστιο χρηματικό ποσό σε σταθερή μηνιαία πληρωμή". Η αντιμονοπωλιακή υπόθεση ξεκίνησε με την κατηγορία ότι η Google καταχράστηκε παράνομα το μονοπώλιό της στη βιομηχανία των μηχανών αναζήτησης. Μέρος των μαρτυριών που σχετίζονταν με την υπόθεση αφορούσε πληρωμές της Google προς την Apple, τη Samsung και άλλες εταιρείες για να διασφαλίσει ότι θα είναι η προεπιλεγμένη μηχανή αναζήτησης στις συσκευές τους. Ο δικαστής Mehta συμφώνησε και έκρινε ότι αυτή η πρακτική αποτελεί παραβίαση της αντιμονοπωλιακής νομοθεσίας. Επί του παρόντος, ακούει επιπλέον μαρτυρίες για να αποφασίσει ποια μέτρα πρέπει να λάβει η Google για να διορθώσει την παράνομη συμπεριφορά, και από αυτή τη διαδικασία προέκυψε η αποκάλυψη για το Gemini. Μαρτυρίες από άλλη υπόθεση που εμπλέκει την Epic Games έδειξαν ότι η Google παρείχε $8 δισεκατομμύρια από το 2020 έως το 2023 για να διασφαλίσει ότι η Google Search, το Play Store και ο Google Assistant θα χρησιμοποιούνταν ως προεπιλογή στις κινητές συσκευές της Samsung. Ένας ομοσπονδιακός δικαστής στην Καλιφόρνια αργότερα αποφάσισε ότι η εταιρεία πρέπει να άρει τους περιορισμούς που εμποδίζουν ανταγωνιστικά καταστήματα εφαρμογών και συστήματα χρέωσης. Η Google βρίσκεται στη διαδικασία έφεσης κατά της απόφασης. Διαβάστε ολόκληρο το άρθρο
-
Η Google ετοιμάζεται να επεκτείνει το Gemini, το chatbot τεχνητής νοημοσύνης της, σε περισσότερες συσκευές αργότερα μέσα στο έτος, σύμφωνα με ανακοίνωση του CEO, Sundar Pichai. Η Google σχεδιάζει να επεκτείνει το chatbot Gemini της σε περισσότερες συσκευές αργότερα μέσα στο έτος, συμπεριλαμβανομένων tablets, αυτοκινήτων (Android Auto) και συσκευών που συνδέονται με κινητά τηλέφωνα, όπως ακουστικά και smartwatches. Η είδηση επιβεβαιώθηκε από τον CEO της Google, Sundar Pichai, κατά τη διάρκεια της ανακοίνωσης των οικονομικών αποτελεσμάτων της εταιρείας για το πρώτο τρίμηνο του 2025. "Αναβαθμίζουμε το Google Assistant στις κινητές συσκευές σε Gemini, και αργότερα μέσα στο έτος θα αναβαθμίσουμε tablets, αυτοκίνητα και συσκευές που συνδέονται με το τηλέφωνό σας, όπως ακουστικά και ρολόγια", δήλωσε ο Pichai κατά τη διάρκεια της ανακοίνωσης. Αν και ο CEO της Google δεν ανέφερε συγκεκριμένο χρονοδιάγραμμα για την επέκταση, είναι πιθανό να μάθουμε περισσότερες λεπτομέρειες στο επερχόμενο συνέδριο Google I/O που θα πραγματοποιηθεί τον επόμενο μήνα. Επιπλέον, σε ένα app teardown τον Αύγουστο του 2024, βρέθηκαν στοιχεία ότι το Gemini Live έρχεται στο Android Auto, και μάλιστα κατάφεραν να ενεργοποιήσουν τη λειτουργία τον προηγούμενο μήνα. Όλα αυτά υποδεικνύουν ότι η κυκλοφορία θα πραγματοποιηθεί σύντομα. Το Gemini της Google είναι ήδη διαθέσιμο σε πολλά Android smartphones και στο web, αλλά η εταιρεία εξακολουθεί να βασίζεται στο Google Assistant για smartwatches, Android Auto, έξυπνες οθόνες και άλλες συσκευές. Η επέκταση που ανακοινώθηκε σηματοδοτεί μια σημαντική αλλαγή στη στρατηγική της Google για την τεχνητή νοημοσύνη σε όλο το οικοσύστημα συσκευών της. Ωστόσο, είναι κατανοητή η πιθανή απογοήτευση των χρηστών που εξαρτώνται από το Google Assistant εδώ και χρόνια, ειδικά αν χρησιμοποιούν ρουτίνες και παρόμοιες εντολές που έλειπαν από το Gemini. Η μετάβαση μπορεί να απαιτήσει προσαρμογή για τους υφιστάμενους χρήστες που είναι εξοικειωμένοι με το παλαιότερο σύστημα. Με την επέκταση του Gemini σε περισσότερες συσκευές, η Google φαίνεται να προχωρά στην ενοποίηση της στρατηγικής της για την τεχνητή νοημοσύνη, αντικαθιστώντας σταδιακά το Google Assistant με την πιο προηγμένη τεχνολογία του Gemini σε όλο το οικοσύστημα των προϊόντων της. Διαβάστε ολόκληρο το άρθρο
-
Η Google σχεδιάζει να επεκτείνει το chatbot Gemini της σε περισσότερες συσκευές αργότερα μέσα στο έτος, συμπεριλαμβανομένων tablets, αυτοκινήτων (Android Auto) και συσκευών που συνδέονται με κινητά τηλέφωνα, όπως ακουστικά και smartwatches. Η είδηση επιβεβαιώθηκε από τον CEO της Google, Sundar Pichai, κατά τη διάρκεια της ανακοίνωσης των οικονομικών αποτελεσμάτων της εταιρείας για το πρώτο τρίμηνο του 2025. "Αναβαθμίζουμε το Google Assistant στις κινητές συσκευές σε Gemini, και αργότερα μέσα στο έτος θα αναβαθμίσουμε tablets, αυτοκίνητα και συσκευές που συνδέονται με το τηλέφωνό σας, όπως ακουστικά και ρολόγια", δήλωσε ο Pichai κατά τη διάρκεια της ανακοίνωσης. Αν και ο CEO της Google δεν ανέφερε συγκεκριμένο χρονοδιάγραμμα για την επέκταση, είναι πιθανό να μάθουμε περισσότερες λεπτομέρειες στο επερχόμενο συνέδριο Google I/O που θα πραγματοποιηθεί τον επόμενο μήνα. Επιπλέον, σε ένα app teardown τον Αύγουστο του 2024, βρέθηκαν στοιχεία ότι το Gemini Live έρχεται στο Android Auto, και μάλιστα κατάφεραν να ενεργοποιήσουν τη λειτουργία τον προηγούμενο μήνα. Όλα αυτά υποδεικνύουν ότι η κυκλοφορία θα πραγματοποιηθεί σύντομα. Το Gemini της Google είναι ήδη διαθέσιμο σε πολλά Android smartphones και στο web, αλλά η εταιρεία εξακολουθεί να βασίζεται στο Google Assistant για smartwatches, Android Auto, έξυπνες οθόνες και άλλες συσκευές. Η επέκταση που ανακοινώθηκε σηματοδοτεί μια σημαντική αλλαγή στη στρατηγική της Google για την τεχνητή νοημοσύνη σε όλο το οικοσύστημα συσκευών της. Ωστόσο, είναι κατανοητή η πιθανή απογοήτευση των χρηστών που εξαρτώνται από το Google Assistant εδώ και χρόνια, ειδικά αν χρησιμοποιούν ρουτίνες και παρόμοιες εντολές που έλειπαν από το Gemini. Η μετάβαση μπορεί να απαιτήσει προσαρμογή για τους υφιστάμενους χρήστες που είναι εξοικειωμένοι με το παλαιότερο σύστημα. Με την επέκταση του Gemini σε περισσότερες συσκευές, η Google φαίνεται να προχωρά στην ενοποίηση της στρατηγικής της για την τεχνητή νοημοσύνη, αντικαθιστώντας σταδιακά το Google Assistant με την πιο προηγμένη τεχνολογία του Gemini σε όλο το οικοσύστημα των προϊόντων της.
-
Η αποκάλυψη έγινε στο πλαίσιο υπάρχουσας αντιμονοπωλιακής υπόθεσης κατά της Google. Ο Peter Fitzgerald, αντιπρόεδρος πλατφορμών και συνεργασιών συσκευών της Google, κατέθεσε σε ομοσπονδιακό δικαστήριο ότι η εταιρεία ξεκίνησε να πληρώνει τη Samsung για αυτή την υπηρεσία τον Ιανουάριο όταν και το Gemini έγινε ο προκαθορισμένος φωνητικός βοηθός της σειράς Galaxy S25. Οι δύο εταιρείες έχουν συνάψει συμβόλαιο που θα διαρκέσει τουλάχιστον δύο χρόνια. Ο Fitzgerald δήλωσε στον δικαστή Amit Metha, ο οποίος επιβλέπει την υπόθεση, ότι η Google παρέχει στη Samsung τόσο σταθερές μηνιαίες πληρωμές όσο και ποσοστό των εσόδων που αποκομίζονται από διαφημιζόμενους μέσω της εφαρμογής Gemini. Τα ακριβή ποσά δεν έχουν γίνει γνωστά, αλλά ο δικηγόρος του Υπουργείου Δικαιοσύνης, David Dahlquist, τα χαρακτήρισε ως "τεράστιο χρηματικό ποσό σε σταθερή μηνιαία πληρωμή". Η αντιμονοπωλιακή υπόθεση ξεκίνησε με την κατηγορία ότι η Google καταχράστηκε παράνομα το μονοπώλιό της στη βιομηχανία των μηχανών αναζήτησης. Μέρος των μαρτυριών που σχετίζονταν με την υπόθεση αφορούσε πληρωμές της Google προς την Apple, τη Samsung και άλλες εταιρείες για να διασφαλίσει ότι θα είναι η προεπιλεγμένη μηχανή αναζήτησης στις συσκευές τους. Ο δικαστής Mehta συμφώνησε και έκρινε ότι αυτή η πρακτική αποτελεί παραβίαση της αντιμονοπωλιακής νομοθεσίας. Επί του παρόντος, ακούει επιπλέον μαρτυρίες για να αποφασίσει ποια μέτρα πρέπει να λάβει η Google για να διορθώσει την παράνομη συμπεριφορά, και από αυτή τη διαδικασία προέκυψε η αποκάλυψη για το Gemini. Μαρτυρίες από άλλη υπόθεση που εμπλέκει την Epic Games έδειξαν ότι η Google παρείχε $8 δισεκατομμύρια από το 2020 έως το 2023 για να διασφαλίσει ότι η Google Search, το Play Store και ο Google Assistant θα χρησιμοποιούνταν ως προεπιλογή στις κινητές συσκευές της Samsung. Ένας ομοσπονδιακός δικαστής στην Καλιφόρνια αργότερα αποφάσισε ότι η εταιρεία πρέπει να άρει τους περιορισμούς που εμποδίζουν ανταγωνιστικά καταστήματα εφαρμογών και συστήματα χρέωσης. Η Google βρίσκεται στη διαδικασία έφεσης κατά της απόφασης.
-
Η ερευνητική ομάδα της Yandex, σε συνεργασία με ερευνητές από το MIT, το ISTA και το KAUST, ανέπτυξε μια μέθοδο ταχείας συμπίεσης μεγάλων γλωσσικών μοντέλων χωρίς σημαντική απώλεια Η ερευνητική ομάδα της Yandex, σε συνεργασία με ερευνητές από το Τεχνολογικό Ινστιτούτο της Μασαχουσέτης (MIT), το Αυστριακό Ινστιτούτο Επιστήμης και Τεχνολογίας (ISTA) και το Πανεπιστήμιο Επιστήμης και Τεχνολογίας King Abdullah (KAUST), ανέπτυξε μια μέθοδο ταχείας συμπίεσης μεγάλων γλωσσικών μοντέλων (LLMs) χωρίς σημαντική απώλεια ποιότητας. Η νέα μέθοδος, με την ονομασία HIGGS (Hadamard Incoherence with Gaussian MSE-optimal GridS), επιτρέπει τη συμπίεση (ποσοτικοποίηση) των LLMs σε λίγα μόλις λεπτά απευθείας σε smartphones ή φορητούς υπολογιστές, χωρίς την ανάγκη για βιομηχανικού επιπέδου υπολογιστική ισχύ ή ισχυρές GPU. Προηγουμένως, η ανάπτυξη μεγάλων γλωσσικών μοντέλων σε φορητές συσκευές απαιτούσε διαδικασία ποσοτικοποίησης που διαρκούσε από ώρες έως εβδομάδες και έπρεπε να εκτελεστεί σε βιομηχανικούς servers για να διατηρηθεί η καλή ποιότητα. Η HIGGS μειώνει τα εμπόδια για τη δοκιμή και την ανάπτυξη νέων μοντέλων σε συσκευές καταναλωτικού επιπέδου, όπως οικιακούς υπολογιστές και smartphones, καταργώντας την ανάγκη για βιομηχανική υπολογιστική ισχύ. Σύμφωνα με την ανακοίνωση, η καινοτόμος μέθοδος συμπίεσης προωθεί τη δέσμευση της εταιρείας να καταστήσει τα μεγάλα γλωσσικά μοντέλα προσιτά σε όλους, από μεγάλους παίκτες, μικρομεσαίες επιχειρήσεις και μη κερδοσκοπικούς οργανισμούς έως μεμονωμένους συνεισφέροντες, προγραμματιστές και ερευνητές. Πέρυσι, οι ερευνητές της Yandex συνεργάστηκαν με σημαντικά πανεπιστήμια επιστήμης και τεχνολογίας για να παρουσιάσουν δύο νέες μεθόδους συμπίεσης LLM: την Additive Quantization of Large Language Models (AQLM) και την PV-Tuning. Συνδυαστικά, αυτές οι μέθοδοι μπορούν να μειώσουν το μέγεθος του μοντέλου έως και 8 φορές διατηρώντας το 95% της ποιότητας απόκρισης. Η μέθοδος HIGGS επιτρέπει στους προγραμματιστές να μειώσουν το μέγεθος του μοντέλου χωρίς να θυσιάσουν την ποιότητα και να τα εκτελέσουν σε πιο οικονομικές συσκευές. Για παράδειγμα, αυτή η μέθοδος μπορεί να χρησιμοποιηθεί για τη συμπίεση LLMs όπως το DeepSeek R1 με 671B παραμέτρους και το Llama 4 Maverick με 400B παραμέτρους, τα οποία προηγουμένως μπορούσαν να ποσοτικοποιηθούν μόνο με σημαντική απώλεια ποιότητας. Η Yandex χρησιμοποιεί ήδη το HIGGS για την ανάπτυξη πρωτοτύπων και την επιτάχυνση της ανάπτυξης προϊόντων καθώς τα συμπιεσμένα μοντέλα επιτρέπουν ταχύτερες δοκιμές από τα πλήρους κλίμακας αντίστοιχά τους. Όπως αναφέρεται, η HIGGS συμπιέζει μεγάλα γλωσσικά μοντέλα χωρίς να απαιτεί πρόσθετα δεδομένα ή μεθόδους κλίσης, καθιστώντας την ποσοτικοποίηση πιο προσιτή και αποτελεσματική για ένα ευρύ φάσμα εφαρμογών και συσκευών. Η μέθοδος δοκιμάστηκε στα μοντέλα της οικογένειας LLaMA 3.1 και 3.2, καθώς και στα μοντέλα της οικογένειας Qwen. Τα πειράματα δείχνουν ότι η HIGGS ξεπερνά άλλες μεθόδους ποσοτικοποίησης χωρίς δεδομένα, συμπεριλαμβανομένων των NF4 και HQQ, όσον αφορά τον λόγο ποιότητας-μεγέθους. Οι προγραμματιστές και οι ερευνητές μπορούν ήδη να έχουν πρόσβαση στη μέθοδο στο Hugging Face ή να εξερευνήσουν την ερευνητική εργασία, η οποία είναι διαθέσιμη στο arXiv. Στο τέλος αυτού του μήνα, η ομάδα θα παρουσιάσει την εργασία τους στο NAACL, ένα από τα κορυφαία συνέδρια AI στον κόσμο. Πέρα από την ποσοτικοποίηση LLM, η Yandex έχει διαθέσει με ανοιχτό κώδικα διάφορα εργαλεία που βελτιστοποιούν τους πόρους που χρησιμοποιούνται στην εκπαίδευση LLM. Για παράδειγμα, η βιβλιοθήκη YaFSDP επιταχύνει την εκπαίδευση LLM έως και 25% και μειώνει τους πόρους GPU για εκπαίδευση έως και 20%. Νωρίτερα φέτος, οι προγραμματιστές της Yandex διέθεσαν ως λογισμικού ανοιχτού κώδικα το Perforator, ένα εργαλείο για συνεχή παρακολούθηση και ανάλυση serivers και εφαρμογών σε πραγματικό χρόνο, το οποίο βοηθά τις εταιρείες να μειώσουν το κόστος υποδομής έως και 20%. Διαβάστε ολόκληρο το άρθρο
-
Η ερευνητική ομάδα της Yandex, σε συνεργασία με ερευνητές από το Τεχνολογικό Ινστιτούτο της Μασαχουσέτης (MIT), το Αυστριακό Ινστιτούτο Επιστήμης και Τεχνολογίας (ISTA) και το Πανεπιστήμιο Επιστήμης και Τεχνολογίας King Abdullah (KAUST), ανέπτυξε μια μέθοδο ταχείας συμπίεσης μεγάλων γλωσσικών μοντέλων (LLMs) χωρίς σημαντική απώλεια ποιότητας. Η νέα μέθοδος, με την ονομασία HIGGS (Hadamard Incoherence with Gaussian MSE-optimal GridS), επιτρέπει τη συμπίεση (ποσοτικοποίηση) των LLMs σε λίγα μόλις λεπτά απευθείας σε smartphones ή φορητούς υπολογιστές, χωρίς την ανάγκη για βιομηχανικού επιπέδου υπολογιστική ισχύ ή ισχυρές GPU. Προηγουμένως, η ανάπτυξη μεγάλων γλωσσικών μοντέλων σε φορητές συσκευές απαιτούσε διαδικασία ποσοτικοποίησης που διαρκούσε από ώρες έως εβδομάδες και έπρεπε να εκτελεστεί σε βιομηχανικούς servers για να διατηρηθεί η καλή ποιότητα. Η HIGGS μειώνει τα εμπόδια για τη δοκιμή και την ανάπτυξη νέων μοντέλων σε συσκευές καταναλωτικού επιπέδου, όπως οικιακούς υπολογιστές και smartphones, καταργώντας την ανάγκη για βιομηχανική υπολογιστική ισχύ. Σύμφωνα με την ανακοίνωση, η καινοτόμος μέθοδος συμπίεσης προωθεί τη δέσμευση της εταιρείας να καταστήσει τα μεγάλα γλωσσικά μοντέλα προσιτά σε όλους, από μεγάλους παίκτες, μικρομεσαίες επιχειρήσεις και μη κερδοσκοπικούς οργανισμούς έως μεμονωμένους συνεισφέροντες, προγραμματιστές και ερευνητές. Πέρυσι, οι ερευνητές της Yandex συνεργάστηκαν με σημαντικά πανεπιστήμια επιστήμης και τεχνολογίας για να παρουσιάσουν δύο νέες μεθόδους συμπίεσης LLM: την Additive Quantization of Large Language Models (AQLM) και την PV-Tuning. Συνδυαστικά, αυτές οι μέθοδοι μπορούν να μειώσουν το μέγεθος του μοντέλου έως και 8 φορές διατηρώντας το 95% της ποιότητας απόκρισης. Η μέθοδος HIGGS επιτρέπει στους προγραμματιστές να μειώσουν το μέγεθος του μοντέλου χωρίς να θυσιάσουν την ποιότητα και να τα εκτελέσουν σε πιο οικονομικές συσκευές. Για παράδειγμα, αυτή η μέθοδος μπορεί να χρησιμοποιηθεί για τη συμπίεση LLMs όπως το DeepSeek R1 με 671B παραμέτρους και το Llama 4 Maverick με 400B παραμέτρους, τα οποία προηγουμένως μπορούσαν να ποσοτικοποιηθούν μόνο με σημαντική απώλεια ποιότητας. Η Yandex χρησιμοποιεί ήδη το HIGGS για την ανάπτυξη πρωτοτύπων και την επιτάχυνση της ανάπτυξης προϊόντων καθώς τα συμπιεσμένα μοντέλα επιτρέπουν ταχύτερες δοκιμές από τα πλήρους κλίμακας αντίστοιχά τους. Όπως αναφέρεται, η HIGGS συμπιέζει μεγάλα γλωσσικά μοντέλα χωρίς να απαιτεί πρόσθετα δεδομένα ή μεθόδους κλίσης, καθιστώντας την ποσοτικοποίηση πιο προσιτή και αποτελεσματική για ένα ευρύ φάσμα εφαρμογών και συσκευών. Η μέθοδος δοκιμάστηκε στα μοντέλα της οικογένειας LLaMA 3.1 και 3.2, καθώς και στα μοντέλα της οικογένειας Qwen. Τα πειράματα δείχνουν ότι η HIGGS ξεπερνά άλλες μεθόδους ποσοτικοποίησης χωρίς δεδομένα, συμπεριλαμβανομένων των NF4 και HQQ, όσον αφορά τον λόγο ποιότητας-μεγέθους. Οι προγραμματιστές και οι ερευνητές μπορούν ήδη να έχουν πρόσβαση στη μέθοδο στο Hugging Face ή να εξερευνήσουν την ερευνητική εργασία, η οποία είναι διαθέσιμη στο arXiv. Στο τέλος αυτού του μήνα, η ομάδα θα παρουσιάσει την εργασία τους στο NAACL, ένα από τα κορυφαία συνέδρια AI στον κόσμο. Πέρα από την ποσοτικοποίηση LLM, η Yandex έχει διαθέσει με ανοιχτό κώδικα διάφορα εργαλεία που βελτιστοποιούν τους πόρους που χρησιμοποιούνται στην εκπαίδευση LLM. Για παράδειγμα, η βιβλιοθήκη YaFSDP επιταχύνει την εκπαίδευση LLM έως και 25% και μειώνει τους πόρους GPU για εκπαίδευση έως και 20%. Νωρίτερα φέτος, οι προγραμματιστές της Yandex διέθεσαν ως λογισμικού ανοιχτού κώδικα το Perforator, ένα εργαλείο για συνεχή παρακολούθηση και ανάλυση serivers και εφαρμογών σε πραγματικό χρόνο, το οποίο βοηθά τις εταιρείες να μειώσουν το κόστος υποδομής έως και 20%.
-
Η Google επιτρέπει στους συνδρομητές του Gemini Advanced να δοκιμάσουν το Veo 2, το μοντέλο τεχνητής νοημοσύνης μετατροπής κειμένου σε βίντεο που μπορεί να δημιουργήσει βίντεο υψηλής ανάλυσης. Από σήμερα, οι συνδρομητές μπορούν να επιλέξουν το Veo 2 από το αναπτυσσόμενο μενού μοντέλων Gemini στο διαδίκτυο και σε κινητές συσκευές, όπου μπορούν να εισάγουν μια περιγραφή για να δημιουργήσουν ένα βίντεο οκτώ δευτερολέπτων σε ανάλυση 720p. Υπάρχει όριο στον αριθμό των βίντεο που μπορούν να δημιουργήσουν οι συνδρομητές κάθε μήνα, και η Google αναφέρει ότι θα ειδοποιεί τους χρήστες όταν πλησιάζουν αυτό το όριο. Το Veo 2 παράγει βίντεο σε μορφή MP4, αλλά οι χρήστες σε κινητές συσκευές έχουν επίσης τη δυνατότητα να τα μεταφορτώσουν απευθείας στο TikTok και το YouTube με το κουμπί "κοινοποίηση". Σύμφωνα με την Google, το αναβαθμισμένο μοντέλο τεχνητής νοημοσύνης έχει "καλύτερη κατανόηση της φυσικής του πραγματικού κόσμου και της ανθρώπινης κίνησης", επιτρέποντάς του να προσφέρει "ρευστή κίνηση χαρακτήρων, ρεαλιστικές σκηνές και λεπτομερέστερα οπτικά στοιχεία σε διάφορα θέματα και στυλ". Τα βίντεο που δημιουργούνται με το Veo 2 περιλαμβάνουν ψηφιακά υδατογραφήματα SynthID, υποδεικνύοντας ότι έχουν δημιουργηθεί με τεχνητή νοημοσύνη. Gemini_Generated_Video__37_aDEwjss.mp4 Prompt: A wide, slow-panning shot of an enormous glacial cavern, bathed in eerie twilight. Pale cyan light filters from above, illuminating frozen candy figures within the ice walls. Two figures in white exosuits, their helmet lights casting beams, trudge through the center. Capture the cavern's scale and stillness. Mouse_Reads_Video_Generated.mp4 Prompt: An animated shot of a tiny mouse with oversized glasses, reading a book by the light of a glowing mushroom in a cozy forest den. Μαζί με το Veo 2, η Google διαθέτει το Whisk Animate — ένα εργαλείο που σας επιτρέπει να μετατρέψετε μια εικόνα σε βίντεο οκτώ δευτερολέπτων με το Veo 2 — στους συνδρομητές του Google One AI Premium. Αυτό βασίζεται στο υπάρχον εργαλείο Whisk της Google, το οποίο επιτρέπει τη δημιουργία συνδυασμών εικόνων με τεχνητή νοημοσύνη. Το Whisk Animate είναι διαθέσιμο στους συνδρομητές παγκοσμίως μέσω του Google Labs. Για να κατανοήσουμε καλύτερα τις δυνατότητες του Veo 2, η Google παρουσίασε παραδείγματα βίντεο που δημιουργήθηκαν με το εργαλείο. Ένα από αυτά δημιουργήθηκε με την περιγραφή: "μια λήψη χαμηλής γωνίας ενός καλομαθημένου γαλλικού μπουλντόγκ που φοράει γυαλιά ηλίου, ξαπλώνει σε ένα πολυτελές ανάκλιντρο δίπλα σε μια αστραφτερή γαλαζοπράσινη πισίνα σε ένα πολυτελές θέρετρο, με φοίνικες να κουνιούνται απαλά στο φόντο, αποτυπωμένο σε μια φωτεινή, ηλιόλουστη μέρα." Ένα άλλο παράδειγμα απεικονίζει "ένα κινούμενο πλάνο ενός μικροσκοπικού ποντικού με υπερμεγέθη γυαλιά, που διαβάζει ένα βιβλίο στο φως ενός λαμπερού μανιταριού σε ένα άνετο δασικό καταφύγιο." Αξίζει να σημειωθεί ότι η Google πρωτολάνσαρε το Veo 2 σε πρώιμη πρόσβαση τον Δεκέμβριο, με το εργαλείο να κοστίζει 50 σεντς ανά δευτερόλεπτο βίντεο στην πλατφόρμα Vertex AI της εταιρείας. Έκτοτε, το YouTube έχει προσθέσει το Veo 2 στο πειραματικό χαρακτηριστικό Dream Screen, το οποίο επιτρέπει στους χρήστες να δημιουργούν βιντεοκλίπ με τεχνητή νοημοσύνη για τα Shorts. Διαβάστε ολόκληρο το άρθρο