Το νέο AI μοντέλο Imagen 3 της Google για δημιουργία εικόνων, διαθέσιμο για όλους τους χρήστες

Crash24 · 10 Οκτωβρίου 2024

Η Google διέθεσε παγκοσμίως το μοντέλο δημιουργίας εικόνων Imagen 3 σε όλους τους χρήστες του Gemini, υλοποιώντας την υπόσχεση που είχε δώσει τον Αύγουστο.

Το Imagen 3, η τρίτη γενιά του μοντέλου που παρουσιάστηκε αρχικά τον Μάιο, προσφέρει σημαντικές βελτιώσεις στην ποιότητα των παραγόμενων εικόνων, με τον χρήστη να χρειάζεται απλά να περιγράψει την εικόνα που θέλει με κείμενο.

Οι χρήστες του Gemini μπορούν πλέον να δημιουργούν εικόνες με πιο έντονες λεπτομέρειες, ζωηρότερα χρώματα και λιγότερες ατέλειες σε σύγκριση με τις προηγούμενες εκδόσεις, φτάνει να συνδεθούν στο gemini.google.com. Μία από τις πιο αξιοσημείωτες βελτιώσεις του Imagen 3 είναι η ικανότητά του να αποδίδει κείμενο με μεγαλύτερη ακρίβεια, ξεπερνώντας έτσι ένα σημαντικό εμπόδιο που αντιμετώπιζαν άλλα μοντέλα μετατροπής κειμένου σε εικόνα, όπως το DALL-E και το Adobe Firefly.

Η Google προωθεί αυτή τη δυνατότητα ως ένα εργαλείο για τη δημιουργία εξατομικευμένων εικόνων που περιέχουν κείμενο, κατάλληλο για ευχετήριες κάρτες ή φωτογραφίες με ειδικά μηνύματα. Για να χρησιμοποιήσουν το Imagen 3, οι χρήστες μπορούν απλά να ανοίξουν το Gemini στο κινητό ή τον υπολογιστή τους και να ξεκινήσουν τις εντολές τους με λέξεις όπως "draw", "generate" ή "create", ακολουθούμενες από το επιθυμητό στυλ. Όσο περισσότερες λεπτομέρειες περιλαμβάνει η εντολή, τόσο καλύτερα το μοντέλο μπορεί να κατανοήσει και να υλοποιήσει το όραμα του χρήστη.

Ωστόσο, υπάρχουν ορισμένοι περιορισμοί για τους δωρεάν χρήστες. Η δημιουργία εικόνων που περιέχουν ανθρώπους δεν είναι διαθέσιμη στην δωρεάν έκδοση. Για να αποκτήσουν πρόσβαση σε αυτή τη λειτουργία, οι χρήστες πρέπει να εγγραφούν στο Gemini Advanced, την επί πληρωμή υπηρεσία. Το Gemini Advanced προσφέρει επιπλέον πλεονεκτήματα, όπως:

Πρόσβαση στο προηγμένο μοντέλο 1.5 Pro της Google
Δυνατότητα επεξεργασίας κειμένων έως 1.500 σελίδων
Προτεραιότητα πρόσβασης στις νεότερες λειτουργίες
Εκτέλεση και επεξεργασία κώδικα Python απευθείας στο Gemini Advanced
2 TB αποθηκευτικού χώρου μέσω του Google One
Ενσωμάτωση του Gemini σε υπηρεσίες όπως το Gmail και το Docs (διαθέσιμο σε επιλεγμένες γλώσσες)

Παρά τις εντυπωσιακές δυνατότητες του Imagen 3, εγείρονται ανησυχίες σχετικά με την ανάγκη για σαφέστερη επισήμανση του περιεχομένου που δημιουργείται από τεχνητή νοημοσύνη. Η ραγδαία εξέλιξη των τεχνολογιών δημιουργίας εικόνων καθιστά επιτακτική την ανάγκη για ρυθμιστικό πλαίσιο που θα αποτρέπει τη διάδοση παραπληροφόρησης.

Σε αυτό το πλαίσιο, η Ευρωπαϊκή Ένωση έχει ήδη κάνει βήματα προς αυτή την κατεύθυνση με τη δημιουργία του EU AI Pact. Πρόκειται για μια εθελοντική συμφωνία μεταξύ εταιρειών τεχνολογίας και της ΕΕ, που στοχεύει στην προώθηση της υπεύθυνης και ηθικής ανάπτυξης της τεχνητής νοημοσύνης. Ωστόσο, η αποτελεσματικότητα αυτής της πρωτοβουλίας παραμένει υπό αμφισβήτηση και θα κριθεί στην πράξη.

Η Google έχει δηλώσει ότι σχεδιάζει να ενσωματώσει το Imagen 3 σε περισσότερες υπηρεσίες της στο εγγύς μέλλον, επεκτείνοντας τις δυνατότητες δημιουργίας εικόνων σε ένα ευρύτερο φάσμα εφαρμογών.

Διαβάστε ολόκληρο το άρθρο

kirileman · 10 Οκτωβρίου 2024

Τίμιο.

Spoiler

Retromaniac · 10 Οκτωβρίου 2024

2 λεπτά πριν, kirileman είπε

Τίμιο.

Απόκρυψη περιεχομένων

Tι prompt έδωσες;

NiKoSmile · 10 Οκτωβρίου 2024

Μείον 4 αστέρια επειδή δεν δημιουργεί εικόνες με ανθρώπους στη δωρεάν έκδοση. Θα πάρει όμως 1 αστέρι γιατί ζωγραφίζει robots! 😅

Επεξ/σία 10 Οκτωβρίου 2024 από NiKoSmile

Retromaniac · 10 Οκτωβρίου 2024

Πάντως ακόμη με το text δεν τα πάει καλά.

Spoiler

MikeKata · 10 Οκτωβρίου 2024

Καλή δουλειά με την αποφυγή artifacts

panther_512 · 10 Οκτωβρίου 2024

Έτσι λίγο που το δοκίμασα, φαίνεται ανώτερο του DallE της πληρωμένης έκδοσης του Chatgpt.

ScorpioX777 · 10 Οκτωβρίου 2024

Ναμαι και εγω τσαρκα στα βραχια.😄

Κανει δουλεια...

kirileman · 10 Οκτωβρίου 2024

2 hours ago, Retromaniac said:

Tι prompt έδωσες;

Της πλάκας prompt έδωσα.

Ζάκυνθος, παραλία απόμερη, γκρεμός, ηλιοβασίλεμα. Μικρή παραλία, δυτικού προσανατολισμού, όχι το ναυάγιο, με μια παλιά, ξύλινη βάρκα αραγμένη στην άμμο. Στο βάθος ο ήλιος που δύει. Η θάλασσα ήρεμη. Μερικά αρμυρίκια στα βράχια.
... και μου δίνει αυτό:

Spoiler

Μετά γράφω:

Πρόσθεσε μερικά ακόμα βράχια στην άκρη της παραλίας και η βάρκα να είναι κατεστραμμένη. Επίσης, η ώρα της φωτογραφίας να είναι σούρουπο, πιο σκοτεινή.

... και έδωσε την πρώτη εικόνα.

Στις παραλίες τα πάει καλά. Στα δάση όχι τόσο. Άλλα του έλεγα, άλλα έκανε. Και εδώ του έλεγα μετά να μου κάνει την άμμο λευκή, αλλά δεν άκουγε.

Επεξ/σία 10 Οκτωβρίου 2024 από kirileman

NiKoSmile · 10 Οκτωβρίου 2024

To ChatGPT έχει όριο... αλλά είναι πολύ μπροστά στην αναγνώριση εικόνων .

Επεξ/σία 10 Οκτωβρίου 2024 από NiKoSmile

Pankobios · 10 Οκτωβρίου 2024

4 ώρες πριν, kirileman είπε

Τίμιο.

Απόκρυψη περιεχομένων

Με το ίδιο prompt, στα Αγγλικά βέβαια, στο Comfyui->Flux 1d.

Βάλτε και τα άλλα prompt από τις φωτογραφίες για να κάνουμε συγκρίσεις.

mindreader · 10 Οκτωβρίου 2024

5 hours ago, kirileman said:

Τίμιο.

Hide contents

Πως σου εβγαλε εικονα σε τοσο μεγαλες διαστασεις; Του ζητησα μια και ειναι πολυ μικροτερη αυτη που εβγαλε.

---

Εντυπωσιακο παντως. Του λες τι θες να σου φτιαξει και το κανει.

kirileman · 10 Οκτωβρίου 2024

9 minutes ago, mindreader said:

Πως σου εβγαλε εικονα σε τοσο μεγαλες διαστασεις; Του ζητησα μια και ειναι πολυ μικροτερη αυτη που εβγαλε.

---

Εντυπωσιακο παντως. Του λες τι θες να σου φτιαξει και το κανει.

Περίμενε που σε λίγο θα γίνει mainstream το text to video. Η ίδια εικόνα, αλλά σε βίντεο.

Bourdoulas · 10 Οκτωβρίου 2024

Μια έτσι , μια γιουβέτσι. Όταν έκανα διορθώσεις ναι μεν έφτιαχνε κάτι, αλλά χαλούσε κάτι άλλο. Βαρέθηκα να πω την αλήθεια.

Rockavlon · 11 Οκτωβρίου 2024

Σύνδεση

Το νέο AI μοντέλο Imagen 3 της Google για δημιουργία εικόνων, διαθέσιμο για όλους τους χρήστες

Προτεινόμενες αναρτήσεις

Crash24

kirileman

Retromaniac

NiKoSmile

Retromaniac

MikeKata

panther_512

ScorpioX777

kirileman

NiKoSmile

Pankobios

mindreader

kirileman

Bourdoulas

Rockavlon

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Δημιουργία λογαριασμού

Σύνδεση

Σύνδεση