Προς το περιεχόμενο

Προτεινόμενες αναρτήσεις

Δημοσ.

Η Google διέθεσε παγκοσμίως το μοντέλο δημιουργίας εικόνων Imagen 3 σε όλους τους χρήστες του Gemini, υλοποιώντας την υπόσχεση που είχε δώσει τον Αύγουστο.

Το Imagen 3, η τρίτη γενιά του μοντέλου που παρουσιάστηκε αρχικά τον Μάιο, προσφέρει σημαντικές βελτιώσεις στην ποιότητα των παραγόμενων εικόνων, με τον χρήστη να χρειάζεται απλά να περιγράψει την εικόνα που θέλει με κείμενο.

Οι χρήστες του Gemini μπορούν πλέον να δημιουργούν εικόνες με πιο έντονες λεπτομέρειες, ζωηρότερα χρώματα και λιγότερες ατέλειες σε σύγκριση με τις προηγούμενες εκδόσεις, φτάνει να συνδεθούν στο gemini.google.com. Μία από τις πιο αξιοσημείωτες βελτιώσεις του Imagen 3 είναι η ικανότητά του να αποδίδει κείμενο με μεγαλύτερη ακρίβεια, ξεπερνώντας έτσι ένα σημαντικό εμπόδιο που αντιμετώπιζαν άλλα μοντέλα μετατροπής κειμένου σε εικόνα, όπως το DALL-E και το Adobe Firefly.

Η Google προωθεί αυτή τη δυνατότητα ως ένα εργαλείο για τη δημιουργία εξατομικευμένων εικόνων που περιέχουν κείμενο, κατάλληλο για ευχετήριες κάρτες ή φωτογραφίες με ειδικά μηνύματα. Για να χρησιμοποιήσουν το Imagen 3, οι χρήστες μπορούν απλά να ανοίξουν το Gemini στο κινητό ή τον υπολογιστή τους και να ξεκινήσουν τις εντολές τους με λέξεις όπως "draw", "generate" ή "create", ακολουθούμενες από το επιθυμητό στυλ. Όσο περισσότερες λεπτομέρειες περιλαμβάνει η εντολή, τόσο καλύτερα το μοντέλο μπορεί να κατανοήσει και να υλοποιήσει το όραμα του χρήστη.

Ωστόσο, υπάρχουν ορισμένοι περιορισμοί για τους δωρεάν χρήστες. Η δημιουργία εικόνων που περιέχουν ανθρώπους δεν είναι διαθέσιμη στην δωρεάν έκδοση. Για να αποκτήσουν πρόσβαση σε αυτή τη λειτουργία, οι χρήστες πρέπει να εγγραφούν στο Gemini Advanced, την επί πληρωμή υπηρεσία. Το Gemini Advanced προσφέρει επιπλέον πλεονεκτήματα, όπως:

  • Πρόσβαση στο προηγμένο μοντέλο 1.5 Pro της Google
  • Δυνατότητα επεξεργασίας κειμένων έως 1.500 σελίδων
  • Προτεραιότητα πρόσβασης στις νεότερες λειτουργίες
  • Εκτέλεση και επεξεργασία κώδικα Python απευθείας στο Gemini Advanced
  • 2 TB αποθηκευτικού χώρου μέσω του Google One
  • Ενσωμάτωση του Gemini σε υπηρεσίες όπως το Gmail και το Docs (διαθέσιμο σε επιλεγμένες γλώσσες)

Παρά τις εντυπωσιακές δυνατότητες του Imagen 3, εγείρονται ανησυχίες σχετικά με την ανάγκη για σαφέστερη επισήμανση του περιεχομένου που δημιουργείται από τεχνητή νοημοσύνη. Η ραγδαία εξέλιξη των τεχνολογιών δημιουργίας εικόνων καθιστά επιτακτική την ανάγκη για ρυθμιστικό πλαίσιο που θα αποτρέπει τη διάδοση παραπληροφόρησης.

Σε αυτό το πλαίσιο, η Ευρωπαϊκή Ένωση έχει ήδη κάνει βήματα προς αυτή την κατεύθυνση με τη δημιουργία του EU AI Pact. Πρόκειται για μια εθελοντική συμφωνία μεταξύ εταιρειών τεχνολογίας και της ΕΕ, που στοχεύει στην προώθηση της υπεύθυνης και ηθικής ανάπτυξης της τεχνητής νοημοσύνης. Ωστόσο, η αποτελεσματικότητα αυτής της πρωτοβουλίας παραμένει υπό αμφισβήτηση και θα κριθεί στην πράξη.

Η Google έχει δηλώσει ότι σχεδιάζει να ενσωματώσει το Imagen 3 σε περισσότερες υπηρεσίες της στο εγγύς μέλλον, επεκτείνοντας τις δυνατότητες δημιουργίας εικόνων σε ένα ευρύτερο φάσμα εφαρμογών.


Διαβάστε ολόκληρο το άρθρο

Δημοσ. (επεξεργασμένο)

Μείον 4 αστέρια επειδή δεν δημιουργεί εικόνες με ανθρώπους στη δωρεάν έκδοση. Θα πάρει όμως 1 αστέρι γιατί ζωγραφίζει robots! 😅

image.png.c7250bff34978682f011c38f75f9769f.png

Επεξ/σία από NiKoSmile
  • Like 2
Δημοσ. (επεξεργασμένο)
2 hours ago, Retromaniac said:

Tι prompt έδωσες;

Της πλάκας prompt έδωσα. 

Ζάκυνθος, παραλία απόμερη, γκρεμός, ηλιοβασίλεμα. Μικρή παραλία, δυτικού προσανατολισμού, όχι το ναυάγιο, με μια παλιά, ξύλινη βάρκα αραγμένη στην άμμο. Στο βάθος ο ήλιος που δύει. Η θάλασσα ήρεμη. Μερικά αρμυρίκια στα βράχια.
... και μου δίνει αυτό:

Spoiler

Gemini_Generated_Image_57imct57imct57im.jpg.c00dcc0ae6fb23b04536ae4f76fb98f8.jpg

 

Μετά γράφω: 

Πρόσθεσε μερικά ακόμα βράχια στην άκρη της παραλίας και η βάρκα να είναι κατεστραμμένη. Επίσης, η ώρα της φωτογραφίας να είναι σούρουπο, πιο σκοτεινή.

... και έδωσε την πρώτη εικόνα.
 
Στις παραλίες τα πάει καλά. Στα δάση όχι τόσο. Άλλα του έλεγα, άλλα έκανε. Και εδώ του έλεγα μετά να μου κάνει την άμμο λευκή, αλλά δεν άκουγε. 
 
 
 
Επεξ/σία από kirileman
  • Like 2
Δημοσ. (επεξεργασμένο)

image.png.ee1920e3cf8a5c96d951376af44f4fb1.png

To ChatGPT έχει όριο... αλλά είναι πολύ μπροστά στην αναγνώριση εικόνων .

Επεξ/σία από NiKoSmile
Δημοσ.
4 ώρες πριν, kirileman είπε

Τίμιο.

  Απόκρυψη περιεχομένων

Gemini_Generated_Image_4wmff54wmff54wmf.jpg.cc33cb232b2e02549e98202f4bf8918e.jpg

Με το ίδιο prompt, στα Αγγλικά βέβαια, στο Comfyui->Flux 1d.

Βάλτε και τα άλλα prompt από τις φωτογραφίες για να κάνουμε συγκρίσεις.

ComfyUI_00030_.png

  • Like 2
Δημοσ.
5 hours ago, kirileman said:

Τίμιο.

  Hide contents

Gemini_Generated_Image_4wmff54wmff54wmf.jpg.cc33cb232b2e02549e98202f4bf8918e.jpg

Πως σου εβγαλε εικονα σε τοσο μεγαλες διαστασεις; Του ζητησα μια και ειναι πολυ μικροτερη αυτη που εβγαλε.

---

Εντυπωσιακο παντως. Του λες τι θες να σου φτιαξει και το κανει.

Δημοσ.
9 minutes ago, mindreader said:

Πως σου εβγαλε εικονα σε τοσο μεγαλες διαστασεις; Του ζητησα μια και ειναι πολυ μικροτερη αυτη που εβγαλε.

---

Εντυπωσιακο παντως. Του λες τι θες να σου φτιαξει και το κανει.

Περίμενε που σε λίγο θα γίνει mainstream το text to video. Η ίδια εικόνα, αλλά σε βίντεο.

  • Like 1
Δημοσ.

Μια έτσι , μια γιουβέτσι. Όταν έκανα διορθώσεις ναι μεν έφτιαχνε κάτι, αλλά χαλούσε κάτι άλλο. Βαρέθηκα να πω την αλήθεια.

1728592719905.jpg

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...