Την Τετάρτη, η Midjourney ανακοίνωσε την 5η έκδοση της εμπορικής της υπηρεσίας σύνθεσης εικόνων τεχνητής νοημοσύνης, η οποία μπορεί να παράγει φωτορεαλιστικές εικόνες με επίπεδο ποιότητας που ορισμένοι οπαδοί της τεχνητής νοημοσύνης χαρακτηρίζουν "ανατριχιαστικό" και "τέλειο".

Το Midjourney v5 είναι διαθέσιμο τώρα ως δοκιμή alpha για τους χρήστες που εγγράφονται στην υπηρεσία, η οποία είναι διαθέσιμη μέσω του Discord. Οι ενδιαφερόμενοι μπορούν να ξεκινήσουν τη διαδικασία από την επίσημη ιστοσελίδα της υπηρεσίας.

«Το MJ v5 μου φαίνεται προς το παρόν σαν να παίρνω επιτέλους γυαλιά, αφού αγνοούσα για καιρό ότι η όρασή μου ήταν κακή», δήλωσε η Julie Wieland, γραφίστρια που μοιράζεται συχνά τις δημιουργίες της Midjourney στο Twitter. «Ξαφνικά βλέπεις τα πάντα σε 4k, αισθάνεσαι παράξενα αλλά και καταπληκτικά».

Η Wieland μοιράστηκε μερικές από τα αποτελέσματα διαφόρων εκδόσεων του Midjourney  με την ιστοσελίδα Ars Technica, τα οποία σίγουρα δείχνουν μια πρόοδο στη λεπτομέρεια της εικόνας από τότε που το Midjourney εμφανίστηκε για πρώτη φορά τον Μάρτιο του 2022. Η έκδοση 3 έκανε το ντεμπούτο της τον Αύγουστο και η έκδοση 4 έκανε το ντεμπούτο της τον Νοέμβριο. Κάθε έκδοση προσέθετε περισσότερη λεπτομέρεια στα παραγόμενα αποτελέσματα, όπως δείχνουν τα πειράματά:

midjourney_v3_v4_v5_comparison.jpg.89debca931c56c39242915eb9838fc81.jpg

Σύγκριση αποτελεσμάτων από τις εκδόσεις Midjourney v3/v4/v5 στην εντολή "a muscular barbarian with weapons beside a CRT television set, cinematic, 8K, studio lighting"

Το Midjourney λειτουργεί παρόμοια με τα AI μοντέλα σύνθεσης εικόνων όπως το Stable Diffusion και το DALL-E, καθώς παράγει εικόνες με βάση περιγραφές κειμένου που ονομάζονται "προτροπές", χρησιμοποιώντας ένα μοντέλο τεχνητής νοημοσύνης που έχει εκπαιδευτεί σε εκατομμύρια έργα τέχνης που έχουν δημιουργηθεί από ανθρώπους. Πρόσφατα, το Midjourney βρέθηκε στο επίκεντρο μιας διαμάχης για τα πνευματικά δικαιώματα σχετικά με ένα κόμικ που χρησιμοποιούσε προηγούμενες εκδόσεις της υπηρεσίας.

Αφού πειραματίστηκε με την v5 για μια ημέρα, η Wieland αναφέρει βελτιώσεις που περιλαμβάνουν «απίστευτα ρεαλιστικές υφές δέρματος και χαρακτηριστικά προσώπου, πιο ρεαλιστικό ή κινηματογραφικό φωτισμό, καλύτερες αντανακλάσεις, λάμψεις και σκιές, πιο εκφραστικές γωνίες και μάτια που είναι σχεδόν τέλεια και όχι πια στραβά». Μερικά από τα άκρως εντυπωσιακά αποτελέσματα μπορείτε να τα δείτε παρακάτω.

N-6CVxmU-1440x720.jpg.decc26df61bea6b7d4b76689e7b7999f.jpg

1ZgWU_Gs-1440x720.jpeg.a74b7d0e845b977bad9e4e43d47d4659.jpeg FrWnJ1eWAAMQH0X-1440x720.jpeg.a5dd30cc7dc72563cc772bbf675ede7c.jpeg

Και, φυσικά έχουμε και τα χέρια… Τον τελευταίο χρόνο, η ιδέα ότι οι δημιουργικές γεννήτριες AI δεν μπορούν να αποδώσουν σωστά τα χέρια έχει γίνει ένας από τους σημαντικούς λόγους κριτικής. Όμως το Midjourney v5 μπορεί να δημιουργήσει αρκετά καλά, ρεαλιστικά ανθρώπινα χέρια. «Τα χέρια είναι σωστά τις περισσότερες φορές, με 5 δάχτυλα αντί για 7-10 σε ένα χέρι», δήλωσε η Wieland.

Στις σημειώσεις που αφορούν τα χαρακτηριστικά της νέας έκδοσης στο Discord, η Midjourney σημείωσε επίσης ότι η v5 ανταποκρίνεται πλέον με ένα "πολύ ευρύτερο στυλιστικό εύρος" από την προηγούμενη έκδοση, ενώ είναι επίσης πιο ευαίσθητη στις προτροπές, παράγει λιγότερο ανεπιθύμητο κείμενο και προσφέρει 2 φορές μεγαλύτερη ανάλυση εικόνας.

Αν υπάρχει κάποιο οπτικό μειονέκτημα στην αναβάθμιση της Midjourney για τους οπαδούς της AI art, αυτό ίσως προέρχεται από τις εικόνες που μπορεί να είναι τόσο ρεαλιστικές και "τέλειες" που η ακρίβεια του μοντέλου αφαιρεί μέρος της συγκίνησης της επανειλημμένης δημιουργίας εικόνων AI για την εύρεση ενός κατάλληλου αποτελέσματος. Χρήστης του Twitter με το όνομα Philipp Lenssen σημειώνει: «Αν έχετε ένα συγκεκριμένο θέμα εικόνας στο μυαλό σας, εξακολουθεί να μοιάζει λίγο με λοταρία. Αλλά με μεγαλύτερες πιθανότητες νίκης από τη v4».

  • Like 7
  • Thanks 1