Προς το περιεχόμενο

Ερώτηση για τεχνητή νοημοσύνη.


Stavros Delta

Προτεινόμενες αναρτήσεις

Δημοσ. (επεξεργασμένο)

Γειά φίλες και φίλοι. Δεν έχω ασχοληθεί καθόλου με τεχνητή νοημοσύνη, απλά ένα βιντεάκι είχα παρακολουθήσει όπου εξηγούσε σε high level μερικά πράγματα. 

Έχω την εξής απορία όμως, γιατί δεν κατάλαβα ακριβώς το κόνσεπτ. Θα σας πω τι νομίζω, και πείτε μου αν αυτό που νομίζω είναι σωστό ή λάθος. 

Υποτίθεται ότι φτιάχνουμε ένα loop όπου δοκιμάζεται randomly μία σειρά από delegates / methods, μέχρι να βρεθεί η σωστή που να πετυχαίνει το σκοπό, και κάθε φορά που αποτυγχάνει, η αποτυχημένη αλληλουχία (πχ ένα array με delegates) αποθηκεύεται ώστε να μη δοκιμαστεί ξανά, και όταν μία αλληλουχία επιτύχει, αποθηκεύεται στις επιτυχείς; Και συνεχίζουμε αυτή την "εκπαίδευση" παίρνοντας διαφορετικά δεδομένα μέχρι να έχουμε αρκετό αριθμό από επιτυχείς αλληλουχίες, όπου από ένα σημείο και ύστερα θα είναι τόσες πολλές οι επιτυχείς που ό,τι δεδομένο και να του περάσουμε, θα πετυχαίνει το σκοπό εύκολα και γρήγορα χρησιμοποιώντας τις αποθηκευμένες αλληλουχίες; 

Δεν σκοπεύω να αναπτύξω κάτι με Τ.Ν, από περιέργεια ρωτάω, για να έχω μία κατανόηση του high level concept. 

 

Επεξ/σία από Stavros Delta
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)

Κατ'αρχάς η ΤΝ είναι μεγάλος κλάδος και περιέχει αρκετές προσεγγίσεις. Δεν είναι ένας αλγόριθμος ούτε όλα βασίζονται στην ίδια λογική. Ακόμη και η πραγματική "λογική" (από φιλοσοφία) όπου χρησιμοποιείται από την ΤΝ μπορεί να έχει διαφορετικές μορφές.

Έχοντας ξεκαθαρίσει αυτό, μου φαίνεται πως το βίντεο που είδες αφορά την μηχανική μάθηση (machine learning) το οποίο βασίζεται πολύ στα μαθηματικά και στα δεδομένα. Η περιγραφή σου μου θυμίζει και τους γενετικούς αλγορίθμους αλλά η μηχανική μάθηση είναι πιο διαδεδομένη. Θα προσπαθήσω χωρίς πολλές λεπτομέρειες να περιγράψω πως δουλεύει ένα απλό μοντέλο μηχανικής μάθησης χωρίς πολλά μαθηματικά:

  • Στην μηχανική μάθηση επί της ουσίας έχεις ένα μοντέλο το οποίο αντιστοιχεί σε μια μαθηματική εξίσωση. Για παράδειγμα ψ = αχ + β.
  • Ο στόχος της μηχανικής μάθησης είναι να βρει μια τέτοια εξίσωση η οποία να μπορεί να προβλέψει σωστά την λύση στο πρόβλημα που έθεσες.
    • Για παράδειγμα. Αν θέλω να προβλέψω τον μισθό ενός υπαλλήλου με βάση τα χρόνια εμπειρίας του θα έχω κάτι τέτοιο:
      • μισθός = α * χρόνια_εμπειρίας + β
  • Αν τα δεδομένα σου είναι το χ, το αποτέλεσμα είναι το ψ... τι τιμές πρέπει να έχουν το α και το β για να προβλέπει την σωστή λύση το μοντέλο σου;
    • Αυτό θα το βρει το μοντέλο σου μετά από εκπαίδευση.
  • Κατά την διάρκεια της εκπαίδευσης, εσύ δίνεις στο μοντέλο σου μια σειρά από δεδομένα και την λύση τους (π.χ. χρόνια = 2, μισθός = 1000). Αν η εξίσωση δεν βρει την λύση, τότε μπαίνει σε εφαρμογή ένας αλγόριθμος ο οποίος θα αλλάξει τις τιμές α και β.
  • Μετά από πολλές επαναλήψεις, αν τα δεδομένα σου είναι καλά, πιθανό να βρεις μια εξίσωση (δλδ ένα μοντέλο) το οποίο να λύνει το πρόβλημα σου.

Για να συνδέσω αυτά που έγραψες

Στις 6/12/2023 στις 3:23 ΜΜ, Stavros Delta είπε

κάθε φορά που αποτυγχάνει, η αποτυχημένη αλληλουχία (πχ ένα array με delegates) αποθηκεύεται ώστε να μη δοκιμαστεί ξανά

Όχι δεν ισχύει αυτό. Κατ'αρχάς δεν είναι εφικτό γιατί η εκπαίδευση χρησιμοποιεί μεγάλο όγκο δεδομένων. Είναι έρευνα σε εξέλιξη αυτό παρεμπιμπτόντως

Στις 6/12/2023 στις 3:23 ΜΜ, Stavros Delta είπε

μέχρι να έχουμε αρκετό αριθμό από επιτυχείς

Όχι απαραίτητα. Μπορείς να συνεχίσεις μέχρι να τελείωσουν τα δεδομένα εκπαίδευσης

Στις 6/12/2023 στις 3:23 ΜΜ, Stavros Delta είπε

που ό,τι δεδομένο

Μπορεί να έχει πολλές προβλέψεις αλλά κανένα μοντέλο δεν θα είναι 100% σωστό αν βασίζεται από τα δεδομένα. Είναι μια από τις αδυναμίες αυτής της προσέγγισης

Στις 6/12/2023 στις 3:23 ΜΜ, Stavros Delta είπε

Υποτίθεται ότι φτιάχνουμε ένα loop όπου δοκιμάζεται randomly μία σειρά από delegates / methods, μέχρι να βρεθεί η σωστή που να πετυχαίνει το σκοπό

Ξεκινάς με μια εξίσωση ψ = αχ + β αλλά δίνεις τυχαίες τιμές στο α και β (εξαρτάται από την υλοποίηση όμως). Αυτή θα δοκιμαστεί από μια σειρά δεδομένων μέχρι να τελειώσουν τα δεδομένα. Σκοπός είναι να βρεθούν οι σωστές τιμές που πετυχαίνουν τον σκοπό

Ελπίζω να βγάζουν νόημα γιατί η αλήθεια είναι δύσκολο να εξηγηθεί χωρίς πολλά μαθηματικά.

Επεξ/σία από Ponous
  • Like 3
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Για να μην ανοίγω νέο νήμα να κάνω και εγώ με την σειρά μου 2 σκέλη ερωτημάτων. 1 Γενικό και 1 προσωπικό:

1. Δεν μπορώ να καταλάβω ούτε στο ελάχιστο τον τρόπο λειτουργίας μια ΑΙ όπως το chat gpt. Δηλαδή πως "καταλαβαίνει" αυτό που ζητάω και πως μου το φέρνει με "ανθρώπινο" λόγο και όχι απλά μία λίστα? Δεν νομίζω οτι το μοντέλο που περιγράφηκε πιο πάνω (ψ = αχ + β) να καλύπτει κάτι τέτοιο. Εκτός αν δεν το κατάλαβα καλά. Γιατί δεν μπορώ να σκεφτώ κάτι άλλο εκτός από αριθμούς σε αυτή την εξίσωση. Στην περίπτωση που δεν θέλω να χάσω το τραίνο που λέγεται "Τεχνητη Νοημοσύνη" έχετε να προτείνετε κάποιο "βιβλίο, course, ιστοσελίδα", που θα εξηγεί "λόλα να ένα μήλο" τι παίζει με αυτή την φάση με την ΑΙ?

2. Έχω μια σελίδα με αρκετά μεγάλη βάση δεδομένων από τοπικές πληροφορίες της περιοχής μου (αγορά, αξιοθέατα, εστίαση, διασκέδαση, διαμονή, χρήσιμα, εκδηλώσεις κλπ). Από ένα απλό select σε mysql με φίλτρα και μία λούπα για παρουσίαση σε αυτό που θέλει ο χρήστης, πως θα μπορούσα να πάω σε ένα chatbot που ο χρήστης θα γράφει, "ποιο εστιατόριο με σούσι θα μου πρότεινες στο κέντρο;" και το chatbot θα απαντάσει "Θα σου πρότεινα το τάδε που έχει πολύ καλές κριτικές" κλπ. Ξέρω οτί στην φάση που είμαι είναι αδύνατον να σκεφτώ πως θα το υλοποιήσω από το μηδέν. Θα μπορούσα να χρησιμοποιήσω όμως κάποια υπηρεσία που το κάνει (πχ chatgpt?) και πως? Κάνει το chatgpt ή έχετε να προτείνεται κάποιο άλλο? (Κατα προτίμηση δωρεάν ή οικονομικό μέχρι να δω πως θα πάει)

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Ένα πολύ περίεργο φαινόμενο που αντιμετώπισα δοκιμάζοντας την μηχανή της Microsoft,  το Bing,  ήταν ότι εφεύρισκε απο μόνη της αποτελέσματα αυτό ήταν τελείως ακατανόητο.

Παράδειγμα υποτιθεμενη ερώτηση που του έκανα και δημιουργησε απο μόνο του μια απάντηση που δεν έστεκε πουθενά :

Ποιος είναι ο ιδιοκτήτης του insomnia.gr?

Tι απάντησε το Bing?

O κύριος Παπαπουδηλινος.

Έκατσα να ψάξω δύο ώρες να δω που στην ευχή έψαξε και δημιουργησε αυτή την απάντηση.  Κατέληξα στο εξής συμπέρασμα. κάπου βρήκε ίσως την βάση με την ιδιοκτησια του domain εκει έδειχνε ενα παπαδοπουλο.  σε κάποια άλλη αναφορά στο ιντερνετ  υπήρχε κάποιος Δηλινος,  Και το bing αντί να πει δεν ξέρω, τα ανακατεψε και δημιουργησε δικο του ονομα.  Που φαινοταν μάλιστα αστειο και ότι δεν υπάρχει στην Ελλάδα τέτοιο όνομα. Αλλά γιατι να μην πει δεν μπορώ;  

 

 

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

3 ώρες πριν, killer76 είπε

Δεν νομίζω οτι το μοντέλο που περιγράφηκε πιο πάνω (ψ = αχ + β) να καλύπτει κάτι τέτοιο

Ισχύει πως το μοντέλο σίγουρα δεν είναι μια εξίσωση του τύπου ψ = αχ + β. Η φιλοσοφία όμως είναι παρόμοια. Έχεις τα πάντα σε αριθμούς, έχεις βαρίδια (δλδ τα α), έχεις τα δεδομένα σε νούμερα (δλδ τα χ) και προσπαθείς να βρεις με τα μαθηματικά μια πιο σύνθετη εξίσωση που να δίνει λύση στο πρόβλημα. Δεν θυμάμαι ποιο μοντέλο, αλλά θυμάμαι πως διάβασα για ένα που είχε πάνω από 40000 βαρίδια (δλδ α)!

3 ώρες πριν, killer76 είπε

πως "καταλαβαίνει" αυτό που ζητάω και πως μου το φέρνει με "ανθρώπινο" λόγο και όχι απλά μία λίστα?

Πριν μερικά χρόνια υπήρξε μια καινοτομία στον τομέα τον νευρωνικών δικτύων και συγκεκριμένα στην ανάλυση της ανθρώπινης γλώσσας (Natural Language Processing). Είναι όντως πιο περίπλοκοι οι αλγορίθμοι σε αυτό, αν μπορούσα να το συνοψίσω όμως θα έλεγα πως βασίζεται σε 3-4 καινούργια concepts:

  • Transformers οι οποίοι αποτελούνται από encoder + decoder
  • Encoder: Είναι υπεύθυνο για την ανάλυση και "κατανόηση" της πρότασης που δίνει ο χρήστης
  • Decoder: Είναι υπεύθυνο για την παραγωγή κειμένου
  • Άμα συνδυάσεις Encoder + Decoder, θα έχεις κάτι σαν το ChatGPT

Τώρα για το πως παράγει και αναλύει τον λόγο είναι άλλο μεγάλο κεφάλαιο, αλλά αυτό που μπορείς να κρατήσεις είναι το εξής:

  • Το μοντέλο θα μάθε λέξεις... αλλά όχι την σημασία τους, θα μάθει τον συσχετισμό τους με άλλες λέξεις.
  • Κάθε φορά, με βάση τα δεδομένα που δίνεις, προσπαθεί να προβλέψει την επόμενη λέξη.
3 ώρες πριν, killer76 είπε

Θα μπορούσα να χρησιμοποιήσω όμως κάποια υπηρεσία που το κάνει (πχ chatgpt?) και πως? Κάνει το chatgpt ή έχετε να προτείνεται κάποιο άλλο?

Υπάρχουν τα πάντα στο huggingface εντελώς δωρεάν. Δεν χρειάζεται να κάνεις κάτι από το μηδέν. Μπορείς να κάνεις fine-tune ένα υφιστάμενο μοντέλο για να μάθει καλύτερα το πρόβλημα σου. Σίγουρα χρειάζεσαι κάποιες γνώσεις για να δουλέψει αυτό αλλά δεν χρειάζεται να κατανοείς πλήρως πως δουλεύουν οι αλγορίθμοι.

 

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...