Leon - το ισχυρότατο πρόγραμμα Η/Υ για τάβλι που παίζει πόρτες, πλακωτό και φεύγα

Anaksimandros4 · 4 Σεπτεμβρίου 2011

εσυ μιλας για τεχνικες κινησεις. εγω ελεγα γενικα σαν παιχνιδι.

Δεν μιλαω για τεχνικες κινησεις. Μιλαω για γενικα σαν παιχνιδι.

Επισης το quote που εκανες ειναι ΤΕΛΕΙΩΣ ΑΝΑΛΗΘΕΣ!
Απο ποιον θεωρειται οτι οι πορτες εχουν την μικροτερη τυχη και το πλακωτο μεγαλυτερη και το φευγα ακομα μεγαλυτερη?

Καμια σχεση! Δεν ισχυει κατι τετοιο.

Δεν ειναι καθολου ευκολο να το ποσοτικοποιησεις ποιο εχει τον μεγαλυτερο παραγοντα τυχης.

ετσι αναφερεται στο νετ. δεν ειναι δικο μου.

http://el.wikipedia.org/wiki/%CE%A4%CE%AC%CE%B2%CE%BB%CE%B9

Wikipedia???? Really???? :shock:

FarCry · 4 Σεπτεμβρίου 2011

Δεν μιλαω για τεχνικες κινησεις. Μιλαω για γενικα σαν παιχνιδι.

μα οι κινησεις που λες οτι το leon παιζει χαλια στο πλακωτο προκειται για τεχνικες κινησεις....τι εννοεις ακριβως?

Anaksimandros4 · 4 Σεπτεμβρίου 2011

μα οι κινησεις που λες οτι το leon παιζει χαλια στο πλακωτο προκειται για τεχνικες κινησεις....τι εννοεις ακριβως?

:fear:

Δεν συννενοουμαστε. Εσυ απαντησες τωρα σε κατι ασχετο απο αυτα που ειπα:

ξεχασες να αναφερεις το πιο σημαντικο πραγμα στο ταβλι το οποιο σχετιζεται με το πλακωτο και το φευγα.
Από τα προηγούμενα παιχνίδια οι πόρτες γενικά θεωρούνται ότι έχουν τον σχετικά μικρότερο παράγοντα τύχης, το πλακωτό ότι έχει μεγαλύτερο παράγοντα τύχης από τις πόρτες και ότι το φεύγα ακόμα μεγαλύτερο παράγοντα τύχης (το ασσόδυο ακόμα μεγαλύτερο από το φεύγα και το γκιούλ είναι καθαρά τυχερό και όχι τεχνικό).

οποτε οτι και να κανεις το συστημα παντα θα χανει ασχετως των plies. αυτη ειναι η διαφορα του σκακιου με το ταβλι

Τι σχεση εχει αυτο σε σχεση με αυτο που ειπα?

Ειδικα η τελευταια προταση σου δεν εχει κανενα νοημα. Τι θα πει οτι και να κάνεις το συστημα παντα θα χανει?

Και οι πορτες και το φευγα και το πλακοτο εχει μεσα του την τυχη ΚΑΙ το skill(ικανοτητα). Οποτε ακομα και ενα σουπερ-ΑΙ παντα θα μπορει να χασει. Δεν ξερω αν εννοεις αυτο.

Αλλά αυτο δεν εχει ΚΑΜΙΑ σημασια. Φτιαξε εσυ το σουπερ-ΑΙ και οκ. Αυτο που λεω εγω ειναι οτι το Leon παιζει μειρκες κινησεις χάλια. Και αυτο βελτιωνεται. Και πρεπει να βελτιωθει!

Και δεν εχει καμια σημασια αν αυτο δεν θα το κανει αηττητο.

εσυ μιλας για τεχνικες κινησεις. εγω ελεγα γενικα σαν παιχνιδι.

Δεν μιλαω για τεχνικες κινησεις. Μιλαω για γενικα σαν παιχνιδι.

μα οι κινησεις που λες οτι το leon παιζει χαλια στο πλακωτο προκειται για τεχνικες κινησεις....

FarCry · 4 Σεπτεμβρίου 2011

:fear:

Δεν συννενοουμαστε. Εσυ απαντησες τωρα σε κατι ασχετο απο αυτα που ειπα:

Αυτο που λεω εγω ειναι οτι το Leon παιζει μειρκες κινησεις χάλια. Και αυτο βελτιωνεται. Και πρεπει να βελτιωθει!

σε αυτο αναφερομουν συγκεκριμενα και θεωρησα οτι εσυ μιλας για τεχνικες κινησεις ενω εγω ελεγα για το παιχνιδι γενικα.

δηλαδη ειτε παιζει σωστα τις κινησεις που λες οτι κανει λαθος ειστε σωστα θα χανει λογω της τυχης του ζαριου.

εσυ μου λες οτι λες για το παιχνιδι γενικα ενω αναφερθηκες συγκεκριμενα σε λαθος κινησεις και γιαυτο σε ρωτησα στο τελος να μου εξηγησεις τι εννοεις.

καταλαβες ή σε μπερδεψα περισσοτερο?

Anaksimandros4 · 4 Σεπτεμβρίου 2011

Αυτο που λεω εγω ειναι οτι το Leon παιζει μειρκες κινησεις χάλια. Και αυτο βελτιωνεται. Και πρεπει να βελτιωθει!

σε αυτο αναφερομουν συγκεκριμενα και θεωρησα οτι εσυ μιλας για τεχνικες κινησεις ενω εγω ελεγα για το παιχνιδι γενικα.

Αν διαβασεις προσεχτικοτερα αυτα που ειπα θα δεις οτι δεν μιλουσα μόνο για "τεχνικες" κινησεις που εκανε λαθος το Leon στο πλακωτο. Εκανε και αλλες μη τεχνικη φυσεως και μαλιστα η μια ΠΟΛΥ ΠΟΛΥ σοβαρη οπως προανεφερα που δειχνει οτι κατι δεν πηγε καλα με το training του ή οτι δνε ητνα αρκετο το training του(το πιθανοτερο).

δηλαδη ειτε παιζει σωστα τις κινησεις που λες οτι κανει λαθος ειστε σωστα θα χανει λογω της τυχης του ζαριου.

Η τυχη στο ταβλι, το ζαρι δηλαδη, δεν παιζει ρολο στην δυναμικοτητα του ΑΙ.

εσυ μου λες οτι λες για το παιχνιδι γενικα ενω αναφερθηκες συγκεκριμενα σε λαθος κινησεις και γιαυτο σε ρωτησα στο τελος να μου εξηγησεις τι εννοεις.

καταλαβες ή σε μπερδεψα περισσοτερο?

Καταλαβα. Αλλά σου ειπα οτι αμα διαβασεις ακριβως τι ειπα θα δεις οτι ανεφερα για λαθη του Leon στο πλακωτο και για "τεχνικες" κινησεις" και για μη τεχνικες που χρειαζονται δηλαδη positional εκτιμηση της θεσης.

"Τεχνικες" κινησεις(technical play) στο ταβλι ονομαζονται οι κινησεις που πρεπει να δεις να σκεφτεις/αναλυσεις μπροστα την θεση για να παιξεις σωστα, δηλαδη να πεις αν παιξω αυτη την κινηση τοτε ο αντιπαλος αν φερει το Χ ζαρι θα παιξει ετσι οποτε...., ενω αν φερει το Υ ζαρι θα παιξει ετσι οποτε...., ενω αν παιξω την αλλη κινηση τοτε......, κλπ, κλπ.

Σε αυτες χρειαζεται τα προγραμματα να κοιτανε μπροστα καποια ply. Και οπως ανεφερα για τις πορτες ειναι αρκετο το να κοιτανε 3 ply. Για το πλακωτο ομως δεν ειναι, και το οριο γινεται 5 ply σιγουρα αν και μπορει να ειναι και υψηλοτερο. Και 5 ply με minimax δεν γινεται να ψαξει καποιο προγραμμα. Οποτε αναγκαστικα η μόνη μεθοδος που ειναι γνωστη και μπορει να επιτευχθουν 5 plies ειναι το STAR2 για αυτο και ρωτησα αν εχει δοκιμασει αυτο τον αλγοριθμο στο πλακωτο και καλο θα ηταν να τον δοκιμαζε.

Παλιοτερα οταν η επεξεργαστικη ισχυς ηταν φυσικα πολυ κατωτερη στο ταβλι τα τεχνικα παιξιματα ηταν η Αχιλλειος φτερνα των προγραμματων ταβλιου(bots). Πλεον φυσικα ψαχνουν ευκολα 3 (ή και περισσοτερα-βλεπε ExtremeGammon) plies μπροστα σε "κανονικο χρονο" οποτε ολα αυτα τα προβληματα εξανεμιστηκαν. Παλιοτερα λοιπον το αδυνατο σημειο των bots ηταν τα τεχνικα παιξιματα που απαιτουσε lookahead δηλαδη να κοιταξουν και να υπολογισουν θεσεις μπροστα ενω αυτο ηταν πολυ ευκολο σχετικα για τους τοπ ανθρωπους παικτες ταβλιου.

Αντιθετα η κριση/εκτιμηση για μια θεση, οταν δεν χρειαζονταν τεχνικη κινηση δηλαδη, ηταν το δυνατο σημειο των bots και θεωρουνταν μαλλον λιγο καλυτερα απο τους τοπ ανθρωπους καθως με την εκπαιδευση τους σε εκατομμυρια παιχνιδια ειχαν συναντησει παρομοια θεση(οχι αναγκαστικα ιδια) και ηξεραν καλυτερα απο τους ανθρωπους τι να κανουν.

Το αντιθετο φυσικα συνεβαινε και συμβαινει στο σκακι! Οπου παντοτε, μα παντοτε το δυνατο σημειο των ΑΙ σκακιου, ηταν το "τακτικο" παιξιμο(tactical play) δηλαδη το να υπολογιζουν πολλες κινησεις μπροστα(χωρις, σχεδον, λαθη!). Απο το 1987 ακομα, σε αυτον τον τομεα υπερτερουσαν των τοπ ανθρωπων παικτων σκακιου.

Ενω αντιθετα η εκτιμηση για μια θεση ακομα και τωρα, οπου οι υπολογιστες σκακιου ειναι πολυ δυνατοτεροι απο τον καλυτερο τοπ γκραντμαστερ, ειναι το αδυνατο σημειο για τους υπολογιστες. Και η ολη δυναμη τους πηγαζει στην δυνατοτητα να υπολογιζουν εκατομμυρια βαριαντες και δεκαδες κινησεις μπροστα σχεδον χωρις να κανουν λαθη.

KostasKarditsa · 13 Σεπτεμβρίου 2011

Εγω θεωρωντας τον ευατο μου σαν expert σε αυτο τον τομεα (καθως και στο ταβλι) μπορω να πω μόνο μια αγγλικη λεξη:

WOW!

Σ' ευχαριστώ!

Αυτά που έγραψες με βοήθησαν πολύ!.

Το βασικότερο είναι ότι εντόπισα ένα σημαντικό bug που προστέθηκε στην μηχανή αναζήτησης του Leon με το τελευταίο update. Μικρό από προγραμματιστικής πλευράς αλλά μεγάλο από πλευράς προγράμματος..

Τώρα το Leon είναι σαφώς πολύ πιο ισχυρό.

Θα σε παρακαλούσα να το ξαναδείς.

Στείλε μου ένα email για να σου πω λεπτομέρειες.

Συγχαρητηρια για την προσπαθεια. Τον Μαιο επειδη ειχα απηυδησει με την ελλειψη καποιου προγραμματος για το Ελληνικο ταβλι ειχα αποφασισει να κατσω και να φτιαξω μόνος μου ενα. Ε μια οι διακοπες, μια τα ποδοσφαιρα και τα μπασκετ βαρεθηκα, και δεν εκανα τιποτα, αλλά εμφανιζεσαι εσυ και με σωνεις.

Μην υποτιμάς το χρόνο που χρειάζεσαι για να φτιάξεις μόνος σου ένα καλό πρόγραμμα τάβλι.

Υπολόγισε τουλάχιστον 2 με 3 χρόνια, ανάλογα βέβαια και με την εμπειρία που έχεις.

Ας τα παρουμε ενα-ενα λοιπον:

Καραρχας εσυ πρεπει να εισαι(κατι μου θυμιζει το Tournavitis) που εγραψες και το Herakles, ΑΙ για Reversi(Othello) δηλαδη. Ετσι? φοβερο προγραμμα οπου απο τα ελευθερα μόνο το NTest και το Edax ηταν ισχυροτερα και ισως η Ζεβρα. Παντως πολυ δυνατο προγραμμα θυμαμαι για 8x8 και ειχε και για 10x10 νομιζω οπου αυτο πρεπει να ηταν το ισχυροτεο διαθεσιμο του κοσμου. Τελοσπαντων ασχετο αυτο....

Ναι, εγώ είμαι.

Καταρχάς όλα τα καλά προγράμματα Othello/Reversi είναι ελεύθερα. Δεν υπάρχει σοβαρό πρόγραμμα που να μπορείς να το αγοράσεις.

Στην εποχή που ήμουν ακόμη ενεργός στο Othello, το Νtest ήταν ελαφρώς ισχυρότερο του Herakles στα στάνταρντ παιχνίδια αλλά αρκετά χειρότερο σε παιχνίδια που ξεκινούσαν με τυχαία αρχική θέση. Το Edax ήταν παρόμοια ισχυρό αλλά σαφώς όχι ισχυρότερο. Το Zebra ήταν πιο αδύναμο.

Το Herakles παίζει 3 παραλλαγές Othello. Το 8x8, το 10x10 και το Octagon.

Μέχρι και που έβγαλα το 10x10 οι άνθρωποι πίστευαν ότι δύσκολα οι υπολογιστές θα καταφέρουν να κερδίζουν τους ανθρώπους στο 10x10. Αλλά τελικά αποδείχτηκε το αντίθετο...

Ακόμη και σήμερα όσο γνωρίζω το Herakles εξακολουθεί να είναι το ισχυρότερο πρόγραμμα σε 10χ10 στον κόσμο.

Δεν το δοκιμασα ακομα, παρα μόνο επαιξα ενα παιχνιδι στο επιπεδο professional πλακοτο. Ομολογω οτι εκανε πολλα λαθη απο την αρχη κιολας οποτε δεν το συνεχισα.

Περισσοτερη αναλυση για την δυναμικοτητα του ΑΙ στα 3 παιχνιδια θα ακολουθησει αργοτερα, οταν κανω περαιτερω αναλυσεις....

Σε ότι αφορά τις αναλύσεις στα παιχνίδια, θα σε παρακαλούσα να το ξαναδείς μετά τη διόρθωση του Bug.

Οπότε δεν θα μπω προς το παρόν σε τέτοιες λεπτομέρειες.

Επικοινώνησε μαζί μου για να σου πω πως.

Μπορεις να πεις περισσοτερα?

Δηλαδη:

•Χρησιμοποιησες καποια supervised τενχικη ή ηταν εντελως unsupervised?

•Επισης υποθετω οτι προφανως και χρησιμοποιησες ενα ANN(artificial neural net) που εκπαιδευτηκε με την τεχνικη TD(L) ετσι?

•Αν ναι τοτε χρησιμοποιησες L=0? Δηλαδη χρησιμοποιησες την τεχνικη TD(0) και το αφησες τελειως μόνο του να μαθαινει?

•Αν ναι τοτε μπορω να μαθω ποσα παιχνιδια(self-games) χρησιμοποιησες για το καθε ενα απο τα 3 παιχνιδια(πορτες,πλακοτο,φευγα)?

•Μπορεις επισης να πεις περισσοτερα για το ΑΝΝ και τα layers και τα inputs του?

•Πχ ενα πραγμα που με ενδιαφερει ιδιαιτερα ειναι το αν στο input layer εβαλες μόνο του κανονες του καθε παιχνιδιου και τιποτα αλλο!

α) Παρότι δεν συμφωνώ θεωρητικά με την έννοια του unsupervised, με βάση τον τρόπο που χρησιμοποιείται τότε ναι είναι unsupervised. Το κάθε παιχνίδι είναι ένα τεράστιο νευρωνικό δίκτυο που ξεκίνησε με μηδενική γνώση, δηλαδή μόνο τους κανόνες, και έμαθε παίζοντας εκατομμύρια παρτίδες εναντίων του εαυτού του.

β) Χρησιμοποίησα αρκετές παραλλαγές του TD(λ) αλγόριθμου, καταλήγοντας στο τέλος στον TD(0) αλλά με αρκετές μικρές διαφοροποιήσεις ώστε να δουλέψει καλά.

γ) Τα inputs είναι διαφορετικά από αυτά που έχουν χρησιμοποιηθεί στα σημερινά προγράμματα backgammon. Καταρχάς δεν έβαλα καθόλου λογική(!). Στις πόρτες π.χ τα inputs είναι κάποιες εκατομμύρια(!) boolean συναρτήσεις που δημιουργήθηκαν αυτόματα. Αυτό κάνει το Leon και ξεχωριστό σε σχέση με άλλα προγράμματα στον τρόπο που παίζει. Επίσης στις πόρτες υπάρχει ένα μεσαίο layer με 64 neurons. Οπότε όπως καταλαβαίνεις υπάρχουν αρκετά ακόμη περιθώρια να γίνει η μηχανή ακόμη πιο ισχυρή.

δ)Παίχτηκαν πολλά(!) εκατομμύρια παρτίδες. Δεν θυμάμαι ακριβώς πόσες αλλά στις πόρτες πρέπει να ξεπέρασαν τα 80 εκατομμύρια. Ίσως και κοντά στα 100...

Δυστυχώς δεν έχω πια το χρόνο να γράψω κάποιο άρθρο για τον τρόπο που έμαθε το Leon.

Πάντως λόγω της ιδιαιτερότητας της τοπολογίας του νευρωνικού δικτύου που χρησιμοποίησα, πολλές ιδέες που παρουσίασα τότε στην δημοσίευση αυτή, χρησιμοποιήθηκαν και στο Leon. Το απλό TD(0) απλά δεν φτάνει..

Δεν ειναι κατι αδυνατο να εχει γινει. Δεν μιλαμε για σκακι οπου για να φτασεις στο επιπεδο της Rybka πχ γραφωντας ενα προγραμμα απο την αρχη, .......well..... να το πω πολυ απλα: ΔΕΝ ΓΙΝΕΤΑΙ! Θα παρει καμια 10ρια χρονια και παλι δεν θα φτασεις (εκτός και αν κλεψεις και δεις τον κωδικα του Ippolit πχ, που εικαζεται οτι ειναι ο κωδικας του Rybka που προηλθε απο reverse engineering αυτου)!

Εδω μπορει να γινει καθως πλεον με την φοβερη δυναμη του hardware, εκπαιδευοντας με την χρηση πχ TD(0) καποια ΑΝΝ, με, ας πουμε, 80 000 000 παιχνιδια, τοτε πλησιαζεις την δυναμη του GNUBG.

Μην υποτιμάς τη δυσκολία που έχει το τάβλι σε σχέση με το σκάκι (έχω γράψει και μηχανή που παίζει σκάκι)

καθώς και το θέμα της μάθησης.

Δεν είναι απαραίτητα θέμα αριθμού παιχνιδιών!

Και για να είμαι ειλικρινής από ένα σημείο και μετά όσο περισσότερα παιχνίδια παίζει για να μάθει το πιθανότερο είναι να γίνεται χειρότερο..

Αυτα τα 2 νουμερα συγκρινεις για να αποφασισεις πιο προγραμμα και πόσο ειναι καλυτερο.

Καταρχάς για να βάλουμε τη συζήτηση στη σωστή βάση τα 10000 παιχνίδια ήταν ουσιαστικά 5000 διπλά παιχνίδια.

Με διπλό παιχνίδι εννοώ ότι το πρώτο παιχνίδι παίζεται με τυχαίο ζάρι ενώ στο δεύτερο παίζονται οι ίδιες ζαριές αλλά αλλάζοντας τη σειρά των παιχτών. Δηλαδή στο δεύτερο παιχνίδι το Leon έπαιζε τις ζαριές που έπαιζε το GNUBg στο πρώτο παιχνίδι και το GNUBg αυτές που έπαιζε το Leon στο πρώτο. Με αυτό τον τρόπο προσπάθησα όσο φυσικά εφικτό να μειώσω τον παράγοντα τύχη.

Θα μου επιτρέψεις να διαφωνήσω (τουλάχιστον προς το παρόν) ότι με rollouts και αναλύσεις θα πάρεις καλύτερα αποτελέσματα από τον τρόπο που χρησιμοποίησα εγώ.

Και στα rollouts και στις αναλύσεις η λογική του κάθε προγράμματος που τις κάνει παίζει σημαντικό ρόλο.

Σκέψου ένα πρόγραμμα που παίζει τελείως τυχαία. Πόσο θα εμπιστευόσουνα τα rollouts ή τις αναλύσεις αυτού του προγράμματος?

Μια ακομα ερωτηση:

Τι διαφορές εχουν τα διάφορα επιπεδα του ΑΙ?

Πχ τα expert, professional, world class κλπ τι διαφορά εχουν μεταξυ τους και πόσα ακριβως plies ψαχνει το καθενα?

Πχ πόσα το expert, πόσα το professional και πόσα το υψηλοτερο ολων world class?

Επισης εκτός απο τον αριθμο των plies που ψαχνει το καθενα τι αλλες διαφορές εχει το καθε level? Απο τα 3 καλυτερα πχ που αυτα με ενδιαφερουν.

Καταρχάς στο βάθος αναζήτησης και δεύτερον στο aggresiveness των selective search extensions.

To expert π.χ ψάχνει σε βάθος 2 plies χωρίς(!) selective search extensions.

Το professional ψάχνει σε βάθος 3 plies με πολύ agressive selective search extensions.

To υψηλότερο επίπεδο ψάχνει επίσης σε βάθος 3 plies αλλά με λιγότερο aggressive selective search extensions.

Πχ ο δημιουργος του BGBlitz σε συζητησεις που ειχαμε μου εχει πει οτι ο κωδικας ενος προγραμματος με artificial neural nets πρεπει να ειναι ΤΕΛΕΙΩΣ μα ΤΕΛΕΙΩΣ bug free και οτι ελαχιστα λαθη ή ενα ελαχιστο λαθος μπορει να δημιουργησει "απειρα" προβληματα στην δυναμικοτητα του ΑΙ. Αυτο συνεβησε και σε αυτον οπου ενα φαινομενικα ασημαντο λαθος σε ενα input ενος layer τον ταλαιπωρουσε επι μηνες καθως(χωρις να εχει εις γνωση του προφανως τοτε το bug) οση επκπαιδευση και να εκανε στο ΑΙ, αυτο συνεχιζε να παιζει χάλια σε ΜΕΡΙΚΕΣ θεσεις και αρα γενικα ηταν πολυ μετριο.

Χαχα. Όντως ότι χειρότερο.

Όπως είπα η έκδοση του Leon που δοκίμασες είχε ένα σημαντικό bug στην μηχανή αναζήτησης και σ' ευχαριστώ που ήσουν αυτός που με έδωσε να καταλάβω που βρίσκεται και να το διορθώσω.

Α και ξεχασα να αναφερω οτι εγω ηθελα να φτιαξω ΑΙ για πλακοτο και φευγα για τον απλουστατο λογο οτι θελω να αναλυω τις παρτιδες, κινησεις, κλπ οπως κανω στις πορτες(backgammon). Και ενω το Leon ειναι μια αξιολογη προσπαθεια φυσικα αλλά δεν εχει λειτουργιες αναλυσης. Οποτε μου ειναι ουσιαστικα αχρηστο για οτν σκοπο μου. Φυσικα μπορεις να προσθεσεις λειτουγιες για αναλυση και κυριως για αυτο που ενδιαφερομαι για rollouts!! Εστω και απλα rollouts, δεν χρειαζεται να εχουν τις χιλιαδες των επιλογων που εχουν τα GNUBG και ExtremeGammon.

Αμα το προσθεσεις αυτο, η αξια του προγραμματος ανεβαινει 10 επιπεδα για μενα.

Λειτουργίες ανάλυσης είναι στο todo list.

Πίστεψέ με ότι δεν θα σε απογοητεύσω..

Βλεπω οτι το Leon δεν εχει ντετερμινιστικο ΑΙ για ενα CPU, δηλαδη ακομη και σε εναν επεξεργαστη σε πολλες θεσεις, με 2 ή και παραπανω παραπλησιες επιλογες ΠΟΥ ΟΜΩΣ υπαρχει σαφης διαχωρισμος μεταξυ καλυτερης κινησης, 2ης καλυτερης, κλπ, παιζει διαφορετικες κινησεις μερικες φορες!! Αυτο ειναι προβλεπομενο?

Περιεργο παντως ειναι καθως δεν ειναι λογικη και σωστη συμπεριφορα αοφυ η καλυτερη κινηση ειναι μια(για τις θεσεις που λεω) οποτε επρεπε να την παιζει παντα.

Γιατι λοιπον δεν ειναι ντετερμινιστικο? Εχεις βαλει καποιο randomizer στις κινησεις?

Εδώ κατάλαβα που βρίσκεται το bug στην μηχανή αναζήτησης.

Σ' ευχαριστώ!!!

Το Leon δεν έχει randomizer στις κινήσεις.

Θα σε παρακαλούσα να ξανακατεβάσεις το Leon με το διορθωμένο bug και να ξανακάνεις τις δοκιμές σου.

Επικοινώνησε μαζί μου!

Χρησιμοποιεις στην search του Leon απλο minimax ή μηπως καποια αλλη τεχνικη, πχ STAR2? Που παρολο που για το GNUBG πχ δεν εδειξε βελτιωση, λογω της ΦΟΒΕΡΑ ισορροπημενης και εξελιγμενης evaluation του, εδειξε μεγαλη βελτιωση σε λιγο "randomized" εκδοση της eval του GNUBG, οποτε μπορει επισης να δειξει βελτιωση σε λιγοτερο ανεπτυγμενες evaluation functions πχ στο πλακωτο του Leon που ανεφερα προηγουμενως. Εχεις δοκιμασει τιποτα τετοιο?

Όχι minimax αλλά τον λεγόμενο expectimax αλλά με κάποιες διαφοροποιήσεις.

Επίσης χρησιμοποείται και ο STAR2 με τον οποίο είχα καλά αποτελέσματα.

Καμια περιπτωση για ρυθμισεις για να αναλυει το Leon θεσεις ή και να κανει rollouts αλλά και για να κανει export τις παρτιδες κλπ σε τιποτα mat ή sgf αρχεια για παραδειγμα?

Ναι όλα αυτά είναι στο todo list.

Anaksimandros4 · 13 Σεπτεμβρίου 2011

Το βασικότερο είναι ότι εντόπισα ένα σημαντικό bug που προστέθηκε στην μηχανή αναζήτησης του Leon με το τελευταίο update. Μικρό από προγραμματιστικής πλευράς αλλά μεγάλο από πλευράς προγράμματος..

Τώρα το Leon είναι σαφώς πολύ πιο ισχυρό.

Θα σε παρακαλούσα να το ξαναδείς.

Στείλε μου ένα email για να σου πω λεπτομέρειες.

Το εμαιλ μου ειναι:

ana555[email protected]

(αφαιρωντας το 555)

Ναι πες μου ποιο ακριβως ηταν το προβλημα, παντα ενδιαφερομαι για αυτα.

Μην υποτιμάς το χρόνο που χρειάζεσαι για να φτιάξεις μόνος σου ένα καλό πρόγραμμα τάβλι.
Υπολόγισε τουλάχιστον 2 με 3 χρόνια, ανάλογα βέβαια και με την εμπειρία που έχεις.

Οχι δεν υποτιμαω αλλά ειναι σχετικα απλο και straightforward να φτασεις σε ενα επιπεδο που να συγκρινεται με τα κορυφαια προγραμματα(πλεον βεβαια το ExtremeGammon εχει θεσει τον πηχη παρα πολυ ψηλα) εστω και αν ειναι λιγο χειροτερο απο αυτα:

Unsupervised learning με TD(0) εκπαιδευση σε ΑΝΝς και παιζεις 50 εκατομμυρια παρτιδες και αν δεν εχεις σοβαρα bug εχεις ενα σουπερ δυνατο ΑΙ.

Αντιθετα στο σκακι εαν αρχισεις απο την αρχη για να φτιαξεις ενα συγκρισιμο ΑΙ με τα Houdini, Rybka, Critter, Naum, Hiarcs, Fritz, κλπ......οπως ειπα ΔΕΝ ΓΙΝΕΤΑΙ. Πρεπει να δουλευεις καμια 10αρια χρονια πανω σε αυτο(εκτός αν "κλεψεις" και δεις τον κωδικα του Ippolitή του Stockfish πχ). Το να φτιαξεις ενα πολυ λιγοτερο δυνατο προγραμμα, φυσικα και γινεται σχετικα ευκολα.

Ναι, εγώ είμαι.
Καταρχάς όλα τα καλά προγράμματα Othello/Reversi είναι ελεύθερα. Δεν υπάρχει σοβαρό πρόγραμμα που να μπορείς να το αγοράσεις.

Το ξερω. Αναφερομουν στο Saio οπου ειναι στην ιδια κατηγορια με ΝΤεστ και Edax το οποιο ειναι ιδιωτικο προγραμμα.

Στην εποχή που ήμουν ακόμη ενεργός στο Othello, το Νtest ήταν ελαφρώς ισχυρότερο του Herakles στα στάνταρντ παιχνίδια αλλά αρκετά χειρότερο σε παιχνίδια που ξεκινούσαν με τυχαία αρχική θέση. Το Edax ήταν παρόμοια ισχυρό αλλά σαφώς όχι ισχυρότερο. Το Zebra ήταν πιο αδύναμο.

Στα τουρνουα μου παντως παντα η σειρα ηταν Ntest, Edax, Herakles, Zebra αν και η Ζεβρα καμια φορα ερχοταν και 3η. Την Ζεβρα την ανεφερα διοτι παντα της ειχα αδυναμια λογω του endgame παιξιματος της.

Σε ότι αφορά τις αναλύσεις στα παιχνίδια, θα σε παρακαλούσα να το ξαναδείς μετά τη διόρθωση του Bug.
Οπότε δεν θα μπω προς το παρόν σε τέτοιες λεπτομέρειες.

Επικοινώνησε μαζί μου για να σου πω πως.

Ναι οκ. Βεβαια υπαρχει ενα προβλημα που φανταζομαι οτι θα υπαρξει. Οτι μιας και οι 7 ημερες του free time του Leon της προηγουμενης εκδοσης εληξαν, αμα εγκαταστησω την καινουρια εκδοση, προφανως δεν θα με αφηνει να παιξω για 7 καινουριες μερες. Μπορω να κανω καποιου ειδους ολικη διαγραφη του παροντος Leon που εχω ωστε εγκαταστοντας το καινουριο να μου δωσει αλλες 7 μερες για να δοκιμασω το καινουριο?

Να το αγορασω δεν με βλεπω καθως ακομη δεν εχει δυνατοτητες αναλυσης, rollout, export κλπ, οποτε η μονη λυση ειναι αν παρεχεις καποιον τροπο να τρεξει για ακομη 7 μερες στον υπολογιστη μου.

γ) Τα inputs είναι διαφορετικά από αυτά που έχουν χρησιμοποιηθεί στα σημερινά προγράμματα backgammon. Καταρχάς δεν έβαλα καθόλου λογική(!). Στις πόρτες π.χ τα inputs είναι κάποιες εκατομμύρια(!) boolean συναρτήσεις που δημιουργήθηκαν αυτόματα.

Εννοεις μετεπειτα οταν ειχε ηδη προχωρησει καπως η εκπαιδευση και οχι αρχικα, γιατι αρχικα αρχικα τα inputs λογικα ηταν μόνο τα board representations σωστα?

Αυτό κάνει το Leon και ξεχωριστό σε σχέση με άλλα προγράμματα στον τρόπο που παίζει. Επίσης στις πόρτες υπάρχει ένα μεσαίο layer με 64 neurons. Οπότε όπως καταλαβαίνεις υπάρχουν αρκετά ακόμη περιθώρια να γίνει η μηχανή ακόμη πιο ισχυρή.
δ)Παίχτηκαν πολλά(!) εκατομμύρια παρτίδες. Δεν θυμάμαι ακριβώς πόσες αλλά στις πόρτες πρέπει να ξεπέρασαν τα 80 εκατομμύρια. Ίσως και κοντά στα 100...

Παρα πολλα πραγματι σε σχεση με τα 2 άλλα εμπορικα προγραμματα που γνωριζω για αυτα(και δεν ξερω αν μπορω να πω τις τιμες γιατι ισως ειχα υποσχεθει να μην τις αναφερω).

Μην υποτιμάς τη δυσκολία που έχει το τάβλι σε σχέση με το σκάκι (έχω γράψει και μηχανή που παίζει σκάκι)
καθώς και το θέμα της μάθησης.

Δεν είναι απαραίτητα θέμα αριθμού παιχνιδιών!

Και για να είμαι ειλικρινής από ένα σημείο και μετά όσο περισσότερα παιχνίδια παίζει για να μάθει το πιθανότερο είναι να γίνεται χειρότερο..

Την δυσκολια την ανεφερα πιο πριν οσον αφορα παντα, να γραψει καποιος ενα προγραμμα στο επιπεδο των υπαρχουσων κορυφαιων. Καμια σχεση η δυσκολια στο ταβλι με αυτη στο σκακι. Και ειναι και λογικο αν σκεφτει κανείς ποσοι προγραμματιστες ασχοληθηκαν και ασχολουνται με το ταβλι(με το backgammon βασικα) και ποσοι με το σκακι. Η μερα με την νυχτα.

Και υπαρχει και ενας αλλος σημαντικοτατος λογος, η φυση των παιχνιδιων. Και ενω στο backgammon πχ η διαφορα δυναμικοτητας του TD-Gammon 2.1 των 90ς, με τα συγχρονα κορυφαια ειναι μεν μεγαλη αλλά δεν θα λεγαμε τιποτα παραπανω απο αυτο, η διαφορα δυναμικοτητας των προγραμματων σκακιου των 90ς με αυτα του τωρα ειναι ΚΟΛΟΣΣΙΑΙΑ, ΤΕΡΑΣΤΙΑ, ΑΠΙΣΤΕΥΤΗ!

Και αυτο οφειλεται στο οτι το σκακι ειναι πολυ πιο δυσκολο οπως φαινεται να κανουμε τον υπολογιστη να το μαθει απο οτι το backgammon. Στο backgammon βρηκαμε το TD(L) learning μαζι με τα νευρωνικα δικτυα και τελος. Σουπερ επιπεδο! Απο εκει και περα οι διάφορες αλλες μεθοδοι και τεχνικες δινουν περαιτερω δυναμη στα προγραμματα αλλά οχι κατι το ιδιαιτερο και ο σκελετος της δυναμης παραμενει η εκπαιδευση των ΑΝΝς.

Αντιθετα στο σκακι η προοδος γινεται σιγα σιγα. Ακομη και τωρα ανακαλυπτονται νεες τεχνικες αναζητησης, νεοι τροποι ρυθμισης και τιμες για την eval(), που δινουν πολλα πολλα ΕΛΟ παραπανω.

Ισως βεβαια αν και στο backgammon ασχολουνταν οι εκατονταδες προγραμματιστες οπως στο σκακι, να βρισκοντουσαν νεες τενχικες που θα εφερναν κατι ριζοσπαστικο αλλά δεν ειμαι σιγουρος περι αυτου.

Οσο για τα περισσοτερα παιχνιδια, το να φτασει σε καποιο σημειο ωστε να γινεται χειροτερη η εξυπναδα του με επιπλεον παιχνιδια, δεν το πιστευω και πιστευω οτι απλως δεν θα υπαρχει περαιτερω βελτιωση απο εκει και περα, θα συμβει δηλαδη αυτο που λεμε ο νόμος των diminishing returns. Δεν θα εχουμε αναποκριση (εξυπνοτερου ΑΙ) με λιγα λογια στην εκπαιδευση που κανουμε.

Έχετε δημοσιεύσει περισσότερες παραθέσεις απ' ότι επιτρέπεται

FO insomnia!!

PostHelper · 13 Σεπτεμβρίου 2011

Ωραια ολα αυτα.

Anaksimandros4 · 13 Σεπτεμβρίου 2011

......συνεχεια απο το προηγουμενο γιατι το ινσομνια system ειναι ηλιθιο!

Αναγκάστηκα να χρησιμοποιησω τον PostHelper γιατι δεν με αφηνε να κανω πολλαπλα quotes και γιατι αλλιως το μηνυμα μου θα εμοιαζε τοσο χαλια(με ολα αυτα τα ξεκαρφωτα και αδιαμορφοποιητα quote παντου) οσο το δικο σου πριν.

Καταρχάς για να βάλουμε τη συζήτηση στη σωστή βάση τα 10000 παιχνίδια ήταν ουσιαστικά 5000 διπλά παιχνίδια.
Με διπλό παιχνίδι εννοώ ότι το πρώτο παιχνίδι παίζεται με τυχαίο ζάρι ενώ στο δεύτερο παίζονται οι ίδιες ζαριές αλλά αλλάζοντας τη σειρά των παιχτών.

Καταλαβα.

Αυτο δυστυχως στο ταβλι γενικα δεν λειτουργει.

Και αυτο γιατι το παιξιμο απο εναν παικτη εστω και μιας(εστω και λαθος κινησης) διαφορετικης κινησης απο τον αλλο, αλλάζει ΤΕΛΕΙΩΣ το ολο παιχνιδι τις κινησεις που ειναι σωστες μετα κλπ.

Πχ:

Ζαρι: 5-1 , 2-1 , 2-1 , 6-2, .........

Παιζει λοιπον το Leon πρωτο και παιζει 5-1 κανοντας splitting πιθανοτατα(ως η καλυτερη κινηση).

Παιζει το GNUBG 2-1 και παιζει 24-21 πιθανοτατα(αυτο παιζει πραγματι(ως η καλυτερη κινηση)).

Παιζει το Leon 2-1 και εδω εχουμε ομως 2 κοντινες επιλογες(οχι οτι αυτο εχει και μεγαλη σημασια, δηλαδη το γεγονος οτι οι επιλογες ειναι κοντινες δεν ειναι το σημειο κλειδι που θελω να αναδειξω): Διαλεγοντας "χτυπημα" και "οχι χτυπημα":

α)6/4* 23/22

β)24/22 23/22

Και παιζει το GNUBG 6-2, στη μεν α) περιπτωση θα παιξει bar/23 13/7, ενω στη β) θα παιξει 21/13, δηλαδη θα εχουμε τις παρακατω 2 θεσεις για τις 2 διαφορετικες πιθανες κινησεις του Leon:

α)

β)

Τελειως διαφορετικες θεσεις.

Μπορει λοιπον εδω περα το Leon να παιξει την α) συνεχεια(κινηση) και το GNUBG(στο επομενο παιχνιδι οταν ερθει η σειρα του να διαλεξει) την αλλη.

Οποτε η συνεχεια του παιχνιδιου και παροτι το ζαρι θα ειναι ακριβως το ιδιο οι θεσεις που θα κληθουν να παιξουν το καθε προγραμμα, θα ειναι ΠΑΝΤΕΛΩΣ διαφορετικες. Και αυτο συμβαινει φοβερα συχνα στο ταβλι.

Πχ σε αυτες τις θεσεις η επομενη ζαρια για την α) θεση εχει καλουτσικη τζοκερ ζαρια το 6-4, ενω για την θεση β) το 6-4 ειναι ψιλοβλακεια, με λιγα λογια ακομα και με τις ιδιες ζαριες εναλλαξ που τους εβαλες βλεπουμε οτι εαν η επομενη ζαρια ηταν η 6-4 τοτε το ενα προγραμμα στο ενα ματς θα ειχε τυχη, ενω το αλλο προγραμμα στο αλλο ματς θα ειχε ατυχια.

Με λιγα λογια αν η β) κινηση ειναι η λαθος(και αυτο στο ταβλι το αποφασιζουμε επειτα απο rollouts χιλιαδων παιχνιδιων) και η α) η σωστη, τοτε εστω οτι αν επαιξε την κινηση α) το Leon και την β) το GNUBG, τοτε εχουμε ενα καταμετρημενο λαθος του GNUBG αλλά στις επομενες κινησεις οι θεσεις που κληθηκαν να αποφασισουν τα 2 προγραμματα ειναι διαφορετικες οποτε το τελικο αποτελεσμα των 2 παιχνιδιων και παλι δεν μας λεει τιποτα καθως σε μια επομενη ζαρια ή στις επομενες ζαριες παροτι ιδιες, λογω του οτι οι θεσεις ειναι διαφορετικες στην μια θεησ μπορει η προδιαγεγραμμενη ζαρια να ειναι τυχερη ενω στην αλλη θεση η ιδια ζαρι ανα ειναι καταστροφη. Οποτε και παλι υπεισερχεται η τυχη ακομα και αν το ενα προγραμμα νικησει 2-0 το ζευγος παιχνιδιων.

Δηλαδη και παλι επανερχομαστε στο κλασικο τροπο που μετραμε την δυναμη των ΑΙ ταβλιου. του να παρουμε τις Χ κινησεις οτυ ενος και τις Υ του αλλου και να τις βαθμολογησουμε με βαση τα rollouts καποιου αλλου προγραμματος καθως με αυτον τον τροπο ΒΓΑΖΟΥΜΕ ΤΕΛΕΙΩΣ εξω τον παραγοντα τυχης και μετραμε μόνο το skill.

Και στα rollouts και στις αναλύσεις η λογική του κάθε προγράμματος που τις κάνει παίζει σημαντικό ρόλο.
Σκέψου ένα πρόγραμμα που παίζει τελείως τυχαία. Πόσο θα εμπιστευόσουνα τα rollouts ή τις αναλύσεις αυτού του προγράμματος?

Καθολου.

Αλλά δεν μιλαω για τετοιο προγραμμα αλλά για προγραμμα ισχυρο που θα τα κάνει.

Καταρχάς στο βάθος αναζήτησης και δεύτερον στο aggresiveness των selective search extensions.
To expert π.χ ψάχνει σε βάθος 2 plies χωρίς(!) selective search extensions.

Το professional ψάχνει σε βάθος 3 plies με πολύ agressive selective search extensions.

To υψηλότερο επίπεδο ψάχνει επίσης σε βάθος 3 plies αλλά με λιγότερο aggressive selective search extensions.

Αχα!! Δηλαδη εχεις και selective search στο Leon!!

Λογικο, ναι.... Σκετο minimax για να ψαξει με brute force 3 ply μπροστα κάνει πολυ χρονο?

Χαχα. Όντως ότι χειρότερο.
Όπως είπα η έκδοση του Leon που δοκίμασες είχε ένα σημαντικό bug στην μηχανή αναζήτησης και σ' ευχαριστώ που ήσουν αυτός που με έδωσε να καταλάβω που βρίσκεται και να το διορθώσω.

Δεν χρειαζεται να με ευχαριστεις καθως αυτο που ψαχνω ειναι ενας οσο το δυνατον δυνατοτερος παικτης ταβλιου γιανα αναλυω παρτιδες και το Leon εχει τις προοπτικες για να γινει ακριβως αυτο(οταν προσθεσεις δυνατοτητες αναλυσης και rollouts ).

Λειτουργίες ανάλυσης είναι στο todo list.
Πίστεψέ με ότι δεν θα σε απογοητεύσω..

Ωραια τοτε!

Εδώ κατάλαβα που βρίσκεται το bug στην μηχανή αναζήτησης.
Σ' ευχαριστώ!!!

Το Leon δεν έχει randomizer στις κινήσεις.

Θα σε παρακαλούσα να ξανακατεβάσεις το Leon με το διορθωμένο bug και να ξανακάνεις τις δοκιμές σου.

Επικοινώνησε μαζί μου!

Α δεν εχει αλλά συμπεριφεροταν σαν να ειχε. ΟΚ ευτυχως που διορθωθηκε το προβλημα γιατι δεν ειχε νοημα και λογικη οπως ειπα να μην παιζει παντα την ιδια κινηση σε μερικες θεσεις(σε αρκετες).

Οπως καταλαβαινω(απο την εμπειρια μου στα προγραμματα σκακιου κυριως) τετοια προβληματα κοστιζουν ακομα και εκατονταδες ποντους δυναμικοτητας Elo. Ευτυχως που διορθωθηκε και ανυπομονω να δοκιμασω το διορθωμενο. Οπως ειπα και πιο πανω βεβαια δεν ξερω αν θα λειτουγρει ακομα στον υπολογιστη μου, αλλά θα το κατεβασω το βραδυ και θα δω....

FarCry · 13 Σεπτεμβρίου 2011

"Τεχνικες" κινησεις(technical play) στο ταβλι ονομαζονται οι κινησεις που πρεπει να δεις να σκεφτεις/αναλυσεις μπροστα την θεση για να παιξεις σωστα, δηλαδη να πεις αν παιξω αυτη την κινηση τοτε ο αντιπαλος αν φερει το Χ ζαρι θα παιξει ετσι οποτε...., ενω αν φερει το Υ ζαρι θα παιξει ετσι οποτε...., ενω αν παιξω την αλλη κινηση τοτε......, κλπ, κλπ.

Σε αυτες χρειαζεται τα προγραμματα να κοιτανε μπροστα καποια ply. Και οπως ανεφερα για τις πορτες ειναι αρκετο το να κοιτανε 3 ply. Για το πλακωτο ομως δεν ειναι, και το οριο γινεται 5 ply σιγουρα αν και μπορει να ειναι και υψηλοτερο. Και 5 ply με minimax δεν γινεται να ψαξει καποιο προγραμμα. Οποτε αναγκαστικα η μόνη μεθοδος που ειναι γνωστη και μπορει να επιτευχθουν 5 plies ειναι το STAR2 για αυτο και ρωτησα αν εχει δοκιμασει αυτο τον αλγοριθμο στο πλακωτο και καλο θα ηταν να τον δοκιμαζε.

Αντιθετα η κριση/εκτιμηση για μια θεση, οταν δεν χρειαζονταν τεχνικη κινηση δηλαδη, ηταν το δυνατο σημειο των bots και θεωρουνταν μαλλον λιγο καλυτερα απο τους τοπ ανθρωπους καθως με την εκπαιδευση τους σε εκατομμυρια παιχνιδια ειχαν συναντησει παρομοια θεση(οχι αναγκαστικα ιδια) και ηξεραν καλυτερα απο τους ανθρωπους τι να κανουν.

α οκ ειχα λαθος κατανοηση των τεχνικων κινησεων. νομιζα το αναποδο

Anaksimandros4 · 14 Σεπτεμβρίου 2011

Οχι δεν υποτιμαω αλλά ειναι σχετικα απλο και straightforward να φτασεις σε ενα επιπεδο που να συγκρινεται με τα κορυφαια προγραμματα(πλεον βεβαια το ExtremeGammon εχει θεσει τον πηχη παρα πολυ ψηλα) εστω και αν ειναι λιγο χειροτερο απο αυτα:

Unsupervised learning με TD(0) εκπαιδευση σε ΑΝΝς και παιζεις 50 εκατομμυρια παρτιδες και αν δεν εχεις σοβαρα bug εχεις ενα σουπερ δυνατο ΑΙ.

Αντιθετα στο σκακι εαν αρχισεις απο την αρχη για να φτιαξεις ενα συγκρισιμο ΑΙ με τα Houdini, Rybka, Critter, Naum, Hiarcs, Fritz, κλπ......οπως ειπα ΔΕΝ ΓΙΝΕΤΑΙ. Πρεπει να δουλευεις καμια 10αρια χρονια πανω σε αυτο(εκτός αν "κλεψεις" και δεις τον κωδικα του Ippolitή του Stockfish πχ). Το να φτιαξεις ενα πολυ λιγοτερο δυνατο προγραμμα, φυσικα και γινεται σχετικα ευκολα.

Και για να μην παρερμηνευθω δεν εννοω οτι ειναι ευκολο και απλο, αλλά σχετικα ευκολο και σχετικα απλο. Καμια σχεση το ενα με το αλλο φυσικα.

Σχετικα παντα σε σχεση με το σκακι.

KostasKarditsa · 17 Σεπτεμβρίου 2011

Το εμαιλ μου ειναι:

ana555[email protected]

(αφαιρωντας το 555)

Μπορείς να μου στείλεις με email το Install Code σου?

Ναι πες μου ποιο ακριβως ηταν το προβλημα, παντα ενδιαφερομαι για αυτα.

Ένα global Array που έπρεπε να αντιγραφεί σε local array κατά τη διάρκεια του searching.

Η πλάκα είναι ότι το έκανα αντιγραφή, αλλά χρησιμοποίησα κατά λάθος το global array..

Οπότε η διόρθωση ήταν απλώς θέμα ενός δευτερολέπτου...

Unsupervised learning με TD(0) εκπαιδευση σε ΑΝΝς και παιζεις 50 εκατομμυρια παρτιδες και αν δεν εχεις σοβαρα bug εχεις ενα σουπερ δυνατο ΑΙ.

Δεν ξέρω πόση εμπειρία έχεις σ' αυτό αλλά δεν είναι τόσο απλό.

Στα τουρνουα μου παντως παντα η σειρα ηταν Ntest, Edax, Herakles, Zebra αν και η Ζεβρα καμια φορα ερχοταν και 3η. Την Ζεβρα την ανεφερα διοτι παντα της ειχα αδυναμια λογω του endgame παιξιματος της.

Επειδή έχω παίξει εκατοντάδες εάν όχι χιλιάδες παρτίδες με αυτά τα προγράμματα στο GGS η διαφορά είναι όπως την περιέγραψα.

Και αυτο οφειλεται στο οτι το σκακι ειναι πολυ πιο δυσκολο οπως φαινεται να κανουμε τον υπολογιστη να το μαθει απο οτι το backgammon. Στο backgammon βρηκαμε το TD(L) learning μαζι με τα νευρωνικα δικτυα και τελος. Σουπερ επιπεδο! Απο εκει και περα οι διάφορες αλλες μεθοδοι και τεχνικες δινουν περαιτερω δυναμη στα προγραμματα αλλά οχι κατι το ιδιαιτερο και ο σκελετος της δυναμης παραμενει η εκπαιδευση των ΑΝΝς.

Αντιθετα στο σκακι η προοδος γινεται σιγα σιγα. Ακομη και τωρα ανακαλυπτονται νεες τεχνικες αναζητησης, νεοι τροποι ρυθμισης και τιμες για την eval(), που δινουν πολλα πολλα ΕΛΟ παραπανω.

Απλά στο σκάκι χρειάζεται μια πολύ γρήγορη μηχανή αναζήτησης.

Δεν είναι κατά τη γνώμη μου το σκάκι δυσκολότερο από το τάβλι.

Σε προκαλώ να το δοκιμάσεις

Οσο για τα περισσοτερα παιχνιδια, το να φτασει σε καποιο σημειο ωστε να γινεται χειροτερη η εξυπναδα του με επιπλεον παιχνιδια, δεν το πιστευω και πιστευω οτι απλως δεν θα υπαρχει περαιτερω βελτιωση απο εκει και περα, θα συμβει δηλαδη αυτο που λεμε ο νόμος των diminishing returns. Δεν θα εχουμε αναποκριση (εξυπνοτερου ΑΙ) με λιγα λογια στην εκπαιδευση που κανουμε.

Ένα πολύ βασικό πρόβλημα είναι το generalization όπως και το overfitting.

Καταλαβα.

Αυτο δυστυχως στο ταβλι γενικα δεν λειτουργει.

Συμφωνώ με το παράδειγμά σου, αλλά μην ξεχνάς ότι παίχτηκαν 5000 διπλές παρτίδες.

Αχα!! Δηλαδη εχεις και selective search στο Leon!!

Λογικο, ναι.... Σκετο minimax για να ψαξει με brute force 3 ply μπροστα κάνει πολυ χρονο?

Σκέτο expectimax!? Ξέχνα το...

Δεν μπορώ να σου πω με ακρίβεια το χρόνο γιατί εξαρτάται από τις θέσεις, αλλά τουλάχιστον 10 με 100 φορές περισσότερο...

Επεξ/σία 19 Σεπτεμβρίου 2011 από KostasKarditsa

KostasKarditsa · 23 Μαρτίου 2012

Γειά σας παιδιά.

Μετά από λίγο καιρό το επόμενο update του Leon είναι έτοιμο.

Στην καινούργια έκδοση 1.2 υπάρχει πολύ μεγάλη βελτίωση στο πλακωτό.

Η παλαιότερη έκδοση του πλακωτού είχε ένα σημαντικό σφάλμα κατά την διαδικασία μάθησης με αποτέλεσμα κάποιες φορές το Leon να μην παίζει καλές κινήσεις στο πλακωτό. Ιδιαίτερα δε να αφήνει τη μάνα του ανοιχτή...

Με την καινούργια έκδοση το πλακωτό είναι περίπου 0.45(!) πόντους ανά παιχνίδι ισχυρότερο, μια πραγματικά πολύ σημαντική βελτίωση.

Επίσης υπήρχουν κάποιες βελτιώσεις στη μηχανή αναζήτησης.

Το Leon μπορείτε να το κατεβάσετε εδώ: www.leon.tournavitis.de

Καλές ζαριές!

KostasKarditsa · 17 Φεβρουαρίου 2013

Alpha version του Leon (mobile για Android) ως freeware! για testing

Μετά από κάποια προσπάθεια το Leon τρέχει τώρα και σε περιβάλλον Android!

Μπορείτε να κατεβάσετε την εφαρμογή για κινητά ή tablets για Android εδώ: http://www.tournavitis.de/leon/mobile/Leon.apk

Αυτή η έκδοση για Android δίνεται δωρεάν!

Θα ήθελα να ακούσω την γνώμη σας και προβλήματα συμβατότητας με διάφορα κινητά ή tablets ώστε να

γίνει καλύτερη!

Η mobile έκδοση του Leon χρησιμοποιεί τον ίδιο κώδικα με την έκδοση για windows οπότε πρόκειται ουσιαστικά για την ίδια εφαμρμογή όπως την ξέρεται και από το περιβάλλον windows.

savvas1340 · 6 Μαρτίου 2013

Alpha version του Leon (mobile για Android) ως freeware! για testing

Μετά από κάποια προσπάθεια το Leon τρέχει τώρα και σε περιβάλλον Android!

Μπορείτε να κατεβάσετε την εφαρμογή για κινητά ή tablets για Android εδώ: http://www.tournavitis.de/leon/mobile/Leon.apk

Αυτή η έκδοση για Android δίνεται δωρεάν!

Θα ήθελα να ακούσω την γνώμη σας και προβλήματα συμβατότητας με διάφορα κινητά ή tablets ώστε να

γίνει καλύτερη!

Η mobile έκδοση του Leon χρησιμοποιεί τον ίδιο κώδικα με την έκδοση για windows οπότε πρόκειται ουσιαστικά για την ίδια εφαμρμογή όπως την ξέρεται και από το περιβάλλον windows.

Ετσι λίγο που έπεξα, τα options δε δουλευουν,δεν εχει ηχο και στο φεύγα κολλάει.Το κιν είναι το nexus s.

Θα επανέλθω.

Σύνδεση

Leon - το ισχυρότατο πρόγραμμα Η/Υ για τάβλι που παίζει πόρτες, πλακωτό και φεύγα

Προτεινόμενες αναρτήσεις

Anaksimandros4

Συχνή συμμετοχή στο θέμα

Δημοφιλείς Ημέρες

Συχνή συμμετοχή στο θέμα

Δημοφιλείς Ημέρες

FarCry

Anaksimandros4

FarCry

Anaksimandros4

KostasKarditsa

Anaksimandros4

PostHelper

Anaksimandros4

FarCry

Anaksimandros4

KostasKarditsa

KostasKarditsa

KostasKarditsa

savvas1340

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Δημιουργία λογαριασμού

Σύνδεση

Σύνδεση