Προς το περιεχόμενο

nVIDIA 6600 vs 6800


giorkosleshi

Προτεινόμενες αναρτήσεις

Δεν είναι δα και δύσκολο. ΄Ενα καλό ποσοστό τεχνικών όρων έχουν την ρίζα τους στα ελληνικά ή και λατινικά.

 

Den exeis adiko, alla an rixeis mia matia se merika periodika tha katalaveis apo pou erxetai h ekplhxh mou.

 

Η εν λόγω μηχανή του παιχνιδιού έχει κάποιες "μικρο-διαφωνίες" με το ιεραρχικό Z των Radeon.

 

An to exei apodeixei kanenas auto, tha borouses na moirasteis mazi mou to link? :) Apo oles tis exhghseis pou eixa akousei gia thn xamhlh apodwsh twn radeon sto doom3 auth fainotan h pio logikh arxika. Sygekrimena eixa akousei to arxiko z-pass "spaei" to hierachical-z. Apo thn allh omws, sto gt2 tou 3dmark03 pou douleyei ki auto me arxiko z-pass, to r420 einai poly pio konta sto nv40 (an kai h apodwsh sto gt2 exartatai arketa perissotero apo to gpu apo oti h apodwsh sto doom3).

 

Κυρίως αν τα παιχνίδια που θα ακολουθήσουν θα πραγματώνονται σε εξωτερικά περιβάλλοντα, όπου οι πολλές σκιάσεις δεν θα είναι στον ίδιο βαθμό απαραίτητες.

 

Akrivws, an kai akoma kai to idio to doom3 de tha borousa na pw oti kanei ypervolikh xrhsh twn stencil shadows kathws se arketa shmeia gia to fwtismo tou perivallontos xrhsimopoiei lightmaps an kai de borw na pw me sigouria an to kanei gia artistikous logous h logous apodwshs.

 

Μου έλειψε όμως και κάπως το Supersampling των GeForces, ειδικά για εκείνες τις περιπτώσεις που η επίδοσεις δεν έχουν τόσο μεγάλη σημασία και το Multisampling αδυνατεί να εξομαλύνει.

 

Paromoiws, arxisa na testarw enan Lineage2 server prin ligo kairo kai to game einai gemato me alpha textures :X Apo thn allh omws, de nomizw na einai poly dyskolo gia kapoion developer na ftiaxei enan supersampling algorithmo gia to game tou, an kai h zhthsh den einai arketa megalh gia na to kanei kanenas.

 

Η απλή 6800 πάντως δε μου γέμιζε το μάτι, αφου σε επιδόσεις ήταν λίγο πιο πάνω ή στα ίδια επίπεδα με μια 9800ΧΤ.....Τα πρώτα benches που είδα για το Hλlflife2 ήταν πολύ απογοητευτικά αφου η ΑΤΙ ήταν μπροστά μέχρι και 50% σχεδόν!!! Δείτε το άρθρο ακολουθώντας το link στη σελίδα του rage3d.gr. Στο forum ωστόσο διάβασα οτι όσοι έτρεξαν στο σπίτι τους το HL2 Stress Test, με NV είχαν σε μερικές περιπτώσεις μεγάλες διαφορές απο το benchmark του site και με πολύ μικρότερα μηχανήματα! Δεν νομίζω οτι δε θα μπορώ να παίξω το HL2 με φουλ λεπτομέρειες σε οποιαδήποτε ανάλυση σηκώνει η οθόνη μου με την 6800GT, αφου είδα βγάζει σε 2500+ με 1gb ram, περίπου 70-80 frames (1280x1024)...

Εντυπωσιάστηκα με τις γνώσεις του αιλουρου πάνω στο θέμα hardware ωστόσο λόγω πρωινού ξυπνήματος δε διάβασα όλο το post! Very Happy

 

Gia na synopsisoume kapws ti paizei, apo th mia den theorw ta benchies tou cs:source antiprosopeytika ths apodwshs twn gpus sto hl2. Apo kei kai pera, an psaxeis ligo tha vreis benchies gia kathe gousto, prama pou me anagazei na amfisvitw ta panta mexri na to dw me ta matia mou/na dw review apo kapoio site pou empisteyomai 100%. Fysika to gegonos oti to pcperspective vrhke shmantikes diafores metaxy radeon kai geforce oson afora to apotelesma tou rendering, de voithaei kai poly thn katastash. Pantws den exeis tipota na fovasai oson afora thn apodwsh ths kartas sou (6800gt den exeis?) sto hl2. Opws exw xanapei, opoiadhpote highend karta kai na parei kapoios se auth th genia kartwn, de borw na pw oti h X etairia ton epiase koroido (isws na to elega prin kana xrono+). Sigoura osoi exoun poly sygekrimenes apaithseis tha prosanatolistoun pros thn etairia pou tis kalyptei kalytera alla den borw na pw oti to ena highend chip den axizei ta lefta tou se sxesh me to allo.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

  • Απαντ. 46
  • Δημ.
  • Τελ. απάντηση

Sas parakalo, apla dierotithika pia apo tis dio einai i kaliteri kai katelixa sto ti tha paro

to na kavgadizete de voitha kanena kai me to na grafete mia selida post me asxeta themata tha empodisi ton opoiondipote na dei kai ta sxetika pou einai grammena gi afto (kanei an xanagrapsete en na koftaro) Metafrasi: sas parakalo an exete kati sxetiko na peite peste to alios min peite tipota

 

Pantote filika vevaios o giorkos

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

giorkosleshi,

 

Αν και μπήκα στην συζήτηση λίγο αργά, όλοι λίγο πολύ παρασυρόμαστε. Να θυμάσαι γενικά ότι ότι πληρώνεις παίρνεις με ελάχιστες εξαιρέσεις. Οτιδήποτε 6600 ανήκει στην μέση κατηγορία και οτιδήποτε 6800 στην ανώτερη κατηγορία.

 

Αν η εξομάλυνση γωνιών ή το ανισοτροπικό φιλτράρισμα σε αφήνουν αδιάφορο και δεν έχεις σκοπό να χρησιμοποιήσεις αναλύσεις πλέον του 1024*768*32 και μια 6600 ή αντίστοιχη κάρτα του ανταγωνισμού πιστεύω ότι θα σε εξυπηρετήσει μια χαρά. Σε κάθε αντίθετη περίπτωση όσο αυξάνονται οι απαιτήσεις σου, σε αναλογία θα πρέπει να πληρώσεις και υψηλότερη τιμή.

 

--------------------------------------------------------------------

 

Den exeis adiko, alla an rixeis mia matia se merika periodika tha katalaveis apo pou erxetai h ekplhxh mou.

 

Για να πάρω περιοδικό σχετικό με Η/Υ, θα πρέπει να περιέχει CD/DVD με υλικό που μου χρειάζεται και μου γλυτώνει χρόνο για το κατέβασμα από το δίκτυο. Σπάνια τα διαβάζω δε. ΄Οχι μόνο γιατί είναι περιττό να διαβάσω μπαγιάτικα νέα, αλλά για παράδειγμα τα τεστ καρτών γραφικών πολύ γνωστού ελληνικού περιοδικού με κάνουν να πεθαίνω στα γέλια από την άλλη.

 

 

An to exei apodeixei kanenas auto, tha borouses na moirasteis mazi mou to link? Apo oles tis exhghseis pou eixa akousei gia thn xamhlh apodwsh twn radeon sto doom3 auth fainotan h pio logikh arxika. Sygekrimena eixa akousei to arxiko z-pass "spaei" to hierachical-z. Apo thn allh omws, sto gt2 tou 3dmark03 pou douleyei ki auto me arxiko z-pass, to r420 einai poly pio konta sto nv40 (an kai h apodwsh sto gt2 exartatai arketa perissotero apo to gpu apo oti h apodwsh sto doom3).

 

Είναι αρκετά πολύπλοκη η εξήγηση και δεν έχει τόση σχέση με το Z-pass μιας και η Radeon υποστηρίζουν εδώ και δύο γενεές early-Z culling.

 

http://www.3dcenter.de/artikel/2004/07-30_english.php

 

Νομίζω ότι η μελέτη αυτή καλύπτει ει δυνατόν περισσότερο τις διαφορές.

 

Τώρα όσον αφορά το GT2/3 στο 3dmark03:

 

  • For every object:
  • Pass 1 (Early Z)
    Skin Object in Vertex Shader
    Pixel Shader writes Z, RGB = ambient, and Alpha = perspective Z

 

  • For every light:
  • For every object:

 

  • Pass 2 (Stencil Shadow Volume calculation)
    Set stencil to increment/decrement
    Skin Object in Vertex Shader
    Stencil extrusion calculation
    No Pixel Shader
     
  • Pass 3 (Lighting)
    Skin Object in Vertex Shader
    Pixel Shader (lighting) write RGB = color

 

Kάπως έτσι χειρίζονται και οι 2 εφαρμογές την επεξεργασία των σκιών. Την βασική διαφορά στην έχω τονίσει ήδη (όπςς βλέπεις) και όπως καταλαβαίνεις το Doom3 κάνει skinning μόνο μια φορά. Μια δοκιμή θα σε πείσει. Τρέξε τις 2 αυτές εφαρμογές με Software VS και σύγκρινε με τα κανονικά αποτελέσματα.

 

Οι επιδόσεις των Vertex Shaders γενικά εξαρτώνται σε μεγάλο βαθμό από τον χρονισμό του επεξεργαστή. X800PRO@475, 6k8GT@350, X800XT@520, 6k8U@400MHz.

 

Akrivws, an kai akoma kai to idio to doom3 de tha borousa na pw oti kanei ypervolikh xrhsh twn stencil shadows kathws se arketa shmeia gia to fwtismo tou perivallontos xrhsimopoiei lightmaps an kai de borw na pw me sigouria an to kanei gia artistikous logous h logous apodwshs.

 

Dynamic stencil shadows = relatively high polygon count scene, whereby >90% of those polygons being translucent = insane overdraw.

 

΄Ενας από τους γνωστούς τρόπους για να πολεμηθεί το Overdraw είναι η υστερημένη επεξεργασία (επεξεργαστής συλλέγει πληροφορίες πριν αρχίσει να επεξεργάζεται) ή αλλιώς deferred rendering. Το Doom3 όπως άλλωστε και κάθε early-Z προσαρμοσμένη εφαρμογή κάνουν ακριβώς αυτό. Καθυστερούν την επεξεργασία για να συλλέξουν πληροφορίες μέσα από πολλαπλά περάσματα για να ελαττώσουν το Overdraw (application driven deferred rendering; a unshaded pass followed immediately by a shaded pass).

 

Ουσιαστικά εδώ ο επεξεργαστής καλείται κάτα ένα μέρος να λειτουργήσει όπως ακριβώς ένας Tile based deferred renderer, με την μόνη διαφορά ότι ο δεύτερος το εκτελεί κατά κανόνα σε όλες τις εφαρμογές στους οδηγούς του, ενώ ο IMR σε αυτή την περίπτωση κάνει κάτι παρόμοιο μέσω πάντα της εφαρμογής.

 

΄Εχει λιγότερο σημασία η ποσότητα των σκιών και μεγαλύτερη πως ακριβώς χειρίζεται μια εφαρμογή τα περάσματα και τι περιέχει το καθένα. Μια αρκετά γνωστή προσομοίωση του μοντέλου σκιάσεων του Doom3 είναι το Fablemark. Φυσικά είναι εντελώς συνθετική εφαρμογή αλλά βοηθάει περισσότερο σε διάφορες δοκιμές λόγω του ότι είναι καθαρά stencil fillrate limited.

 

http://www.pvrdev.com/pub/PC/extra/h/FableMark.htm

 

Paromoiws, arxisa na testarw enan Lineage2 server prin ligo kairo kai to game einai gemato me alpha textures :X Apo thn allh omws, de nomizw na einai poly dyskolo gia kapoion developer na ftiaxei enan supersampling algorithmo gia to game tou, an kai h zhthsh den einai arketa megalh gia na to kanei kanenas.

 

To ερώτημα εδώ για την ATI είναι γιατί υποστηρίζεται το Supersampling μόνο στους Mac και όχι και στις άλλες πλατφόρμες.

 

΄Ενας developer θα μπορούσε να κάνει πολλά, αν οι πλειοψηφία των δεν έβλεπε την εξομάλυνση γωνιών σαν υπερβολική πολυτέλεια. Ιδανική λύση είναι να φτιαχτεί ένα παιχνίδι όπου η ίδια η εφαρμογή θα αποφασίζει αν θα χρησιμοποιήσει Supersampling ή Multisampling και που. Μακάρι η άλφα υφές να ήταν το μοναδικό πρόβλημα. ΄Ολα τα full screen effects (render 2 texture f.e.), pixel shaders, parallax mapping κλπ. αντιμετωπίζουν -αν όχι όλα εντελώς- σε κάποιο βαθμό πρόβλημα.

 

Μέχρι στιγμής τα πολύγωνα είναι αρκετά μεγάλα έτσι ώστε από άποψη επιδόσεων να έχει ακόμα για αρκετό καιρό νόημα το Multisampling. Εν ολίγοις οι πληροφορίες στο εσωτερικό των πολυγώνων ακόμα ξεπερνούν κατά ένα μεγάλο βαθμό το εξωτερικό τους (γωνίες). ΄Οσο θα μικραίνουν τα πολύγωνα όμως η αναλογία αυτή θα σπάει και δεν αποκλείεται διόλου οι πληροφορίες του εσωτερικού ενός πολύγωνου να γίνουν κάποτε μικρότερες από αυτές των γωνιών. Είναι όμως τόσο μακρινό που αποτελεί σχεδόν επιστημονική φαντασία. Προς στιγμήν φυσικά και προτιμώ το Multisampling για τον απλό λόγο ότι αποτελεί εξομάλυνση γωνιών υψηλών αναλύσεων, ενώ το Supersampling ροκανίζει ατέλειωτα τους ρυθμούς πλήρωσης και άρα δεν επιτρέπει τόσο υψηλές αναλύσεις.

 

Υπενθυμίζω ότι ουδείς αλγόρυθμος δεν λειτουργεί χωρίς την υποστήριξη του ανάλογου hardware (άσχετα ότι εξ ορισμού ο αλγόριθμος δεν είναι καν λογισμικό). Ιδανικό παράδειγμα μελλοντικής ουτοπίας η 64-πλη στοχαστική εξομάλυνση γωνιών (Supersampling and temporal antialiasing) που χρησιμοποιεί η Pixar. Ποιός δεν είδε το Finding Nemo; :wink:

 

***edit: crappy BB code :cry:

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Sas parakalo, apla dierotithika pia apo tis dio einai i kaliteri kai katelixa sto ti tha paro

to na kavgadizete de voitha kanena kai me to na grafete mia selida post me asxeta themata tha empodisi ton opoiondipote na dei kai ta sxetika pou einai grammena gi afto

 

Zthw sygnwmh an vghkame kapws apo to arxiko thema tou topic, an kai exw anaferei th gnwmh mou arketa replies pisw. Dystyxws einai sth fysh twn perissoterwn syzhthsewn na exelissontai kai na xanoun ligo-poly ton arxiko tous stoxo. Apo kei kai pera, de nomizw mia syzhthsh san thn parousa na kanei kako se kanenan, mallon to antitheto.

 

Είναι αρκετά πολύπλοκη η εξήγηση και δεν έχει τόση σχέση με το Z-pass μιας και η Radeon υποστηρίζουν εδώ και δύο γενεές early-Z culling.

 

http://www.3dcenter.de/artikel/2004/07-30_english.php

 

Νομίζω ότι η μελέτη αυτή καλύπτει ει δυνατόν περισσότερο τις διαφορές.

 

Gnwrizw tis texnikes pou xrhsimopoiei h kathe karta, to sygekrimeno arthro omws den anaferei eytheos to logo pou to hi-z den leitourgei sto doom3.

 

Kάπως έτσι χειρίζονται και οι 2 εφαρμογές την επεξεργασία των σκιών. Την βασική διαφορά στην έχω τονίσει ήδη (όπςς βλέπεις) και όπως καταλαβαίνεις το Doom3 κάνει skinning μόνο μια φορά. Μια δοκιμή θα σε πείσει. Τρέξε τις 2 αυτές εφαρμογές με Software VS και σύγκρινε με τα κανονικά αποτελέσματα.

 

Akrivws epeidh to gt2/3 kanei to skinning sto vertex shader anafera oti einai pio gpu-dependant apo to doom3. An katalava kala, les oti oute sto d3 oute sto gt2/3 douleyei to hi-z kai h diafora metaxy nv40 kai r420 ofeiletai apokleistika sthn apodwsh twn vs ths kathe kartas. Tha psaxw na vrw scores tou gt2 apo ta 2 chips xronismena sthn idia syxnothta kai tha sygrinw posostiaka th diafora me to d3...

 

EDIT: Hmm, h diafora metaxy x800xtpe kai 6800u se oso kontinoteres syxnothtes borousa na vrw (5mhz mikrotero to core clock kai 50mhz megalytero to memclock ths 6800u) htan ~20%. Se polles periptwseis einai paromoia kai h diafora tous sto d3, alla se alles h x800 einai arketa pio pisw. Opws kai na xei einai h pio orthh exhghsh pou exw akousei mexri twra...

 

 

Dynamic stencil shadows = relatively high polygon count scene, whereby >90% of those polygons being translucent = insane overdraw.

 

Enneoitai oti an eixe gia ta panta stencils h apodwsh tha htan akoma pio xamhlh, alla se merika shmeia pisteyw tha htan ligotero atmosfairiko an anti gia lightmaps eixe katamaura stencils ;)

 

΄Ενας από τους γνωστούς τρόπους για να πολεμηθεί το Overdraw είναι η υστερημένη επεξεργασία (επεξεργαστής συλλέγει πληροφορίες πριν αρχίσει να επεξεργάζεται) ή αλλιώς deferred rendering.

 

Na ypothesw oti eisai fan ths powervr? :lol:

 

Μακάρι η άλφα υφές να ήταν το μοναδικό πρόβλημα. ΄Ολα τα full screen effects (render 2 texture f.e.), pixel shaders, parallax mapping κλπ. αντιμετωπίζουν -αν όχι όλα εντελώς- σε κάποιο βαθμό πρόβλημα.

 

Symfwnoi, an kai pros to paron h pleiopshfia oswn apaitoun supersampling to theloun exaitias twn alpha textures. Sigoura kapou sto makry mellon h tha gyrisoume se kapoia morfh supersampling h tha exoume kateytheian para poly ypshlh analysh.

 

To ερώτημα εδώ για την ATI είναι γιατί υποστηρίζεται το Supersampling μόνο στους Mac και όχι και στις άλλες πλατφόρμες.

 

Pithanotata gia na apofygei apples-to-oranges sygriseis me kartes allwn etairiwn.

 

Προς στιγμήν φυσικά και προτιμώ το Multisampling για τον απλό λόγο ότι αποτελεί εξομάλυνση γωνιών υψηλών αναλύσεων, ενώ το Supersampling ροκανίζει ατέλειωτα τους ρυθμούς πλήρωσης και άρα δεν επιτρέπει τόσο υψηλές αναλύσεις.

 

Ektws tou oti trwei to fillrate, pros to paron toulaxiston, nomizw oti oi kartes exoun ena sxetika mikro orio oson afora th megisth analysh sthn opoia boroun na kanoun ypologismous opote akoma kai an eixame arketo fillrate gia 8x SSAA se 1600x1200 as poume, de nomizw na eftane gia na doulepsei to en logo mode.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Hmm, h diafora metaxy x800xtpe kai 6800u se oso kontinoteres syxnothtes borousa na vrw (5mhz mikrotero to core clock kai 50mhz megalytero to memclock ths 6800u) htan ~20%. Se polles periptwseis einai paromoia kai h diafora tous sto d3, alla se alles h x800 einai arketa pio pisw. Opws kai na xei einai h pio orthh exhghsh pou exw akousei mexri twra...

 

http://www.beyond3d.com/forum/viewtopic.php?p=10148&highlight=hierarchical+z#10148

 

΄Ισως βοηθήσει το παραπάνω λίγο παραπάνω; ΄Οπως καταλαβαίνεις και να ξέρω κάποιες λεπτομέρειες παραπάνω, υπάρχουν συνήθως άγραφοι κανόνες εχεμύθειας. Το σημαντικότερο κομμάτι είναι αυτό:

 

That is, the solution to the first problem is to use a combination of hierarchical z and parallel z checks (a combination of ATI's and NVidia's approaches).

 

 

Na ypothesw oti eisai fan ths powervr?

 

΄Εχω άριστες σχέσεις με τις περισσότερες εταιρίες εδώ και χρόνια. ΄Εχω αδυναμία στην επάρκεια και οι TBDR είναι γνωστοί για αυτό. Δυστυχώς ούτε η ATI ούτε η NVIDIA προβλέπεται να κάνουν ποτέ τόσο δραστικές αλλαγές, αλλά η ελπίδα λένε πεθαίνει τελευταία.

 

Symfwnoi, an kai pros to paron h pleiopshfia oswn apaitoun supersampling to theloun exaitias twn alpha textures. Sigoura kapou sto makry mellon h tha gyrisoume se kapoia morfh supersampling h tha exoume kateytheian para poly ypshlh analysh.

 

΄Οχι απαραίτητα. Πάρε παράδειγμα το F1 2002 ή όσα παιχνίδια της EA χρησιμοποιούν την ίδια μηχανή παιχνιδιού. Οι σκιές επειδή ακριβώς είναι από render 2 texture με το Multisampling δεν εξομαλύνονται καθόλου.

 

Pithanotata gia na apofygei apples-to-oranges sygriseis me kartes allwn etairiwn.

 

Οι λόγοι είναι μάλλον βαθύτεροι και όσο και αν θέλω δεν μπορώ να μπω σε λεπτομέρειες τι ακριβώς υποψιάζομαι. Αν βοηθάει ακόμα και το R200 ήταν ουσιαστικά σχεδιασμένο για Multisampling. Για κάποιον παράξενο λόγο οι 2 μεθόδοι δεν μοιάζουν να θέλουν να συνυπάρξουν. Και όχι οι Mac δεν είναι η απόλυτη απόδειξη του αντίθετου.

 

Ektws tou oti trwei to fillrate, pros to paron toulaxiston, nomizw oti oi kartes exoun ena sxetika mikro orio oson afora th megisth analysh sthn opoia boroun na kanoun ypologismous opote akoma kai an eixame arketo fillrate gia 8x SSAA se 1600x1200 as poume, de nomizw na eftane gia na doulepsei to en logo mode.

 

Υπάρχουν πολλοί τρόποι να εξομαλύνει κανείς και δεν είναι απολύτως απαραίτητο να χρησιμοποιηθούν οι ως τώρα γνωστές μεθόδοι. Yπάρχουν πολλές εναλλακτικές λύσεις που εξερευνούνται αυτή τη στιγμή. Για μεγαλύτερο από 6xMSAA οι απαιτήσεις στην ποσότητα μνήμης και στο εύρος μνήμης είναι προς το παρών υπερβολικές. Για εξαπλό οι Radeon καταναλώνουν πάνω από 100MB στα 1600*1200, για 8xMSAA ούτε λόγος, πόσο μάλλον για Supersampling.

 

Αν το Fragment AA της Parhelia δεν είχε τις γνωστές αδυναμίες, θα ήταν ίσως ένας από τους πιο ενδιαφέροντες αλγόρυθμους. Απαιραίτητη θα ήταν βέβαια η ανάμιξή του με τεχνικές τύπου coverage mask (two pass mechanisms, early-Z alike), γιατί ο εντοπισμός των γωνιών γίνεται συνήθως με back to front. Αυτονόητο δε θα ήταν να μην έχει μόνο ένα 4*4 grid όπως στην Parhelia, αλλά 16*16.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

http://www.beyond3d.com/forum/viewtopic.php?p=10148&highlight=hierarchical+z#10148

 

΄Ισως βοηθήσει το παραπάνω λίγο παραπάνω

 

Thanks for the info :)

 

΄Οχι απαραίτητα. Πάρε παράδειγμα το F1 2002 ή όσα παιχνίδια της EA χρησιμοποιούν την ίδια μηχανή παιχνιδιού. Οι σκιές επειδή ακριβώς είναι από render 2 texture με το Multisampling δεν εξομαλύνονται καθόλου.

 

Gia thn pleiopshfia milisa ;)

 

Οι λόγοι είναι μάλλον βαθύτεροι και όσο και αν θέλω δεν μπορώ να μπω σε λεπτομέρειες τι ακριβώς υποψιάζομαι. Αν βοηθάει ακόμα και το R200 ήταν ουσιαστικά σχεδιασμένο για Multisampling. Για κάποιον παράξενο λόγο οι 2 μεθόδοι δεν μοιάζουν να θέλουν να συνυπάρξουν. Και όχι οι Mac δεν είναι η απόλυτη απόδειξη του αντίθετου.

 

Hmm, twra me vazeis se skepseis :? Isws psaxw na vrw apanthsh...

 

Υπάρχουν πολλοί τρόποι να εξομαλύνει κανείς και δεν είναι απολύτως απαραίτητο να χρησιμοποιηθούν οι ως τώρα γνωστές μεθόδοι.

 

Sto mellon, nai. Sto paron, to quote yourself, ουδείς αλγόρυθμος δεν λειτουργεί χωρίς την υποστήριξη του ανάλογου hardware. Ektws an yponnoeis vevaia oti yparxei se parontika chips...

 

Για μεγαλύτερο από 6xMSAA οι απαιτήσεις στην ποσότητα μνήμης και στο εύρος μνήμης είναι προς το παρών υπερβολικές.

 

Nomizw kapou eixa diavasei oti ta nea chips borousan na kanoun address 512mb vram kai oti ta reference pcbs tous eixan ftiaxtei me auto to skopo sto nou, opote de nomizw h posothta ths mnhmhs na apotelei provlhma gia poly, toulaxiston sta high-end boards. Proswpika pio poly fovamai gia to bandwidth, mias kai anevainei me poly argous rythmous twra teleytaia.

 

Αν το Fragment AA της Parhelia δεν είχε τις γνωστές αδυναμίες, θα ήταν ίσως ένας από τους πιο ενδιαφέροντες αλγόρυθμους. Απαιραίτητη θα ήταν βέβαια η ανάμιξή του με τεχνικές τύπου coverage mask (two pass mechanisms, early-Z alike), γιατί ο εντοπισμός των γωνιών γίνεται συνήθως με back to front. Αυτονόητο δε θα ήταν να μην έχει μόνο ένα 4*4 grid όπως στην Parhelia, αλλά 16*16.

 

That would be nice :)

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Sto mellon, nai. Sto paron, to quote yourself, ουδείς αλγόρυθμος δεν λειτουργεί χωρίς την υποστήριξη του ανάλογου hardware. Ektws an yponnoeis vevaia oti yparxei se parontika chips...

 

Δυστυχώς για μένα δεν υπάρχουν high end TBDRs στην αγορά. Θεωρητικά όμως όχι μόνο μπορούν να χρησιμοποιήσουν πολλά samples (=/>16x samples) με ελάχιστη μνήμη, αλλά καταφέρνουν Supersampling bandwidth free και Μultisampling fillrate & bandwidth free, χωρίς συμπίεση χρωμάτων ή άλλες βελτιώσεις.

 

Είναι απορίας άξιον πως και η NVIDIA δεν χρησιμοποίησε GIGAPIXEL IP για τα μικρά ενσωματωμένα τσιπάκια (PDA/mobile).

 

Παρακάτω έπεσες διάνα όσον αφορά το εύρος μνήμης. Τι εξοικονομεί ένας deferred renderer κυρίως; Εύρος μνήμης.

 

Nomizw kapou eixa diavasei oti ta nea chips borousan na kanoun address 512mb vram kai oti ta reference pcbs tous eixan ftiaxtei me auto to skopo sto nou, opote de nomizw h posothta ths mnhmhs na apotelei provlhma gia poly, toulaxiston sta high-end boards. Proswpika pio poly fovamai gia to bandwidth, mias kai anevainei me poly argous rythmous twra teleytaia.

 

Να και η διάνα που λέγαμε. ΄Οσον αφορά την μνήμη:

 

Eric Demers (aka "sireric" ένας από τους πατέρες των R3xx/4xx και βάλε)

 

One thing people do have to realize is that if you use a lossless algorithm such as ours (lossy ones can only degrade quality), the memory used by the back buffer can be quite large. At 1600x1200 with 6xAA, our buffer consumption is over 100 MBs of local memory space. Going to 8xAA would have blown passed 128MB. Consequently, with a lossless algorithm, the increase in subsamples must be matched with algorithm changes or with larger local storage. We've looked at things such as randomly altering the programmable pattern, but the low frequency noise introduced was worst than the improvement in the sampling position. Unless you have 32~64 subsamples, introducing random variations is not good. So we are looking at other solutions and algorithms.

 

***edit: oooops link:

 

http://www.3dcenter.de/artikel/2003/11-06_english.php

***

 

΄Εχουμε ξεφύγει όμως πάρα μα πάρα πολύ από το θέμα. Η επόμενη γενιά των καρτών θα υποστηρίζει ούτως ή άλλως ως και 512MB on board ram, οπότε τουλάχιστον ένα από τα προβλήματα θα έχει λυθεί.

 

Δυστυχώς ο αλγόρυθμος του NV40 όχι μόνο δεν είναι προγραμματιζόμενος όπως στην ATI, αλλά ενώ θεωρητικά θα ήταν δυνατόν να εκτελέσει μέχρι και 16x MSAA, το κύριο εμπόδιο είναι το εύρος μνήμης και η ποσότητα της μνήμης. Για τετραπλό MSAA η κάρτα περνάει ένα δεύτερο loop των 2x samples και εκεί τελειώνει και η ιστορία.

 

***edit:

 

Το παρέβλεψα εντελώς....φυσικά και είχαν σχεδιαστεί οι τωρινές κάρτες για εώς και 512MB GDDR3. Μόνο που θα καταλείγαμε σε κάρτες με τιμές έναρξης των ~700$, εάν θα είχαν εξοπλιστεί με τόσο πολύ μνήμη.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δυστυχώς για μένα δεν υπάρχουν high end TBDRs στην αγορά. Θεωρητικά όμως όχι μόνο μπορούν να χρησιμοποιήσουν πολλά samples (=/>16x samples) με ελάχιστη μνήμη, αλλά καταφέρνουν Supersampling bandwidth free και Μultisampling fillrate & bandwidth free, χωρίς συμπίεση χρωμάτων ή άλλες βελτιώσεις.

 

To Multisampling outws h allws den einai fillrate-free ? Opws kai na xei, an kai tha hthela na dw Series5 se desktop, dyskolo to kovw na to doume.

 

Δυστυχώς ο αλγόρυθμος του NV40 όχι μόνο δεν είναι προγραμματιζόμενος όπως στην ATI, αλλά ενώ θεωρητικά θα ήταν δυνατόν να εκτελέσει μέχρι και 16x MSAA, το κύριο εμπόδιο είναι το εύρος μνήμης και η ποσότητα της μνήμης. Για τετραπλό MSAA η κάρτα περνάει ένα δεύτερο loop των 2x samples και εκεί τελειώνει και η ιστορία.

 

Ontws, alla egw anarwtiemai pws h nvidia den exei vgalei temporal (pou sigoura isws einai axrhsto se arketa nea games stis perissoteres kartes, se palia omws kanei thaumata :) ) akoma. H prwth mou skepsei htan oti den einai arketa programmatisimo to hardware alla meta thymithika oti eixa diavasei kapou se ena review (htane kai palio kai de thymamai link :X) oti me ena sygekrimeno driver set h 5200 otan rythmizotan gia 4xAA sto control panel, ekane 2xT. Malista thymamai oti eixe kai ena gifaki gia na deixei pws fainotan se kinish (den xerw an ekane force vsync ki olas, alla opws kai na eixe 5200 htan kai den epiane ta apaitoumena frames gia na mhn "xoreyoun" ta jaggies).

 

Το παρέβλεψα εντελώς....φυσικά και είχαν σχεδιαστεί οι τωρινές κάρτες για εώς και 512MB GDDR3. Μόνο που θα καταλείγαμε σε κάρτες με τιμές έναρξης των ~700$, εάν θα είχαν εξοπλιστεί με τόσο πολύ μνήμη.

 

Kai se poly mikrotero availability. Apla hthela na pw oti efoson oi sygekrimenes mnhmes ginoune diathesimes se megalytero euros kai pesei h timh tous, den yparxei tipota pou na stamataei tous AIBs eite ths ati h ths nvidia apo to na vgaloun ekdoseis twn kartwn tous me 512mb.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

To Multisampling outws h allws den einai fillrate-free ?

 

2xMSAA μετά το NV20 και 4/6xMSAA μετά το R300, με την συμπίεση των χρωμάτων. Για 8x θα πρέπει αμφότεροι να κάνουν ριζικότερες αλλαγές όπως στο triangle setup.

 

Opws kai na xei, an kai tha hthela na dw Series5 se desktop, dyskolo to kovw na to doume.

 

Πίστεψέ με είναι μια πονεμένη ιστορία. Δυστυχώς όμως δεν λέγεται τουλάχιστον όχι ακόμα δημόσια. Ποτέ δεν πίστεψα όμως ότι θα αποτελούσε ή θα αποτελέσει σοβαρό ανταγωνισμό όσον αφορά τις πωλήσεις γενικά. Απλά θα έσπρωχνε ένα παραπάνω τους 2 μεγάλους να ανεβάσουν κι άλλο την επάρκεια στα προιόντα τους. Από μικρές εταιρίες και ειδικά αυτές που επικεντρώνονται συνήθως στο IP, δυστυχώς δεν μπορεί κανείς να περιμένει πολλά. Υπερφορτώθηκαν και αυτοί με υπερβολικά πολλά projects για τις δυνάμεις τους και αν και ακόμα δεν έχουν εγκαταλείψει την προσπάθεια τα πάντα ακόμα παίζονται. ΄Ενα προιόν έτοιμο για παραγωγή από την ΄Ανοιξη.

 

Ontws, alla egw anarwtiemai pws h nvidia den exei vgalei temporal (pou sigoura isws einai axrhsto se arketa nea games stis perissoteres kartes, se palia omws kanei thaumata ) akoma. H prwth mou skepsei htan oti den einai arketa programmatisimo to hardware alla meta thymithika oti eixa diavasei kapou se ena review (htane kai palio kai de thymamai link :X) oti me ena sygekrimeno driver set h 5200 otan rythmizotan gia 4xAA sto control panel, ekane 2xT. Malista thymamai oti eixe kai ena gifaki gia na deixei pws fainotan se kinish (den xerw an ekane force vsync ki olas, alla opws kai na eixe 5200 htan kai den epiane ta apaitoumena frames gia na mhn "xoreyoun" ta jaggies).

 

Πρώτη φορά το ακούω. Η εξομάλυνση δεν είναι προγραμματιζόμενη στην NVIDIA, για αυτό είμαι σίγουρος. Μάλιστα της ATI είναι arbitrary sparsed grid multisampling, που σημαίνει (όπως ίσως ξέρεις) ότι τα sample positions είναι απόλυτα προγραμματίσιμα. Στις NV3x μόνο το διπλό ήταν rotated grid, ενώ στις NV40 έχουν απλά περιστρέψει τα 4 σημεία κατά 27 μοίρες ακριβώς. ΄Οτι κι αν είναι αυτό στο NV34, αμφιβάλλω αν έχει καμία σχέση με κάθε τι temporal της ATI.

 

Το αποκαλούμενο temporal AA (ουσιαστικά είναι sample merging in the temporal dimension...γνήσιο temporal antialiasing είναι motion blur) το είχα δοκιμάσει μέχρι εξάντλησης στην R3xx, αλλά πάντα προτιμούσα να ανεβάσω την ανάλυση με το καλύτερο δυνατό AA, παρά να χρησιμοποιήσω tempAA. Είναι και 21" η οθόνη, οπότε αναλύσεις 8*6 ή 1*7 μάλλον δεν μου κάνουν.

 

Kai se poly mikrotero availability. Apla hthela na pw oti efoson oi sygekrimenes mnhmes ginoune diathesimes se megalytero euros kai pesei h timh tous, den yparxei tipota pou na stamataei tous AIBs eite ths ati h ths nvidia apo to na vgaloun ekdoseis twn kartwn tous me 512mb.

 

Eίναι ωστόσο ενοχλητικό το γεγονός ότι έχουμε αυτή τη στιγμή κάρτες που περιορίζονται από το εύρος μνήμης τους (κυρίως το R420...το ότι η NVIDIA στόχευε σε μεγαλύτερο χρονισμό από 400MHz είναι άλλη ιστορία), γιατί δεν υπάρχει διαθεσιμότητα σε μεγάλες ποσότητες σε πολύ πιο γρήγορη GDDR3.

 

Θα προτιμούσα να έβλεπα την R420 με περίπου 700MHz GDDR3 (44.8GB/sec bandwidth), παρά 512 μνήμη.

 

Φυσικά και έχεις δίκιο σε αυτό που λες, απλά είμαι λίγο παραπάνω φλαφλατάς απ΄ότι χρειάζεται :lol:

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

΄Οτι κι αν είναι αυτό στο NV34, αμφιβάλλω αν έχει καμία σχέση με κάθε τι temporal της ATI.

 

Den to exw psaxei proswpika, den exw kan kai nv34 na to dokimasw, apla thymamai oti elege to site oti anti na parei 4 samples ana frame, epairne 2 apla allaze sample positions se kathe frame. Anafere oti to iq den htan kai oti kalytero efoson to frame rate den htan arketa ypshlo kai evlepe ths allages stis theseis twn samples me to mati kai eixe ki ena gifaki me 2 frame gia na deixei pws akrivws fainetai. Epsaxa xtes na vrw to link alla ta parathsa meta tis 10 prwtes pages tou google :/

 

Θα προτιμούσα να έβλεπα την R420 με περίπου 700MHz GDDR3 (44.8GB/sec bandwidth), παρά 512 μνήμη.

 

Paromoiws :) Logika an synexisei na peftei ki allo o rythmos anodou twn syxnwthtwn twn mnhmwn (toulaxiston se sxesh me ton antistoixo rythmo anodou fillrate twn gpus) arga h grhgora kapoia etairia tha anagastei na megalwsei to platos tou bus.

 

Apo thn allh vevaia, isws merikoi AIBs na exoun diaforetikoi gnwmh apo mas kai na protimousan to 512mb grammeno panw sto kouti me megala grammata ktl.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

http://www.beyond3d.com/forum/viewtopic.php?t=14622

 

Σχετικά με το HierZ που συζητάγαμε πριν. Ξέρω είναι 5 σελίδες, αλλά βοηθάει.

 

Den to exw psaxei proswpika, den exw kan kai nv34 na to dokimasw, apla thymamai oti elege to site oti anti na parei 4 samples ana frame, epairne 2 apla allaze sample positions se kathe frame. Anafere oti to iq den htan kai oti kalytero efoson to frame rate den htan arketa ypshlo kai evlepe ths allages stis theseis twn samples me to mati kai eixe ki ena gifaki me 2 frame gia na deixei pws akrivws fainetai. Epsaxa xtes na vrw to link alla ta parathsa meta tis 10 prwtes pages tou google :/

 

Χμμμμμ.... μου θυμίζει μια πατέντα που ανήκει στην Sony/Ericcson oνόματι FLIPTRI & FLIPQUAD. Αμφότερα είναι μετεξελιγμένες μορφές του Quincunx (μπλιαχ...), όπου το πρώτο χρησιμοποιεί 1.25x samples και περίπου ανάλογη ποιότητα όπως το Quincunx (εξοικονομεί όμως συγκριτικά περίπου 60% του εύρους μνήμης) και το δεύτερο 2x samples με γενικά πολύ καλύτερη ποιότητα από το Quincunx εκτός τις γωνίες των 45 μοιρών.

 

Whitepaper:

 

http://users.otenet.gr/~ailuros/fliptri_tr.pdf

 

Το FLIPQUAD χρησιμοποιούν οι Bitboys OY στην επόμενη γενιά από τσιπάκια για κινητά/PDAs.

 

Δεν είναι απαραίτητο να είναι βέβαια η ίδια μέθοδος, γιατί το παραπάνω σε γενικές γραμμές δουλεύει μια χαρά.

 

Paromoiws Logika an synexisei na peftei ki allo o rythmos anodou twn syxnwthtwn twn mnhmwn (toulaxiston se sxesh me ton antistoixo rythmo anodou fillrate twn gpus) arga h grhgora kapoia etairia tha anagastei na megalwsei to platos tou bus.

 

Θα αργίσει πολύ να φτάσουμε στα 512. ΄Ηδη το βήμα στα 256 ήταν κάπως πρόωρο. Είναι μεγάλο θέμα και θα πλατύνουμε την συζήτηση κι άλλο. Αν θέλεις δεν έχω πρόβλημα.

 

'Ασχετο διάβασε εδώ να σου έρθει μια ανακατοσούρα όπως μου ήρθε και μένα....

 

http://www.theinquirer.net/?article=18029

 

Κι αμέσως μετά διάβασε το τελευταίο headline στο http://www.beyond3d.com.....arghhhhhh :X

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Gia allh mia fora, euxaristw gia ta links :)

 

Θα αργίσει πολύ να φτάσουμε στα 512. ΄Ηδη το βήμα στα 256 ήταν κάπως πρόωρο. Είναι μεγάλο θέμα και θα πλατύνουμε την συζήτηση κι άλλο. Αν θέλεις δεν έχω πρόβλημα.

To prwto pragma pou mou erxetai sto myalo otan skeftomai gia 512bit wide memory bus se kartes grafikwn einai "1 metro pcb". To deytero einai "Wildcat realizm 800". Afou to katafere h 3dlabs (an kai einai ligo teras kai apo power consumption, kai apo diastaseis kai fysika apo timh h sygekrimenh karta) den tha htan adynato gia thn ati h thn nvidia an kai gia kamposo kairo akoma profanws de tha symferei apo epeixirimatikh apopsh.

 

'Ασχετο διάβασε εδώ να σου έρθει μια ανακατοσούρα όπως μου ήρθε και μένα....

 

Em, inquirer einai autos...tha hthela na pw kana 2 prammatakia (ektws apo ta emfanh) gia to sygekrimeno arthro kai ton pithano sygrafea tou alla eggrafoi kanones exemytheias mou denoun ta xeilh ;)

 

Btw, oson afora to b3d, se enhmerwnw oti eimai long-time lurker sta forum tou, an kai an xanapw th gnwmh mou gia to sygekrimeno site edw mallon tha nomizoun oti kanw diafhmish :|

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Gia allh mia fora, euxaristw gia ta links.

 

Θα μου επιτρέψεις τότε να ευλογήσω και τα γένια μου. Απλά ήταν offline το site τις τελευταίες μέρες και μόλις ξαναεμφανίστηκε. Εντυπώσεις σε 14 σελίδες για την GeForce 6800 (non Ultra). ΄Εχει μερικά λαθάκια (όπως παράδειγμα είναι 5-way MIMD τελικά και όχι 6), όταν βρω χρόνο θα τα διορθώσω.

 

http://www.mitrax.de/?cont=artikel&aid=24&page=1

 

Είναι και σχετικότερο με το θέμα εδώ και όχι δεν υπάρχουν ουσιαστικές συγκρίσεις.

 

To prwto pragma pou mou erxetai sto myalo otan skeftomai gia 512bit wide memory bus se kartes grafikwn einai "1 metro pcb". To deytero einai "Wildcat realizm 800". Afou to katafere h 3dlabs (an kai einai ligo teras kai apo power consumption, kai apo diastaseis kai fysika apo timh h sygekrimenh karta) den tha htan adynato gia thn ati h thn nvidia an kai gia kamposo kairo akoma profanws de tha symferei apo epeixirimatikh apopsh.

 

P20? :lol:

 

΄Οσο αυτό έχει 512bit δίαυλο, άλλο τόσο είχε η Voodoo5 256bits ή η Volari Duo 512bits. Το καλό είναι ότι στην επίσημη πρώτη παρουσίαση του υπήρχε διαθέσιμο hardware, αλλά το σύστημα να κρασάρει πολλαπλές φορές έδωσε μάλλον μέτριες ενυπώσεις. Μπορεί να είναι επαγγελματικές κάρτες προσαρμοσμένες για επαγγελματικές εφαρμογές σε OpenGL, αλλά αναρωτιέμαι πόσο δύσκολο είναι να γράψει κανείς έναν σωστό D3D οδηγό.

 

Για 512bit θα πρότεινα να αναμένεις μάλλον WGF timeframe & beyond (2007+).

 

Το πρόβλημα με πολύ έναν πολύ πλατύ διάυλο είναι αλλού. Με μία λέξη granularity. Πάρε παράδειγμα το PS2.0 test/3dmark03, που εμπεριέχει αρκετό noise. Εδώ με ένα τυπικό burst 4 στις σημερινές DDR μνήμες, ένας επεξεργαστής καταλήγει να διαβάσει 4*256=1024bits. Μιλάμε για μια ποσότητα πληροφοριών που διαβάζονται εντελώς άσκοπα. ΄Οταν τραυματίζεται η επάρκεια ανάγνωσης ενός επεξεργαστή (read efficiency), τελείωνει απίστευτα γρήγορα το εύρος μνήμης. Είναι ήδη ένα σημείο όπου ένας 256bit δίαυλος παρουσιάζει μειονεκτήματα, πόσο μάλλον στους 512 δίαυλους. ΄Ερευνες έχουν δείξει ότι noise functions ή γενικά αν προτιμάς η τυχαία πρόσβαση υφών σε μελλοντικά παιχνίδια αυξάνονται (random texture access), πράγμα που μάλλον δυσκολεύει ένα παραπάνω για τα τωρινά δεδομένα τόσο πλατύ διαύλους.

 

Παρεπιπτόντως μόνο Parhelia/P10,20 έχουν "πραγματικά" 256bit δίαυλους. ATI/NVIDIA έχουν 4*64bit ελεγκτές μνήμης. Το παραπάνω πρόβλημα ωστόσο παραμένει, γιατί απλά και με έναν 4*128 ελεγκτή δεν αλλάζει η ποσότητα που θα αναγκαστεί να διαβάσει ένας επεξεργαστής (2048bits).

 

Em, inquirer einai autos...tha hthela na pw kana 2 prammatakia (ektws apo ta emfanh) gia to sygekrimeno arthro kai ton pithano sygrafea tou alla eggrafoi kanones exemytheias mou denoun ta xeilh

 

Υπάρχει ήδη ανάλογη μνεία σε thread του B3D, και έχω υπόψη μου την υστεροβουλία και τις σκοπιμότητες του συγγραφέα.

 

Btw, oson afora to b3d, se enhmerwnw oti eimai long-time lurker sta forum tou, an kai an xanapw th gnwmh mou gia to sygekrimeno site edw mallon tha nomizoun oti kanw diafhmish.

 

Δεν βλέπω τίποτα μεμπτό στο να αναφέρεται κανείς σε μια αρκετά τεχνικά προηγμένη ιστοσελίδα. Δεν είναι καθόλου τυχαίο γεγονός ότι συμμετάσχουν στα forums του αρκετοί developers και κάθε λογής engineers από σχεδόν όλες τις εταιρίες.

 

Αν νομίζουν μερικοί ωστόσο ότι η σελίδα κλείνει προς την μία εταιρία ή την άλλη, δεν ξέρουν πόσο λάθος κάνουν. Τα παιδιά τα ξέρω χρόνια πριν ακόμα και την εποχή που ο Reverend βοήθησε τον Kristof (πιτσιρικάς τότε ακόμα) να γράψει την αίτησή του για την 3dfx. Τι εποχές.... :wink:

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Αρχειοθετημένο

Αυτό το θέμα έχει αρχειοθετηθεί και είναι κλειστό για περαιτέρω απαντήσεις.


  • Δημιουργία νέου...