nVidia G(T)300

Obecně o problematice zobrazování 3D ;-)

Moderátoři: ps47, swarm

Příspěvekod no-X » úte led 19, 2010 11:38 am

Termín geometrický výkon je velice široký.

To, co prudce rostlo u předchozích čipů, byl výkon vertex shaderu; tzn. schopnost zpracovávat programy přiřazené jednotlivým vertexům (vrcholům).

To, co rostlo pomalu, je triangle-rate, tzn. schopnost vůbec zpracovávat trojúhelníky. Tohle bylo omezeno výkonem CPU, protože vertexy generuje CPU. Bylo tedy zbytečné navyšovat výkon GPU, protože by stejně nebylo jak ho využít.

Přisla teselace = schopnost, díky níž je GPU schopno vertexy generovat samo. Tzn. možnost nárůstu počtu polygonů na mnohonásobek toho, co by zvládal CPU. Teoreticky. Praxe má dva zádrhely:

1. Triangle-rate. Triangle setup na to není dimenzovaný, byl dimenzovaný na množství polygonů, které stíhalo dodávat CPU. Triangle setup jako jednotka běží na základní frekvenci, za takt obvykle dokáže zpracovat 1 polygon. Tzn. frekvence v MHz obvykle = miliony trojúhelníků za sekundu. Má to ale výjimky - třeba R600 měla klasicky 1 trojúhelník za takt, ale RV670 v některých situacích potřebovala na 1 trojúhelník dva takty. Nebyl to moc problém, protože G80 a první generace G8x čipů měla poddimenzovaný (nebo zabugovaný) front-end čipu (tzn. buďto triangle setup, nebo rasterizér; detaily nevím), takže taky měla problémy s vysokým množstvím polygonů. Proto se zezačátku říkalo, že u G8x nefunguje unifikace jak by měl, protože výkon vertex shaderu při vysokém množství polygonů není o moc větší, než u starých čipů. Unifikace ve skutečnosti fungovala, ale pomalý front-end nezvládal unifikované jádro zásobovat polygony. Tohle ale pro nVidii nebyl problém; tehdejší hry - psané tak, aby běhaly i na unifikovaných čipech - náročné na geometrii nebyly, R6xx byla zabržděná bugy a drivery, takže do toho nikdo moc neryl.

Druhý limit je, že nVidia má základní frekvenci GPU nízkou, takže i triangle-setup běží na nižší frekvenci. Proto nVidia byla z tohohle hlediska víc limitovaná, než ATi a musela to začít řešit dříve.

ATi to zatím řešila tak nějak průběžně pozvolna - RV670 měla 1 polygon za 2 takty, RV770 zvládá 1 polygon za takt (tzn. dvojnásobek). RV870 má ještě dvojitý rasterizér, takže hrubý triangle-rate nevzrostl (resp. jen co se týče rozdílu frekvence), ale dokáže se ním nakládat o něco efektivněji.

Další řešení ATi je multi-GPU. AFR přes všechny své zápory má jeden velký klad a to je, že efektivně násobí triangle-rate. Tzn. zatímco nVidia se při návrhu velkého čipu musela pachtit s řešením problému, jak ho "nakrmit" dostatkem polygonů, tak ATi pro "nakrmení" menšího čipu stačil klasický způsob a high-end, který tradičně řeší přes AFR, které triangle-rate násobí, jako problém odpadl.

Nemůžu si pomoct, ale tahle genialita jednoduchosti se mi fakt líbí.


2. Zádrhel číslo dvě je, že když máme nějakou tu teselaci, kdy se zněkolikanásobí počet polygonů, není kladena zvýšená zátěž jen na teselátor a triangle-setup, ale na celý čip. Protože více polygonů = více stínů, které je třeba spočítat, složitější HDAO/SSAO (které je v módě a jehož obliba s DX11/compute-shadery poroste), několikanásobně více hran, které musí MSAA vyhladit. Tzn. s teselací rostou navíc nároky na unifikované jádro, texturovací jednotky i ROPs.

Nevím, jestli tohle nVidii uniklo, nebo co, ale dávat vlastní geometrickou jednotku do každého ze 16 bloků, ze kterých se čip skládá, je blbost. Výkon se projeví jen v syntetických testech; v reálných hrách bude návratnost mizivá - jak jsem zmínil, teselace není jen o polygonech navíc, stoupají nároky i na zbytek čipu. Takže zvýšit geometrický výkon o 800% je úplná zbytečnost, když výkon zbytku čipu jde nahoru jen o 40-100%.

ATi už se poučila z R5xx a R6xx a technologie, který se projevujou jen na papíře, nechala plavat (dynamic branching u R5xx atp...) a řeší věci, které mají vliv na 90% her. nVidia místo toho řeší nesmysly jako PhysX, "čistě" skalární architekturu a předimenzované geometrické jednotky, které se projeví v pár vybraných hrách, zatímco většinu titulů to neovlivní nijak...
If you're doing rotated grid SSAA (call it sparse grid if you wish but most often your samples will be in the "rotated" position) : then this AA is better than sex. ---Blazkowicz
Uživatelský avatar
no-X
Administrátor
 
Příspěvky: 6908
Registrován: stř dub 28, 2004 9:02 am
Bydliště: Č. Budějovice

Příspěvekod Lukfi » stř led 20, 2010 10:39 am

Uživatelský avatar
Lukfi
Certifikovaný fanATik
 
Příspěvky: 888
Registrován: ned pro 16, 2007 8:38 pm
Bydliště: ne

Příspěvekod no-X » stř led 20, 2010 11:00 am

Ne. Ale pozor, má tam chyby. Nečetl jsem to všechno (všude bych je asi ani neodhalil), ale slajd 16 (přklepy u sběrnice, špatně TMUs u GT200/GF100) a slajd 17 (špatně TMUs u GT200 a podle toho, o čem se mluví, tak i u GF100)
If you're doing rotated grid SSAA (call it sparse grid if you wish but most often your samples will be in the "rotated" position) : then this AA is better than sex. ---Blazkowicz
Uživatelský avatar
no-X
Administrátor
 
Příspěvky: 6908
Registrován: stř dub 28, 2004 9:02 am
Bydliště: Č. Budějovice

Příspěvekod Lukfi » čtv led 21, 2010 11:09 pm

Mimochodem, nevíš něco víc o tom, jak nVidia řešila ten problém s triangle rate?
Uživatelský avatar
Lukfi
Certifikovaný fanATik
 
Příspěvky: 888
Registrován: ned pro 16, 2007 8:38 pm
Bydliště: ne

Příspěvekod no-X » sob úno 27, 2010 12:42 am

Obrázek

:mrgreen:
If you're doing rotated grid SSAA (call it sparse grid if you wish but most often your samples will be in the "rotated" position) : then this AA is better than sex. ---Blazkowicz
Uživatelský avatar
no-X
Administrátor
 
Příspěvky: 6908
Registrován: stř dub 28, 2004 9:02 am
Bydliště: Č. Budějovice

Příspěvekod no-X » pon bře 01, 2010 10:34 pm

If you're doing rotated grid SSAA (call it sparse grid if you wish but most often your samples will be in the "rotated" position) : then this AA is better than sex. ---Blazkowicz
Uživatelský avatar
no-X
Administrátor
 
Příspěvky: 6908
Registrován: stř dub 28, 2004 9:02 am
Bydliště: Č. Budějovice

Příspěvekod DOC_ZENITH/XAN » úte bře 02, 2010 12:08 am

Cím blíže ta karta je, tím měně robustní a velkej dojem budí. Chladič bude mít menší výměnou plochu jak ten u GTX280 a z bedny prej niak extra horkej vzduch nešel. + 2x6-pin, odhadovaná 470.
Obrázek
Obrázek

Takže fakt nevim, ale TSMC asi nebude ten kdo zavinil zdržení... spíš tam byla ňáká kritická bota v architektuře jako měla R600 u HW resolve ale NV radši než aby dopadla jak ATI s R600 to prostě nevydala a radši to opravila tudiž to zpoždění.

Bude to úplně normální karta konkurence k 5870, jen o půl roku později, pok NV nedá cenu jako konkurenci k 5870, bude to zaslouženej propadák.
Uživatelský avatar
DOC_ZENITH/XAN
Senior member
 
Příspěvky: 1922
Registrován: stř říj 20, 2004 9:37 pm
Bydliště: Praha - Hloubětín

Příspěvekod Bob van Sikorski » úte bře 02, 2010 1:28 am

já ti nevím docente, mě přijde, že fakt moc sázíš na hry. to mi nepřijde zajímavý už od dob 4850, kterej jsem měl možnost proklepnout v 2560x1600. spíš jsem zvědav na to, co udělá nebo neudělá Fermi s GPGPU světem, zejména s ohledem na C++/Nexus a tak vůbec. jestli bude tesselátor/dx11 takový nebo makový, je mi zcela u řiti, hry nejsou u supercoolsexy grafice, ta může být pěkná už od dob DX9.0c, na to DX11 není nezbytně nutné. pokud má "jen" 2x6pin, pak to kvituji s povděkem, rozhodně bude nadále možné živit s 1200W zdrojem (pc power&cooling :-D) 4 tyto karty v "supercomputer" deskách, což ocení jistá (velmi omezená) skupinka uživatelů (nemluvě o nižším TDP Tesla/Quadro karet. ale chápu, že už asi zním jako nvidiot, že mi igor vymyl mozek, jenže to tak opravdu není. na GTX480 jsem hodně zvědavej z jiných aspektů než herních, ty byly dobré už u generace 200/4800.
Uživatelský avatar
Bob van Sikorski
ex certifié fanATIque
 
Příspěvky: 2040
Registrován: stř pro 01, 2004 7:18 pm
Bydliště: Poděbrady

Příspěvekod no-X » úte bře 02, 2010 1:50 am

DOC_ZENITH/XAN: podle obou modelů výtěžnosti výroby (které znám) vychází, že GF100 má čistě z důvodu defektů daných výrobním procesem výtěžnost oproti RV870 poloviční... druhá věc je, že tam můžou být nějaké důvody navíc (nVidia mohla něco podcenit), ale už ta polovina vůči RV870 mohla stačit

btw. ta karta na obrázku je opravdu osekaná verze - má 320bit sběrnici
If you're doing rotated grid SSAA (call it sparse grid if you wish but most often your samples will be in the "rotated" position) : then this AA is better than sex. ---Blazkowicz
Uživatelský avatar
no-X
Administrátor
 
Příspěvky: 6908
Registrován: stř dub 28, 2004 9:02 am
Bydliště: Č. Budějovice

Příspěvekod Lukfi » úte bře 02, 2010 7:28 am

Počítají ty modely i s možností redundance? Nechce se mi věřit, že by nVidia naplánovala high-endový čip na nevyzkoušený výrobní postup a nepočítala s tím, že výtěžnost nemusí být ideální. Takže plně funkční Fermi může být dost vzácná, ale třeba usilovali právě o to, aby měli slabší verzi s 448 SP a silnější se 480.
Uživatelský avatar
Lukfi
Certifikovaný fanATik
 
Příspěvky: 888
Registrován: ned pro 16, 2007 8:38 pm
Bydliště: ne

Příspěvekod no-X » úte bře 02, 2010 10:30 am

Ne, počítá se se 100% funkčními čipy. Tzn. pokud by třeba RV870 měla 22%, pak by to mělo znamenat, že 22% čipů je použitelných na HD5870 a ze zbytku se vypaběrkuje na HD5850 a HD5830. Pokud se vyrábějí v poměru 1:1:1, pak ATi využije 66% (2/3) čipů.

Pro 1,5x větší čip by to znamenalo 11% plně funkčních čipů... GTX470 zřejmě bude mít deaktivováno méně jednotek, než HD5830/5850, takže by s těmito čísly byla celková výtěžnost možná 25-30%.
If you're doing rotated grid SSAA (call it sparse grid if you wish but most often your samples will be in the "rotated" position) : then this AA is better than sex. ---Blazkowicz
Uživatelský avatar
no-X
Administrátor
 
Příspěvky: 6908
Registrován: stř dub 28, 2004 9:02 am
Bydliště: Č. Budějovice

Příspěvekod no-X » sob bře 06, 2010 3:33 pm

GTX470 je pomalejší než HD5870 v DiRT2 i STALKERovi COP [o 20%?]
ve 1920x1200 je pomalejší než HD5870 1GB o 10%
ve 2560x1600 je stejně rychlá jako HD5870 1GB [zřejmě kvůli větší kapacitě paměti?]
TDP GTX470 je výrazně pod 300W, ale karta je výrazně víc rozpálená než HD5870

http://we.pcinlife.com/thread-1369198-1-1.html
If you're doing rotated grid SSAA (call it sparse grid if you wish but most often your samples will be in the "rotated" position) : then this AA is better than sex. ---Blazkowicz
Uživatelský avatar
no-X
Administrátor
 
Příspěvky: 6908
Registrován: stř dub 28, 2004 9:02 am
Bydliště: Č. Budějovice

Příspěvekod Bob van Sikorski » sob bře 06, 2010 3:34 pm

TDP může být maximálně 225W, neb 2x6pin PCIe.
Uživatelský avatar
Bob van Sikorski
ex certifié fanATIque
 
Příspěvky: 2040
Registrován: stř pro 01, 2004 7:18 pm
Bydliště: Poděbrady

Příspěvekod Lukfi » sob bře 06, 2010 3:37 pm

To by odpovídalo těm 225 W. A vypadá to, že nVidia volila mezi hlukem a vysokými teplotami, tak dovolili vysoké teploty.
Každopádně z toho pořád víc a víc cítím průser, na tak obrovský čip je to docela nízký výkon.
Uživatelský avatar
Lukfi
Certifikovaný fanATik
 
Příspěvky: 888
Registrován: ned pro 16, 2007 8:38 pm
Bydliště: ne

Příspěvekod no-X » sob bře 06, 2010 3:38 pm

Bob: Pokud to nezměnili... ale asi ne. Vypadá to, že GTX470 je docela krátká, takže pasivní část chladiče je poměrně malá, a proto se hřeje...

Jinak TDP může být 225W, ale nedávno jsem narazil na zajímavou diskusi, kde byly vypsané TDP předešlých modelů nVidie + linky na různé recenze, kde naměřili i o desítky wattů víc. Takže nVidia se s tímhle asi moc netrápí.

Lukfi: Taky mi to tak přijde... navíc všude samá GTX470 - o GTX480 nic.
If you're doing rotated grid SSAA (call it sparse grid if you wish but most often your samples will be in the "rotated" position) : then this AA is better than sex. ---Blazkowicz
Uživatelský avatar
no-X
Administrátor
 
Příspěvky: 6908
Registrován: stř dub 28, 2004 9:02 am
Bydliště: Č. Budějovice

Příspěvekod ps47 » sob bře 27, 2010 11:25 am

..tak prve recenzie veselo nabiehaju,ale nemozem si pomoct,cisla ktore vidim ma nejak do kolien nedostavaju..spatne to rozhodne nieje,ale viac ako polrocny sklz za konkurenciou to neospravedlnuje ani nahodou..no neviem,myslim ze ceny budu musiet byt hodne nizke aby sa to predavalo.
3Dfx Help Page / 3Dfx Game Guide
ObrázekObrázek
Pain is temporary...Support is forever.
Uživatelský avatar
ps47
Moderátor
 
Příspěvky: 7940
Registrován: čtv dub 29, 2004 7:48 pm
Bydliště: SK,BA

Příspěvekod Lukfi » sob bře 27, 2010 11:48 am

Mně to teda do kolen dostává, jmenovitě spotřeba a teploty.
Uživatelský avatar
Lukfi
Certifikovaný fanATik
 
Příspěvky: 888
Registrován: ned pro 16, 2007 8:38 pm
Bydliště: ne

Příspěvekod no-X » sob bře 27, 2010 11:56 am

ps47: Recenze vyšly, ale GTX480 přesto nejsou a neví se, kdy budou. Zatím se mluví o polovině dubna v nejlepším případě.
If you're doing rotated grid SSAA (call it sparse grid if you wish but most often your samples will be in the "rotated" position) : then this AA is better than sex. ---Blazkowicz
Uživatelský avatar
no-X
Administrátor
 
Příspěvky: 6908
Registrován: stř dub 28, 2004 9:02 am
Bydliště: Č. Budějovice

Příspěvekod ps47 » sob bře 27, 2010 12:33 pm

Lukfi píše:Mně to teda do kolen dostává, jmenovitě spotřeba a teploty.

no,nejak obludne to zasa nieje,ale nieje to ani nic moc..co su asi dve slova ktore tieto karty najvystiznejsie vystihuju-vykon? nic moc..spotreba? nic moc..hlucnost? nic moc..teploty? nic moc..

proste po pol roku..nic moc.
3Dfx Help Page / 3Dfx Game Guide
ObrázekObrázek
Pain is temporary...Support is forever.
Uživatelský avatar
ps47
Moderátor
 
Příspěvky: 7940
Registrován: čtv dub 29, 2004 7:48 pm
Bydliště: SK,BA

Příspěvekod chosen » sob bře 27, 2010 12:38 pm

http://www.pcgameshardware.com/aid,7434 ... ws/?page=2

že nejsou teploty/spotřeba/hluk špatné mno u gtx 480 určitě ano

zato ta 470 nevypadá po této stránce nejhůř
Naposledy upravil chosen dne ned bře 28, 2010 10:54 am, celkově upraveno 1
Voodoo1, Voodoo2, Velocity 100, 2*Voodoo3 2000 AGP, 2*Voodoo3 3000 AGP, Voodoo3 2000 PCI SGR, Voodoo3 3500TV (včetně chobotnice)
chosen
 
Příspěvky: 916
Registrován: pát kvě 05, 2006 9:05 pm
Bydliště: Stratov

PředchozíDalší

Zpět na 3D grafika

Kdo je online

Uživatelé procházející toto fórum: Žádní registrovaní uživatelé a 1 návštěvník

cron