Veldu síðu

Reyndi það: AMD GCN - Kynntu Radeon HD 7970 og HD 7950

Tíminn er kominn að við kynnum að lokum AMD GCN (Graphics Core Next) arkitektúrinn og tvo öflugustu fulltrúa þess, Radeon HD 7970 og Radeon HD 7950.

Greinarmerki GCN

Af HD 7950 vottuðum við strax tveimur þeirra svo við fengum líka tækifæri til að prófa CrossFireX og einnig gerðum við stilltar mælingar með báðum kortunum. Auðvitað sendum við líka fjölda knapa á móti tveimur nýju fallbyssunum til að sjá hversu mikið spilin höfðu hraðað samanborið við fyrri kynslóð GeForces og Radeons. 


Áður en við förum í þátttakendur og prófin munum við skoða GCN arkitektúrinn betur og taka yfir eiginleika HD 7970 og HD 7950.

 allkortakassar 2k

 Grafískur kjarni Næst

Í maí 2007 kynnti AMD Radeon HD 2900 XT skjákortið, sem þegar var byggt á sameinaðri skyggingararkitektúr. Það kom í ljós að hönnunin hafði ýmsa galla en vandamálunum var næstum algjörlega eytt þegar Radeon HD 4000 serían gaf fótfestu á skjákortamarkaðnum á skjáborðinu. Á þessum tímapunkti mátti sjá að nú var þörf á róttækum breytingum. HD 6900 „Cayman“ serían er talin fyrsta skrefið. Hér hefur verið skipt út fyrir 5-vega ofurskalara örgjörva (VLIW5) fyrir 4-vega örgjörva (VLIW4) og Cayman var fyrsti flísinn til að takast á við mörg sjálfstæð leiðbeiningarstraum. Hin stóra nýjungin var kynning á tveimur „grafíkvélum“ sem tvöfölduðu getu þríhyrningsuppsetningarinnar - aukið tessellating power - og fjölda sumra þátta (Rasterizer, Hierarchical Z, Tessellator). Hann varð viðfangsefni næsta stigs prófsins okkar í dag. Þökk sé byggingarlist sem kallast Graphics Core Next (GCN) eru skyggingarmörk sem vinna með VLIW leiðbeiningum sem notuð hafa verið hingað til úrelt og í stað þeirra koma svokölluð reiknieiningar (CU). GCN frumraun sína í Radeon HD 7900 „Tahiti“ fjölskyldunni.

19 m

Athyglisvert, en ekki á óvart, hafa GPU-tölvur frá Tahiti náð framúrskarandi þéttleika smári, þökk sé 28nm bandvíddar framleiðslutækni - þeir innihalda 365 milljarða smára á 4,3 fermetra. Ein reiknieining inniheldur fjögur SIMD og ein skalareining. Flaggskip AMD, Radeon HD 7970 „Tahiti XT“, vinnur með 32 virkum rafknúnum búnaði, miðað við alls 2048 skyggna örgjörva (fjóra 16-vega SIMD, 64 ALU). Miðað við framfarir kynslóðanna hingað til virðist þetta ekki vera framúrskarandi gildi við fyrstu sýn, en til að auka skilvirkni og nýtingu viljum við benda á að það er ekki þess virði að draga óvart víðtækar ályktanir af þessu einn tæknilegur vísir. Fræðilega getur CU framkvæmt eins mikið og ein Cayman SIMD eining. Stórt vandamál með fyrri kynslóðir er gagnabundið (eftirfarandi leiðbeiningar eru háðar hver annarri á gögnum), sem hefur valdið því að nýting hefur sveiflast mikið. GCN arkitektúrinn er einnig framfaraskref á þessu sviði vegna þess að það útrýma áður reyndum ósjálfstæði með straumvinnslu. Ávinningurinn er eingöngu í leitarorðum: áætlanir, kembiforrit, áætlað árangur og ökumannsþróun hafa einnig orðið gagngert einfaldari og gegnsærri. 

24

36 mCU inniheldur ekki aðeins fjórar SIMD einingar, heldur hefur einnig sinn eigin tímaáætlun, 340 KB tímabundna geymslu og áferðarþyrping. Þetta stafar af summan af 4 × 64 KB vektorskránni, Local Data Share, sem er einnig 64 KB að stærð, 4 KB mælikvarðaskránni og fyrsta stigs skyndiminni með 16 KB getu. Á myndinni hér að ofan má sjá enn einn þáttinn sem á svo sannarlega skilið að nefna, en það er svokölluð „Branch & Message Unit“ sem gegnir hlutverki í skilvirkari stjórn á forritunum.
Ef við höfum upplýsingarnar hingað til skulum við fara yfir helstu breytur „Tahiti XT“ grafík örgjörva aftur: 32 CU (2048 skyggna örgjörvar, 128 SIMD skjöl), 128 áferð einingar, 512 Load-Store einingar og samtals 8,2 MB skyndiminni. Þannig að staða stelpunnar var strax önnur, jafnvel þó við værum að byrja að „klæða okkur úr“.

35 mAð framanverðu

Hvað framhlið varðar getum við séð verulegan mun á samanburði við arkitektúr NVIDIA GF110. Stjórnun er í grundvallaratriðum ekki gerð á stigi CUs. Þetta verkefni er framkvæmt af Command örgjörva og ósamstilltur reiknivél (ACE). Flísin hefur fengið tvo rúmfræðilega mótora sem auk Geometry-Assembler, Vertex-Assembler, rúma einnig níundu kynslóð tessellator eininga. Samskiptin við CU eru auðveldari með Global Data Share (GDS), þar sem þessar einingar geta einnig deilt gögnum hvor með annarri. Framhliðin inniheldur tvö rasterizers - þú getur séð skipulagið hér að neðan.

37

ROP og minni tengi
AMD Tahiti inniheldur 8 ROP klasa - á þessum tímapunkti fundum við samsvörun við Cayman flísina. Hver slíkur „fylking“ inniheldur fjórar ROP einingar og 16 Z sýnatökuvélar. Mikilvægt er að geta þess að hver klasi fékk sitt skyndiminni. Önnur mikil breyting hefur átt sér stað: það er ekki lengur bein tenging við minnistýringuna. Ferðinni er ætlað að bæta sveigjanleika og notagildi, sem við sjáum kannski í samhengi við Pitcairn ... ROP geta skrifað í 768 KB L2 skyndiminnið, sem aftur er hægt að lesa af mörgum einingum. Minnisviðmótið fær glaðlega mynd. Sex 64 bita minnistýringar hafa alls 384 bita. Við myndum bara bæta orði við þetta. Loksins! Sjálfgefin stærð myndbandsminnis er 3072 MB, en 1536 MB og 6 GB pakkarnir eru fræðilega gerlegir.

Við vonum að lesendur okkar taki það ekki í slæmu nafni, en á þessum tímapunkti viljum við láta í ljós persónulega skoðun okkar á baksvæðinu. Samband Barts, sem hefur staðið sig mjög vel, og Cayman-flísarinnar, sem sýnir tiltölulega hóflegar niðurstöður, bendir til þess að „almenna vandamálið“ við AMD-flís sé þétt ROP-getu. Enginn árangur hefur náðst á Tahiti hér heldur, en síður mætti ​​skrifa með ýkjum um aðrar nýjungar í flísinni. Hlutverk ROP er sérstaklega áberandi meðan á leikunum stendur, meðan á GPGPU verkefnunum stendur og verða þau önnur fiðluleikarar. Það er líka öruggt að þessi hluti eyðir miklum fjölda smára, sem endurspeglast auðvitað líka í stærð flísarinnar.

 

Aukning AMD hingað til hefur að mestu þjónað þörfum leikmanna. Nú hefur orðið að minnsta kosti 90 gráður beygja og það hefur orðið sterk gatnamót til að mæta faglegum þörfum, til að nota GPU víðar. Auðvitað er þetta ekki vandamál þar sem við erum í grundvallaratriðum að tala um mjög gróft frammistöðu, sem mun örugglega þola reynslu nútímaleikja í nokkur ár. Samkvæmt sögusögnum er ekki aðeins AMD heldur einnig NVIDIA að meðhöndla ROP með þröngum hætti með Kepler.

Að stækka minni strætó var lofsvert skref. Reyndar höfðu hönnuðirnir lítið val. Ekki er lengur hægt að auka klukkur verulega en flísinn sveltur eftir gögnum. Að okkar mati gæti þessi flutningur einn og sér aukið frammistöðu í leikjum um allt að 15 prósent.

44DirectX 11.1 og PCI Express 3.0
PCI-Express 3.0 staðall eykur hraðann úr 16 GB / sekúndu í 32 GB / sekúndu og tvöfaldar gagnaflutningshraða PCIe 2.0. Framleiðendur móðurborðsins „bitu strax á efninu“ en það er sama hversu mikið þeir vilja, rofarinn býður ekki upp á verulegan kost um þessar mundir. PCIe 3.0 er mikilvægt vopn út frá markaðssjónarmiðum, lögboðinn staðall fyrir AMD og NVIDIA og önnur „peningagildra“ fyrir notendur.
DirectX 11.1 getur hafið landvinninga sína með eftirfarandi Windows stýrikerfi, sem inniheldur minni háttar lagfæringar og hagræðingu. Samkvæmt opinberu efni, getum við búist við innfæddum stereo 3D stuðningi og skilvirkari rasterization frá nýju API. Því miður hefur kannski ekki verið nákvæmasti áhugaverði punkturinn, sem fjallar um hvernig hægt er að bæta sveigjanleika og víðtæka notagildi grafíkbúnaðar.

31 m

Grafík-Core-Next arkitektúrinn lítur svona í stórum dráttum út. Auðvitað þjónar kubburinn ekki aðeins þörfum leikmanna heldur hefur hann einnig pláss fyrir fagleg verkefni. Fræðilegur hámarksafköst Tahiti (fyrir tvöfalda nákvæmniútreikninga) er 947 GFLOP, fjórum sinnum hærri fyrir flotpunktaaðgerðir með ein nákvæmni. Að auki hafa minningarnar stuðning við ECC og GPU er vel kunnugur DirectCompute 11.1, OpenCL 1.2 C ++ AMP API.27 Nýir eiginleikar: Zero-Core
Almennt séð eru Radeon HD 7900 stigi rándýr vanir að neyta tabú viðfangs, en AMD verkfræðinga skortir hugvitið. Hugmyndin er einföld en frábær en ekki ný. Ef þú skilur tölvuna eftir í langan tíma en vilt af einhverjum ástæðum ekki slökkva á henni gætirðu viljað láta skjáinn aðeins vera í biðstöðu. Þökk sé ZeroCore Power tækni, þegar slökkt er á skjánum, er hægt að slökkva á öllu grafíkstýringunni og ekki er þörf á virkri kælingu í þessu formi. Ávinningurinn er sannfærandi: núll hávaði, 3 wött af orkunotkun. Það mun vera óverulegur þáttur fyrir marga en málsmeðferð fjögurra vega Crossfire kerfa lokar skjákortum sem ekki eru aðal og dregur verulega úr rafmagnsreikningnum þínum - þó að einhver sem hugsar um slíka samsetningu geri lítið til að taka á orkunýtni.

21a

20

Eyefinity 2.0
Einn af áhugaverðu eiginleikum nýju útgáfunnar er að hún gerir þér kleift að stjórna ráðstefnu samtölum með mörgum skjáum með hljómsveitarhljóði. Opinber heiti málsmeðferðarinnar er Discrete Digital Multi-Point (DDM) hljóð. Radeon HD 7970 er hægt að tengja við þrjá skjái á sama tíma, sem geta tekið á móti átta rása hljóðstraumi. Þetta hefur kannski ekki sérstakan áhuga fyrir heimanotendur, en það er gott dæmi um hve mörg svæði nýju fallbyssurnar geta verið notaðar á. Catalyst drifið er líka að þróast og auðveldar til dæmis að koma bakkanum fyrir og gera þér kleift að setja saman sérsniðnar upplausnir. Þess má geta að 3D HD steríó innihald er einnig hægt að skoða í Eyefinity ham. 

29 m

UVD og VCE
UVD 3.0 býður nú þegar upp á hröðun vélbúnaðar fyrir DivX / Xvid, MPEG-4 hluta 2 MVC efni, og Video Code Engine (VCE) er nánast AMD sem samsvarar Intel Quick Sync Video. VCE er sjálfstæður vélbúnaður og er aðeins hannaður til að flýta fyrir umritun H.264 myndbanda. Vélin er hægari en skyggna örgjörvarnir í grafík örgjörvanum, en mun sparneytnari. Það eru tvær stillingar í boði fyrir notendur. Í fyrstu virkar aðeins VCE, sem í sjálfu sér er hraðvirkara en flestir örgjörvar. Í þessu tilfelli munum við ekki verða fyrir hægagangi, við getum hlaðið skjákortið eða miðstöðina án vandræða. Seinni kosturinn er tvinnstilltur. Reiknifræðilegu einingarnar í VCE og GPU stökkva til verkefnisins saman. Þetta „hjónaband“ hefur augljóslega góð áhrif á kóðunarhraðann, en í því tilfelli, ekki vera hissa ef uppáhaldsleikurinn þinn skiptir yfir í „myndasýningu“.

32

Nú þegar við erum meðvituð um kenninguna og tölurnar skulum við kynnast þremur GCN módelunum í prófinu!