AMD GPU-k jövője - amit tudni vélünk - IT café Hozzászólások

Legfrissebb anyagok

IT café témák

PROHARDVER! témák

Mobilarena témák

GAMEPOD.hu témák

LOGOUT.hu témák

Téma összefoglaló

Utoljára frissítve: 2017-08-30 10:47

IT café

A legtöbb kérdésre (igen, talán arra is amit éppen feltenni készülsz) már jó eséllyel megtalálható a válasz valahol a topikban. Mielőtt írnál, lapozz vagy tekerj kicsit visszább, és/vagy használd bátran a keresőt a kérdésed kulcsszavaival!

Új hozzászólás Aktív témák

#35051 Cathulhu addikt Jack@l #35050

Új Válasz 2018-04-13 19:46:17 #35051
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Cathulhu

addikt

válasz Jack@l #35050 üzenetére

Akkor muvelodj inkabb a GPUk memoria felepiteserol ugy nagy altalanossagban, mielott osztod az eszt. Bar tudom utobbit jobban szereted, meg akkor is ha az esetek 90%-ban szintiszta baromsagokat hordasz ossze.

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell
#35052 Jack@l veterán Cathulhu #35051

Új Válasz 2018-04-13 19:47:26 #35052
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Jack@l

veterán

válasz Cathulhu #35051 üzenetére

Most akkor fröcsögsz, vagy ki tudod mérni egy gpgpu-s kis programmal?

A hozzászólási jogosultságodat 2 hónap időtartamra korlátoztuk (1 hsz / 10 nap) a következő ok miatt: Az ÁSZF III 10/8. pontjának megsértése - trollkodás - miatt. Többször és többen is kértek már, hogy hozzászólás írásakor használd a linkelés funkciót, mert ennek elmaradása sokak számára zavaró.
#35053 Cathulhu addikt Jack@l #35052

Új Válasz 2018-04-13 20:00:26 #35053
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Cathulhu

addikt

válasz Jack@l #35052 üzenetére

Mit merjek ki? Hogy van-e 2x8 MB-nyi kozos cache terulet a magok kozott? Vagy hogy az OS dobalja-e a taskokat ide-oda a CCX-ek kozott mint Ryzenen? Oszinten varom az indoklasodat tovabbra is (es nem a mellebeszelest) hogy miert lenne hatranyos egy IF-al osszedrotozott tobb kisebb complexre szetosztott GPU architektura? Azert erdekelne, hogy tudjam valoban kapizsgalod-e amirol beszelsz, vagy csak "frocsogsz" a te szohasznalatoddal elve.

[ Szerkesztve ]

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell
#35054 Petykemano veterán #45185024 #35046

Új Válasz 2018-04-13 21:52:24 #35054
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Petykemano

veterán

válasz #45185024 #35046 üzenetére

Nem baj. Hanem tényleg átvitték a knowhowt a sikeres zenből a radeonhoz. Persze hogy ez pontosan mi, az jó kérdés... talán csak az EPYC. Ha nem, akkor azért az ciki, hogy a 3000fős - sikertelen - RTG-hez kell egy új nagyagy.
Nincs baj az epyckel, csak az igazság az, hogy ezt már moat is megtehetnék. Mármint a kis lapkákra való szétbontás azért indokolt, es szükséges, hogy normális selejtaránnyal lehessen gyártani. Ha megvan a recept 2-4 Vega (merthogy a navi ugye 1080 teljesítményű középkatwgóriás lapka lesz) összekapcsolására, ahhoz nem kell külön lapkákként legyártani. Ha nem rakják rendbe a navit akkor hiába lesz mcm, akkor is alul fog maradni a konkurens termékkel szemben.

Találgatunk, aztán majd úgyis kiderül..
#35055 #45185024 törölt tag Petykemano #35054

Új Válasz 2018-04-14 04:12:19 #35055
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

#45185024

törölt tag

válasz Petykemano #35054 üzenetére

No ha már nem félünk az erős szerverprocis Apuktól amik részegységeit lekapcsolva CPUsan feszt spórolnak meg térjünk át a másik mondandódra az 1080 teljesítményű Navira.
A történetből egy apró dolgot hagytál ki hogy a Fudzillás leaksben van egy ár
Pletyka: Az AMD Navi a GeForce GTX 1080-as szintű teljesítményét kínálja a 250$ -os Budget árszegmensben.
Igen ez szörnyű katasztrófa lenne, ha az 1080 at is ennyiért árulnák
Akkor meg nem ha ezt beteheted egy APUba és mellé tehetsz egy 2700x+40%os CPU-t
Kiállsz a pódiumra és ezt mondod.
Amézing mostantól nem kellenek videókártyák 1080-as (vagy Vega) szintig.
és itt vannak a real 4K konzolok olcsón, ki is akarna ekkor méregdrága videókártyákat venni ?
Kiáll 3 lány miniszoknyában a pódiumra és a középső thay szépségkirálynő szoknyában kb így öltözve
A középsőnél lesz az APU (CPU-GPU) a szélsőknél a fantáziádra bízom mit tokoznak össze (CPU-CPU , GPU-GPU)

[ Szerkesztve ]
#35056 Petykemano veterán #45185024 #35055

Új Válasz 2018-04-14 09:09:35 #35056
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Petykemano

veterán

válasz #45185024 #35055 üzenetére

Azért tegyük hozzá: 1080-as szintű kártya $250-ért 2019-ben - de még 2018-ban sem - nem nagy wasistdas. Ha ugyanis az nvidia kihozza a következő XX60-as kártyáját, ami általában szintén ezt az árshegmenst szokta célozni, az is el fogja érni a mai 1080-as szintet. (Ahogy ugye a mai 1060 is eléri a 980-at.)
Az árban én Mondjuk erősen kételkedek, de persze bízzunk, reméljünk.
Ami az apukat illeti, nem tudom, nevezzük-e mcm tokozásban összeragasztott cput es gput apunak. Illetve nem tudom, hogy bárminemű előnye lenne-e annak, ha nem egy külön gyártott cput és gput ragasztóznak össze, hanem két valódi aput, ahol tényleg ott van mellette az igp egybegyártva. Merthogy azt gondolom, ilyen lapka is lesz, hiszen nyilván le kell fedni a piacnak azt a részét, ahol szingli CPU (am4), szingli gpu vagy szingli apu kell, mert kicsik az igények.
Aztán ezeket el lehet kezdeni összetokozni:
CPU +CPU: Threadripper
CPU +CPU+CPU +CPU: EPYC
A gyönyörű az lenne, ha 2 vagy 4 kompozícióban bármit bármivel össze lehetne rakni. Namost ennek persze compute vonatkozásban nyilván nincsen akadálya (lásd Vega cube ), de vajon a grafikát hogy és mi fogja skálázni több gpu felé automatikusan?
Vagy lehetséges lenne, hogy nem komplett gpukat fognak összetokozni, hanem különböző részegységeket. Erre egyébként én kevés esélyt látok, az AMD ennél nagyobb biztonsági játékos.

Találgatunk, aztán majd úgyis kiderül..
#35057 Televan74 nagyúr Petykemano #35056

Új Válasz 2018-04-14 09:26:08 #35057
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Televan74

nagyúr

válasz Petykemano #35056 üzenetére

Ez attól függ mikor jön a Navi. A Nvidia is a xx60 -at csak 2019 tavaszára dátumozza.Addig csak a xx70/xx80 modellek fognak érkezni ősztől.
Több GPU egyben,ha nincs driver oldali támogatás,akkor csak benchmarkolni lesz jó.
AMD mindig szerette a kihívásokat,különös megoldásokat és erre párszor rá is b@sztak.

Amikor nincs remény! Jusson eszedbe nincs isten, csak én!
#35058 #45185024 törölt tag Petykemano #35056

Új Válasz 2018-04-14 13:12:00 #35058
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

#45185024

törölt tag

válasz Petykemano #35056 üzenetére

Jaj Petyke jaj, 19 még messze van. AMD-é 18 ban már itt lesz.
Inkább nézzél 'ménsztrím' videókat:
Facebook sucks Future AMD GPUs could be GREAT! - WAN Show Apr.13 2018

[ Szerkesztve ]
#35059 Petykemano veterán Televan74 #35057

Új Válasz 2018-04-14 14:48:38 #35059
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Petykemano

veterán

válasz Televan74 #35057 üzenetére

Talán csak én vagyok pesszimista, de az, hogy az 1080 értékű XX60 csak 2019-ben jön, nekem pont nem azt üzeni jelen körülmények között, hogy jaj szegény nvidia megcsúszott és csak késve tudja kidobni a középkategóriát, hanem pont azt, hogy ráér akkor is, addig meg max az 1080 is elketyeg abban az árszegmensben.
Több GPUt egybetokozni igen, csakis akkor van értelme, ha szoftveres rásegítés nélkül, vagyis valami közös frontenddel egy gpunak látszódva működik. Gbors cikke alapján az SM, meg az SE már már most is belső mini -gpuként működik, amit egy közös frontend köt össze és ütemez. Akkor van értelme az egybetokozásnak, ha meg tudják oldani, hogy több külön gpuban levő egyégeket egyben tudjanak ütemezni. Csak ha ezt Meg tudják oldani, akkor ahhoz nem feltétlenül szükségesek külön gpu lapkák, meg mcm.

Találgatunk, aztán majd úgyis kiderül..
#35060 Petykemano veterán #45185024 #35058

Új Válasz 2018-04-14 14:50:46 #35060
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Petykemano

veterán

válasz #45185024 #35058 üzenetére

Dehogy lesz... 2018-ban 7nm Vega20 lesz, meg Vega mobile. Melyik évben jött az amdtől kettőnél több lapka az utóbbi időben? (Nem számítva a customokat.)

Találgatunk, aztán majd úgyis kiderül..
#35061 Abu85 HÁZIGAZDA Petykemano #35056

Új Válasz 2018-04-14 18:37:38 #35061
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Petykemano #35056 üzenetére

Az Infinity Fabric arra van, hogy ezzel ne kelljen törődni. A 4 darab Zeppelin magot használó EPYC is egyetlen 32 magos processzornak látszik az operációs rendszer felé. A kulcs a koherencia.
Egyébként a mai GPU-k belül nem különböznek ettől. Ott is tömbökbe vannak szervezve a multiprocesszorok, és egymás felé eléggé lassú a kommunikáció (30-40 GB/s maximum). De ugye kit érdekel, alig kommunikálnak egymással, a GCN esetében azt is egy 64 kB-os táron keresztül. Az Infinity Fabric-nak elég ezt a tárat szinkronizálnia a lapkák között.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#35062 Televan74 nagyúr Abu85 #35061

Új Válasz 2018-04-14 18:41:43 #35062
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Televan74

nagyúr

válasz Abu85 #35061 üzenetére

Navi -t is majd hasonlóan kell elképzelni.Mondjuk a csúcs kategórián lesz 4 modul,a középen lesz 2,a belépő meg 1 modul lesz? Vagy a belépő szint 1 modullal az már csak APU lesz?
Szerk.: Látom közben megkaptam a választ,részben.

[ Szerkesztve ]

Amikor nincs remény! Jusson eszedbe nincs isten, csak én!
#35063 Abu85 HÁZIGAZDA Televan74 #35062

Új Válasz 2018-04-14 18:43:35 #35063
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Televan74 #35062 üzenetére

Az én véleményem szerint klasszikus értelemben nem lesz több APU. Sokkal célszerűbb GMI-vel összekötni a CPU-t és a GPU-t. Vagy két CPU-t és két GPU-t ugyanazon a tokozáson. Esetleg egy CPU-t két GPU-val. Ez innentől kezdve már legó. A működés tekintetében nem lesz különbség ahhoz képest, mintha tényleg egy lapkán lenne mind.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#35064 Plasticbomb addikt Petykemano #35059

Új Válasz 2018-04-14 18:45:07 #35064
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Plasticbomb

addikt

válasz Petykemano #35059 üzenetére

köszi, hogy emlékeztettél, el akartam már olvasni gbors cikkét, de elfeledtem, most megtettem. De most végre megyek fürödni, elég jó cikk volt, nem bírtam ott hagyni...

ArchLinux, Star Citizen, Subnautica+BZ, ASTRONEER, Grounded, DRAG, VOLCANOIDS, Space Engineers, Elite:Dangerous, Beyond Blue (TK-Glitch Proton)
#35065 Petykemano veterán Abu85 #35061

Új Válasz 2018-04-14 21:54:17 #35065
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Petykemano

veterán

válasz Abu85 #35061 üzenetére

Azért szerintem van különbség. De legyen igazad, akkor az AMD miért nem csinált 4SE x 16 CU helyett mondjuk 6x10-eset? A belső kommunikációért már a vegában is az IF felel, nem?
Vagy akkor Mondd el, kérlek, hogy ehhez képest miért könnyebb 2db komplett 4 SE-nel rendelkező lapka összedrótozása IF-fel, hogy ez így egy gpunak látsszon?
Miért nem teszi meg ezt az AMD két Vega lapkával?

Találgatunk, aztán majd úgyis kiderül..
#35066 Cathulhu addikt Petykemano #35065

Új Válasz 2018-04-14 21:57:20 #35066
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Cathulhu

addikt

válasz Petykemano #35065 üzenetére

"Miért nem teszi meg ezt az AMD két Vega lapkával?"
Nem emiatt lesznek az uj vegaban IF busok? Ha 7 nanon merseklodik a fogyasztas es az ar, akkor ugyan meg mindig dragan, de meg lehet csinalni. Lehet nem veltlen az MI a celpiac. Kerdes, hogy ki vesz MI-re AMD-t.

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell
#35067 Petykemano veterán Cathulhu #35066

Új Válasz 2018-04-15 00:39:55 #35067
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Petykemano

veterán

válasz Cathulhu #35066 üzenetére

Lesznek??
3. Oldal 1. Hasáb 2. Bekezdés
Vagy most már ez is a "benne van, höhö, de rohadtul nem működik" fícsörök listáját hosszabbítja csak?
Egyébként nekem tökre elfogadható válasz lenne, hogy jött a bámyászláz és hát így is elfogyott minden az utolsó szálig, felesleges lett volna küazködni az egybetokozott, vagy más módon összekapcsolt (Vega cube) gpuval való erőlködés.
(Csak közben persze tegyük hozzá, hogy az nvidia népszerűségének az is részét képezi, hogy képes és hajlandó legyártani a leggyorsabb terméket a piacra akkor is, ha Elképesztő áron, vagy valójában sehogy nem is árulja)

Találgatunk, aztán majd úgyis kiderül..
#35068 #45185024 törölt tag

Új Válasz 2018-04-15 08:26:32 #35068
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

#45185024

törölt tag

A GamesBeat konferencián a Sonytól Andrew House beszélt a PlayStation és a konzolok jövőjéről.
Majd erre a TweakTown emlékeztetett egy cikkel egy "exkluzív TweakTown forrás"-ra hivatkozva miszerint a PS5 már nem "gyenge APU"-t fog használni hanem GPU-t.
"PlayStation 5 will feature full discrete GPU, not an APU"
Ami általam átértelmezve egy Navi GPU-t jelentene.

[ Szerkesztve ]
#35069 szmörlock007 aktív tag

Új Válasz 2018-04-15 09:02:20 #35069
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

szmörlock007

aktív tag

Üdv
AMD 600 Series GPU Project “Zen” Detailed – Radeon on Steroids to Amp Clock Speeds & Efficiency
#35070 Abu85 HÁZIGAZDA Petykemano #35065

Új Válasz 2018-04-15 10:23:05 #35070
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Petykemano #35065 üzenetére

Csinálhatnak, ez csak döntés kérdése. A Vega esetében a 4 az optimális, mert a 6 tömb aránytalanul sok extra tranzisztorköltség ahhoz képest, ami előnyt ad.
A probléma a jövőben specifikus lesz. A 7 nm-es node-on már jelezték a bérgyártók, hogy a méretes lapkákat igen gazdaságtalan lesz legyártani. Emiatt a mostani tipikus 400-500 mm^2 közötti reális határ inkább 300-350 mm^2 lesz. Nem fognak megérni fölé menni, de az optimális is inkább 200 mm^2. Tehát költségben, 7 nm-es node-on sokkal előnyösebb 4 200 mm^2-es lapkát csinálni és valahogy összekötni, mint egy 700 mm^2-est. Az 5 nm-re még borúsabbak a kilátások. Ott inkább 100 mm^2 tűnik az optimális határnak, de egyelőre erről még kevés a tapasztalatra épülő adat. Ez persze akkora gond így sem lesz, mert mire elérjük az 5 nm-et, addigra 3D-ben is építkezhetünk majd, tehát úgy összeköthetsz mondjuk négy stacket, hogy egy stack kettő vagy akár négy lapkából áll majd, vagyis effektíve 16 lapka lesz összekötve. 5 nm-en túl teljes homály van. Nagyjából abban ért egyet mindenki, hogy a chipletek koncepciója az egyetlen gazdaságilag fenntartható opció.
Erre készül a Vega 20, amibe beépítik a GMI-ket. Onnantól tényleg legó az egész, lásd EPYC.
(#35066) Pinky Demon: Maga az Infinity Fabric már a Vega része, elvégre a Raven Ridge-ben a Zen és a Vega klaszter így van összekötve (részben emiatt olyan veszettül gyors az az IGP), és nyilván a Vega 10-ben is IF van belsőleg. Ami hiányzik az a GMI, vagyis az IF kivezethető memóriakoherens interfésze. Emiatt nem lehet most összekötni két Vegát, de a Vega 20 ebből tartalmaz majd négyet is.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#35071 Cathulhu addikt Petykemano #35067

Új Válasz 2018-04-15 10:26:10 #35071
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Cathulhu

addikt

válasz Petykemano #35067 üzenetére

Kozosen IF neven emlegetnek tobb kulonbozo bust, amik mas-mas feladatot latnak el a modulok kozti kommunikacioban. Az a gyanum (de ezt megalapozni nem tudom), hogy ami a jelenlegi veganal van, az csak egy kis resze ennek, es nem a teljes IF ami ket vega kozotti kommunikaciot is lehetove tenne. Abu cikkjebol viszont az jon le, hogy eggyel tovabb lepnek az uj vegaban.
#35070, koszonom, egyre gondoltunk akkor.

[ Szerkesztve ]

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell
#35072 Abu85 HÁZIGAZDA Cathulhu #35071

Új Válasz 2018-04-15 10:36:37 #35072
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Cathulhu #35071 üzenetére

Pontosan. Az Infinity Fabric leginkább egy gyűjtőnév. Igazából maga a fejlesztés nagyon komplex és nagyon moduláris. Az AMD eldöntheti, hogy az IF-ből miket épít egy lapkába. Nyilván ha nem akarják sosem összekötni ezeket, akkor a GMI komponens csak felesleges tranzisztorköltség. Ha pedig terv van az összekötésre, lásd Vega 20, akkor elég belegózni a dizájnba. Az, hogy itt az összekötés miképp lesz megoldva már megint egy külső tényező. A négy GMI-t rengeteg dologra lehet felhasználni. Összeköthető szimplán két lapka, ahol mind a négy interfész ezt szolgálja. Vagy négy lapka, ahol lapkánként három GMI gondoskodik a kommunikációról, és még marad mindegyikben egy, hogy melléhelyezhető legyen egy másik tokozásban még négy lapka. Kvázi olyan formában, amilyen az EPYC kétutas dizájnja. És ha már itt tartunk, akkor természetesen lehet vegyíteni a Vega 20-at a készülő Rome CPU-val. Egy tokozásra maximum négy lapka helyezhető majd, hogy abból mennyi a Vega 20 és mennyi a Rome az már egyéni döntés kérdése. Valószínű egyébként, hogy első körben egy Vega 20 és egy Rome lesz egy tokozáson, mert a Vega 20-nak azért szüksége lenne mind a négy GMI-re, hogy ezeken keresztül teljes sebességgel el tudja érni a Rome CPU-hoz kapcsolódó rendszermemóriát. A sampling sem véletlenül van egymáshoz kötve, mivel a Rome és a Vega 20 is elérhető lesz a partnereknek a Q4-ben.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#35073 Carlos Padre veterán Petykemano #35045

Új Válasz 2018-04-15 10:40:41 #35073
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Carlos Padre

veterán

válasz Petykemano #35045 üzenetére

Anno volt egy víziója az AMD-nek, miszerint a CPU és GPU részleget összefésülik, mindkettőből a legjobbat hozva ki, de jött ez a Raja és megtorpedózta az egészet. A végeredményt mind látjuk. Most, hogy lelépett úgy látszik visszatérnek az eredeti koncepcióhoz.

Genyó vagyok, ha hülye vagy megmondom.
#35074 Petykemano veterán Abu85 #35070

Új Válasz 2018-04-15 15:33:24 #35074
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Petykemano

veterán

válasz Abu85 #35070 üzenetére

Ok, a gyártástechnológia miatti kis lapkák gyártásáról szóló kényszer világos (unalomig ismételgetett)
De nem magyarázza, nem indokolja, nem következik belőle, hogy az AMD 2db teljes gpu lapkát GMI-vel összekötve hogy tud skáláztatni, míg most meg nem? Amikor pedig az IF benne van a vegában.
Pedig teljesen nyilvánvaló gbors számaiból (is, ha eddig nem volt triviális), hogy vagy a ROP gyengus, vagy a geometria. Nem véletlen, hogy a primitive shader ás a dsbr is ezt célozta, és az intelnek készült vegaris is pont ezeket a részeket duplázta a P10-zel összevetve.
Hogy lehetséges az, hogy ha 6 Se 4 helyett aránytalanul nagy tranzosztorköltséget jelent, akkor majd 2x4 Se IF@GMI-vel összekötve az meg már majd nem?

Találgatunk, aztán majd úgyis kiderül..
#35075 #45185024 törölt tag

Új Válasz 2018-04-15 19:28:49 #35075
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

#45185024

törölt tag

Lisa Mama ma a Kínai F1-en miután zsíros üzleteket kötött Kínában.
Mi lesz veled embargó... Csak a piros csak a piros...

[ Szerkesztve ]
#35076 Cathulhu addikt Petykemano #35074

Új Válasz 2018-04-15 20:07:39 #35076
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Cathulhu

addikt

válasz Petykemano #35074 üzenetére

De az IF nincs benne a Vegaban. Csak egy kis resze. Pont az hianyzik ami osszekotne ket vegat. Az majd most kerul bele.

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell
#35077 velizare nagyúr Cathulhu #35076

Új Válasz 2018-04-15 20:17:21 #35077
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

velizare

nagyúr

válasz Cathulhu #35076 üzenetére

nincs a vegában két vega, szóval összekötnie se lenne mit.

Tudod, mit jelent az, hogy nemezis? Az érintett, erősebb fél kinyilatkoztatása a méltó büntetés mértékét illetően. Az érintett fél jelen esetben egy szadista állat... én.
#35078 Cathulhu addikt velizare #35077

Új Válasz 2018-04-15 20:18:08 #35078
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Cathulhu

addikt

válasz velizare #35077 üzenetére

Ne nekem mondd

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell
#35079 TTomax nagyúr #45185024 #35075

Új Válasz 2018-04-15 20:21:18 #35079
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

TTomax

nagyúr

válasz #45185024 #35075 üzenetére

Hogyan kapcsolódik ez ismét a topic témájához?Nem unod még?

★★★★★ I got too much soul, rhythm and blues R&B ya see, all that's cool, but hip-hop and rap yeah that's where my heart's at Even back when I used to break on a box ★★★★★ "Chief Rocka"
#35080 Crytek veterán TTomax #35079

Új Válasz 2018-04-15 21:16:45 #35080
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Crytek

veterán

válasz TTomax #35079 üzenetére

Találgatja mit kereshet ott A hölgy AMD-s szóval van benne valami

[ Szerkesztve ]

Next PC Upgrade: 2022
#35081 Pipó őstag Crytek #35080

Új Válasz 2018-04-15 21:23:31 #35081
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Pipó

őstag

válasz Crytek #35080 üzenetére

Ő rakta fel ma Kimi (bal hátsó) gumiját. Pont volt egy üresedés.

"Vannak győzelmek, amiktől jobban alszik az ember. És olyanok is, amik ébren tartanak." Broadchurch - Kis fekete szir-szar rózsaszín biszbasszal a tetején? - Az is vaaan!
#35082 #45185024 törölt tag TTomax #35079

Új Válasz 2018-04-15 21:28:04 #35082
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

#45185024

törölt tag

válasz TTomax #35079 üzenetére

Mit keres egy AMD találgatós szobába hogy Lisa Su kínában van ?
A kérdés nem az hogy miért van ott és milyen kereskedelmi üzletről tárgyal ?
Vagy a 138. onban elkövetett semmiről sem szóló trollkodásod mit keres itt meg a vega szobában ezt akartad kérdezni ?

[ Szerkesztve ]
#35083 Petykemano veterán Cathulhu #35076

Új Válasz 2018-04-15 21:44:37 #35083
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Petykemano

veterán

válasz Cathulhu #35076 üzenetére

Talán félreérthetően fogalmaztam.
Azt értem, hogy abu állítása szerint az Infinity fabricnek az a része, amely két lapka epycus összekapcsolását teszi lehetővé a vega10-nek nem része. Vagyis fogalmazzunk úgy, hogy az IF nincs kivezetve. Ez lenne a GMI. Ez nincs, 2 vega10 lapkát nem lehet összekapcsolni IF/GMI-vel Mert nem tartalmazza.
A kérdésem arra vonatkozik akkor tehát, hogy:
Vega10 Block diagram
Most a vega10-ben van 4SE, ugye? Ehhez kapcsolódnak a számítást végző alrendszerek (1 SE = 1 geometrai motor, 16 CU és a végén meghatározott számú pixel engine - nagyjából ezt nevezi gbors mini-gpunak) Ezen most csak azért rugózok, mert szintén gbors által szállított adatok alapján a vega10 szűk keresztmetszetét a geometria vagy a pixel motor adja. De tesztek során is láttuk, hogy azonos órajelen néha nem volt különbség 56 és 64 CU között.
Na tehát ezt a 4 SE-t kapcsolja össze a parancsprocesszor, meg az ütemező, meg az IWD
Miközben az egész körül ott az IF az ábra szerint és a display motor meg mittoménmivel a memóriával együtt a kommunikáció már az IF-en keresztül zajlik.
Namost Abu állítása szerint azért 4 SE van a vegában, mert ez az ideális. Most azt mondja, hogy túl sok tranzisztor kellett volna és ahhoz képest kevés lett volna az elérhető nyereség. Korábban ugyanezt a kérdést a túlzottan nagy memóriasávszélesség igényével indokolta. De ezt most hagyjuk.
Egyébként mégegyszer idézném a vega whitepapert:
"“Vega” 10 is the first AMD graphics processor built using
the Infinity Fabric interconnect that also underpins our
"Zen" microprocessors. This low-latency, SoC-style
interconnect provides coherent communication between
on-chip logic blocks with built-in quality-of-service and
security capabilities. Because it is a standard across our IP
portfolio, Infinity Fabric allows us to take a flexible,
modular approach to processor design. We can mix and
match various IP blocks to create new configurations to
serve our customers' needs. In “Vega” 10, Infinity Fabric
links the graphics core and the other main logic blocks on
the chip, including the memory controller, the PCI Express
controller, the display engine, and the video acceleration
blocks. Thanks to the Infinity Fabric support built into each
of these IP blocks, our future GPUs and APUs will have the
option of incorporating elements of the “Vega” architecture
at will."
Mégegyszer elmondom: világos, hogy ez nem teszi lehetővé két vega10 lapka összekötését, de a belső kommunikációért már az IF felel.
Namost lépjünk egyet az időben és képzeljük el azt, hogy például már Vega20-ban benne lesz az IF-en keresztüli külső kommunikációt lehetővé tevő GMI és össze lehet majd kötni két vega20-at. Eddig annyit tudunk, hogy a vega20 szinte majdnem ugyanaz lesz, mint a vega10, csak DP támogatással és kétszeres HBM kapacitással és sávszélességgel (amúgy mi végett? A vega10 talán sávszél limites? Vagy esetleg ez annak beismerése, hogy a vega 10 pixel-engine limites és ahogy gbors is mondta, majdnem jó lenne a dsbr, csak több pixel engne kell hozzá, amihez meg több sávszélessség?)
Na tehát képzeljü el az IF-fel összekötött 2db vega20 lapkát. Mi az, ami miatt az 1 lapkában a 4 SE pont ideális volt és annál több már pazarlás lett volna, mert nem skálázódik jól a rendszer, DE ha 2 lapkát összekötik és lesz 2x4 SE, akkor már hirtelen kellően jó skálázódást biztosít? Hiszen az IF-nek a lényege, hogy a program egyben, 1 GPU-ként látja mind 8SE-vel rendelkező rendszer.
(Remélem így már érthető a kérdésem)

Találgatunk, aztán majd úgyis kiderül..
#35084 TTomax nagyúr #45185024 #35082

Új Válasz 2018-04-15 21:50:37 #35084
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

TTomax

nagyúr

válasz #45185024 #35082 üzenetére

Hadd javítsalak ki,Kínában van egy forma1-es versenyen mint szponzor,mi lesz következő?A WCben van?Még mindig nem válaszoltál a kérdésre,hogy hogyan kapcsolódik a topichoz,ahol az amd radeonról találgatnak. Kézenfekvő,SEHOGY!Akkor?

[ Szerkesztve ]

★★★★★ I got too much soul, rhythm and blues R&B ya see, all that's cool, but hip-hop and rap yeah that's where my heart's at Even back when I used to break on a box ★★★★★ "Chief Rocka"
#35085 leviske veterán Petykemano #35074

Új Válasz 2018-04-15 21:52:00 #35085
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

leviske

veterán

válasz Petykemano #35074 üzenetére

Engem speciel a 1950X meggyőzött a skálázódásról. A DX11 pedig eleve olyan formában kezeli a GPU-t, ahogy azt a driver neki mondja. Amikor adott az egységes memória, akkor elméletileg nem kéne, hogy gond legyen a skálázódással (a késleltetéseken túl, persze).
A tranzisztorpazarlásnál meg figyelembe kell venni, hogy mennyivel drágul egy lapka legyártásának költsége a méretével arányosan. Nem kizárt, hogy az az 50%-os emelés drágábbra jön ki egy monolitikus lapkával megoldva, mint egy 100%-os emelés két kisebb lapkán megoldva. Ezt meglátjuk az év végéig.
MOD: a hosszabb hozzászólásod még nem létezett, mikor elkezdtem írni

[ Szerkesztve ]
#35086 Cathulhu addikt Petykemano #35083

Új Válasz 2018-04-15 22:17:47 #35086
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Cathulhu

addikt

válasz Petykemano #35083 üzenetére

"Eddig annyit tudunk, hogy a vega20 szinte majdnem ugyanaz lesz, mint a vega10, csak DP támogatással és kétszeres HBM kapacitással és sávszélességgel (amúgy mi végett? A vega10 talán sávszél limites? Vagy esetleg ez annak beismerése, hogy a vega 10 pixel-engine limites és ahogy gbors is mondta, majdnem jó lenne a dsbr, csak több pixel engne kell hozzá, amihez meg több sávszélessség?)"
Az a baj abbol a feltevesbol indulsz ki, hogy a vega20-at gamer kartyanak szanjak, es ehhez nezed a bottleneckeket. Hivatalosan Instinct lesz, ahol a legevesbe sem szamitanak pl a ropok, de annal inkabb a memoria mennyiseg es savszel.

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell
#35087 Petykemano veterán Cathulhu #35086

Új Válasz 2018-04-15 22:39:31 #35087
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Petykemano

veterán

válasz Cathulhu #35086 üzenetére

Ne haragudj, de sikerült nagyon megragadnod a lényeget.
Nyivlánvaló, hogy a Vega20 nem gamer kártya lesz - még ha esetleg készül is belőle valami játékra is használható Frontier Edition. Felejtsd el a vega20-at. Azért azt mondtam, mert az van legközelebb és arra mondta abu, hogy lesz benne GMI, amivel működik az összekapcsolás.
Te akkor vedd úgy, hogy vega20 helyett Navit mondtam és úgy értelmezd a kérdésemet.

Találgatunk, aztán majd úgyis kiderül..
#35088 Petykemano veterán leviske #35085

Új Válasz 2018-04-15 22:58:15 #35088
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Petykemano

veterán

válasz leviske #35085 üzenetére

Az 1950X arról győzhetett meg, hogy az IF kellően nagy sávsélességgel és elfogadható késleltetéssel tudja biztosítani a külön lapkákon levő magok közötti kommunikációt, a cache-koherenciát.
Abban nincs kérdés, hogy ha az 1950X 4 CCX-e történetesen 1 lapkán lenne, akkor az ugyanolyan jól vagy még jobban skálázódna. Persze legyártani biztos egyszerűbb és olcsóbb a kis lapkákat és a külön lapkák összeköttetése is elég jó, tehát lehet darabolni.
A GPU-kra vonatkozó kérdésem a zen CCX-ekre lefordítva így hangzana:
Látjuk, hogy van ~~4SE~~ 2 CCX a zeppelin lapkán. Ennél persze lehetne gyorsabb is. Kérdés: Miért nem tesz az AMD egy lapkára ~~6SE-t~~ 3CCX-et? Abu válasza: hát az nem lenne jó, mert túl sok tranzisztor, mközben alig skálázódna jól (Zárójelben: közben ugye látjuk, hogy ez az állítás a CPU-k esetén valószínűleg nem igaz) De ha 2db ~~4SE-s~~ 2CCX-es lapkát IF/GMI-vel összekötünk, akkor az már jó.
Kérdésem: hogyan és miért?
Ez CPU esetén azért nem kérdés, mert soha nem volt kérdés, hogy egy CPU lehetne-e 8 helyett 16 magos. Ennek maximum az szabna határt, hogy a szoftver skálázódik-e. De ez a kérdés ugyanúgy sújtja a monolit, mint az összeragasztott megoldást.
Egy lehetséges válasz lehetne, hogy valójában egyáltalán nincs semmiféle skálázódási limit az 4-nél több SE esetén. Lehetne 6, ahhoz persze mondjuk akkor tényleg kéne plusz egy memóriavezérlő is. De limit nincs, csupán arról van szó, hogy 6SE x 11CU esetén a compute teljesímény majdnem ugyanaz, míg a frontendet és a backendet szélesíteni kell. Ez ugyan gamer szempontból jó lenne, de semmit nem segítene a compute taszkokban. ÉS mivel a vega10 fókuszpontja a compute felhasználás volt, ezért hááát így jártunk.
Akkor mondjuk ezt: hogy nincs skálázódási probléma, az AMD tudott volna egy jobb gamer gpu-t készíteni, csak esze ágába nem volt. Nyilván egy ilyen 6x11-es felépítésű kártya nagyobb lapkaméretű lett volna, miközben semmivel sem tudott volna jobb compute eredményeket. Nem volt cél, hogy ezzel a kártyával tényleg körbehugyozzák az 1080Ti-t. Főleg nem egy nagyobb lapkával.
Ha viszont ilyen skálázódási gond van, akkor hogy szűnik meg, ha 2 lapka össze van kapcsolva?
Vagy lehetséges válasz az is, hogy ugyan most még van skálázódási gond, de majd a Navival javítják azt.
Rendben: vajon hogy?

Találgatunk, aztán majd úgyis kiderül..
#35089 Cathulhu addikt Petykemano #35087

Új Válasz 2018-04-16 00:14:04 #35089
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Cathulhu

addikt

válasz Petykemano #35087 üzenetére

Ne haragudj, de csak arra tudok reagalni amit irsz, arra nem amit gondolsz. Az irasodbol meg eleg osszevissza, meg ha szakmailag elegge rendben is van, de olyan dolgokon lovagolsz, ami ebben a kontextusban ertelmezhetetlen, amikor meg megrpobalod kontextusba helyezni, akkor meginkabb. Tovabbra sem ertem (bar lehet egyedul vagyok ezzel) hogy megis mit akarsz kihozni abbol, hogy a vega 10-ben most van IF vagy sincs.
Egyreszt irrelevans, mert a multi GPU osszekottesre nem alkalmas, masreszt irrelevans mert nincs multi-vega10 (egyreszt marha nagy lenne, draga es kilowattnyi hot termelne), harmadreszt majd lesz vega 20-ban ami meg azert irrelevans, mert semmikepp se befolyasolja az, hogy gamereknek mire van szukseguk, megis belemesz egy bottleneck fejtegetesbe.

Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell
#35090 velizare nagyúr Petykemano #35088

Új Válasz 2018-04-16 06:54:30 #35090
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

velizare

nagyúr

válasz Petykemano #35088 üzenetére

te is írtad, hogy egyes teszteken még a 4 se sem skálázódik maradéktalanul.

Tudod, mit jelent az, hogy nemezis? Az érintett, erősebb fél kinyilatkoztatása a méltó büntetés mértékét illetően. Az érintett fél jelen esetben egy szadista állat... én.
#35091 Petykemano veterán velizare #35090

Új Válasz 2018-04-16 08:37:51 #35091
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Petykemano

veterán

válasz velizare #35090 üzenetére

Ebben lehet, hogy tévedek, de szerintem a Vega 56 és 64 közötti kis differencia oka némely esetekben nem az, hogy a 4 SE-re nem skálázódik jól, hanem hogy a 4x16 CU compute teljesítménye sok esetben nem hasznosul, sok esetben elég lenne kevesebb is. Ugyanez viszont nem mondható el az SE többi részéről, a geometry engineről, amit a primitive shader technológia lett volna hivatott felturbózni és a pixel engineről, amit a dsbr igyekszik javítani.

Találgatunk, aztán majd úgyis kiderül..
#35092 gbors nagyúr Petykemano #35091

Új Válasz 2018-04-16 08:44:09 #35092
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

gbors

nagyúr

válasz Petykemano #35091 üzenetére

Ha a 4x16 CU teljesítménye nem hasznosul, akkor ott van valami szűk keresztmetszet. Vagy az SE-k, vagy a ROP-ok, vagy a memória, vagy valami az egész chip infrastruktúrájában.

Pedro... amigo mio... ma is konzervvért iszunk! Kár lenne ezért a tehetséges gyerekért...
#35093 Petykemano veterán Cathulhu #35089

Új Válasz 2018-04-16 08:45:35 #35093
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Petykemano

veterán

válasz Cathulhu #35089 üzenetére

Rendben, bocs, ha félreérthető voltam. Azt gondoltam, hogy ha azt írom, "képzeljünk el" az elegendő abszkrakciós felhívás az elvonatkoztatásra.
Lehet, hogy az én kérdésem triviális és azért nem sikerül átvinni a lényeget. Abból, hogy ennyire nem világos, hogy mire vonatkozik a kérdésem, arra következtetek, hogy szerinted ha a Vega nem 4db 16CU-t tartalmazó egységből épülne fel, hanem 8db 8CU-sból, akkor a compute jellegű teljesítménye ugye pont ugyanakkora lenne, és a grafikai jellegű feladatokban sem lépne fel skálázódási probléma (4 minigpu helyett 8)
(Persze természetesen a lapka nagyobb lenne, mint most, hiszen a CUkon kívül az SE minden részéből kétszer annyit tartalmazna)
Így gondolod?

Találgatunk, aztán majd úgyis kiderül..
#35094 velizare nagyúr gbors #35092

Új Válasz 2018-04-16 08:47:30 #35094
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

velizare

nagyúr

válasz gbors #35092 üzenetére

most itt bővítsük ki a szóhasználatot, és a nem hasznosul mellé tegyük oda a "nem dolgozik"-ot is.

Tudod, mit jelent az, hogy nemezis? Az érintett, erősebb fél kinyilatkoztatása a méltó büntetés mértékét illetően. Az érintett fél jelen esetben egy szadista állat... én.
#35095 gbors nagyúr velizare #35094

Új Válasz 2018-04-16 08:52:35 #35095
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

gbors

nagyúr

válasz velizare #35094 üzenetére

Akár helyette is mondhatjuk, erre gondoltam.

Pedro... amigo mio... ma is konzervvért iszunk! Kár lenne ezért a tehetséges gyerekért...
#35096 velizare nagyúr gbors #35095

Új Válasz 2018-04-16 08:53:23 #35096
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

velizare

nagyúr

válasz gbors #35095 üzenetére

Tudod, mit jelent az, hogy nemezis? Az érintett, erősebb fél kinyilatkoztatása a méltó büntetés mértékét illetően. Az érintett fél jelen esetben egy szadista állat... én.
#35097 Abu85 HÁZIGAZDA

Új Válasz 2018-04-16 09:45:08 #35097
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

Akkor, hogy mindenki tisztán lásson. A tervezés úgy működik manapság, hogy mindenkinek van egy igen jó szimulátora, ez egy marha erős számítógép, amin fut egy szimulációs program. Ebben a szimulátorban rengeteg dizájnt lehet tesztelni, vagyis alaposan kielemezhető, hogy mi és meg és mi nem. Ennek megfelelően a gyártók még azelőtt igen pontos képet kapnak a működésről, mielőtt egyáltalán elkezdenék összerakni a dizájn fizikai implementációját. Ugyanis ezeket a lapkákat már modulárisra tervezik, vagyis az egyes részegységeket összelegózzák, ezért tudnak egy generációban olyan gyorsan 2-3 lapkát is kihozni. Nem tipikusan ezeket tervezik, hanem a részegységeket, amire majd épülnek, és utána rakják össze őket egy lapkává. Ez is egy művészet persze, csak a fizikai dizájnok tesztelése már nagyon drága, így maximum kettő "fordításra" van lehetőség, mert az egész procedúra kb. 50 millió dollárba kerül. Ezért épít ma már mindenki a szimulátorra, ugyanis az legalább négy nullával olcsóbban ad eredményt. Itt azt is ki lehet próbálni, hogy mi az ideális felépítés, és bizony fontos tényező, hogy ha a 6 SE a 4-nél csak 7-8%-kal gyorsabb, mert régebben mondták hogy kb. ennyivel gyorsabb, akkor nem fognak beleölni 15%-nyi extra tranzisztort. Végeredményben ugyanis nem éri meg. Pláne úgy, hogy kb. mindenki a GPU-driver pipeline felé megy, ahol aztán még kisebb az előny, de a 15%-nyi extra tranyót a lapka akkor is hordozza, ha csak 2%-os az extra sebesség az adott játékban.
Az egész tehát messze nem úgy történik, hogy a darabkákat hasraütés-szerűen összepakolják. Előbb a szimulátorban megnézik, hogy az adott lapka élettartama alatt várható terhelésre mi az ideális felépítés, mert annak a lapkának nem csak megjelenéskor kell működnie, hanem másfél évvel később is.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#35098 Abu85 HÁZIGAZDA Petykemano #35093

Új Válasz 2018-04-16 09:55:18 #35098
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Petykemano #35093 üzenetére

Ha arra vonatkozik a kérdés, hogy háromszögek feldolgozása legyen jobb, akkor a motorok fejlődését tekintve inkább TFLOPS-okat rakj bele és ne setup egységeket. A compute culling erősen megváltoztatja a hardverek működését is, ugyanis a játékon belül háromszögekből jóval több lesz, de a GPU oldalán már a pipeline kevésbé lesz terhelve ezektől, mert jó részüket már a pipeline elején kivágja a rendszer. Innentől kezdve a setup terhelése pont, hogy csökken, viszont a multiprocesszorok terhelése nő. Egyre több motor új verziója működik így (idtech, Dunia, Frostbite, Dawn, Glacier, stb.). A több setuppal itt nem érsz el semmit, mert nem ebből lesz kevés, hanem a TFLOPS-okból.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#35099 Petykemano veterán Abu85 #35097

Új Válasz 2018-04-16 10:45:25 #35099
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Petykemano

veterán

válasz Abu85 #35097 üzenetére

"ha a 6 SE a 4-nél csak 7-8%-kal gyorsabb, mert régebben mondták hogy kb. ennyivel gyorsabb, akkor nem fognak beleölni 15%-nyi extra tranzisztort. Végeredményben ugyanis nem éri meg. Pláne úgy, hogy kb. mindenki a GPU-driver pipeline felé megy, ahol aztán még kisebb az előny, de a 15%-nyi extra tranyót a lapka akkor is hordozza, ha csak 2%-os az extra sebesség az adott játékban."
Rendben, nyilvánvaló, hogy az AMD céljainak (lett légyen az bármi) a 4 SE felelt meg legjobban. Ez volt a legtranzisztorkímélőbb.
Azt mondd meg, hogy ha majd megfogsz 2db ilyen lapkát - amiben feltehetőleg egyenként lesz 4db SE - és IF-fel / GMI-vel összekötöd, akkor hogy fog az 2%, meg 7-8%-nál jobb többlet-teljesítményt adni, ha már a 4 helyett 6 SE is csupán ennyivel jelentene többet?
Mi lesz más a felépítésben, vagy működésben, ami lehetővé teszi, hogy 4 helyett 2x4 jól működjön, de 4 helyett 6 SE szarul skálázódik?
Vagy esetleg azt mondod, hogy valójában nem 4 SE-vel rendelkező lapkákat fognak összekötni IF/GMI-vel, hanem 2db 2SE-vel rendelkezőt, hovatovább 4db 1SE-vel rendelkező lapkát és akkor megmarad az ideális 4 SE? (Amit ugye a program 1 GPU-nak lát hiába áll több lapkából)

Találgatunk, aztán majd úgyis kiderül..
#35100 Abu85 HÁZIGAZDA Petykemano #35099

Új Válasz 2018-04-16 11:03:28 #35100
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Petykemano #35099 üzenetére

Ha elméletben összekötnél mondjuk két Vega 10-et, akkor ott a 8 SE már 24 TFLOPS fölötti teljesítményt ad. Ergo ahhoz a számítási teljesítményhez már kell a többlet, de nem kell a 12 TFLOPS-hoz. Ott hibáztok, hogy azt hiszitek, hogy ezek az egységek nem egymáshoz vannak tervezve. Az egész attól függ, hogy a tömbben mennyi multiprocesszor van. Ha csinálsz 4 tömböt tömbönként 16 multiprocesszorral, akkor az a szimuláció alapján optimális lesz. De ha csinálsz 8 tömböt tömbönként 8 multiprocesszorral, akkor valójában tranzisztort fogsz pazarolni. Persze ez csak a Vega dizájnjára érvényes. A régebbi dizájnok más konfigurációban működhetnek jól.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák

Téma tudnivalók

A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!

MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!

A topik témája:

Az AMD éppen érkező, vagy jövőbeni új grafikus processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva. Architektúra, esélylatolgatás, érdekességek, spekulációk, stb.

Aktív témák

Hirdetés

Új prémium hirdetések

Új ingyenes hirdetések

Állásajánlatok

Full Stack Developer Diákmunka

Cég: Ozeki Kft.

Város: Debrecen

Részletek

IT café - infotech fórumok

Mobilarena - mobil fórumok

PROHARDVER! - hardver fórumok

GAMEPOD.hu - játék fórumok

LOGOUT.hu - lépj ki, lépj be!

FÁRADT GŐZ - közösségi tér szinte bármiről

Blokkméret

Rendezés

Kezdő blokk

Új hozzászólás Aktív témák

Új hozzászólás Aktív témák

IT café - infotech fórumok

Mobilarena - mobil fórumok

PROHARDVER! - hardver fórumok

GAMEPOD.hu - játék fórumok

LOGOUT.hu - lépj ki, lépj be!

FÁRADT GŐZ - közösségi tér szinte bármiről

Blokkméret

Rendezés

Kezdő blokk

Hi﻿rd﻿e﻿t﻿é﻿s

Állásajánlatok

Full Stack Developer Diákmunka

Hirdetés