-
IT café
A legtöbb kérdésre (igen, talán arra is amit éppen feltenni készülsz) már jó eséllyel megtalálható a válasz valahol a topikban. Mielőtt írnál, lapozz vagy tekerj kicsit visszább, és/vagy használd bátran a keresőt a kérdésed kulcsszavaival!
Új hozzászólás Aktív témák
-
Cathulhu
addikt
válasz Jack@l #35050 üzenetére
Akkor muvelodj inkabb a GPUk memoria felepiteserol ugy nagy altalanossagban, mielott osztod az eszt. Bar tudom utobbit jobban szereted, meg akkor is ha az esetek 90%-ban szintiszta baromsagokat hordasz ossze.
Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell
-
Jack@l
veterán
válasz Cathulhu #35051 üzenetére
Most akkor fröcsögsz, vagy ki tudod mérni egy gpgpu-s kis programmal?
A hozzászólási jogosultságodat 2 hónap időtartamra korlátoztuk (1 hsz / 10 nap) a következő ok miatt: Az ÁSZF III 10/8. pontjának megsértése - trollkodás - miatt. Többször és többen is kértek már, hogy hozzászólás írásakor használd a linkelés funkciót, mert ennek elmaradása sokak számára zavaró.
-
Cathulhu
addikt
válasz Jack@l #35052 üzenetére
Mit merjek ki? Hogy van-e 2x8 MB-nyi kozos cache terulet a magok kozott? Vagy hogy az OS dobalja-e a taskokat ide-oda a CCX-ek kozott mint Ryzenen? Oszinten varom az indoklasodat tovabbra is (es nem a mellebeszelest) hogy miert lenne hatranyos egy IF-al osszedrotozott tobb kisebb complexre szetosztott GPU architektura? Azert erdekelne, hogy tudjam valoban kapizsgalod-e amirol beszelsz, vagy csak "frocsogsz" a te szohasznalatoddal elve.
[ Szerkesztve ]
Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell
-
Petykemano
veterán
válasz #45185024 #35046 üzenetére
Nem baj. Hanem tényleg átvitték a knowhowt a sikeres zenből a radeonhoz. Persze hogy ez pontosan mi, az jó kérdés... talán csak az EPYC. Ha nem, akkor azért az ciki, hogy a 3000fős - sikertelen - RTG-hez kell egy új nagyagy.
Nincs baj az epyckel, csak az igazság az, hogy ezt már moat is megtehetnék. Mármint a kis lapkákra való szétbontás azért indokolt, es szükséges, hogy normális selejtaránnyal lehessen gyártani. Ha megvan a recept 2-4 Vega (merthogy a navi ugye 1080 teljesítményű középkatwgóriás lapka lesz) összekapcsolására, ahhoz nem kell külön lapkákként legyártani. Ha nem rakják rendbe a navit akkor hiába lesz mcm, akkor is alul fog maradni a konkurens termékkel szemben.
Találgatunk, aztán majd úgyis kiderül..
-
#45185024
törölt tag
válasz Petykemano #35054 üzenetére
No ha már nem félünk az erős szerverprocis Apuktól amik részegységeit lekapcsolva CPUsan feszt spórolnak meg térjünk át a másik mondandódra az 1080 teljesítményű Navira.
A történetből egy apró dolgot hagytál ki hogy a Fudzillás leaksben van egy ár
Pletyka: Az AMD Navi a GeForce GTX 1080-as szintű teljesítményét kínálja a 250$ -os Budget árszegmensben.
Igen ez szörnyű katasztrófa lenne, ha az 1080 at is ennyiért árulnák
Akkor meg nem ha ezt beteheted egy APUba és mellé tehetsz egy 2700x+40%os CPU-t
Kiállsz a pódiumra és ezt mondod.
Amézing mostantól nem kellenek videókártyák 1080-as (vagy Vega) szintig.
és itt vannak a real 4K konzolok olcsón, ki is akarna ekkor méregdrága videókártyákat venni ?
Kiáll 3 lány miniszoknyában a pódiumra és a középső thay szépségkirálynő szoknyában kb így öltözve
A középsőnél lesz az APU (CPU-GPU) a szélsőknél a fantáziádra bízom mit tokoznak össze (CPU-CPU , GPU-GPU)[ Szerkesztve ]
-
Petykemano
veterán
válasz #45185024 #35055 üzenetére
Azért tegyük hozzá: 1080-as szintű kártya $250-ért 2019-ben - de még 2018-ban sem - nem nagy wasistdas. Ha ugyanis az nvidia kihozza a következő XX60-as kártyáját, ami általában szintén ezt az árshegmenst szokta célozni, az is el fogja érni a mai 1080-as szintet. (Ahogy ugye a mai 1060 is eléri a 980-at.)
Az árban én Mondjuk erősen kételkedek, de persze bízzunk, reméljünk.
Ami az apukat illeti, nem tudom, nevezzük-e mcm tokozásban összeragasztott cput es gput apunak. Illetve nem tudom, hogy bárminemű előnye lenne-e annak, ha nem egy külön gyártott cput és gput ragasztóznak össze, hanem két valódi aput, ahol tényleg ott van mellette az igp egybegyártva. Merthogy azt gondolom, ilyen lapka is lesz, hiszen nyilván le kell fedni a piacnak azt a részét, ahol szingli CPU (am4), szingli gpu vagy szingli apu kell, mert kicsik az igények.
Aztán ezeket el lehet kezdeni összetokozni:
CPU +CPU: Threadripper
CPU +CPU+CPU +CPU: EPYCA gyönyörű az lenne, ha 2 vagy 4 kompozícióban bármit bármivel össze lehetne rakni. Namost ennek persze compute vonatkozásban nyilván nincsen akadálya (lásd Vega cube ), de vajon a grafikát hogy és mi fogja skálázni több gpu felé automatikusan?
Vagy lehetséges lenne, hogy nem komplett gpukat fognak összetokozni, hanem különböző részegységeket. Erre egyébként én kevés esélyt látok, az AMD ennél nagyobb biztonsági játékos.Találgatunk, aztán majd úgyis kiderül..
-
Televan74
nagyúr
válasz Petykemano #35056 üzenetére
Ez attól függ mikor jön a Navi. A Nvidia is a xx60 -at csak 2019 tavaszára dátumozza.Addig csak a xx70/xx80 modellek fognak érkezni ősztől.
Több GPU egyben,ha nincs driver oldali támogatás,akkor csak benchmarkolni lesz jó.
AMD mindig szerette a kihívásokat,különös megoldásokat és erre párszor rá is b@sztak.
Amikor nincs remény! Jusson eszedbe nincs isten, csak én!
-
#45185024
törölt tag
válasz Petykemano #35056 üzenetére
Jaj Petyke jaj, 19 még messze van. AMD-é 18 ban már itt lesz.
Inkább nézzél 'ménsztrím' videókat:
Facebook sucks Future AMD GPUs could be GREAT! - WAN Show Apr.13 2018[ Szerkesztve ]
-
Petykemano
veterán
válasz Televan74 #35057 üzenetére
Talán csak én vagyok pesszimista, de az, hogy az 1080 értékű XX60 csak 2019-ben jön, nekem pont nem azt üzeni jelen körülmények között, hogy jaj szegény nvidia megcsúszott és csak késve tudja kidobni a középkategóriát, hanem pont azt, hogy ráér akkor is, addig meg max az 1080 is elketyeg abban az árszegmensben.
Több GPUt egybetokozni igen, csakis akkor van értelme, ha szoftveres rásegítés nélkül, vagyis valami közös frontenddel egy gpunak látszódva működik. Gbors cikke alapján az SM, meg az SE már már most is belső mini -gpuként működik, amit egy közös frontend köt össze és ütemez. Akkor van értelme az egybetokozásnak, ha meg tudják oldani, hogy több külön gpuban levő egyégeket egyben tudjanak ütemezni. Csak ha ezt Meg tudják oldani, akkor ahhoz nem feltétlenül szükségesek külön gpu lapkák, meg mcm.
Találgatunk, aztán majd úgyis kiderül..
-
Abu85
HÁZIGAZDA
válasz Petykemano #35056 üzenetére
Az Infinity Fabric arra van, hogy ezzel ne kelljen törődni. A 4 darab Zeppelin magot használó EPYC is egyetlen 32 magos processzornak látszik az operációs rendszer felé. A kulcs a koherencia.
Egyébként a mai GPU-k belül nem különböznek ettől. Ott is tömbökbe vannak szervezve a multiprocesszorok, és egymás felé eléggé lassú a kommunikáció (30-40 GB/s maximum). De ugye kit érdekel, alig kommunikálnak egymással, a GCN esetében azt is egy 64 kB-os táron keresztül. Az Infinity Fabric-nak elég ezt a tárat szinkronizálnia a lapkák között.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Televan74
nagyúr
Navi -t is majd hasonlóan kell elképzelni.Mondjuk a csúcs kategórián lesz 4 modul,a középen lesz 2,a belépő meg 1 modul lesz? Vagy a belépő szint 1 modullal az már csak APU lesz?
Szerk.: Látom közben megkaptam a választ,részben.
[ Szerkesztve ]
Amikor nincs remény! Jusson eszedbe nincs isten, csak én!
-
Abu85
HÁZIGAZDA
válasz Televan74 #35062 üzenetére
Az én véleményem szerint klasszikus értelemben nem lesz több APU. Sokkal célszerűbb GMI-vel összekötni a CPU-t és a GPU-t. Vagy két CPU-t és két GPU-t ugyanazon a tokozáson. Esetleg egy CPU-t két GPU-val. Ez innentől kezdve már legó. A működés tekintetében nem lesz különbség ahhoz képest, mintha tényleg egy lapkán lenne mind.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Plasticbomb
addikt
válasz Petykemano #35059 üzenetére
köszi, hogy emlékeztettél, el akartam már olvasni gbors cikkét, de elfeledtem, most megtettem. De most végre megyek fürödni, elég jó cikk volt, nem bírtam ott hagyni...
ArchLinux, Star Citizen, Subnautica+BZ, ASTRONEER, Grounded, DRAG, VOLCANOIDS, Space Engineers, Elite:Dangerous, Beyond Blue (TK-Glitch Proton)
-
Petykemano
veterán
Azért szerintem van különbség. De legyen igazad, akkor az AMD miért nem csinált 4SE x 16 CU helyett mondjuk 6x10-eset? A belső kommunikációért már a vegában is az IF felel, nem?
Vagy akkor Mondd el, kérlek, hogy ehhez képest miért könnyebb 2db komplett 4 SE-nel rendelkező lapka összedrótozása IF-fel, hogy ez így egy gpunak látsszon?
Miért nem teszi meg ezt az AMD két Vega lapkával?
Találgatunk, aztán majd úgyis kiderül..
-
Cathulhu
addikt
válasz Petykemano #35065 üzenetére
"Miért nem teszi meg ezt az AMD két Vega lapkával?"
Nem emiatt lesznek az uj vegaban IF busok? Ha 7 nanon merseklodik a fogyasztas es az ar, akkor ugyan meg mindig dragan, de meg lehet csinalni. Lehet nem veltlen az MI a celpiac. Kerdes, hogy ki vesz MI-re AMD-t.Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell
-
Petykemano
veterán
válasz Cathulhu #35066 üzenetére
Lesznek??
3. Oldal 1. Hasáb 2. Bekezdés
Vagy most már ez is a "benne van, höhö, de rohadtul nem működik" fícsörök listáját hosszabbítja csak?Egyébként nekem tökre elfogadható válasz lenne, hogy jött a bámyászláz és hát így is elfogyott minden az utolsó szálig, felesleges lett volna küazködni az egybetokozott, vagy más módon összekapcsolt (Vega cube) gpuval való erőlködés.
(Csak közben persze tegyük hozzá, hogy az nvidia népszerűségének az is részét képezi, hogy képes és hajlandó legyártani a leggyorsabb terméket a piacra akkor is, ha Elképesztő áron, vagy valójában sehogy nem is árulja)Találgatunk, aztán majd úgyis kiderül..
-
#45185024
törölt tag
A GamesBeat konferencián a Sonytól Andrew House beszélt a PlayStation és a konzolok jövőjéről.
Majd erre a TweakTown emlékeztetett egy cikkel egy "exkluzív TweakTown forrás"-ra hivatkozva miszerint a PS5 már nem "gyenge APU"-t fog használni hanem GPU-t.
"PlayStation 5 will feature full discrete GPU, not an APU"
Ami általam átértelmezve egy Navi GPU-t jelentene.[ Szerkesztve ]
-
szmörlock007
aktív tag
-
Abu85
HÁZIGAZDA
válasz Petykemano #35065 üzenetére
Csinálhatnak, ez csak döntés kérdése. A Vega esetében a 4 az optimális, mert a 6 tömb aránytalanul sok extra tranzisztorköltség ahhoz képest, ami előnyt ad.
A probléma a jövőben specifikus lesz. A 7 nm-es node-on már jelezték a bérgyártók, hogy a méretes lapkákat igen gazdaságtalan lesz legyártani. Emiatt a mostani tipikus 400-500 mm^2 közötti reális határ inkább 300-350 mm^2 lesz. Nem fognak megérni fölé menni, de az optimális is inkább 200 mm^2. Tehát költségben, 7 nm-es node-on sokkal előnyösebb 4 200 mm^2-es lapkát csinálni és valahogy összekötni, mint egy 700 mm^2-est. Az 5 nm-re még borúsabbak a kilátások. Ott inkább 100 mm^2 tűnik az optimális határnak, de egyelőre erről még kevés a tapasztalatra épülő adat. Ez persze akkora gond így sem lesz, mert mire elérjük az 5 nm-et, addigra 3D-ben is építkezhetünk majd, tehát úgy összeköthetsz mondjuk négy stacket, hogy egy stack kettő vagy akár négy lapkából áll majd, vagyis effektíve 16 lapka lesz összekötve. 5 nm-en túl teljes homály van. Nagyjából abban ért egyet mindenki, hogy a chipletek koncepciója az egyetlen gazdaságilag fenntartható opció.
Erre készül a Vega 20, amibe beépítik a GMI-ket. Onnantól tényleg legó az egész, lásd EPYC.
(#35066) Pinky Demon: Maga az Infinity Fabric már a Vega része, elvégre a Raven Ridge-ben a Zen és a Vega klaszter így van összekötve (részben emiatt olyan veszettül gyors az az IGP), és nyilván a Vega 10-ben is IF van belsőleg. Ami hiányzik az a GMI, vagyis az IF kivezethető memóriakoherens interfésze. Emiatt nem lehet most összekötni két Vegát, de a Vega 20 ebből tartalmaz majd négyet is.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Cathulhu
addikt
válasz Petykemano #35067 üzenetére
Kozosen IF neven emlegetnek tobb kulonbozo bust, amik mas-mas feladatot latnak el a modulok kozti kommunikacioban. Az a gyanum (de ezt megalapozni nem tudom), hogy ami a jelenlegi veganal van, az csak egy kis resze ennek, es nem a teljes IF ami ket vega kozotti kommunikaciot is lehetove tenne. Abu cikkjebol viszont az jon le, hogy eggyel tovabb lepnek az uj vegaban.
#35070, koszonom, egyre gondoltunk akkor.
[ Szerkesztve ]
Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell
-
Abu85
HÁZIGAZDA
válasz Cathulhu #35071 üzenetére
Pontosan. Az Infinity Fabric leginkább egy gyűjtőnév. Igazából maga a fejlesztés nagyon komplex és nagyon moduláris. Az AMD eldöntheti, hogy az IF-ből miket épít egy lapkába. Nyilván ha nem akarják sosem összekötni ezeket, akkor a GMI komponens csak felesleges tranzisztorköltség. Ha pedig terv van az összekötésre, lásd Vega 20, akkor elég belegózni a dizájnba. Az, hogy itt az összekötés miképp lesz megoldva már megint egy külső tényező. A négy GMI-t rengeteg dologra lehet felhasználni. Összeköthető szimplán két lapka, ahol mind a négy interfész ezt szolgálja. Vagy négy lapka, ahol lapkánként három GMI gondoskodik a kommunikációról, és még marad mindegyikben egy, hogy melléhelyezhető legyen egy másik tokozásban még négy lapka. Kvázi olyan formában, amilyen az EPYC kétutas dizájnja. És ha már itt tartunk, akkor természetesen lehet vegyíteni a Vega 20-at a készülő Rome CPU-val. Egy tokozásra maximum négy lapka helyezhető majd, hogy abból mennyi a Vega 20 és mennyi a Rome az már egyéni döntés kérdése. Valószínű egyébként, hogy első körben egy Vega 20 és egy Rome lesz egy tokozáson, mert a Vega 20-nak azért szüksége lenne mind a négy GMI-re, hogy ezeken keresztül teljes sebességgel el tudja érni a Rome CPU-hoz kapcsolódó rendszermemóriát. A sampling sem véletlenül van egymáshoz kötve, mivel a Rome és a Vega 20 is elérhető lesz a partnereknek a Q4-ben.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Carlos Padre
veterán
válasz Petykemano #35045 üzenetére
Anno volt egy víziója az AMD-nek, miszerint a CPU és GPU részleget összefésülik, mindkettőből a legjobbat hozva ki, de jött ez a Raja és megtorpedózta az egészet. A végeredményt mind látjuk. Most, hogy lelépett úgy látszik visszatérnek az eredeti koncepcióhoz.
Genyó vagyok, ha hülye vagy megmondom.
-
Petykemano
veterán
Ok, a gyártástechnológia miatti kis lapkák gyártásáról szóló kényszer világos (unalomig ismételgetett)
De nem magyarázza, nem indokolja, nem következik belőle, hogy az AMD 2db teljes gpu lapkát GMI-vel összekötve hogy tud skáláztatni, míg most meg nem? Amikor pedig az IF benne van a vegában.
Pedig teljesen nyilvánvaló gbors számaiból (is, ha eddig nem volt triviális), hogy vagy a ROP gyengus, vagy a geometria. Nem véletlen, hogy a primitive shader ás a dsbr is ezt célozta, és az intelnek készült vegaris is pont ezeket a részeket duplázta a P10-zel összevetve.Hogy lehetséges az, hogy ha 6 Se 4 helyett aránytalanul nagy tranzosztorköltséget jelent, akkor majd 2x4 Se IF@GMI-vel összekötve az meg már majd nem?
Találgatunk, aztán majd úgyis kiderül..
-
#45185024
törölt tag
Lisa Mama ma a Kínai F1-en miután zsíros üzleteket kötött Kínában.
Mi lesz veled embargó... Csak a piros csak a piros...[ Szerkesztve ]
-
Cathulhu
addikt
válasz Petykemano #35074 üzenetére
De az IF nincs benne a Vegaban. Csak egy kis resze. Pont az hianyzik ami osszekotne ket vegat. Az majd most kerul bele.
Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell
-
-
#45185024
törölt tag
válasz TTomax #35079 üzenetére
Mit keres egy AMD találgatós szobába hogy Lisa Su kínában van ?
A kérdés nem az hogy miért van ott és milyen kereskedelmi üzletről tárgyal ?
Vagy a 138. onban elkövetett semmiről sem szóló trollkodásod mit keres itt meg a vega szobában ezt akartad kérdezni ?[ Szerkesztve ]
-
Petykemano
veterán
válasz Cathulhu #35076 üzenetére
Talán félreérthetően fogalmaztam.
Azt értem, hogy abu állítása szerint az Infinity fabricnek az a része, amely két lapka epycus összekapcsolását teszi lehetővé a vega10-nek nem része. Vagyis fogalmazzunk úgy, hogy az IF nincs kivezetve. Ez lenne a GMI. Ez nincs, 2 vega10 lapkát nem lehet összekapcsolni IF/GMI-vel Mert nem tartalmazza.
A kérdésem arra vonatkozik akkor tehát, hogy:
Most a vega10-ben van 4SE, ugye? Ehhez kapcsolódnak a számítást végző alrendszerek (1 SE = 1 geometrai motor, 16 CU és a végén meghatározott számú pixel engine - nagyjából ezt nevezi gbors mini-gpunak) Ezen most csak azért rugózok, mert szintén gbors által szállított adatok alapján a vega10 szűk keresztmetszetét a geometria vagy a pixel motor adja. De tesztek során is láttuk, hogy azonos órajelen néha nem volt különbség 56 és 64 CU között.
Na tehát ezt a 4 SE-t kapcsolja össze a parancsprocesszor, meg az ütemező, meg az IWDMiközben az egész körül ott az IF az ábra szerint és a display motor meg mittoménmivel a memóriával együtt a kommunikáció már az IF-en keresztül zajlik.
Namost Abu állítása szerint azért 4 SE van a vegában, mert ez az ideális. Most azt mondja, hogy túl sok tranzisztor kellett volna és ahhoz képest kevés lett volna az elérhető nyereség. Korábban ugyanezt a kérdést a túlzottan nagy memóriasávszélesség igényével indokolta. De ezt most hagyjuk.
Egyébként mégegyszer idézném a vega whitepapert:
"“Vega” 10 is the first AMD graphics processor built using
the Infinity Fabric interconnect that also underpins our
"Zen" microprocessors. This low-latency, SoC-style
interconnect provides coherent communication between
on-chip logic blocks with built-in quality-of-service and
security capabilities. Because it is a standard across our IP
portfolio, Infinity Fabric allows us to take a flexible,
modular approach to processor design. We can mix and
match various IP blocks to create new configurations to
serve our customers' needs. In “Vega” 10, Infinity Fabric
links the graphics core and the other main logic blocks on
the chip, including the memory controller, the PCI Express
controller, the display engine, and the video acceleration
blocks. Thanks to the Infinity Fabric support built into each
of these IP blocks, our future GPUs and APUs will have the
option of incorporating elements of the “Vega” architecture
at will."Mégegyszer elmondom: világos, hogy ez nem teszi lehetővé két vega10 lapka összekötését, de a belső kommunikációért már az IF felel.
Namost lépjünk egyet az időben és képzeljük el azt, hogy például már Vega20-ban benne lesz az IF-en keresztüli külső kommunikációt lehetővé tevő GMI és össze lehet majd kötni két vega20-at. Eddig annyit tudunk, hogy a vega20 szinte majdnem ugyanaz lesz, mint a vega10, csak DP támogatással és kétszeres HBM kapacitással és sávszélességgel (amúgy mi végett? A vega10 talán sávszél limites? Vagy esetleg ez annak beismerése, hogy a vega 10 pixel-engine limites és ahogy gbors is mondta, majdnem jó lenne a dsbr, csak több pixel engne kell hozzá, amihez meg több sávszélessség?)
Na tehát képzeljü el az IF-fel összekötött 2db vega20 lapkát. Mi az, ami miatt az 1 lapkában a 4 SE pont ideális volt és annál több már pazarlás lett volna, mert nem skálázódik jól a rendszer, DE ha 2 lapkát összekötik és lesz 2x4 SE, akkor már hirtelen kellően jó skálázódást biztosít? Hiszen az IF-nek a lényege, hogy a program egyben, 1 GPU-ként látja mind 8SE-vel rendelkező rendszer.
(Remélem így már érthető a kérdésem)
Találgatunk, aztán majd úgyis kiderül..
-
TTomax
nagyúr
válasz #45185024 #35082 üzenetére
Hadd javítsalak ki,Kínában van egy forma1-es versenyen mint szponzor,mi lesz következő?A WCben van?Még mindig nem válaszoltál a kérdésre,hogy hogyan kapcsolódik a topichoz,ahol az amd radeonról találgatnak. Kézenfekvő,SEHOGY!Akkor?
[ Szerkesztve ]
★★★★★ I got too much soul, rhythm and blues R&B ya see, all that's cool, but hip-hop and rap yeah that's where my heart's at Even back when I used to break on a box ★★★★★ "Chief Rocka"
-
leviske
veterán
válasz Petykemano #35074 üzenetére
Engem speciel a 1950X meggyőzött a skálázódásról. A DX11 pedig eleve olyan formában kezeli a GPU-t, ahogy azt a driver neki mondja. Amikor adott az egységes memória, akkor elméletileg nem kéne, hogy gond legyen a skálázódással (a késleltetéseken túl, persze).
A tranzisztorpazarlásnál meg figyelembe kell venni, hogy mennyivel drágul egy lapka legyártásának költsége a méretével arányosan. Nem kizárt, hogy az az 50%-os emelés drágábbra jön ki egy monolitikus lapkával megoldva, mint egy 100%-os emelés két kisebb lapkán megoldva. Ezt meglátjuk az év végéig.
MOD: a hosszabb hozzászólásod még nem létezett, mikor elkezdtem írni
[ Szerkesztve ]
-
Cathulhu
addikt
válasz Petykemano #35083 üzenetére
"Eddig annyit tudunk, hogy a vega20 szinte majdnem ugyanaz lesz, mint a vega10, csak DP támogatással és kétszeres HBM kapacitással és sávszélességgel (amúgy mi végett? A vega10 talán sávszél limites? Vagy esetleg ez annak beismerése, hogy a vega 10 pixel-engine limites és ahogy gbors is mondta, majdnem jó lenne a dsbr, csak több pixel engne kell hozzá, amihez meg több sávszélessség?)"
Az a baj abbol a feltevesbol indulsz ki, hogy a vega20-at gamer kartyanak szanjak, es ehhez nezed a bottleneckeket. Hivatalosan Instinct lesz, ahol a legevesbe sem szamitanak pl a ropok, de annal inkabb a memoria mennyiseg es savszel.
Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell
-
Petykemano
veterán
válasz Cathulhu #35086 üzenetére
Ne haragudj, de sikerült nagyon megragadnod a lényeget.
Nyivlánvaló, hogy a Vega20 nem gamer kártya lesz - még ha esetleg készül is belőle valami játékra is használható Frontier Edition. Felejtsd el a vega20-at. Azért azt mondtam, mert az van legközelebb és arra mondta abu, hogy lesz benne GMI, amivel működik az összekapcsolás.
Te akkor vedd úgy, hogy vega20 helyett Navit mondtam és úgy értelmezd a kérdésemet.Találgatunk, aztán majd úgyis kiderül..
-
Petykemano
veterán
válasz leviske #35085 üzenetére
Az 1950X arról győzhetett meg, hogy az IF kellően nagy sávsélességgel és elfogadható késleltetéssel tudja biztosítani a külön lapkákon levő magok közötti kommunikációt, a cache-koherenciát.
Abban nincs kérdés, hogy ha az 1950X 4 CCX-e történetesen 1 lapkán lenne, akkor az ugyanolyan jól vagy még jobban skálázódna. Persze legyártani biztos egyszerűbb és olcsóbb a kis lapkákat és a külön lapkák összeköttetése is elég jó, tehát lehet darabolni.
A GPU-kra vonatkozó kérdésem a zen CCX-ekre lefordítva így hangzana:
Látjuk, hogy van4SE2 CCX a zeppelin lapkán. Ennél persze lehetne gyorsabb is. Kérdés: Miért nem tesz az AMD egy lapkára6SE-t3CCX-et? Abu válasza: hát az nem lenne jó, mert túl sok tranzisztor, mközben alig skálázódna jól (Zárójelben: közben ugye látjuk, hogy ez az állítás a CPU-k esetén valószínűleg nem igaz) De ha 2db4SE-s2CCX-es lapkát IF/GMI-vel összekötünk, akkor az már jó.Kérdésem: hogyan és miért?
Ez CPU esetén azért nem kérdés, mert soha nem volt kérdés, hogy egy CPU lehetne-e 8 helyett 16 magos. Ennek maximum az szabna határt, hogy a szoftver skálázódik-e. De ez a kérdés ugyanúgy sújtja a monolit, mint az összeragasztott megoldást.Egy lehetséges válasz lehetne, hogy valójában egyáltalán nincs semmiféle skálázódási limit az 4-nél több SE esetén. Lehetne 6, ahhoz persze mondjuk akkor tényleg kéne plusz egy memóriavezérlő is. De limit nincs, csupán arról van szó, hogy 6SE x 11CU esetén a compute teljesímény majdnem ugyanaz, míg a frontendet és a backendet szélesíteni kell. Ez ugyan gamer szempontból jó lenne, de semmit nem segítene a compute taszkokban. ÉS mivel a vega10 fókuszpontja a compute felhasználás volt, ezért hááát így jártunk.
Akkor mondjuk ezt: hogy nincs skálázódási probléma, az AMD tudott volna egy jobb gamer gpu-t készíteni, csak esze ágába nem volt. Nyilván egy ilyen 6x11-es felépítésű kártya nagyobb lapkaméretű lett volna, miközben semmivel sem tudott volna jobb compute eredményeket. Nem volt cél, hogy ezzel a kártyával tényleg körbehugyozzák az 1080Ti-t. Főleg nem egy nagyobb lapkával.
Ha viszont ilyen skálázódási gond van, akkor hogy szűnik meg, ha 2 lapka össze van kapcsolva?Vagy lehetséges válasz az is, hogy ugyan most még van skálázódási gond, de majd a Navival javítják azt.
Rendben: vajon hogy?Találgatunk, aztán majd úgyis kiderül..
-
Cathulhu
addikt
válasz Petykemano #35087 üzenetére
Ne haragudj, de csak arra tudok reagalni amit irsz, arra nem amit gondolsz. Az irasodbol meg eleg osszevissza, meg ha szakmailag elegge rendben is van, de olyan dolgokon lovagolsz, ami ebben a kontextusban ertelmezhetetlen, amikor meg megrpobalod kontextusba helyezni, akkor meginkabb. Tovabbra sem ertem (bar lehet egyedul vagyok ezzel) hogy megis mit akarsz kihozni abbol, hogy a vega 10-ben most van IF vagy sincs.
Egyreszt irrelevans, mert a multi GPU osszekottesre nem alkalmas, masreszt irrelevans mert nincs multi-vega10 (egyreszt marha nagy lenne, draga es kilowattnyi hot termelne), harmadreszt majd lesz vega 20-ban ami meg azert irrelevans, mert semmikepp se befolyasolja az, hogy gamereknek mire van szukseguk, megis belemesz egy bottleneck fejtegetesbe.Ashy Slashy, hatchet and saw, Takes your head and skins you raw, Ashy Slashy, heaven and hell, Cuts out your tongue so you can't yell
-
nagyúr
válasz Petykemano #35088 üzenetére
te is írtad, hogy egyes teszteken még a 4 se sem skálázódik maradéktalanul.
Tudod, mit jelent az, hogy nemezis? Az érintett, erősebb fél kinyilatkoztatása a méltó büntetés mértékét illetően. Az érintett fél jelen esetben egy szadista állat... én.
-
Petykemano
veterán
válasz velizare #35090 üzenetére
Ebben lehet, hogy tévedek, de szerintem a Vega 56 és 64 közötti kis differencia oka némely esetekben nem az, hogy a 4 SE-re nem skálázódik jól, hanem hogy a 4x16 CU compute teljesítménye sok esetben nem hasznosul, sok esetben elég lenne kevesebb is. Ugyanez viszont nem mondható el az SE többi részéről, a geometry engineről, amit a primitive shader technológia lett volna hivatott felturbózni és a pixel engineről, amit a dsbr igyekszik javítani.
Találgatunk, aztán majd úgyis kiderül..
-
nagyúr
válasz Petykemano #35091 üzenetére
Ha a 4x16 CU teljesítménye nem hasznosul, akkor ott van valami szűk keresztmetszet. Vagy az SE-k, vagy a ROP-ok, vagy a memória, vagy valami az egész chip infrastruktúrájában.
Pedro... amigo mio... ma is konzervvért iszunk! Kár lenne ezért a tehetséges gyerekért...
-
Petykemano
veterán
válasz Cathulhu #35089 üzenetére
Rendben, bocs, ha félreérthető voltam. Azt gondoltam, hogy ha azt írom, "képzeljünk el" az elegendő abszkrakciós felhívás az elvonatkoztatásra.
Lehet, hogy az én kérdésem triviális és azért nem sikerül átvinni a lényeget. Abból, hogy ennyire nem világos, hogy mire vonatkozik a kérdésem, arra következtetek, hogy szerinted ha a Vega nem 4db 16CU-t tartalmazó egységből épülne fel, hanem 8db 8CU-sból, akkor a compute jellegű teljesítménye ugye pont ugyanakkora lenne, és a grafikai jellegű feladatokban sem lépne fel skálázódási probléma (4 minigpu helyett 8)
(Persze természetesen a lapka nagyobb lenne, mint most, hiszen a CUkon kívül az SE minden részéből kétszer annyit tartalmazna)Így gondolod?
Találgatunk, aztán majd úgyis kiderül..
-
nagyúr
-
Abu85
HÁZIGAZDA
Akkor, hogy mindenki tisztán lásson. A tervezés úgy működik manapság, hogy mindenkinek van egy igen jó szimulátora, ez egy marha erős számítógép, amin fut egy szimulációs program. Ebben a szimulátorban rengeteg dizájnt lehet tesztelni, vagyis alaposan kielemezhető, hogy mi és meg és mi nem. Ennek megfelelően a gyártók még azelőtt igen pontos képet kapnak a működésről, mielőtt egyáltalán elkezdenék összerakni a dizájn fizikai implementációját. Ugyanis ezeket a lapkákat már modulárisra tervezik, vagyis az egyes részegységeket összelegózzák, ezért tudnak egy generációban olyan gyorsan 2-3 lapkát is kihozni. Nem tipikusan ezeket tervezik, hanem a részegységeket, amire majd épülnek, és utána rakják össze őket egy lapkává. Ez is egy művészet persze, csak a fizikai dizájnok tesztelése már nagyon drága, így maximum kettő "fordításra" van lehetőség, mert az egész procedúra kb. 50 millió dollárba kerül. Ezért épít ma már mindenki a szimulátorra, ugyanis az legalább négy nullával olcsóbban ad eredményt. Itt azt is ki lehet próbálni, hogy mi az ideális felépítés, és bizony fontos tényező, hogy ha a 6 SE a 4-nél csak 7-8%-kal gyorsabb, mert régebben mondták hogy kb. ennyivel gyorsabb, akkor nem fognak beleölni 15%-nyi extra tranzisztort. Végeredményben ugyanis nem éri meg. Pláne úgy, hogy kb. mindenki a GPU-driver pipeline felé megy, ahol aztán még kisebb az előny, de a 15%-nyi extra tranyót a lapka akkor is hordozza, ha csak 2%-os az extra sebesség az adott játékban.
Az egész tehát messze nem úgy történik, hogy a darabkákat hasraütés-szerűen összepakolják. Előbb a szimulátorban megnézik, hogy az adott lapka élettartama alatt várható terhelésre mi az ideális felépítés, mert annak a lapkának nem csak megjelenéskor kell működnie, hanem másfél évvel később is.[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Abu85
HÁZIGAZDA
válasz Petykemano #35093 üzenetére
Ha arra vonatkozik a kérdés, hogy háromszögek feldolgozása legyen jobb, akkor a motorok fejlődését tekintve inkább TFLOPS-okat rakj bele és ne setup egységeket. A compute culling erősen megváltoztatja a hardverek működését is, ugyanis a játékon belül háromszögekből jóval több lesz, de a GPU oldalán már a pipeline kevésbé lesz terhelve ezektől, mert jó részüket már a pipeline elején kivágja a rendszer. Innentől kezdve a setup terhelése pont, hogy csökken, viszont a multiprocesszorok terhelése nő. Egyre több motor új verziója működik így (idtech, Dunia, Frostbite, Dawn, Glacier, stb.). A több setuppal itt nem érsz el semmit, mert nem ebből lesz kevés, hanem a TFLOPS-okból.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Petykemano
veterán
"ha a 6 SE a 4-nél csak 7-8%-kal gyorsabb, mert régebben mondták hogy kb. ennyivel gyorsabb, akkor nem fognak beleölni 15%-nyi extra tranzisztort. Végeredményben ugyanis nem éri meg. Pláne úgy, hogy kb. mindenki a GPU-driver pipeline felé megy, ahol aztán még kisebb az előny, de a 15%-nyi extra tranyót a lapka akkor is hordozza, ha csak 2%-os az extra sebesség az adott játékban."
Rendben, nyilvánvaló, hogy az AMD céljainak (lett légyen az bármi) a 4 SE felelt meg legjobban. Ez volt a legtranzisztorkímélőbb.
Azt mondd meg, hogy ha majd megfogsz 2db ilyen lapkát - amiben feltehetőleg egyenként lesz 4db SE - és IF-fel / GMI-vel összekötöd, akkor hogy fog az 2%, meg 7-8%-nál jobb többlet-teljesítményt adni, ha már a 4 helyett 6 SE is csupán ennyivel jelentene többet?
Mi lesz más a felépítésben, vagy működésben, ami lehetővé teszi, hogy 4 helyett 2x4 jól működjön, de 4 helyett 6 SE szarul skálázódik?
Vagy esetleg azt mondod, hogy valójában nem 4 SE-vel rendelkező lapkákat fognak összekötni IF/GMI-vel, hanem 2db 2SE-vel rendelkezőt, hovatovább 4db 1SE-vel rendelkező lapkát és akkor megmarad az ideális 4 SE? (Amit ugye a program 1 GPU-nak lát hiába áll több lapkából)
Találgatunk, aztán majd úgyis kiderül..
-
Abu85
HÁZIGAZDA
válasz Petykemano #35099 üzenetére
Ha elméletben összekötnél mondjuk két Vega 10-et, akkor ott a 8 SE már 24 TFLOPS fölötti teljesítményt ad. Ergo ahhoz a számítási teljesítményhez már kell a többlet, de nem kell a 12 TFLOPS-hoz. Ott hibáztok, hogy azt hiszitek, hogy ezek az egységek nem egymáshoz vannak tervezve. Az egész attól függ, hogy a tömbben mennyi multiprocesszor van. Ha csinálsz 4 tömböt tömbönként 16 multiprocesszorral, akkor az a szimuláció alapján optimális lesz. De ha csinálsz 8 tömböt tömbönként 8 multiprocesszorral, akkor valójában tranzisztort fogsz pazarolni. Persze ez csak a Vega dizájnjára érvényes. A régebbi dizájnok más konfigurációban működhetnek jól.
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
Új hozzászólás Aktív témák
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az AMD éppen érkező, vagy jövőbeni új grafikus processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva. Architektúra, esélylatolgatás, érdekességek, spekulációk, stb.
- ASUS ROG STRIX 3080 10GB V2 White/fehér LHR
- MSI GeForce GTX 1050 Ti 4GB GDDR5 128bit videókártya
- 2025.11.04. Garancia! MSI RTX 3080 12GB GDDR6X TRIO PLUS Videokártya! BeszámítOK
- EVGA RTX 3070 8GB GDDR6 FTW3 ULTRA GAMING Eladó! 125.000.-
- ASRock Challenger D RX 6600 8GB - garancia 2024 november - eladó!
Állásajánlatok
Cég: Ozeki Kft.
Város: Debrecen