Nyheder
AMD: Hvorfor Bulldozer sparker rovSkrevet af Mads F. | 24-02-2011 02:21 | 5024 visninger | 33 kommentarer, hop til seneste
En AMD-medarbejder har i en tråd på xtremesystems, givet en officiel forklaring på, hvordan Bulldozer er opbygget, og hvordan det nye design gi'r Intels Hyperthreading baghjul.
JF-AMD, som AMD-medarbejderen hedder, giver følgende forklaring:
Først lægger han ud med, at sige, at det han snakker om er såkaldt 'throughput' - hvad vi kan oversætte på dansk til gennemløb, og han lægger meget vægt på, at det ikke er det samme som, eller repræsenterer hastighed. Herefter forklarer han:
"Vi antager, at en processorkerne har 100% gennemløb.
Tilføjer man endnu en kerne (dualcore), vil denne sekundære kerne typisk tilføje ca. 95% gennemløb. Altså vil de to kerner tilsammen ha' i alt 195% gennemløb.
Intels Hypertreading gi'r en kerne yderligere ca. 18% gennemløb.
Derfor kan man sige, at:
-
2 tråde på 2 kerner = 195% gennemløb
-
2 tråde på 1 kerne = 118% gennemløb
Hvis vi så antager, at 1 Bulldozer-kerne har 100% gennemløb, så vil:
-
2 tråde, på 2 individuelle moduler* være = 195% gennemløb.
-
2 tråde på samme modul* = 180% gennemløb"
*1 modul = mindst 2 kerner
Det vil altså sige, at en enkelt-kernet proces, vil med Bulldozer ha' ca. 90% (180% divideret med 2) gennemløb, mens Intels Hypertreading vil gi' ca. 118% gennemløb. Altså en umiddelbar stor fordel til Intel for enkelt-kernede processer.
Men da AMD's design af Bulldozer gør, at 1 modul (2 kerner i samme "pakke"), behandler data som 1 samlet kerne, vil det gi 180% gennemløb, hvilket ift. en Intel-kerne med Hyperthreading, er 62% mere.
Hvorfor er det en fordel? En dualcore er vel en dualcore, og en quadcore er vel en quadcore - hyperthreading er vel bare en bonus?
Det hele handler om, hvor meget gennemløb man kan få ud af en processor, på den mindst fysiske plads (die). Her er JF-AMD meget positivt indstillet, idet han udtaler at:
"Målet med Bulldozer var, at øge antallet af kerner og derved det endelige gennemløb. Fordi kerner skalerer bedre end Hyperthreading, er det den logiske vej til at nå det mål.
Når man laver udregningerne med die space (den fysiske plads chippen fylder) vs. gennemløbet, ser man, at den bedste måde at opnå et højere gennemløb,er ved at tilføje flere kerner.
Det går ud over overall performance for den enkelte kerne, men den extra plads det gi'r til flere kerner, er en meget god byttehandel efter min mening."
Han gi'r et meget godt metaforisk billede for påstanden:
"Når man sidder 5 person i en bil, så er der måske nogen der vil lægge fokus på, at bilen har et højere brændstofforbrug - men det er jo ingenting, ift. hvis alle 5 personer, sad i hver deres egen bil."
På samme måde er Bulldozer altså en samlet pakke, der tager et mindre performancehit pr. kerne, men overordnet set, tilbyder en overlegen "ægte" multikerneydelse, modsat Intels Hyperthreading, der kun gi'r et lille performanceboost.
Dertil kommer denne række af teoretiske udregninger (med stor vægt på at de er teoretiske og ikke reelle) af forskellige processorere:
Mythical 6-core bulldozer:
100% + 95% + 95% + 95% + 95% + 95% = 575%
Orochi die with 4 modules (8-core):
180% + 180% + 180% + 180% = 720%
What if we had just done a 4 core and added HT (keeping in the same die space):
100% + 95% +95% +95% + 18% + 18% + 18% + 18% = 457%
What about a 6 core with HT (has to assume more die space):
100% + 95% +95% +95% +95% +95% + 18% + 18% + 18% + 18% + 18% + 18% = 683%
Rygterne siger, at AMD's Bulldozer vil blive fremvist ved dette års CeBIT, der løber af stablen mellem 1.- og 5. marts. HardwareOnline vil være til stede ved messen.
Kilde: Xtremesystems.org
Lyder sgu spændende især da jeg er amd mand. Håber så også bare prisen stadig er det billigere end intels -- If you havent googled it you made the mother of all fuckups Problemet er så blot; er CPC ydelse på højde med Intel.
Samt hvor mange cores de rent faktisk vælger at release. -- Events; AOCM(x2),AMD-OC-DK,TweaKING,P55 Challenge,AOCM, Cebit(x4),GOOC.
Powered by; Gigabyte & Corsair
GRÆDER når jeg læser "Gamer bærbar" Mine feriepenge kommer til at lande på et tørt sted!! -- /- Radeon 4890 XXX -//- Asus Crosshair IV formula -//- Crucial C300 60gb -//- Spinpoint f1 500gb -//- TX 750w -//- HAF 912+ -//- lyder nice! -- - Daniel Stuhr. Add Steam "danielstuhr" ! Athlon X2 2.80 GHz - 2GB DDR3 Dual Channel - ASRock M3N78D-
400 watt - GTS 450 #3 helt enig ;) -- AMD 1090T @ 4,3 | Asus Crosshair IV Formula | HAF X | custom vand| 5870 CF | 8 GB 1600 MHZ CL6 Mushkin | ocz vertex 2| Logitech G500 | G2420HD Sejt. -- AMD 1090T | Asus Crosshair IV Formula | HAF922 | H70 | XFX 6870 | 8 GB 1600 MHZ CL6 Mushkin | P2470H | Logitech G19 | Logitech G35 | JF-AMD er ikke en hvilken som helst medarbejder. Han hedder John Fruehe og er er direktør for product marketing inden for server / workstation.
Man må lige huske at AMD også er aktiv i dette segment og at de også har server produkter baseret på bulldozer på programmet. Det er bare lidt ærgerligt at han er direktør for server for helt generelt så svarer han ikke på spørgsmål omkring bulldozer til alm. forbrugere. Fordi han er faktisk ret god til at deltage i diverse sider på nettet med at forklare om bulldozeres fortræffeligheder :-)
Men man skal også lige passe lidt på når man hører en marketing mand snakke. Det må være uafhængige tests fra store veletablerede sider der må give os svaret på om AMD bulldozer er værd at investere i. Men spændende læsning fra ham John Fruhe gutten. -- A clean house is a sign of a broken computer Jeg skal da helt sikkert ha fat i sådan en fyr der -- #8 Du mener du skal have fat i en fyr som ham John Fruhe ? -- Life is a bitch and then you marry one #9 Ja hver sine lyster :).......... -- Core i7 2600k@4,8Ghz|Asrock P67 Extreme6|16GB Corsair Vengeance DDR3|2xGainward GTX 580 "GOOD"|240GB OCZ Revodrive X2|23,6" BenQ XL2410T 3D LED #11
Tal er det afgørende!
Der er lige noget som JF sjovt nok undlader... Forøgelsen i performance gør sig UDELUKKENDE gældende for Integer operationer.
Jeg håber selv at denne bringer Gulftown til skam, så vi alle kan få 12 trådede processore til billige penge.
*Men ikke at forglemme, den kommer højeste halvandet kvartal før næste generation af Intel.... Socket 2011....
Så bliver lidt presset! -- Events; AOCM(x2),AMD-OC-DK,TweaKING,P55 Challenge,AOCM, Cebit(x4),GOOC.
Powered by; Gigabyte & Corsair
GRÆDER når jeg læser "Gamer bærbar" Håber seriøst osse AMD kommer med noget ordenligt denne gang, så de kan konkurrerer på både pris OG performance. Deres nuværende lineup har aldrig imponeret mig - Man får langt mere ydelse for pengene hos Intel lige nu, især hvis man OCer (AMD har ikke kunnet følge med siden introduktionen af 1156/1366 IMO) - Er er ikke fanboiiii, sådan er det bare - Hvis man ikke kan se det, er man vist AMD fanboy :) -- EVGA X58 Classified | i7 980X @ 4.5 | 12GB G.Skill CL6 | 580GTX EVGA Hydro Copper 2 SLI | 2xCrucial C300 256GB Raid0 | Corsair HX1000W Hmmmm, må sige jeg er Intel mand, men dette lyder alligevel interessant, men som det bliver nævnt kommer Socket 2011 fra Intel jo også "snart", så vi må vente og se nogle reelle BenchMarks før vi kan bedømme om en af producenterne har fået baghjul :) -- Intel Core i7-860, MSI P55 GD85, Corsair Dominator 4GB DDR3 1600MHz CL7, Zotac GeForce GTX570, Fractal Design Define XL, OCZ 600W ModXStream Pro #13
intel har bare et stort problem ved ALM bruger og det er prisen, Socket 2011 bliver sikkert meget dyre end amd's nye :) -- Bundkort: ASrock A780G
CPU: AMD Phenom II X4 3.0Ghz
Grafikkort: Sapphire Radeon HD 4870 512 GDDR5
RAM: A-Data 2x2GB+2*1 800 MHz håber de beholder prisen som bedste performance for pris. -- 1090T -/- PowerColor 5870 -/- Asus Crosshair IV -/- Corsair Dominator 1333MHz CL6 -/- CM 1000W Jeg forstår det ikke.. Manden siger jo bare at flere kerner = bedre ydelse. Det er da klart, men hvis de laver "moduler" med 2 kerner der virker som én processor, vil det vel stadig bruge tilsvarende mere strøm, udlede tilsvarende meget varme, koste tilsvarende (næsten) meget at producere etc. hvor jeg ser HT som "gratis" ift. Så ja.. 2 kerner bedre end 1 kerne med HT, men 2 kerner med HT er da bedre end 2 uden. Jeg ser sgu ikke det fantastiske i det her. -- Stat: Q6600@3,6 ghz 24/7,6gb XMS2 DHX,2x4850,Gigabyte EP45-DS3
HTPC: E5200,2 gb XMS2,4350,Zotac G43 itx
Filserver: E4500,1 gb,3 TB,Zotac 610i itx #19
HT udvikler stadig varme og forbruger strøm iforhold til det arbejde der bliver udført.
2 kerner = 2 kerner
2 kerner > 1 kerne + ht
2 kerner 2 kerner
2 kerner på samme modul -- Gæstebruger, opret dit eget login og få din egen signatur. Det jo fint nok med alle de teoretiske tal.
Men det løser stadigvæk ikke problemet med at programmør ikke forstå at skrive softwaren effektiv nok til at udnytte disse processorer.
Så hvad nytter det? - Rigtig mange applikationer er stadigvæk single threated. -- http://www.fredagspatter.dk[...] - Nyt galleri hver fredag! #21
Man kan faktisk godt forestille sig at hver core kan splitte single threaded op internt, da CPU modtager opgaven, og så har 2 pipes, altså to "rør" som håndtere opgaven som tidligere kørte igennem et rør.
Kan være at AMD endelig kommer ind i superpi kampen igen ;-) -- Events; AOCM(x2),AMD-OC-DK,TweaKING,P55 Challenge,AOCM, Cebit(x4),GOOC.
Powered by; Gigabyte & Corsair
GRÆDER når jeg læser "Gamer bærbar" #21 Det meste understøtter da flere kerner. Desuden snakker han om server markedet hvilket vil sige ca. ALT understøtter flere kerner. -- POKKYUN!
HP & Cisco certified Håber at den kommer til og understytte et GA-890GPA-UD3H motherboard. Isåfald skal jeg da have sådan en stud her. :D -- #25
Zambezi (desktop-varianten af Bulldozer) er en AM3+ CPU, der har en enkelt pin mere end AM3 (Phenom II). Derfor:
AM3+ CPU'er (Zambezi) passer ikke i AM3 bundkort, men
AM3 CPU'er (Phenom I) passer i AM3+ bundkort. -- "Rebellion to Tyrants is Obedience to God" - Thomas Jefferson #7 Jacob XP
Det eller bare læse hvad der står. Der står jo ikke en pointe, som AMD ikke tidligere har lagt frem. Det bliver konkretiseret med tal de tidligere har haft pointer for, men det er også det.
Det er jo ikke smart PR-fis han fyrer af, det er en gentagelse af de velkendte årsager til, at de gik dual integer. Hvis man læser ting som forkert/korrekt, så skal man måske passe på, men så kan man jo ikke læse noget som helst – ej heller benchmarks fra uafhængige sider, for de fortæller også kun det testen tager udgangspunkt i ligesom hans udgangspunkt er råt output med henblik på servere. Servere er nu en gang det man udviklere CPU’er til, og det der præger beslutningsprocessen for en x86 CPU.
#13 M.Beier
Hvordan skulle en AMD 8-kerne (8/16 FPU/Int) have nogen betydning for en 12-kernet 999 USD CPU? Og hvad er det for en 12-kernet CPU? Der kommer en hurtigere Sandy Bridge ”MHz” mainstream model (LGA1366) foruden de to stk. Q3 Sandy Bridge E high end (LGA2011) modeller. Jeg er i hvert fald ikke helt med på, hvad der menes med den sidste del. Man der kommer da ikke en dual-pakke 12-kernet Gulftown? Uanset hvad, så koster et Intel monster 999 USD uanset om den vinder i output eller ej.
#17 martinbg
” intel har bare et stort problem ved ALM bruger og det er prisen, Socket 2011 bliver sikkert meget dyre end amd's nye :)”
Den kommer til at koste det samme som X58, hverken mere eller mindre. Den bliver så parret med to modeller, og er fortsat en ligegyldig 999 USD platform. Tidligere har high end platformene haft mere spillerum, da de nemmere kunne skille sig ud på ydelsen, men jo flere kerner vores processorer har, jo sværere bliver det at differentiere ydelsen. Og med en 3,6-3,8 GHz Sandy Bridge er det meget begrænset hvor stort et prisspektre platformen kan have. AMD har grundet deres mindre prisspektre inte t andet valg end at undlade at differentiere platformen, og gør det derfor kun på processoren.
#19 BjarkeHedegaard
Problemet med argumentationen er, at HT netop ikke er gratis. Det koster transistorer, og ligeledes strøm. Meget forsimplet giver AMD ca. 40% transistorer for 90% ekstra integer ydelse og uændret FPU ydelse. Intel giver 5 til 10% ekstra transistorer for mellem 0 til 30-35% ekstra FPU/Int ydelse (det kan dog også koste ydelse, men lad os glemme det for et øjeblik). Hovedproblemet i forhold til at erklære 2kerne+HT som vinderen ligger dog ikke i disse tal, men i at AMD’s tilgang skalerer i alle (Integer) tilfælde hvor koden skalerer med kerne-antal. Integerudregninger udgør i øvrigt størstedelen af CPU’ens arbejde. Flere af de ting vi tidligere brugte FPU-ydelse i er enten bygget ind i en separet udvidelse eller henvist til andre enheder som grafikkortet.
Det er desuden værd at huske, at når vi snakker output, som det er tilfældet her, så er det med udgangspunkt i super-trådet server-software, ikke standard forbrugerapplikationer. Dvs. eksemplerne bliver meget værre for HT, når emnet er de applikationer vi bruger processorerne til. Det er meget få forbrugerapplikationer, som er output bundet. Spil er det f.eks. ikke, for her er de fleste output bundne opgaver flyttet væk fra CPU’en. Output er en ret ligegyldig måleenhed for desktop CPU’er godt illustreret af i7-990X/980X som har flere fysiske og logiske tråde end i7-2600k samt højere frekvens, men alligevel taber i næsten alt hvad vi som slutbrugere kaster efter den. Deres markant højere output kan ikke rigtig bruges her.
#21 M.Beier
"Man kan faktisk godt forestille sig at hver core kan splitte single threaded op internt"
Nej det kan man desværre ikke. Det er bare ikke muligt. Vil du så udpakke data et sted og arbejde på det endnu ikke udpakkede data et andet sted eller måske hente data på en integer enhed og afkode det samtidigt på den anden? Det kan man selvsagt ikke, og derfor følger AMD's to integer enhed per processor de samme regler som var det separate kerner blot med den forskel, at der ikke skaleres på FPU'en. En udregning består af en given sekvens, men man kan ikke splitte en proces i sekvensen op mere op end det.
Du kan flytte arbejdet fra en integer enhed til en anden, men det forbedrer ikke udførslen, kun styringen af den. Det kan man i øvrigt allerede så længe der er flere kerner (snart lidt hurtigere og smartere). Det er nøjagtig samme princip som i en multi-kerne 1 FPU/integer pipeline. -- Mvh. Thomas Christensen. Jeg ved det somsagt ikke endnu.
Men en anden måde at se på det er at integer bliver fordret med 1 given opgave, og håndtere denne dobbelt så hurtigt, da der er to integer pipes til at håndtere opgaven.
Hvis du kigger på denne illustration;
http://logout.hu[...]
Vil du se at decoder er før de pipes, så hvorfor skulle den ikke kunne være lavet intelligent nok til at splitte det op?
Jeg siger ikke at det er tilfælde, jeg siger at det kan være at AMD har en listig kanin i hatten, de har jo trodsalt ville have anti-hyperthreading længe - og jeg glæder mig til at se det endelige produkt. -- Events; AOCM(x2),AMD-OC-DK,TweaKING,P55 Challenge,AOCM, Cebit(x4),GOOC.
Powered by; Gigabyte & Corsair
GRÆDER når jeg læser "Gamer bærbar" Jeg kan anbefale at følge denne twitter konto http://twitter.com[...] for dem som gerne vil følge lidt med i hvad der sker med AMD bulldozer. Han har også en sin egen hjemmeside.
EDIT: fik lige set at den illustration i #28 som M Beier omtaler faktisk er lavet er ham Dresden Boy gutten med twitter siden, som jeg lige nævnte :-) -- A clean house is a sign of a broken computer #28: opsplitningen er schedulerens arbejde, ikke den simple dekodning.
Men der må være noget om at hvis der kun kører en enkelt tråd på et modul, så har den fri adgang til en særdeles kraftig FP enhed, rigeligt fetch/dispatch osv. Så den vil i lidt højere grad end en mere traditionel flerkernet model få glæde af de ellers ledige ressourcer.
Dertil siges de jo at have satset på muligheden for meget høje frekvenser, hvilket nok skal gå til nogen ret store turbo steps når den manglende kerneudnyttelse giver mulighed for det qua strømforbruget. -- Har lige haft AMD's 6 kernede topmodel. Den kan ikke spille det nye DirectX11 Formel 1 spil og yder 60% i forhold til en i7 920 ved min proff. videorendering. Så kom 2600K og igen lammetævede 920'eren :-) og kun til 2.200 Kr. NICE!
FÆRDIG med AMD! -- #31
kan den ikke spille det?
min gamle 940 har jeg ikke prøvet et spil den har haft problemer med endnu -- Bundkort: ASrock A780G
CPU: AMD Phenom II X4 3.0Ghz
Grafikkort: Sapphire Radeon HD 4870 512 GDDR5
RAM: A-Data 2x2GB+2*1 800 MHz #33
hvad mener du? -- Bundkort: ASrock A780G
CPU: AMD Phenom II X4 3.0Ghz
Grafikkort: Sapphire Radeon HD 4870 512 GDDR5
RAM: A-Data 2x2GB+2*1 800 MHz
Grundet øget spam aktivitet fra gæstebrugere, er det desværre ikke længere muligt, at oprette svar som gæst.
Hvis du ønsker at deltage i debatten, skal du oprette en brugerprofil.
Opret bruger | Login
|
Du skal være logget ind for at tilmelde dig nyhedsbrev.
Hvilken udbyder har du til internet? 242 personer har stemt - Mit energiselskab (Ewii f.eks) 11%
|