Seneste forumindlæg
Køb / Salg
 * Uofficiel Black/White liste V3
Login / opret bruger

Nyheder

AMD: Hvorfor Bulldozer sparker rov

Skrevet af Mads F. | 24-02-2011 02:21 | 5024 visninger | 33 kommentarer, hop til seneste

En AMD-medarbejder har i en tråd på xtremesystems, givet en officiel forklaring på, hvordan Bulldozer er opbygget, og hvordan det nye design gi'r Intels Hyperthreading baghjul.

JF-AMD, som AMD-medarbejderen hedder, giver følgende forklaring:

Først lægger han ud med, at sige, at det han snakker om er såkaldt 'throughput' - hvad vi kan oversætte på dansk til gennemløb, og han lægger meget vægt på, at det ikke er det samme som, eller repræsenterer hastighed. Herefter forklarer han:

"Vi antager, at en processorkerne har 100% gennemløb.

Tilføjer man endnu en kerne (dualcore), vil denne sekundære kerne typisk tilføje ca. 95% gennemløb. Altså vil de to kerner tilsammen ha' i alt 195% gennemløb.

Intels Hypertreading gi'r en kerne yderligere ca. 18% gennemløb.

Derfor kan man sige, at:

  • 2 tråde på 2 kerner = 195% gennemløb
  • 2 tråde på 1 kerne = 118% gennemløb

 

Hvis vi så antager, at 1 Bulldozer-kerne har 100% gennemløb, så vil:

  • 2 tråde, på 2 individuelle moduler* være = 195% gennemløb.
  • 2 tråde på samme modul* = 180% gennemløb"

*1 modul = mindst 2 kerner

 

Det vil altså sige, at en enkelt-kernet proces, vil med Bulldozer ha' ca. 90% (180% divideret med 2) gennemløb, mens Intels Hypertreading vil gi' ca. 118% gennemløb. Altså en umiddelbar stor fordel til Intel for enkelt-kernede processer.

Men da AMD's design af Bulldozer gør, at 1 modul (2 kerner i samme "pakke"), behandler data som 1 samlet kerne, vil det gi 180% gennemløb, hvilket ift. en Intel-kerne med Hyperthreading, er 62% mere.

Hvorfor er det en fordel? En dualcore er vel en dualcore, og en quadcore er vel en quadcore - hyperthreading er vel bare en bonus?

Det hele handler om, hvor meget gennemløb man kan få ud af en processor, på den mindst fysiske plads (die). Her er JF-AMD meget positivt indstillet, idet han udtaler at:

"Målet med Bulldozer var, at øge antallet af kerner og derved det endelige gennemløb. Fordi kerner skalerer bedre end Hyperthreading, er det den logiske vej til at nå det mål.

Når man laver udregningerne med die space (den fysiske plads chippen fylder) vs. gennemløbet, ser man, at den bedste måde at opnå et højere gennemløb,er ved at tilføje flere kerner.

Det går ud over overall performance for den enkelte kerne, men den extra plads det gi'r til flere kerner, er en meget god byttehandel efter min mening."

Han gi'r et meget godt metaforisk billede for påstanden:

"Når man sidder 5 person i en bil, så er der måske nogen der vil lægge fokus på, at bilen har et højere brændstofforbrug - men det er jo ingenting, ift. hvis alle 5 personer, sad i hver deres egen bil."

På samme måde er Bulldozer altså en samlet pakke, der tager et mindre performancehit pr. kerne, men overordnet set, tilbyder en overlegen "ægte" multikerneydelse, modsat Intels Hyperthreading, der kun gi'r et lille performanceboost.

Dertil kommer denne række af teoretiske udregninger (med stor vægt på at de er teoretiske og ikke reelle) af forskellige processorere:

Mythical 6-core bulldozer:
100% + 95% + 95% + 95% + 95% + 95% = 575%

Orochi die with 4 modules (8-core):
180% + 180% + 180% + 180% = 720%

What if we had just done a 4 core and added HT (keeping in the same die space):
100% + 95% +95% +95% + 18% + 18% + 18% + 18% = 457%

What about a 6 core with HT (has to assume more die space):
100% + 95% +95% +95% +95% +95% + 18% + 18% + 18% + 18% + 18% + 18% = 683%

Rygterne siger, at AMD's Bulldozer vil blive fremvist ved dette års CeBIT, der løber af stablen mellem 1.- og 5. marts. HardwareOnline vil være til stede ved messen.

 

Kilde: Xtremesystems.org

#1
DarkNoller
Semi Supporter
24-02-2011 02:27

Rapporter til Admin
Lyder sgu spændende især da jeg er amd mand. Håber så også bare prisen stadig er det billigere end intels
--
If you havent googled it you made the mother of all fuckups
#2
M.Beier
Semi Nørd
24-02-2011 04:08

Rapporter til Admin
Problemet er så blot; er CPC ydelse på højde med Intel. Samt hvor mange cores de rent faktisk vælger at release.
--
Events; AOCM(x2),AMD-OC-DK,TweaKING,P55 Challenge,AOCM, Cebit(x4),GOOC. Powered by; Gigabyte & Corsair GRÆDER når jeg læser "Gamer bærbar"
#3
PhosFer
Semi Supporter
24-02-2011 06:16

Rapporter til Admin
Mine feriepenge kommer til at lande på et tørt sted!!
--
/- Radeon 4890 XXX -//- Asus Crosshair IV formula -//- Crucial C300 60gb -//- Spinpoint f1 500gb -//- TX 750w -//- HAF 912+ -//-
#4
danielstuhr
Ultrabruger
24-02-2011 08:14

Rapporter til Admin
lyder nice!
--
- Daniel Stuhr. Add Steam "danielstuhr" ! Athlon X2 2.80 GHz - 2GB DDR3 Dual Channel - ASRock M3N78D- 400 watt - GTS 450
#5
Andrew-90
Maxi Supporter
24-02-2011 08:30

Rapporter til Admin
#3 helt enig ;)
--
AMD 1090T @ 4,3 | Asus Crosshair IV Formula | HAF X | custom vand| 5870 CF | 8 GB 1600 MHZ CL6 Mushkin | ocz vertex 2| Logitech G500 | G2420HD
#6
Andersaha
Monster Supporter
24-02-2011 08:59

Rapporter til Admin
Sejt.
--
AMD 1090T | Asus Crosshair IV Formula | HAF922 | H70 | XFX 6870 | 8 GB 1600 MHZ CL6 Mushkin | P2470H | Logitech G19 | Logitech G35 |
#7
Jacob XP
Nørd
24-02-2011 10:19

Rapporter til Admin
JF-AMD er ikke en hvilken som helst medarbejder. Han hedder John Fruehe og er er direktør for product marketing inden for server / workstation. Man må lige huske at AMD også er aktiv i dette segment og at de også har server produkter baseret på bulldozer på programmet. Det er bare lidt ærgerligt at han er direktør for server for helt generelt så svarer han ikke på spørgsmål omkring bulldozer til alm. forbrugere. Fordi han er faktisk ret god til at deltage i diverse sider på nettet med at forklare om bulldozeres fortræffeligheder :-) Men man skal også lige passe lidt på når man hører en marketing mand snakke. Det må være uafhængige tests fra store veletablerede sider der må give os svaret på om AMD bulldozer er værd at investere i. Men spændende læsning fra ham John Fruhe gutten.
--
A clean house is a sign of a broken computer
#8
Lygtemanden
Ultra Supporter
24-02-2011 10:31

Rapporter til Admin
Jeg skal da helt sikkert ha fat i sådan en fyr der
--
#9
Wifebeater666
Elitebruger
24-02-2011 10:35

Rapporter til Admin
#8 Du mener du skal have fat i en fyr som ham John Fruhe ?
--
Life is a bitch and then you marry one
#10
Ege-Netfight
Downer
24-02-2011 11:28

Rapporter til Admin
#9 Ja hver sine lyster :)..........
--
Core i7 2600k@4,8Ghz|Asrock P67 Extreme6|16GB Corsair Vengeance DDR3|2xGainward GTX 580 "GOOD"|240GB OCZ Revodrive X2|23,6" BenQ XL2410T 3D LED
#11
gQrgh
Guru
24-02-2011 12:57

Rapporter til Admin
#0 Syntes det lyder meget simpelt, håber AMD kommer til at lægge pres på Intel nu.
--
Mvh. gQrgh / Mads http://geekentertainment.org[...]
--
Sidst redigeret af crucial-kid
#12
TTWIXX
Ny på siden
24-02-2011 14:44

Rapporter til Admin
nice
--
#13
M.Beier
Semi Nørd
24-02-2011 15:03

Rapporter til Admin
#11 Tal er det afgørende! Der er lige noget som JF sjovt nok undlader... Forøgelsen i performance gør sig UDELUKKENDE gældende for Integer operationer. Jeg håber selv at denne bringer Gulftown til skam, så vi alle kan få 12 trådede processore til billige penge. *Men ikke at forglemme, den kommer højeste halvandet kvartal før næste generation af Intel.... Socket 2011.... Så bliver lidt presset!
--
Events; AOCM(x2),AMD-OC-DK,TweaKING,P55 Challenge,AOCM, Cebit(x4),GOOC. Powered by; Gigabyte & Corsair GRÆDER når jeg læser "Gamer bærbar"
#15
lasn
Monsterbruger
24-02-2011 18:52

Rapporter til Admin
Håber seriøst osse AMD kommer med noget ordenligt denne gang, så de kan konkurrerer på både pris OG performance. Deres nuværende lineup har aldrig imponeret mig - Man får langt mere ydelse for pengene hos Intel lige nu, især hvis man OCer (AMD har ikke kunnet følge med siden introduktionen af 1156/1366 IMO) - Er er ikke fanboiiii, sådan er det bare - Hvis man ikke kan se det, er man vist AMD fanboy :)
--
EVGA X58 Classified | i7 980X @ 4.5 | 12GB G.Skill CL6 | 580GTX EVGA Hydro Copper 2 SLI | 2xCrucial C300 256GB Raid0 | Corsair HX1000W
#16
HrCookie
Bruger Aspirant
24-02-2011 20:09

Rapporter til Admin
Hmmmm, må sige jeg er Intel mand, men dette lyder alligevel interessant, men som det bliver nævnt kommer Socket 2011 fra Intel jo også "snart", så vi må vente og se nogle reelle BenchMarks før vi kan bedømme om en af producenterne har fået baghjul :)
--
Intel Core i7-860, MSI P55 GD85, Corsair Dominator 4GB DDR3 1600MHz CL7, Zotac GeForce GTX570, Fractal Design Define XL, OCZ 600W ModXStream Pro
#17
martinbg
Maxi Nørd
24-02-2011 20:53

Rapporter til Admin
#13 intel har bare et stort problem ved ALM bruger og det er prisen, Socket 2011 bliver sikkert meget dyre end amd's nye :)
--
Bundkort: ASrock A780G CPU: AMD Phenom II X4 3.0Ghz Grafikkort: Sapphire Radeon HD 4870 512 GDDR5 RAM: A-Data 2x2GB+2*1 800 MHz
#18
Kwindu
Supporter
24-02-2011 20:57

Rapporter til Admin
håber de beholder prisen som bedste performance for pris.
--
1090T -/- PowerColor 5870 -/- Asus Crosshair IV -/- Corsair Dominator 1333MHz CL6 -/- CM 1000W
#19
BjarkeHedegaard
Giga Supporter
25-02-2011 13:41

Rapporter til Admin
Jeg forstår det ikke.. Manden siger jo bare at flere kerner = bedre ydelse. Det er da klart, men hvis de laver "moduler" med 2 kerner der virker som én processor, vil det vel stadig bruge tilsvarende mere strøm, udlede tilsvarende meget varme, koste tilsvarende (næsten) meget at producere etc. hvor jeg ser HT som "gratis" ift. Så ja.. 2 kerner bedre end 1 kerne med HT, men 2 kerner med HT er da bedre end 2 uden. Jeg ser sgu ikke det fantastiske i det her.
--
Stat: Q6600@3,6 ghz 24/7,6gb XMS2 DHX,2x4850,Gigabyte EP45-DS3 HTPC: E5200,2 gb XMS2,4350,Zotac G43 itx Filserver: E4500,1 gb,3 TB,Zotac 610i itx
#20
Stefan
Gæst
25-02-2011 14:11

Rapporter til Admin
#19 HT udvikler stadig varme og forbruger strøm iforhold til det arbejde der bliver udført. 2 kerner = 2 kerner 2 kerner > 1 kerne + ht 2 kerner 2 kerner 2 kerner på samme modul
--
Gæstebruger, opret dit eget login og få din egen signatur.
#21
inckie
Nørd
25-02-2011 14:13

Rapporter til Admin
Det jo fint nok med alle de teoretiske tal. Men det løser stadigvæk ikke problemet med at programmør ikke forstå at skrive softwaren effektiv nok til at udnytte disse processorer. Så hvad nytter det? - Rigtig mange applikationer er stadigvæk single threated.
--
http://www.fredagspatter.dk[...] - Nyt galleri hver fredag!
#22
M.Beier
Semi Nørd
25-02-2011 14:44

Rapporter til Admin
#21 Man kan faktisk godt forestille sig at hver core kan splitte single threaded op internt, da CPU modtager opgaven, og så har 2 pipes, altså to "rør" som håndtere opgaven som tidligere kørte igennem et rør. Kan være at AMD endelig kommer ind i superpi kampen igen ;-)
--
Events; AOCM(x2),AMD-OC-DK,TweaKING,P55 Challenge,AOCM, Cebit(x4),GOOC. Powered by; Gigabyte & Corsair GRÆDER når jeg læser "Gamer bærbar"
#23
Barnet
Monsterbruger
25-02-2011 16:47

Rapporter til Admin
#21 Det meste understøtter da flere kerner. Desuden snakker han om server markedet hvilket vil sige ca. ALT understøtter flere kerner.
--
POKKYUN! HP & Cisco certified
#24
Burnaye
Juniorbruger
25-02-2011 17:06

Rapporter til Admin
Cool.
--
#25
vMattz
Ny på siden
25-02-2011 17:24

Rapporter til Admin
Håber at den kommer til og understytte et GA-890GPA-UD3H motherboard. Isåfald skal jeg da have sådan en stud her. :D
--
#26
Mads321
Monsterbruger
25-02-2011 22:22

Rapporter til Admin
#25 Zambezi (desktop-varianten af Bulldozer) er en AM3+ CPU, der har en enkelt pin mere end AM3 (Phenom II). Derfor: AM3+ CPU'er (Zambezi) passer ikke i AM3 bundkort, men AM3 CPU'er (Phenom I) passer i AM3+ bundkort.
--
"Rebellion to Tyrants is Obedience to God" - Thomas Jefferson
#27
crucial-kid
Nyhedsredaktør
26-02-2011 00:26

Rapporter til Admin
#7 Jacob XP Det eller bare læse hvad der står. Der står jo ikke en pointe, som AMD ikke tidligere har lagt frem. Det bliver konkretiseret med tal de tidligere har haft pointer for, men det er også det. Det er jo ikke smart PR-fis han fyrer af, det er en gentagelse af de velkendte årsager til, at de gik dual integer. Hvis man læser ting som forkert/korrekt, så skal man måske passe på, men så kan man jo ikke læse noget som helst – ej heller benchmarks fra uafhængige sider, for de fortæller også kun det testen tager udgangspunkt i ligesom hans udgangspunkt er råt output med henblik på servere. Servere er nu en gang det man udviklere CPU’er til, og det der præger beslutningsprocessen for en x86 CPU. #13 M.Beier Hvordan skulle en AMD 8-kerne (8/16 FPU/Int) have nogen betydning for en 12-kernet 999 USD CPU? Og hvad er det for en 12-kernet CPU? Der kommer en hurtigere Sandy Bridge ”MHz” mainstream model (LGA1366) foruden de to stk. Q3 Sandy Bridge E high end (LGA2011) modeller. Jeg er i hvert fald ikke helt med på, hvad der menes med den sidste del. Man der kommer da ikke en dual-pakke 12-kernet Gulftown? Uanset hvad, så koster et Intel monster 999 USD uanset om den vinder i output eller ej. #17 martinbg ” intel har bare et stort problem ved ALM bruger og det er prisen, Socket 2011 bliver sikkert meget dyre end amd's nye :)” Den kommer til at koste det samme som X58, hverken mere eller mindre. Den bliver så parret med to modeller, og er fortsat en ligegyldig 999 USD platform. Tidligere har high end platformene haft mere spillerum, da de nemmere kunne skille sig ud på ydelsen, men jo flere kerner vores processorer har, jo sværere bliver det at differentiere ydelsen. Og med en 3,6-3,8 GHz Sandy Bridge er det meget begrænset hvor stort et prisspektre platformen kan have. AMD har grundet deres mindre prisspektre inte t andet valg end at undlade at differentiere platformen, og gør det derfor kun på processoren. #19 BjarkeHedegaard Problemet med argumentationen er, at HT netop ikke er gratis. Det koster transistorer, og ligeledes strøm. Meget forsimplet giver AMD ca. 40% transistorer for 90% ekstra integer ydelse og uændret FPU ydelse. Intel giver 5 til 10% ekstra transistorer for mellem 0 til 30-35% ekstra FPU/Int ydelse (det kan dog også koste ydelse, men lad os glemme det for et øjeblik). Hovedproblemet i forhold til at erklære 2kerne+HT som vinderen ligger dog ikke i disse tal, men i at AMD’s tilgang skalerer i alle (Integer) tilfælde hvor koden skalerer med kerne-antal. Integerudregninger udgør i øvrigt størstedelen af CPU’ens arbejde. Flere af de ting vi tidligere brugte FPU-ydelse i er enten bygget ind i en separet udvidelse eller henvist til andre enheder som grafikkortet. Det er desuden værd at huske, at når vi snakker output, som det er tilfældet her, så er det med udgangspunkt i super-trådet server-software, ikke standard forbrugerapplikationer. Dvs. eksemplerne bliver meget værre for HT, når emnet er de applikationer vi bruger processorerne til. Det er meget få forbrugerapplikationer, som er output bundet. Spil er det f.eks. ikke, for her er de fleste output bundne opgaver flyttet væk fra CPU’en. Output er en ret ligegyldig måleenhed for desktop CPU’er godt illustreret af i7-990X/980X som har flere fysiske og logiske tråde end i7-2600k samt højere frekvens, men alligevel taber i næsten alt hvad vi som slutbrugere kaster efter den. Deres markant højere output kan ikke rigtig bruges her. #21 M.Beier "Man kan faktisk godt forestille sig at hver core kan splitte single threaded op internt" Nej det kan man desværre ikke. Det er bare ikke muligt. Vil du så udpakke data et sted og arbejde på det endnu ikke udpakkede data et andet sted eller måske hente data på en integer enhed og afkode det samtidigt på den anden? Det kan man selvsagt ikke, og derfor følger AMD's to integer enhed per processor de samme regler som var det separate kerner blot med den forskel, at der ikke skaleres på FPU'en. En udregning består af en given sekvens, men man kan ikke splitte en proces i sekvensen op mere op end det. Du kan flytte arbejdet fra en integer enhed til en anden, men det forbedrer ikke udførslen, kun styringen af den. Det kan man i øvrigt allerede så længe der er flere kerner (snart lidt hurtigere og smartere). Det er nøjagtig samme princip som i en multi-kerne 1 FPU/integer pipeline.
--
Mvh. Thomas Christensen.
#28
M.Beier
Semi Nørd
26-02-2011 00:36

Rapporter til Admin
Jeg ved det somsagt ikke endnu. Men en anden måde at se på det er at integer bliver fordret med 1 given opgave, og håndtere denne dobbelt så hurtigt, da der er to integer pipes til at håndtere opgaven. Hvis du kigger på denne illustration; http://logout.hu[...] Vil du se at decoder er før de pipes, så hvorfor skulle den ikke kunne være lavet intelligent nok til at splitte det op? Jeg siger ikke at det er tilfælde, jeg siger at det kan være at AMD har en listig kanin i hatten, de har jo trodsalt ville have anti-hyperthreading længe - og jeg glæder mig til at se det endelige produkt.
--
Events; AOCM(x2),AMD-OC-DK,TweaKING,P55 Challenge,AOCM, Cebit(x4),GOOC. Powered by; Gigabyte & Corsair GRÆDER når jeg læser "Gamer bærbar"
#29
Jacob XP
Nørd
26-02-2011 01:04

Rapporter til Admin
Jeg kan anbefale at følge denne twitter konto http://twitter.com[...] for dem som gerne vil følge lidt med i hvad der sker med AMD bulldozer. Han har også en sin egen hjemmeside. EDIT: fik lige set at den illustration i #28 som M Beier omtaler faktisk er lavet er ham Dresden Boy gutten med twitter siden, som jeg lige nævnte :-)
--
A clean house is a sign of a broken computer
#30
HenrikM
Giga Nørd
26-02-2011 01:19

Rapporter til Admin
#28: opsplitningen er schedulerens arbejde, ikke den simple dekodning. Men der må være noget om at hvis der kun kører en enkelt tråd på et modul, så har den fri adgang til en særdeles kraftig FP enhed, rigeligt fetch/dispatch osv. Så den vil i lidt højere grad end en mere traditionel flerkernet model få glæde af de ellers ledige ressourcer. Dertil siges de jo at have satset på muligheden for meget høje frekvenser, hvilket nok skal gå til nogen ret store turbo steps når den manglende kerneudnyttelse giver mulighed for det qua strømforbruget.
--
#31
Angloamerikansk
Supporter
27-02-2011 10:03

Rapporter til Admin
Har lige haft AMD's 6 kernede topmodel. Den kan ikke spille det nye DirectX11 Formel 1 spil og yder 60% i forhold til en i7 920 ved min proff. videorendering. Så kom 2600K og igen lammetævede 920'eren :-) og kun til 2.200 Kr. NICE! FÆRDIG med AMD!
--
#32
martinbg
Maxi Nørd
27-02-2011 10:54

Rapporter til Admin
#31 kan den ikke spille det? min gamle 940 har jeg ikke prøvet et spil den har haft problemer med endnu
--
Bundkort: ASrock A780G CPU: AMD Phenom II X4 3.0Ghz Grafikkort: Sapphire Radeon HD 4870 512 GDDR5 RAM: A-Data 2x2GB+2*1 800 MHz
#33
HenrikM
Giga Nørd
27-02-2011 11:44

Rapporter til Admin
#34
martinbg
Maxi Nørd
27-02-2011 14:05

Rapporter til Admin
#33 hvad mener du?
--
Bundkort: ASrock A780G CPU: AMD Phenom II X4 3.0Ghz Grafikkort: Sapphire Radeon HD 4870 512 GDDR5 RAM: A-Data 2x2GB+2*1 800 MHz

Opret svar til nyheden: AMD: Hvorfor Bulldozer sparker rov

Grundet øget spam aktivitet fra gæstebrugere, er det desværre ikke længere muligt, at oprette svar som gæst.

Hvis du ønsker at deltage i debatten, skal du oprette en brugerprofil.

Opret bruger | Login
NYHEDSBREV
Afstemning