Eikö yhdeksi merkittäväksi tekijäksi Bulldozerin hitaudessa ole nimenomaan arvioitu välimuistin hitautta / pitkiä latensseja?
On toki tiedetty jo pitkään, ettei nyt tuleva päivitys korjaa sitä ongelmaa merkittävästi.
Juu, tai yhdistelmä pienet+läpikirjoittavat L1-kakut + hidas L2-kakku.
(L2-kakun hitaus ei olisi ongelma, jos L1-kakut olisivat isompia ja takaisinkirjoittavia, että L2-kakulla käytäisiin harvoin.)
Ja tämä välimuistirakenne tosiaan pysyy piledriverissa ennallaan, ei parannusta näihin. (välimuistiviiveet on jo dokumentoitu optimointioppaassa, joten tiedetään että niihin ei tule parannusta.. tosin siellä mainittiin, että 1 MiB L2-kakulla viive on 2 kellojaksoa pienempi, mutta missään ei olla puhuttu mistään piiristä missä välimuistia olisi vain tämä 1MiB/moduuli.. ehkä olisi ollu kodomoon tulossa)
Mutta osasyy Bulldozerin L2-kakun hitauteen on, että varmistettiin, että se ei tule pullonkaulaksi korkeiden kellojen saavuttamisessa. Suuri määrä kellojaksoja suurella kellotaajuudella ei ajassa mitattuna olisikaan kovin hidas.
Bulldozerin kanssa vaan kävi niin, että piirillä joku muu osa otti vastaan ja esti nostamasta kelloja niin ylös kuin oli tarkoitus (ja pakotti käyttöjännitteenkin ja sen myötä virrankulutuksen ylemmäs että edes nuo kellot saavutettiin)
Itse olen kohtalaisen optimistinen siinä, että piledriverissa nämä kellottuvuus/virrankulutusongelmat on saatu korjattua, ja suorituskyky/virrankulutus-suhde paranee selvästi, mutta se hidas L2-kakku sekä muutamat muut pullonkaulat edelleen tuntuu, eikä piledriverilla ole mitään mahdollisuuksia päästä tasoihin ivy bridgen kanssa cpu-tehossa, mutta hiukan saattaa intelin etumatka kaventua.
__________________
Hei. Olen signaturevirus. Sinulle tulee vastustamaton halu kopioida tämä rivi sigusi jatkeeksi.
ST-suorituskykyä paremmin testaa oikeastaan mikä tahansa muu kuin SuperPI 1M.
Suositeltavia vaihtoehtoja esim. Y-Cruncher, Cinebench, Euler3D, x264, MD5 / SHA-1 BF yms.
Noista ainakin x264:n ajaminen yksisäikeisenä on aika keinotekoista, koska x264 osaa hyödyntää hyvin myös useampaa ydintä.
Pitäisi löytää prosessorin nopeudesta riippuvainen yksisäikeinen ohjelma, jota käytetään yleisesti muuhunkin kuin testaamiseen. Jos taas pelisuorituskykyä haluataan testata, niin sitten testataan niillä peleillä.
Onko Piledriveristä mitään uutta? Vai on se ihan Kodomo?
Sellainen uusi huhu on, että nyky-bulldozereissa on kokonaisluku-jakolaskuyksikkö, joka on kytketty pois päältä(todennäköisesti siinä olevan rautabugin takia) ja kokonaislukujen jakolasku tehdään mikrokoodilla.
Ja että piledriverissä tämä kokonaisluku-jakaja-yksikkö on vihdoin kytkettynä päälle (ilmeisesti korjattu se rautabugi, minkä takia se bulldozerissa on pois päältä).
Kokonaislukujen jakolasku on melko harvinainen operaatio, joten keskimääräinen suorituskyky ei tästä paljoa nouse, mutta joillain tietyillä erikoiskoodeilla, joissa jakolaskua käytetään paljon, muutos on suuri.
Tämän todenperäisyys olisi melko helppo varmentaa optimointiopasta lukemalla, mutta en ole vielä ehtinyt/jaksanut.
__________________
Hei. Olen signaturevirus. Sinulle tulee vastustamaton halu kopioida tämä rivi sigusi jatkeeksi.
Jos on mahdollisuus kellottaa vehkeet tappiin ja budjetti on rajallinen, niin 2-module (4-core) BD voi olla ihan järkevä valinta.
Intelin halpisprossuja kun ei voi kellottaa ja samasta hintaluokasta löytyy vain noita Core i3:sia, niin BD:llä saa tappiin kellottamalla suhteessa ihan hyvän prossun.
Mun pikaisella testailuilla Battlefield 3 64 pelaajan serverillä pyörii paremmin FX-4100 @ 4,5GHz:lla kuin i3-2100:lla (3,1GHz). i3 ottaa vastaan, FX ei. Vähän meni kysymyksen ohi, mutta siis en pidä Bulldozeria niin huonona valintana kuin arvostelijat, ja valitsisin pelikoneeseen mieluummin Bulldozerin kuin i3:n, kun pelit alkavat tukea useampaa ydintä.
__________________
Luotettavaa kaupankäyntiä: hae nimimerkkiä Demianor palauteketjusta @Oulu || jraitala ät jraitala piste net || Demian @ IRCNet/QuakeNet
Mun pikaisella testailuilla Battlefield 3 64 pelaajan serverillä pyörii paremmin FX-4100 @ 4,5GHz:lla kuin i3-2100:lla (3,1GHz). i3 ottaa vastaan, FX ei. Vähän meni kysymyksen ohi, mutta siis en pidä Bulldozeria niin huonona valintana kuin arvostelijat, ja valitsisin pelikoneeseen mieluummin Bulldozerin kuin i3:n, kun pelit alkavat tukea useampaa ydintä.
Juurikin näin. Jos taas tehdään budjettikonetta, eikä kelloteta, niin i3:nen lie parempi valinta...
Jos taas panostetaan prossuun se lähemmäs 200e, niin i5-2500K on melko ylivoimainen.
No itsellä on nyt x6 1055t mut on huono kellottuu ja lämpenee ku uuni
Ei oikeastaan mitään järkeä hommata 4/6 -ydin puskutraktoria. Tuossa tapauksessa FX-8150 mutta sekään nyt ei paljoa hyödytä jos osuu surkea yksilö. Mutta luulis hyvällä jäähyllä menevän 4,5 GHz ainakin ja jos nyt emolevykään ei ihan tatti ole. Itsehän virittelin puoltoista viikkoa konetta ennen kuin pääsin tyydyttäviin lukemiin niin kelloissa kuin lämmöissä. Asiasta kolmanteen, menee vielä useampi kuukaus ennen kuin visherasta kuullaan jotain oleellista.
nii no tämäkin on m4a87td et am3 lankku mut oon kuullu et jotkut ku päivittää ni voi saada bulldozerin. mut siis emt paljonko menis lankkuun ja prossuun
"Steamroller-arkkitehtuurin odotetaan tuovan asiaan tuntuvan muutoksen. Seuraavan sukupolven AMD-suorittimissa on tehty huomattavia muutoksia sekä arkkitehtuuriin että siruytimiin. Verkkolehti VrZonen lähteiden mukaan Steamrollerin pitäisi nostaa AMD mukaan tehokilpailuun Intelin kanssa."
Jahas. Mitähän tästä uskaltaisi odottaa?
__________________ In the beginning, the universe was created. This made a lot of people very angry, and has been widely regarded as a bad idea - Douglas Adams =====¤¤¤¤¤ Intel - evil inside ¤¤¤¤=====
"Steamroller-arkkitehtuurin odotetaan tuovan asiaan tuntuvan muutoksen. Seuraavan sukupolven AMD-suorittimissa on tehty huomattavia muutoksia sekä arkkitehtuuriin että siruytimiin. Verkkolehti VrZonen lähteiden mukaan Steamrollerin pitäisi nostaa AMD mukaan tehokilpailuun Intelin kanssa."
Jahas. Mitähän tästä uskaltaisi odottaa?
No tämähän riippuu siitä, mihin verrataan. Mikäli tuijotetaan perf/wattia, niin oletan että Steamroller on tehokkaampi kuin pentium4 suorittimet.
Mutta pitänee odottaa kiltisti pari vuotta - ja pettyä pahoin.
No tämähän riippuu siitä, mihin verrataan. Mikäli tuijotetaan perf/wattia, niin oletan että Steamroller on tehokkaampi kuin pentium4 suorittimet.
Mutta pitänee odottaa kiltisti pari vuotta - ja pettyä pahoin.
Toivottavasti tulee oikein megapettymys, pikku teho- tai aikataululipsumiset ei tunnu enää missään.
__________________ In the beginning, the universe was created. This made a lot of people very angry, and has been widely regarded as a bad idea - Douglas Adams =====¤¤¤¤¤ Intel - evil inside ¤¤¤¤=====
"Tehokkaita Steamroller-piirejä joudutaan tästä syystä todennäköisesti odottamaan vuoteen 2014 saakka."
Odottaa saat ainakin.
Xbitlabsin mukaan taas 28nm APUjen valmistuksen olisi tarkoitus alkaa jo tämän vuoden puolella. Ja 28nm APUt ovat Steamroller-pohjainen "Kaveri" sekä Jaguar-pohjaiset "Kabini ja Temash"
Sellainen uusi huhu on, että nyky-bulldozereissa on kokonaisluku-jakolaskuyksikkö, joka on kytketty pois päältä(todennäköisesti siinä olevan rautabugin takia) ja kokonaislukujen jakolasku tehdään mikrokoodilla.
Ja että piledriverissä tämä kokonaisluku-jakaja-yksikkö on vihdoin kytkettynä päälle (ilmeisesti korjattu se rautabugi, minkä takia se bulldozerissa on pois päältä).
Kokonaislukujen jakolasku on melko harvinainen operaatio, joten keskimääräinen suorituskyky ei tästä paljoa nouse, mutta joillain tietyillä erikoiskoodeilla, joissa jakolaskua käytetään paljon, muutos on suuri.
Tämän todenperäisyys olisi melko helppo varmentaa optimointiopasta lukemalla, mutta en ole vielä ehtinyt/jaksanut.
Nyt jaksoin tarkastaa, ja ilmeisesti tämä huhu ei pitänyt paikkaansa;
Optimointioppaassa lukee myös piledriverille että kokonaislukujen jakolasku on mikrokoodilla tehtävä operaatio.
__________________
Hei. Olen signaturevirus. Sinulle tulee vastustamaton halu kopioida tämä rivi sigusi jatkeeksi.
Mistä muuten saa kytkettyä tuon Bulldozerin virransäästö ominaisuuden pois? Käytössä sigun kone. Core Tempin ja CPU-Z:n mukaan rasituksessa kellot hyppivät 1400mhz ja 4300mhz:n välillä. Biosissa ei suoranaisesti mielestäni ollut ainakaan mitään AMD APM -asetusta. Milläköhän nimellä sieltä löytyisi?
Mistä muuten saa kytkettyä tuon Bulldozerin virransäästö ominaisuuden pois? Käytössä sigun kone. Core Tempin ja CPU-Z:n mukaan rasituksessa kellot hyppivät 1400mhz ja 4300mhz:n välillä. Biosissa ei suoranaisesti mielestäni ollut ainakaan mitään AMD APM -asetusta. Milläköhän nimellä sieltä löytyisi?
Nyt tuntuu taas siltä, että halutaan säätää vain säätämisen takia, eikä ymmärretä miksi. "Jos tehot pienenee alle 10%, viritys oli onnistunut".
Kun rasitetaan vain osaa ytimistä, kannattaa idlaavien tai vähän kuormitettujen ytimien kellot laskea alemmas, ja nostaa paljon kuormitettujen ytimien kelloja ja jännitteitä ylös(turbo mode).
Eli, se, että osan ytimistä kellotaajuus laskee mahdollistaa koko systeemille PAREMMAN suorituskyvyn.
__________________
Hei. Olen signaturevirus. Sinulle tulee vastustamaton halu kopioida tämä rivi sigusi jatkeeksi.