Ei omia tunnuksia? Rekisteröidy tästä

Mene takaisin   MuroBBS - Plaza > Muropaketin Omat > Tietotekniikkauutisia maailmalta

Vastaa
 
Ketjutyökalut Hae ketjusta
Vanha 05.09.09, 23:12   #1 (linkki)
 
Rekisteröitynyt: 12/1999
Viestejä: 2512
IBM tipautti prosessorejen välimuistin tilantarpeen alle puoleen

IBM tipautti prosessorejen välimuistin tilantarpeen alle puoleen
IBM:n uutuusprosessori Power7: hurja tehopakkaus - Tietokone.fi
Lainaus:
lauantaina 5.9.2009 klo 13:03
Kahdeksan ydintä ja uudenlainen muistiratkaisu
IBM:n uutuusprosessori Power7: hurja tehopakkaus

IBM on esitellyt yksityiskohtia uudesta Power7-prosessorista, joka on tarkoitettu järeimpien palvelimien numeronmurskaajaksi. Suorittimessa on kahdeksan prosessoriydintä, ja tietokoneelle päin se näyttää 32 prosessorin joukolta. IBM on saavuttanut läpimurron prosessorin muistitekniikassa, ja radikaali muutos näkyy heti prosessorin pintaa katsomalla.


IBM:n Power7-prosessori pyörii jo IBM:n laboratorioissa, mutta kehitystyö jatkuu vielä. IBM on jo kuitenkin esitellyt prosessorin tekniikan.

Power7 julkaistaan kahden, neljän ja kahdeksan siruytimen versioina. Jokainen siruydin pystyy ajamaan neljää yhtäaikaista ohjelmasäiettä, eli prosessori pystyy ajamaan yhtä aikaa 32 säiettä. Power7 on suunniteltu niin, että sitä voidaan käyttää 32 prosessorikannan palvelimissa. Yhdessä koneessa voi siis pyöriä samanaikaisesti 1024 ohjelmasäiettä.

Uusi välimuisti vähentää transistoritarpeen puoleen

Kahdeksan prosessoriydintä aiheuttaa siruille melkoisen välimuistihaasteen. Jotta ytimet toimisivat tehokkaasti, tarvitaan datan syöttöä varten paljon välimuistia, mutta samalla se kasvattaa prosessorin kokoa valtavasti. Esimerkiksi Intelin uusissa prosessoreissa voi samalla piipalalla olla yli kaksi miljardia transistoria.

Power7-prosessorissa välimuistia on melkoisesti, 32 megatavua. Perinteisesti prosessorien välimuistit ovat sram-tyyppiä, mutta IBM:n kehittämällä tekniikalla Power7-prosessorissa voidaan käyttää dram-muistityyppiä. Dram-muisti vaatii vain puolet aiemmasta transistorimäärästä. Näin ollen prosessorista tulee pienempi ja edullisempi valmistaa.

IBM:n mukaan Power7-prosessorissa on yhteensä 1,2 miljardia transistoria. IBM arvioi, että ilman uusia tekniikoita transistoreja olisi pitänyt olla 2,7 miljardia.

Samuli Kotilainen
Vielä kun AMD saisi tuon lisensoitua IBMltä prosessoreihinsa niin se pystyisi kilpailemaan Intelin kanssa huomattavasti paremmin.

AMD on aina joutunut käyttämään pienempiä välimuisteja prosessoreissaan kuin Intel kun sen on aina täytynyt optimoida prosessorejaan ottaen huomioon rajatun tuotantokapasiteettinsa.
___________________________________
Gues(+t) typo siinäkin kele
  Vastaa lainaten
Vanha 05.09.09, 23:48   #2 (linkki)
 
Rekisteröitynyt: 12/2008
Viestejä: 169
"Yhdessä koneessa voi siis pyöriä samanaikaisesti 1024 ohjelmasäiettä." O_O
Ja maksaa varmaan hunajaa. Olisi kyllä mukava nähdä tuollainen jossain AMD'n rosessorissa, balanssia markkinoille ja uusi CPU koneeseeni.
___________________________________
E8400 @ 3.4Ghz | Radeon 4870 512mb x2 | Gigabyte GA-EP45-DS3R | 2x2Gb Kingston 903Mhz | 500Gb Seagate 7200.11 & 1000Gb Samsung F3 | Corsair TX750W | Antec Twelve Hundred | Windows 7 Professional 64bit. |
  Vastaa lainaten
Vanha 06.09.09, 10:02   #3 (linkki)
 
Rekisteröitynyt: 06/2001
Viestejä: 4193
Lainaus:
Alkuperäinen kirjoittaja TuBBe Näytä viesti
"Yhdessä koneessa voi siis pyöriä samanaikaisesti 1024 ohjelmasäiettä." O_O
Ja maksaa varmaan hunajaa. Olisi kyllä mukava nähdä tuollainen jossain AMD'n rosessorissa, balanssia markkinoille ja uusi CPU koneeseeni.
Sinullako on kotikoneessasi ylensä pyörimässä/tehoa tarvitsemassa 1024 säiettä yhtä aikaa?

Tuollaista säiemäärää tarvitaan esim. siihen, että www-palvelin palvelee yhtäaikaisesti sataa käyttäjää.(joista jokaisen surffailu hakee yhtä aikaa n. 10ntä tiedostoa)
___________________________________
Hei. Olen signaturevirus. Sinulle tulee vastustamaton halu kopioida tämä rivi sigusi jatkeeksi.
  Vastaa lainaten
Vanha 06.09.09, 10:11   #4 (linkki)
 
Rekisteröitynyt: 06/2001
Viestejä: 4193
Lainaus:
Alkuperäinen kirjoittaja gues Näytä viesti
IBM tipautti prosessorejen välimuistin tilantarpeen alle puoleen
IBM:n uutuusprosessori Power7: hurja tehopakkaus - Tietokone.fi

Vielä kun AMD saisi tuon lisensoitua IBMltä prosessoreihinsa niin se pystyisi kilpailemaan Intelin kanssa huomattavasti paremmin.

AMD on aina joutunut käyttämään pienempiä välimuisteja prosessoreissaan kuin Intel kun sen on aina täytynyt optimoida prosessorejaan ottaen huomioon rajatun tuotantokapasiteettinsa.
AMD lisensoi aikoinaan Z-DRAMin käytettäväksi L3-välimuisteihinsa; Z-RAMilla saadaan käsittääkseni musiti vieläkin tiheämpään kuin eDRAMilla
(eDRAM vaatii yhden kondensaattorin + transistorin, zRAM:ssa on yhdistetty kondensaattori ja transistori) . Mutta muistelisin lukeneeni jostain, että Z-RAMin kanssa olisi ollut ongelmia eikä se soveltuisikaan hyvin AMDlle (suuret kellotaajuudet, tai liian uudet valmistustekniikat?) eikä AMD näin ollen koskaan olekaan ottamassa sitä käyttöön prosessoreissaan.

Löytyipä linkki:

http://www.semiconductor.net/article...le&rid=8242135

"Pellerin also said that GlobalFoundries is no longer pursuing the one-transistor ZRAM developed by Innovative Silicon Inc. (ISI, Lausanne, Switzerland), a capacitor-less design based on SOI substrates. Instead, GlobalFoundries is working on a thyristor-based memory with T-RAM Semiconductor Inc. (Milpitas, Calif.). GlobalFoundries and T-RAM announced in mid-May that GlobalFoundries would co-develop 32 and 22 nm versions of the T-RAM, which is based on SOI technology, for low-power cache applications."

Eli 32nm tai 22nm myötä AMDlle ehkä tulossa käyttöön tyristoripohjainen välimuisti, joka on nopeampaa kuin IBMn eDram-pohjainen, mutta selvästi tiheämpää kuin nykyiset/normaalit SRAM-pohjaiset.
___________________________________
Hei. Olen signaturevirus. Sinulle tulee vastustamaton halu kopioida tämä rivi sigusi jatkeeksi.
  Vastaa lainaten
Vanha 08.09.09, 23:09   #5 (linkki)
 
Rekisteröitynyt: 12/1999
Viestejä: 2512
Juu muistin tuon Z-Dram lisensin mutta kun siitä ei ole senjälkeen kuulunut niin oletin itsekseni että se olisi jostain syystä haudattu.
___________________________________
Gues(+t) typo siinäkin kele
  Vastaa lainaten
Vanha 09.09.09, 00:34   #6 (linkki)
 
Rekisteröitynyt: 11/1999
Viestejä: 9227
Se, että yksi ydin pystyy säilömään neljän säikeen tiedot ei tarkoita, että se pystyisi suorittamaan niitä yhtäaikaa. Varmaankin osittain limittäin onnistuu, ytimestä riippuen, mutta tuskin täysin yhtäaikaa.
___________________________________
!!Don´t read this!! You did it!! Bad Bad!!
  Vastaa lainaten
Vanha 09.09.09, 10:42   #7 (linkki)
 
Rekisteröitynyt: 08/2000
Viestejä: 4777
Lainaus:
Alkuperäinen kirjoittaja Griffin Näytä viesti
Se, että yksi ydin pystyy säilömään neljän säikeen tiedot ei tarkoita, että se pystyisi suorittamaan niitä yhtäaikaa. Varmaankin osittain limittäin onnistuu, ytimestä riippuen, mutta tuskin täysin yhtäaikaa.
Normaalisti HT:ssä liukuhihnan stallatessa kun tarvittavaa dataa ei välimuistista löydy, aletaan suorittaa noita HT säikeitä.

Se, miten ALU / FPU:ita käytetään on sitten toinen tarina, ehkäpä niissä voidaan ajaa eri säikeiden komentoja?
  Vastaa lainaten
Vanha 09.09.09, 17:49   #8 (linkki)
 
Rekisteröitynyt: 11/1999
Viestejä: 9227
Lainaus:
Alkuperäinen kirjoittaja Zepi Näytä viesti
Normaalisti HT:ssä liukuhihnan stallatessa kun tarvittavaa dataa ei välimuistista löydy, aletaan suorittaa noita HT säikeitä.

Se, miten ALU / FPU:ita käytetään on sitten toinen tarina, ehkäpä niissä voidaan ajaa eri säikeiden komentoja?
Muistelisin HT:n pystyvän suorittamaan "yhtäaikaa" asioita myös silloin, kun säikeet käyttävät coren eri yksikköjä. Tietyt coren yksiköt voivat toimia yhtäaikaa, toisistaan riippumatta.

4 Saiettä / core kuulostaa vain aika pirun raskaalta.
___________________________________
!!Don´t read this!! You did it!! Bad Bad!!
  Vastaa lainaten
Vanha 09.09.09, 20:50   #9 (linkki)
jjx
 
Rekisteröitynyt: 12/2001
Viestejä: 5597
Samaahan tuossa Sunin nyt jo wanhassa Sparc T1 prossussa harrastetaan. 8 corea yhdellä chipillä, jokaisessa neljä säiettä: http://en.wikipedia.org/wiki/UltraSPARC_T1

Tiedä sitten onko IBM ottanut vinkkiä tuosta, muistaakseni kyseessä on open source prosessori (GPL lisenssoitu) =)
___________________________________
Kolme soutaa, kaksi lepää
  Vastaa lainaten
Vanha 10.09.09, 00:01   #10 (linkki)
 
Rekisteröitynyt: 06/2001
Viestejä: 4193
Lainaus:
Alkuperäinen kirjoittaja Griffin Näytä viesti
Muistelisin HT:n pystyvän suorittamaan "yhtäaikaa" asioita myös silloin, kun säikeet käyttävät coren eri yksikköjä. Tietyt coren yksiköt voivat toimia yhtäaikaa, toisistaan riippumatta.
Juu.

Intelin HypeThreading P4ssa,Core i7ssa ja Atomissa pystyy ajamaan käskyjä useammastä säikeestä samalla kellojaksolla, samoin IBMn aiemmat Power5 ja Power6. Tekniikkaa kutsutaan lyhenteellä SMT(Symmetric MultiThreading)


Itaniumissä sekä Sunin Ultrasparc T-sarjassa taas ei pystytä yhtä aikaa aloittamaan uusien käskyjen suoritusta useamasta eri säikeestä, vaan kerrallaan vain yhdestä, mutta sitä voidaan vaihtaa vaikka joka kellojakson välein, siten että prosessoriydin silti näkyy käyttöjärjestelmälle useampana suorittimena. Kutsutaan nimellä CMT(Coarse grained MultiThreading)


Lainaus:
4 Saiettä / core kuulostaa vain aika pirun raskaalta.
Missä suhteessa raskaalta?

Paljon kevyempää se on joka tapauksessa ajaa niitä 4ää yhtä aikaa/raudan tekemillä säikeenvaihdoilla, ilman softalla tehtyjä säikeenvaihtoja, kuin vaihdella softalla sitä ajossa olevaa säiettä vähän väliä. (mitä joudutaan tekemään kun säikeitä on ajossa enemmän kuin softalle/käyttöjärjestelmälle näkyviä suorittimia)

Säikeenvaihto softalla on nimittäin raskas operaatio, erityisesti jos vaihdetaan samalla prosessia, maksaa helposti tuhannesta pariin tuhanteen kellojaksoa.
___________________________________
Hei. Olen signaturevirus. Sinulle tulee vastustamaton halu kopioida tämä rivi sigusi jatkeeksi.
  Vastaa lainaten
Vanha 10.09.09, 23:15   #11 (linkki)
 
Rekisteröitynyt: 11/1999
Viestejä: 9227
Ajattelin raskautta siis lähinnä tuon SMT:n kannalta. Voisi kuvitella yksiköiden loppuvan kesken.

Tuo on kyllä totta, jotta threadin vaihdossa säästetään paljon aikaa. Tällöin on kuiten oltava softaa, joka säikeistyy, mutta sitä ei voida / ei ole fiksua ajaa yhdessä säikeessä. Siis tarkoitan tällä että jos meilla on ongelma joka ratkeea yhden säikeen ratkaisulla, niin sen jakaminen useampaa säikeeseen, joita prossu sitten vaihtelee ja ajaa peräkkäin ei auta.

Toisaalta jos ajetaan koodia, joka luonnostaan koostuu helposti useista säikeistä, niin tuosta nopeudesta on paljonkin iloa.

Ihan mielenkiinnosta: Eikö tuo coarse grained vaadi inorder prossun? Vai tallennetaanko eri suuntiin haarautuneiden? vaihtoehtojen tiedot, kun threadi vaihdetaan. Vaatii ison kasan rekistereitä (paljon nopeaa logiikkaa).

Tietysti voisi olla ihan toimiva juttu, jos meillä olisi prossu, jossa olisi reilusti eri suoritusyksikköjä / core ja se ajaisi sitten esim kahdeksaa säiettä / core. Jos sitten vaikka coreja olisi 4 kpl, niin saataisiin aikahyvä suorituskyky sekakäyttöön. Käyttiksen pitäisi vain tajuta jakaa threadit s.e. coret rasittuisivat mahdollisimman monipuolisesti. Tai sitten prossun pitäisi osata siirtää threadeja corelta toiselle automaattisesti..

Onko tuon Power seiskan syvemmästä sielunelämästä kansantajuista selitystä missä?
___________________________________
!!Don´t read this!! You did it!! Bad Bad!!
  Vastaa lainaten
Vanha 11.09.09, 01:03   #12 (linkki)
 
Rekisteröitynyt: 12/1999
Viestejä: 2512
Pitää muistaa että Power7 on palvelin prossa jolloin tyypillinen kuorma on esim. lukuisia virtuaalipalvelimia joiden säikeillä ei ole juurikaan tekemistä keskenään mutta niittä on paljon ylläpidettävinä jolloin maksimaalisesta säikeiden varastointikapasiteetista on hurjasti hyötyä.
___________________________________
Gues(+t) typo siinäkin kele
  Vastaa lainaten
Vastaa

Hae ketjusta:

Laajennettu haku

Hyppää alueelle:




















UUSIMMAT IT-PAIKAT
KATSO KAIKKI IT-ALAN TYÖPAIKAT!