Annonces Google
Serveur IRC
Serveur : irc.portlane.se
Canal : #AmigaNG
Activité du Site

Pages vues depuis 25/07/2007 : 25 291 542

  • Nb. de membres 187
  • Nb. d'articles 1 270
  • Nb. de forums 19
  • Nb. de sujets 20
  • Nb. de critiques 24

Top 10  Statistiques

Index du forum »»  Matériel »» Benchmark mémoire

Benchmark mémoire#880

21Contributeur(s)
CrisotMrodfrphardfrCreolspowermetalOlrickMurakamisncrackLioalexK-LdavebracoBrumigascriptjestersinisrusFabElwoodartblinkFernechocortozzd10h
3 Modérateur(s)
K-LElwoodcorto
K-L K-Licon_post
Les résultats du X1000 :

RAGEMEM v0.37 - compiled 11/06/2010

CPU: P.A. Semi PWRficient PA6T-1682M B1 @ 1800 Mhz
Caches Sizes: L1: 64 KB - L2: 2048 KB - L3: none
Cache Line: 64

CPU
MAX MIPS: 3084

L1
READ32: 6851 MB/Sec
READ64: 13682 MB/Sec
WRITE32: 6851 MB/Sec
WRITE64: 13681 MB/Sec

L2
READ32: 3276 MB/Sec
READ64: 4784 MB/Sec
WRITE32: 2531 MB/Sec
WRITE64: 4090 MB/Sec

RAM
READ32: 2857 MB/Sec
READ64: 4000 MB/Sec
WRITE32: 2732 MB/Sec
WRITE64: 3383 MB/Sec
WRITE: 352 MB/Sec (Tricky)

VIDEO BUS
READ: 15 MB/Sec
WRITE: 161 MB/Sec

Crisot, une idée de la raison pour laquelle la veule en MIPS est inférieure à un simple G4 ? A l'usage, le X1000 est bien plus performant (en tous cas pour les divers essais que j'ai effectués lors de la MicoAlchimie).

Résultat avec une Sam460 (AmigaOne 500) :

RAGEMEM v0.37 - compiled 11/06/2010

CPU: AMCC PPC460EX 1.2 @ 1150 Mhz
Caches Sizes: L1: 32 KB - L2: 256 KB - L3: none
Cache Line: 32

---> CPU <---
MAX MIPS: 2296

---> L1 <---
READ32: 4291 MB/Sec
READ64: 8539 MB/Sec
WRITE32: 4185 MB/Sec
WRITE64: 8300 MB/Sec

---> L2 <---
READ32: 929 MB/Sec
READ64: 929 MB/Sec
WRITE32: 446 MB/Sec
WRITE64: 446 MB/Sec

---> RAM <---
READ32: 276 MB/Sec
READ64: 276 MB/Sec
WRITE32: 442 MB/Sec
WRITE64: 441 MB/Sec
WRITE: 854 MB/Sec (Tricky)

---> VIDEO BUS <---
READ: 66 MB/Sec
WRITE: 302 MB/Sec

Notez que grâce aux diverses améliorations apportés par ACube (Sam460Setup et optimisations DMA), les transferts du bus vidéo sont plus rapides que les premiers tests réalisés précédemment. (55MB/s et 191MB/s lors des tests réalisés par Davebraco).
--
AmigaONE X1000/1,8 Ghz (A-Eon), Radeon RX560, 2 Go de Ram et OS4.1 FE
Crisot Crisoticon_post
Hummmmm...

Plusieurs chiffres me choquent.

Sur SAM460, la RAM tourne à la vitesse du L2... Soit le L2 du 460EX est pas terrible, soit j'ai loupé un truc (mais quoi...)

Sur X1000, c'est encore pire, l'écriture RAM est supérieure à l'écriture L2, ce qui est matériellement impossible, la RAM passant forcément par le L2... Je me demande si ma loop est pas trop courte pour bencher à ces vitesses là.

Pour le tricky super lent, c'est parceque mon code n'est pas adapté à la Cache Line du PA6T.

Pour les MIPS. Je n'ai que des hypothèses mais pas de réponse:

-Déjà, mon bench n'est pas multi-threadé, il n'utilise qu'un seul core, donc il faut multiplier par 2 ce chiffre.

-Dans tous les cas le PA6T@2.0 Ghz est donné constructeur pour 8800 MIPS, ça fait 3960 MIPS par core@1.8 Ghz.

-Ma loop n'est pas du tout optimisée pour le PA6T, elle a été écrite avec les datasheet des 604e/G3/G4/460EX. Je pense que le PA6T ne dispatche pas du tout les instructions de la même manière, mais sans datasheet je peux rien écrire.

-Au dela des MIPS la rapidité des caches et de la ram ont une énorme influence sur les performances CPU. A titre d'exemple, lire un seul octet en mémoire sur un XE (240 mo/sec) équipé d'un G4@1.0Ghz (3000 MIPS), c'est en temps machine l'équivalent de 104 instructions perdues (!!!) pendant lesquelles le CPU attend. En clair, un G4 attend continuellement après le reste de la machine, si on pouvait convertir le temps machine perdu en taches ménagères, la pelouse serait toujours tondue et la maison propre.

Je pense pas que core à core (ahah) le PA6T soit beaucoup plus puissant que le G4, mais tout ce qui tourne autour (caches, bus, ram) lui laisse infiniment plus de marge de manoeuvre. Le G4 ira beaucoup moins vite, mais paradoxalement glandera beaucoup plus.
--
AmigaOne X1000 - 2 Go DDR2 - Sapphire R9 280x Toxic - Crucial MX200 500 Go - Alim/Cooling BeQuiet
Elwood Elwoodicon_post
Est-ce que tu voudrais mettre à dispo les sources de Ragemem (sur OS4depot) ?
Max d'ACube voudrait bien y jeter un oeil.
--
Philippe Ferrucci
Avec une Sam460 et AmigaOS 4.1, je suis eco-responsable. Cool !
corto cortoicon_post
Ca m'intéresse aussi. On ne peut pas dire grand chose des résultats sachant qu'on ne sait pas ce qui est fait.

Déjà que le problème des benchmarks, c'est qu'on peut leur faire dire ce qu'on veut, dès qu'on dépasse les premières conclusions ... alors sans précision sur ce qui est fait.

Crisot : Ca permettrait aussi de, peut-être, répondre à des questions que tu te poses, de clarifier des points, ... Il faut qu'on en discute à l'Amigâteries. Et si tu n'es pas chaud pour os4depot, j'ai mon serveur svn, on peut faire un dépôt privé.
Lio Lioicon_post
sur le site d'Afxgroup, il y a 2 benchs de ragemem et il est écrit :
Can you spot the differences ?
http://www.amigasoft.net/wordpress/index.php/spot-the-differences/

est ce que quelqu un comprend ? on voit que read32 et read64 passent de 261 à 303 MB/s sur une SAM460 et c est a peu pres tout.
A1G4/Radeon9000PRO/1Go RAM; X5000/RadeonR7-250x/2Go RAM; AOS4.1FE
zzd10h zzd10hicon_post

AfxGroup aurait "patché" un truc dans le noyau pour accélérer la RAM sur les 460.

C'est ce qu'un de ses compatriotes a fait remonter sur FaceBook il y a qq semaines.
corto cortoicon_post
Désolé, je n'aime pas déterrer les vieux fils mais là, ça reprend juste où on avait laissé.

Sur le uAOne, j'obtiens en 81 MB/s pour WRITE32 alors qu'avec un bench à moi j'obtiens 119 MB/s (et même 125 en coupant le multitâche). De ce que je vois du code, il est quasiment identique. J'aurais bien aimé qu'on étudie ça.

Crisot : Tu m'avais laissé tes sources à l'Amigâteries, c'est intéressant. Je suis toujours dispo à le mettre sous subversion :-)

Mais j'aurais aussi beaucoup qu'on puisse en discuter. Or, je ne t'ai pas vu inscrit à l'Alchimie !!!

Edit: J'ajoute que tous les résultats valent zero avec la version que tu m'as filé, je soupçonne un problème de conversion dans le calcul du elapsedTime.
Message édité par : corto / 03-11-2013 23:43
Crisot Crisoticon_post
Space... La fonction de calcul est effectivement de mémoire un peu anarchique (y'a gros risque d'overflow je crois).

J'agonise pour les 5 prochains jours et on verra ça à l'Alchi.
--
AmigaOne X1000 - 2 Go DDR2 - Sapphire R9 280x Toxic - Crucial MX200 500 Go - Alim/Cooling BeQuiet
K-L K-Licon_post
Hop,

Je viens d'essayer le petit programme nommé Flops sur OS4Depot et voici les résultats de mon G4 à 1,26 Ghz :


FLOPS C Program (Double Precision), V2.1 03 Nov 2013

Module Error RunTime MFLOPS
(μsec)
1 -7.6739e-13 0.0981 142.6752
2 -5.7021e-13 0.0534 130.9942
3 -2.4314e-14 0.0983 172.9730
4 6.8501e-14 0.1023 146.5649
5 -1.6320e-14 0.1823 159.1084
6 1.3961e-13 0.1573 184.4014
7 -3.6152e-11 0.1513 79.3388
8 9.0483e-15 0.1697 176.7956

Iterations = 256000000
NullTime (μsec) = 0.0075
MFLOPS(1) = 142.2830
MFLOPS(2) = 122.2571
MFLOPS(3) = 152.2072
MFLOPS(4) = 172.4863
--
AmigaONE X1000/1,8 Ghz (A-Eon), Radeon RX560, 2 Go de Ram et OS4.1 FE
zzd10h zzd10hicon_post
Sur mon X1000


Module Error RunTime MFLOPS
(âμsec)
1 320.5725
2 374.1127
3 289.7470
4 115.2807
5 212.2356
6 232.3631
7 117.1178
8 156.2246

Iterations = 512000000
NullTime (âμsec) = 0.0103
MFLOPS(1) = 341.5961
MFLOPS(2) = 168.1881
MFLOPS(3) = 185.1856
MFLOPS(4) = 179.9753

Je ne sais pas à quoi correspondent ces chiffres, mais ils ont l'air mieux que les tiens (contrairement à ce qu'indique un RageMem entre nos 2 systémes, 3792 MIPS pour toi et 3082 pour moi)

Petites Annonces

0 annonce(s) publiée(s)

Consulter

AmigaOS 4.1

Laissez-vous tenter par
AmigaOS 4.1
AmiTheme

AmiTheme