flops

FLOPS na cykl dla sandy-bridge i haswell SSE2 / AVX/AVX2

Jestem zdezorientowany, ile flopów na cykl na rdzeń można zrobić z Sandy-Bridge i Haswell. Jak rozumiem to z SSE powinno być ... inkowej (DP), więc osiągają 4 DP FLOPs / cykl dla SSE i 8 DP FLOPs / cykl dla AVX. Ciekawie byłoby przerobić te testy na SP.

Co to jest FLOP/S i czy jest to dobra miara wydajności?

Poproszono mnie o pomiar wydajności programu fortran, który rozwiązuje równania różniczkowe w systemie wielordzeniowym. Mój p ... ypadku to ' kod fortran, który wykonuje wiele obliczeń arytmetycznych w kółko znowu przez kilka dni na kilkuset procesorach)?