cpu-cache

Co to jest kod "przyjazny dla pamięci podręcznej"?

Jaka jest różnica pomiędzy kodem "Cache friendly code" a kodem "Cache friendly"? Jak mogę się upewnić, że piszę kod efektywny w pamięci podręcznej?

Dlaczego kolejność pętli wpływa na wydajność podczas iteracji na tablicy 2D?

Możliwy duplikat:która z tych dwóch pętli for jest bardziej efektywna pod względem czasu i wydajności pamięci podręcznej ... c int x[4000][4000]; for (j = 0; j < 4000; j++) { for (i = 0; i < 4000; i++) { x[j][i] = i + j; } } }

Przybliżony koszt dostępu do różnych pamięci podręcznych i pamięci głównej?

Czy ktoś może mi podać przybliżony czas (w nanosekundach) dostępu do pamięci podręcznej L1, L2 i L3, a także pamięci głównej ... D CZĘSTOTLIWOŚCI CORE I UNCORE, PRĘDKOŚCI PAMIĘCI, USTAWIENIA BIOS-U, LICZBY DIMM , ITD..TWÓJ PRZEBIEG MOŻE SIĘ RÓŻNIĆ."

Gdzie jest udokumentowana pamięć podręczna L1 procesorów Intel x86?

Staram się profilować i optymalizować algorytmy i chciałbym zrozumieć specyficzny wpływ pamięci podręcznych na różne procesor ... . Moja obecna teoria robocza jest taka, że szczegóły buforowania L1 są teraz traktowane jako tajemnice handlowe przez Intel.

najprostsze narzędzie do pomiaru C Cache hit / miss i czas procesora w Linuksie?

Piszę mały program w C i chcę zmierzyć jego wydajność. Chcę zobaczyć, ile czasu to działa w procesorze i ile cache hit+misse ... e Valgrind dodaje sporo kosztów. Dlatego chciałem prostego narzędzia, takiego jak / proc/[pid] / stat, które zawsze tam jest.

Dlaczego szybkość memcpy() drastycznie spada co 4KB?

Przetestowałem prędkość memcpy() zauważając, że prędkość drastycznie spada na i*4KB. Wynik jest następujący: oś Y to prędkość ... ropli, dodając 2KB bufora atrapowego pomiędzy pbuff_1 i pbuff_2. To działa, ale nie jestem pewien co do wyjaśnienia Leeora.

Jak zrobić spłukanie pamięci podręcznej procesora w systemie Windows x86?

Jestem zainteresowany wymuszeniem spłukiwania pamięci podręcznej procesora w Windows (ze względów benchmarkingowych, chcę emu ... owego lub nawet czegoś tak podstępnego, jak mówienie dużego memcpy? Platforma Intel i686 (P4 i up jest również w porządku).

Czy Mogę wymusić spójność pamięci podręcznej na wielordzeniowym procesorze x86?

W drugim tygodniu napisałem małą klasę wątku i jednokierunkowy kanał komunikacyjny, aby umożliwić komunikację między wątkami ... lej. Głównie zastanawiam się, czy są x86 Nie wiem, która siła lub może być użyta do wymuszenia spójności pamięci podręcznej.

Zrozumienie pamięci podręcznej procesora i linii pamięci podręcznej

Próbuję zrozumieć, jak działa pamięć podręczna procesora. Powiedzmy, że mamy taką konfigurację(jako przykład). Rozmiar pami ... znie potrzebne, ponieważ wszystkie 32 bajty znajdują się w linii bufora? Proszę dać mi znać, jeśli coś jest nie tak. Dzięki

Która kolejność zagnieżdżonych pętli do iteracji na tablicy 2D jest bardziej efektywna

Która z poniższych kolejności zagnieżdżonych pętli do iteracji na tablicy 2D jest bardziej efektywna pod względem czasu (wyda ... a[i][j] = 10; } } Lub for(i=0; i<100; i++) { for(j=0; j<100; j++) { a[j][i] = 10; } }

Co to jest cache hit I Cache miss? Dlaczego przełączanie kontekstu powoduje brak pamięci podręcznej?

Z 11 rozdziału (wydajność i skalowalność ) oraz sekcji o nazwie przełączanie kontekstu książki JCIP: Gdy nowy wątek zo ... jego prawdopodobne przeciwieństwo (Cache hit)? Dlaczego przełączanie kontekstu powodowałoby wiele braków pamięci podręcznej?

Cykle / koszt dla L1 Cache hit vs. rejestracja na x86?

Pamiętam założenie, że w mojej klasie architektury hit cache L1 to 1 cykl (tzn. identyczny z czasem dostępu do rejestru), ale ... prawda na nowoczesnych procesorach x86? Ile cykli zajmuje L1 Cache hit? Jak to wygląda w porównaniu do dostępu do rejestru?

Dlaczego rozmiar pamięci podręcznej L1 jest mniejszy niż w przypadku pamięci podręcznej l2 w większości procesorów?

Dlaczego rozmiar pamięci podręcznej L1 jest mniejszy niż rozmiar pamięci podręcznej l2 w większości procesorów?

Co oznacza pamięć podręczna danych i pamięć podręczna instrukcji?

From here : Instrukcje i dane mają różne wzorce dostępu, a dostęp różne regiony pamięci. Tak więc, posiadanie tej sam ... może nie, nie możemy być pewni, więc musimy przeczytać następny instrukcja-w ten sposób niwelując cel pamięci podręcznej.

Projekt kodu, który zmieści się w pamięci podręcznej procesora?

Podczas pisania symulacji mój kumpel mówi, że lubi pisać program na tyle mały, aby zmieścił się w pamięci podręcznej. Czy to ... optymalizacji jest ogromną korzyścią. Jeśli znasz jakieś dobre linki wyjaśniające buforowanie CPU, wskaż mi w tamtą stronę.

CUDA wyłącza pamięć podręczną L1 tylko dla jednej zmiennej

Czy Jest jakiś sposób na urządzeniach CUDA 2.0, aby wyłączyć pamięć podręczną L1 tylko dla jednej konkretnej zmiennej? Wiem, ... podręczną L1. Na podstawie wyszukiwania, które zrobiłem w internecie, możliwe rozwiązanie jest za pomocą kodu montażu PTX.

Lokacja czasowa A przestrzenna z tablicami

Jestem trochę zdezorientowany co do znaczeń lokalności przestrzennej i czasowej. Mam nadzieję, że patrząc na to z przykładu t ... dzieję, że pewne wyjaśnienie, jak działa lokalność czasowa i przestrzenna w prawdziwym kodzie, pomoże mi lepiej je zrozumieć.

Dlaczego liniowy odczyt-tasowany zapis nie jest szybszy niż tasowany Odczyt-Zapis liniowy?

Obecnie staram się lepiej zrozumieć problemy związane z wydajnością pamięci/pamięci podręcznej. Czytałem gdzieś, że lokalizac ... się być różnica, ale to jest znacznie bardziej subtelne i może teraz przejść w obie strony w zależności od problemu rozmiar.

Jak uniknąć "sterty wskaźników" w dynamicznych wykresach?

Problem ogólny Załóżmy, że kodujesz system składający się z grafu oraz reguł przepisywania grafu, które można aktywować w ... entacją w JS, ze straszną wydajnością pamięci podręcznej (i samego języka). ten film pokazuje graficznie system w działaniu.