cuda

CUDA / OpenCL w maszynie wirtualnej / Hypervisor

Ktoś zna jakieś rozwiązania wirtualizacji, które albo pozwalają CUDA / OpenCL dostęp bezpośrednio lub implementują CUDA / Ope ... tórzy komentowali. Chociaż klasyczna wirtualizacja "desktopowa" byłaby fajna, podejrzewam, że tacy jak Xen będą bliżej znaku.

Jakieś rozszerzenia Lispu dla CUDA?

Właśnie zauważyłem, że jednym z pierwszych języków dla Connection-Machine W. D. Hillisa był * Lisp, rozszerzenie Common Lispu ... alna. Jak na razie oprócz nVidia SDK dla C / C++, znalazłem tylko PyCUDA, środowisko Pythona. Czy ktoś słyszał coś o Lispie?

Czy można porównywać jednostki SSE / AVX z rdzeniami GPU?

Mam prezentację dla osób, które nie mają (prawie) pojęcia jak działa GPU. Myślę, że powiedzenie, że GPU ma tysiąc rdzeni, gdz ... y uzasadnić, dlaczego to porównanie nie powinno być posuwane za daleko, ale CaptainObvious dostarczył bardzo dobre artykuły .

Zmuszanie CUDA do użycia rejestru dla zmiennej

Mam wiele nieużywanych rejestrów w moim jądrze. Chciałbym powiedzieć CUDA, aby użyć kilku rejestrów do przechowywania niektó ... (nvcc-arch sm_20-ptx simple.cu) .loc 2 14 2 ret; Jakiś pomysł, gdzie mogę znaleźć prawdziwy komputer / skompilowany kod?

Jak używać pamięci graficznej jako pamięci RAM? [zamknięte]

Ponieważ Karty graficzne zapewniają duże ilości pamięci RAM (0,5 GiB do 2gib), a dostęp API do GPU nie jest tak trudny z CUDA ... ch aplikacjach (a nie Darmowa użyteczna dla systemu operacyjnego)? Jeśli tak, to jaki jest preferowany sposób, aby to zrobić?

Przydziel tablicę 2D na pamięci urządzenia w CUDA

Jak przydzielić i przenieść(do i z hosta) tablice 2D w pamięci urządzenia w Cuda?

Techniki zmniejszające opóźnienie transferu danych procesora do GPU

Szukałem sposobów na zmniejszenie opóźnień spowodowanych przesyłaniem danych tam iz powrotem z procesora i GPU. Kiedy po raz ... ację bazodanową, w której potrzebny byłby stały odczyt z dysku twardego (HDD lub SSD), operacja może wykonać tylko procesor,

Czy CUDA obsługuje rekurencję?

Czy CUDA obsługuje rekurencję?

Jak profilować i optymalizować jądra CUDA?

Jestem nieco zaznajomiony z CUDA visual profiler i arkusza obłożenia, chociaż prawdopodobnie nie jestem ich wykorzystanie tak ... właściwe pytania i jakie narzędzie mogę uzyskać odpowiedzi od. Jak zidentyfikować sposoby, aby jądra CUDA działały szybciej?

Cuda Image average filter

Filtr średni jest filtrem okienkowym klasy liniowej, który wygładza sygnał (obraz). Filtr pracuje jako dolnoprzepustowy. Pods ... obrazach, więc pomyślałem o użyciu GPGPU. Pytanie brzmi teraz, Jak można to zaimplementować w cuda, jeśli jest to możliwe ?

Jak wywołać funkcję hosta w jądrze CUDA?

Jak wynika z poniższego błędu, wywołanie funkcji hosta ('rand') nie jest dozwolone w kernelu i zastanawiam się, czy nie ma na ... muszę to zrobić. error: calling a host function("rand") from a __device__/__global__ function("xS_v1_cuda") is not allowed

Zmniejsz wiersze matrycy za pomocą CUDA

Windows 7, NVidia GeForce 425M. Napisałem prosty kod CUDA, który oblicza sumy wierszy macierzy. Macierz ma jednowymiarową r ... użytkownicy i tutaj: ZAPOMNIJ O PRÓBACH PISANIA WŁASNYCH FUNCTIONS , zamiast tego użyj Biblioteki ciągu, A magia nadejdzie.

Wskaźniki funkcji urządzenia

Potrzebuję wersji urządzenia następującej kod hosta: double (**func)(double x); double func1(double x) { return x+1.; } ... t;(); test_kernel<<<1,1>>>(); cudaThreadSynchronize(); assign(); test(); return 0; }

Jak połączyć kod hosta ze statyczną biblioteką CUDA po oddzielnej kompilacji?

W porządku, mam naprawdę niepokojące pytanie CUDA 5.0 o to, jak prawidłowo połączyć rzeczy. Byłbym bardzo wdzięczny za każdą ... ważnego? Czy to w ogóle możliwe? Bonus pytanie: chcę, aby efektem końcowym była dynamiczna biblioteka. Jak mogę to osiągnąć?

CUDA kernel-zagnieżdżone dla pętli

Witam Próbuję napisać jądro CUDA, aby wykonać następujący fragment kodu. for (n = 0; n < (total-1); n++) { a = values[ ... n+1; i < total; i++){ b = values[i] - a; c = b*b; if( c < 10) newvalues[i] = c; } }

CUDA jak uzyskać siatkę, blok, rozmiar gwintu i obliczenie paraleli bez kwadratowej macierzy

Jestem nowy w CUDA i potrzebuję pomocy w zrozumieniu niektórych rzeczy. Potrzebuję pomocy przy tworzeniu tych dwóch pętli. ... eczytałem poradniki, ale nadal nie rozumiem, jak uzyskać właściwy nr. siatek / bloków / wątków i efektywnie z nich korzystać.

Budowanie programu GPL C z modułem CUDA

Próbuję zmodyfikować program GPL napisany w języku C. moim celem jest zastąpienie jednej metody implementacją CUDA, co oznacz ... racyjnych i Makefile? Jest to nawet gorsze niż skrypty Apache Ant, do których przywykłem (Tak, jestem poza moim zasięgiem)

Czy możliwy jest dostęp do dysku twardego bezpośrednio z gpu?

Czy jest możliwy dostęp do dysku twardego / dysku flash bezpośrednio z GPU (CUDA / openCL) i ładowanie/przechowywanie zawarto ... ma). Staram się jak najmniej angażować procesor i RAM. Zachęcamy do zaproponowania wszelkich sugestii dotyczących projektu.

Maksymalna liczba wątków, które mogą być zainicjowane w jednym jądrze CUDA

Jestem zdezorientowany co do maksymalnej liczby wątków, które mogą być uruchomione w GPU Fermi. Moje zapytanie o urządzenie ... ło się dziwnie, jeśli przypadkowo stworzyłem instancję więcej wątków, niż jest to możliwe dla tego konkretnego jądra.

Jak pozwolić cmake znaleźć CUDA

Próbuję zbudować Ten projekt , który ma CUDA jako zależność. Ale skrypt cmake nie może znaleźć instalacji CUDA w systemie: ... .bashrc, bez skutku: export CUDA_TOOLKIT_ROOT_DIR=/usr/local/cuda-5.5 Jak poprawnie wykonać Specify CUDA_TOOLKIT_ROOT_DIR?