gpgpu

Najszybszy rodzaj stałej długości 6 int array

Odpowiadając na inne pytanie o przepełnienie stosu ( to jedno ) natknąłem się na interesujący sub-problem. Jaki jest najszybs ... uje się 6 testów). To daje każdemu swapowi średnio 4 cykle. Nazywam to niesamowicie szybkim. Jakieś inne możliwe ulepszenia ?

Najlepsze podejście do GPGPU / CUDA / OpenCL w Javie?

Obliczenia ogólnego przeznaczenia na jednostkach przetwarzania grafiki (GPGPU) jest bardzo atrakcyjną koncepcją do wykorzysta ... JNA bezpośrednio jest opcją? Zapomniałem o czymś? Wszelkie prawdziwe doświadczenia/przykłady/historie wojenne są doceniane.

NVIDIA vs AMD: wydajność GPGPU

Chciałbym usłyszeć od ludzi z doświadczeniem w kodowaniu dla obu. Sam mam tylko doświadczenie z Nvidią. NVIDIA CUDA wydaje s ... ewaga AMD nad Nvidią i czy prawdopodobnie zostanie zrealizowana w większości zadań GPGPU? Co się dzieje z zadaniami integer?

OpenCL / AMD: Deep Learning

Podczas "googlowania" i wykonywania pewnych badań nie byłem w stanie znaleźć żadnego poważnego/popularnego frameworka/sdk d ... ch na OpenCL/AMD w 2015/16? Jaki jest dobry początek deep learningz OpenCL/AMD? Jakaś Literatura? Tutoriale? Różne źródła?

CUDA Driver API vs. CUDA runtime

Podczas pisania aplikacji CUDA, możesz pracować na poziomie sterownika lub na poziomie runtime, jak pokazano na tym obrazku ( ... ten sposób? Jedyną korzyścią, jaką widzę, jest to, że łatwiej jest zintegrować inteligentną obsługę błędów z resztą kodu C#.

Czy powinienem ujednolicić dwa podobne jądra za pomocą polecenia "if", ryzykując utratę wydajności?

Mam 2 bardzo podobne funkcje jądra, w tym sensie, że kod jest prawie taki sam, ale z niewielką różnicą. Obecnie mam 2 opcje: ... jeśli", albo "else". Czy pojedyncza Instrukcja if zmniejszy moją wydajność, jeśli funkcja jądra będzie wywoływana wiele razy?

Programowanie GPU, CUDA czy OpenCL? [zamknięte]

Jestem początkującym programistą GPU. Mam laptopa z kartą NVIDIA GeForce GT 640. Mam do czynienia z 2 dylematami, sugestie są ... ą najbardziej przydatne. Am Nie mam żadnej funkcjonalności, jeśli pójdę na OpenCL, a nie CUDA ? Jakaś pomoc lub sugestie ?

CUDA: ile w sumie równoległych wątków?

[1]} mam GeForce GTX 580 i chcę złożyć oświadczenie o całkowitej liczbie wątków, które mogą (najlepiej) być uruchamiane równo ... że działać równolegle 512*32 = 16384 wątków, czy też jestem daleko i CUDA rdzenie jakoś tak naprawdę nie działają równolegle?

Czy z powodzeniem korzystałeś z GPGPU? [zamknięte]

zamknięte . To pytanie jest oparte na opinii . Obecnie nie przyjmuje odpowiedzi. ... UDA . Jeśli tak, to jakie problemy znajdujesz i jakie zyski z wydajności osiągnąłeś w porównaniu ze standardowym procesorem?

Wydajność OpenCL vs OpenMP [zamknięta]

Czy były jakieś badania porównujące wydajność OpenCL do OpenMP? W szczególności interesują mnie ogólne koszty uruchamiania wą ... PU), a nie procesorów, które mają mniej, ale bardziej wydajne rdzenie. Czy OpenCL może być skutecznym zamiennikiem OpenMP?

Wydajność bloku CUDA i rozmiaru siatki

Jaki jest zalecany sposób radzenia sobie z dynamicznymi zestawami danych w cuda? Czy jest to przypadek 'set the block and gr ... określony rozmiar osnowy). Przejrzałem "Programowanie masowo równoległych procesorów" Kirka, ale to nie dotyka tego obszaru.

GPGPU kontra Multicore?

Jakie są najważniejsze praktyczne różnice pomiędzy GPGPU a zwykłym programowaniem wielordzeniowym / wielowątkowym CPU z punkt ... lelizm ? Jeśli procesory graficzne są tak spektakularnie wydajne, dlaczego Procesory nie są zaprojektowane bardziej jak GPU?

Czy można uruchomić CUDA na GPU AMD?

Chciałbym rozszerzyć mój zestaw umiejętności na komputery GPU. Jestem zaznajomiony z raytracingiem i grafiką w czasie rzeczyw ... wien, że jest to często zadawane pytanie, ale najlepsze widziałem od 08' i myślę, że pole zmieniło się trochę od tego czasu.

Jak korzystać z OpenCL na Androidzie?

For plattform independence (desktop, cloud, mobile, ...) byłoby wspaniale używać OpenCL do rozwoju GPGPU, gdy szybkość ma zna ... nie zostanie uwzględniony w systemie iOS. Dlatego szukam rozwiązania do wykonywania kodu OpenCL w aplikacjach na Androida.

Jakieś rozszerzenia Lispu dla CUDA?

Właśnie zauważyłem, że jednym z pierwszych języków dla Connection-Machine W. D. Hillisa był * Lisp, rozszerzenie Common Lispu ... alna. Jak na razie oprócz nVidia SDK dla C / C++, znalazłem tylko PyCUDA, środowisko Pythona. Czy ktoś słyszał coś o Lispie?

Jak używać przypiętej pamięci / zmapowanej pamięci w OpenCL

W celu skrócenia czasu transferu z hosta do urządzenia dla mojej aplikacji, Chcę użyć przypiętej pamięci. Przewodnik najleps ... iteBuffer lub czy enqueueMapBuffer wystarczy? Ponadto, jaka jest różnica między CL_MEM_ALLOC_HOST_PTR i CL_MEM_USE_HOST_PTR?

Jak wywołać funkcję hosta w jądrze CUDA?

Jak wynika z poniższego błędu, wywołanie funkcji hosta ('rand') nie jest dozwolone w kernelu i zastanawiam się, czy nie ma na ... muszę to zrobić. error: calling a host function("rand") from a __device__/__global__ function("xS_v1_cuda") is not allowed

Jak zoptymalizować Kod OpenCL dla dostępu sąsiadów?

Edit : Wyniki proponowanych rozwiązań są dodawane na końcu pytania. Zaczynam programować z OpenCL i stworzyłem naiwną implem ... ększony o współczynnik x1.25, który jest bardzo dobry. Warto to zrobić, pomimo złożoności programowania i nieczytelności :p.

Programowanie GPGPU z OpenGL ES 2.0

Próbuję wykonać pewne przetwarzanie obrazu na GPU, np. mediana, rozmycie, jasność itp. Ogólną ideą jest zrobienie czegoś taki ... m naprawdę sfrustrowany sobą. Aktualizacja: Wygląda na to, że będę musiał użyć FBO, dostając taki: glBindFramebuffer(...)

Jaki jest aktualny stan C++ AMP [zamknięty]

Pracuję nad wysokiej wydajności kodu w C++ i używam zarówno CUDA i OpenCL, a ostatnio C++AMP, który bardzo lubię. Jestem jedn ... ko windows, ale to wszystko, a nie coś, co zostało powiedziane daleko i szeroko. Jaki rodzaj pracy, jeśli w ogóle, że wiesz?