CUDA
CUDAの挙動をよく知らないので, 現時点でぼくが理解している(真偽不明な)内容をメモ. 真偽はかなり怪しいです. カーネルは非同期実行 カーネル関数は非同期なので処理はすぐ帰ってくる. 処理時間を計測するのにタイマーを使うときに注意が必要. カーネル関…
よく見かけるけど、中身とかよくわかってなかったのでメモ. CUDA_SAFE_CALL()の中身 cutil.hに書いてあるCUDA_SAFE_CALL()の中身. 実態はマクロ. # define CUDA_SAFE_CALL_NO_SYNC( call) { \ cudaError err = call; \ if( cudaSuccess != err) { \ fprintf(…
CUDA Toolkit 3.2 の PTX 規格のPDF。 PTX 、全然いじったことのないんだけどね…。 PTX: Parallel Thread Execution ISA Version 2.2 →http://developer.download.nvidia.com/compute/cuda/3_2_prod/toolkit/docs/ptx_isa_2.2.pdf 誰か和訳してくれないかな…