2012-08-22から1日間の記事一覧
Efficient Sparse Matrix-Vector Multiplication on CUDA | NVIDIA の論文の、CRS spmv vector のメモ。CRS spmv の場合、1行に複数のスレッドが計算したほうが効率がよい。 しかしある行で各スレッドが計算した結果を全て足し算 (parallel reduction) をす…
Efficient Sparse Matrix-Vector Multiplication on CUDA | NVIDIA の論文の、CRS spmv vector のメモ。CRS spmv の場合、1行に複数のスレッドが計算したほうが効率がよい。 しかしある行で各スレッドが計算した結果を全て足し算 (parallel reduction) をす…