スポンサーリンク
Cudaでバンクコンフリクトの実験をしたいが結果の確認のしようがないのでプロファイリングの方法を調べている。とりあえずNsight Computeでそれらしき項目を見つけたのでひとまずメモしておく。
なおプログラムは以下のあたりから借用。
https://toropippi.livedoor.blog/archives/55467682.html
Cuda Toolkit をインストールすると入っている。
まず起動するときに管理者権限で実行しないとエラーになるので気を付ける。
実行ファイルへのパスを指定しLaunchするとNsight Computeから実行できる。
「Profile」でも「Interactive Profile」でもいいが、操作方法が若干違うので注意。
バンクコンフリクトを表示させるにはSectionに「Memory Workload Analysis」を指定している必要がある。前ステップでInteractive Profileを選んだ場合、下のようにLaunchしてからSection Setsから選ぶ。
Profileを選んだ場合はLaunch前にSection一覧から選択する。
⑥のボタンでステップ実行できるので、⑦に見たい関数が表示されるまで処理を進め、「Profile Kernel」をクリックすると右側にプロファイルが表示される
プロファイルの中のMemory Workload Analysisの下の方にBank Conflictsの項目がある。