img
SYSU超算17级在读
永远喜欢水野爱
田宫例四驱车
ASC
首页 留言 标签 归档 打赏
    1. blockDim, gridDim
      1. blockDim 的经验值
      2. cudaOccupancyMaxPotentialBlockSize
      3. cudaOccupancyMaxActiveBlocksPerMultiprocessor
    2. 继续减少调度开销
      1. 减少核函数启动次数
      2. 将线程和对应的数据解耦
      3. 循环展开
      4. 使用 template 传递编译期常数
    3. 调库
    4. 减少 Bank Conflict
    天 时 分 秒
    次
    枚
    人
    jekyll-theme-WuK
    2017-2020 WuK
    粤ICP备 20024947号
    皖公网安备 34070202000407号