読書活動 PMPP Ch.7
CHAPTER 7 Convolution
さて具体的なテクニックの章に入ってまいりました。Convolution とか簡単でしょと思っていたが、ここまでの章を読むといくらでも複雑な高速化があり得ることがわかり、やや恐怖。
- Tile 化するが、Convolution という計算の性質上 input のタイルを output のタイルより大きくしないといけない。
- Input のタイルを output のタイルと同じ大きさに揃え、はみ出す分は L2 が hit することを期待するアプローチもある。って L2 あんのね。
- どのアプローチが一番速い、という話はしない。ベンチマークしろということか・・・。