对GPU进行性能优化时,cudagraph是绕不开的话题。
不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。
NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。
本文尝试从底层原理出发,根据文档 和 …。
{dede:pagebreak/}
IntelliJ IDEA 中有什么让你相见恨晚的技巧?
为什么全世界无一人能实现新mac直接全功能稳定装Win 11 arm,或PC直接装macOS arm?
为什么没有人在意iPad Pro 2024标准版仅搭载的8GB内存(RAM)?
如果苹果真的下架了微信的话,会发生什么?
Linux 下有没有类似 Everything 的搜索工具?
微信服务器会保留聊天记录吗,会保存多久?
迷茫。J***a还是.net?
iPhone用户是什么原因才用苹果手机?
为什么全世界无一人能实现新mac直接全功能稳定装Win 11 arm,或PC直接装macOS arm?
一个非常漂亮的残疾女孩,会有人愿意娶吗?
不建议笔记本买苹果的那些人真的用过苹果电脑吗?
国家为什么要把国企等企业电脑全部换成Linux环境?能不能从专业的角度分析一下?
苹果 6 月 10 日召开的 2025 年全球开发者大会「WWDC25」,有哪些值得关注的信息?
如何看待贾玲、沙溢、贾冰、杨天真、范湉湉均瘦身成功?为什么明星想瘦就瘦普通人却很难?
你们是怎样看待警察这一职业的?
为什么有人嘲笑练瑜伽的女性?