V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  luyanaa  ›  全部回复第 1 页 / 共 1 页
回复总数  3
2020-06-02 10:35:21 +08:00
回复了 Eender 创建的主题 Python AMD 跑深度学习
印象里面 Github 上面 ROCm 跑 ResNet50 的 benchmark 相对价格不算很难看,主要是受 AMD 每代产品定位的拖累( Radeon VII 毕竟买的人实在太少,大多数人买的 Vega56/Vega64(GFX9 架构)或者 RX580(GFX8)说到底就是甜品卡,就算是平常的使用环境 RX580 也只能和 GTX1050Ti 或者 GTX1060 对比,Vega64 只能和 1070Ti 对比)。实际上我个人的统计(仅供参考,不保证完全控制变量,不保证实际使用体验,来源基本都是 Github 的 issue 和 lambdalabs 的测试数据) Resnet50 benchmark Vega64 比 1080Ti 慢 1/7,Radeon VII 甚至 ROCm2.7 能够接近 RTX2080Ti 的表现。但显然 ROCm 各方面的支持做的不好,新架构的支持偏慢( RDNA 我印象里面似乎还只有 unofficial 的 port,只是填了基础的坑,离开箱可用还差一些),性能还得一点点鸡血上去( Radeon VII 从 2.1.96 到 2.6 似乎 Image/sec 涨了快四分之一),等到满血了很可能下一代甚至下两代都已经出来了,而且动不动还有各种神奇的锅。(当然我以上的数据都只算了 ResNet50 的 Benchmark,因为这个 Benchmark 那个 issue 里测的最多,最方便进行有意义的统计,并不全面,但应该能反映一些问题)
知乎里面可能比较值得参考的几个帖子: https://www.zhihu.com/question/53091802/answer/890213654
https://zhuanlan.zhihu.com/p/80531243
2020-01-24 19:58:34 +08:00
回复了 lyver 创建的主题 推广 除了集五福,咱们春节还能干点啥?(发福利呀~)
听音乐,吃话梅(
2018-02-07 15:37:49 +08:00
回复了 boboliu 创建的主题 分享创造 yinshiGo - 又一个有点想法的一言服务端
有个微小的提议,第一句话能不能不要那么苟,容易翻车
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2729 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 13ms · UTC 12:12 · PVG 20:12 · LAX 04:12 · JFK 07:12
Developed with CodeLauncher
♥ Do have faith in what you're doing.