RTX 3090深度學習性能實測奉上!模型訓練可提升40~60%
點擊標題下「云軒cloudhin」可快速關注
| 匠心 | 專業 |
Cloud hin,寓意以“云計算助力科技發展”
Cloud hin的品牌目標是“解決計算的問題”,品牌定位是“讓專業的計算機裝備為無限的計算潛能服務”。
RTX 3090在深度學習訓練任務中,性能表現究竟如何,它能否取代Titan RTX成為最強消費級AI訓練卡?現在已經有了答案。如果需要搭建128塊以上的GPU集群,8塊成組的Tesla A100顯然效率更高;如果超過512塊GPU,則推薦使用DGX A100系統。目前RTX 3090更適合于高校、科研單位、企業的模型訓練應用,性價比高、部署快、模型訓練效率提升可實現40%~60%!
3DMARK 理論性能測試
全新的NVIDIA Ampere GPU核心擁有280億個晶體管,628平方毫米的面積,基于三星的8nm NVIDIA定制工藝,來自美光的GDDR6X顯存,RT Core、Tensor Core、SM三大處理核心均為初代Turing的兩倍速率,構成了目前消費級性能最強大的RTX 30系列GPU。
我們首先來看下基準測試,采用3DMARK,測試平臺配置如下:
衡量顯卡DX11理論性能的3DMARK FS套裝:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數實際測試結果如下:
針對顯卡DX11性能的3DMARK FS套裝測試,RTX 3080比RTX 2080 Ti在FS中分數高22%,在FSE中分數高26%,在FSU中分數高35%;RTX 3090比RTX 2080 Ti在FS中分數高34%,在FSE中分數高41%,在FSU中分數高53%。
DLSS是3DMARK中專門針對深度學習超級采樣的測試項,在DLSS都開啟的情況下,RTX 3080相比RTX 2080 Ti的FPS提升了23%;RTX 3090相比RTX 2080Ti的FPS提升了35%。
AI訓練性能測試
由于RTX 3090現階段不能很好地支持TensorFlow 2,因此先在TensorFlow 1.15上進行測試。在FP32任務上,RTX 3090每秒可處理561張圖片,Titan RTX每秒可處理373張圖片,性能提升50.4%!
而在FP16任務上,RTX 3090每秒可處理1163張圖片,Titan RTX每秒可處理1082張圖片,性能僅提升7.5%。
NVIDIA官方現已提供了支持RTX 3090的CUDA 11.1,Google官方在TensorFlow nightly版中也已加入了對最新GPU的支持。于是又有用戶再次測試了RTX 3090和Titan的性能對比。
▲ 訓練性能:每秒處理的圖片數量
可以看出,使用FP32進行的所有模型訓練,RTX 3090都能實現40%~60%的訓練提升。而大多數模型的FP16訓練速度幾乎不變,最多提升20%。
RTX 3090雖然是3080價格的兩倍,但是比起A100這種專業卡來說真的還是白菜價,上述測評也已指出3090的目標受眾并不僅限傳統的游戲用戶,專業用戶一樣被瞄準。
此刻@Cloudhin云軒
專屬補貼定制深度學習利器
Cloudhin?云軒專業售前工程師可為您量身定制深度學習AI服務器/工作站,并可預裝ubuntu、centos、redhat、TensorFlow、cuda、cudnn等軟件環境,讓您收到即用,快速開展實驗項目。
購買以上塔式工作站,教育用戶可領專屬補貼,歡迎聯系我們詳詢。工作站CPU可選Intel酷睿X i9-10900X/10920X /10940X/10980XE 等高性能多線程處理器;GPU除 RTX 30 系列外,另可選 RTX 2070S/2080S/2080Ti/Titan RTX 單或雙路配置。以上均支持按需定制,為開發者們構建最適配的算力裝備,加速HPC、數據科學、深度學習等領域的應用。
專業勤修,銳意進取。云軒技術工程師畢業于NVIDIA深度學習研究所,豐富經驗,值得信賴。更多定制方案請聯系客服,我們將實時響應您的定制需求。
如果您有合作需求或寶貴建議,歡迎來信。
郵箱:hezuo@kuanfans.com
合作熱線:021-5415 5559