NVIDIA? Tesla? T4
產品亮點:小巧的 70 瓦外形設計讓 T4 針對可擴展服務器進行了優化,能效相比 CPU 提高了50 倍之多,大大降低了運營成本。過去兩年, NVIDIA 推理平臺的性能提高了 10 多倍,仍然是具有超高能效的分布式 AI 訓練和推理解決方案。NVIDIA T4 數據中心 GPU是完美適用于分布式計算環境的通用加速器。革命性的多精度性能可加速深度學習以及機器學習訓練和推理、視頻轉碼和虛擬桌面。 T
產品亮點:小巧的 70 瓦外形設計讓 T4 針對可擴展服務器進行了優化,能效相比 CPU 提高了50 倍之多,大大降低了運營成本。過去兩年, NVIDIA 推理平臺的性能提高了 10 多倍,仍然是具有超高能效的分布式 AI 訓練和推理解決方案。NVIDIA T4 數據中心 GPU是完美適用于分布式計算環境的通用加速器。革命性的多精度性能可加速深度學習以及機器學習訓練和推理、視頻轉碼和虛擬桌面。 T
產品亮點:
小巧的 70 瓦外形設計
讓 T4 針對可擴展服務器進行了優化,能效相比 CPU 提高了50 倍之多,大大降低了運營成本。過去兩年, NVIDIA 推理平臺的性能提高了 10 多倍,仍然是具有超高能效的分布式 AI 訓練和推理解決方案。
NVIDIA T4 數據中心 GPU
是完美適用于分布式計算環境的通用加速器。革命性的多精度性能可加速深度學習以及機器學習訓練和推理、視頻轉碼和虛擬桌面。 T4 支持所有 AI 框架和網絡類型,性能強勁,效率卓越,可最大限度提高大規模部署的效用。
Turing Tensor 核心技術
具有多精度計算特性,實現了從 FP32 、 FP16 到 INT8 以及 INT4 精度的突破性 Al 性能、與 CPU 相比,它的訓練性能高達 9 . 3 倍,推理性能高達 36 倍。
規格參數
GPU架 構 | NVIDIA Turing |
NVIDIA Turing Tensor 核心數量 | 320 |
NVIDIA CUDA ? 核心數量 | 2560 |
單精度 | 8.1 TFLOPS |
混合精度 (FP16/FP32) | 65 TFLOPS |
INT8 | 130 TOPS |
INT4 | 260 TOPS |
GPU 顯存 | 16 GB GDDR6 300 GB/s |
ECC | 支持 |
互聯帶寬 | 32 GB / s |
系統接口 | x16 PCIe Gen3 |
外形尺寸 | PCIe 半高卡 |
散熱解決方案 | 被動式 |
計算 API | CUDA NVIDIA TensorRT ? ONNX |