Deep X G20系列在全面的性能测试中展现出卓越的AI计算能力,特别是旗舰型号G20 Pro Max,其1824 TOPS的综合算力在多项测试中超越了NVIDIA DGX Spark。本报告详细记录了在不同工作负载下的性能表现。
测试平台 | CPU | GPU | 内存 | 存储 |
---|---|---|---|---|
Deep X G20 | Intel Core Ultra 7 265F (20核) | RTX RRO 2000 (8GB) | 96GB DDR5-6400 | 2TB NVMe Gen4 |
Deep X G20 Pro | Intel Core Ultra 7 265 (20核) | RTX RRO 4000 (16GB) | 128GB DDR5-6400 | 4TB NVMe Gen4 |
Deep X G20 Pro Max | Intel Core Ultra 9 285 (24核) | RTX RRO 5000 (24GB) | 192GB DDR5-6400 | 4TB NVMe Gen4 |
NVIDIA DGX Spark | 20核 ARM处理器 | 集成GPU | 128GB LPDDR5x | 1TB NVMe |
测试条件: 批量大小=1,序列长度=2048,4-bit量化
型号 | 吞吐量 (tokens/s) | 首字延迟 (ms) | 相对性能 |
---|---|---|---|
NVIDIA DGX Spark | 185 | 142 | 100% (基准) |
Deep X G20 | 156 | 168 | 84% |
Deep X G20 Pro | 245 | 107 | 132% |
Deep X G20 Pro Max | 338 | 78 | 182% |
测试条件: FP16精度,批量大小=8
型号 | 批处理吞吐量 (req/s) | 平均延迟 (ms) | GPU利用率 |
---|---|---|---|
NVIDIA DGX Spark | 12.5 | 640 | 78% |
Deep X G20 | 15.2 | 526 | 85% |
Deep X G20 Pro | 24.8 | 323 | 92% |
Deep X G20 Pro Max | 31.6 | 253 | 94% |
测试条件: 1024×1024分辨率,50步采样
型号 | 生成速度 (img/min) | 批量16张 (秒) | VRAM使用 |
---|---|---|---|
NVIDIA DGX Spark | 18 | 53.3 | N/A |
Deep X G20 | 12 | 80.0 | 7.2GB |
Deep X G20 Pro | 20 | 48.0 | 14.5GB |
Deep X G20 Pro Max | 30 | 32.0 | 21.8GB |
测试条件: 1080p视频流,YOLOv8x模型
型号 | FPS | 延迟 (ms) | mAP@0.5 |
---|---|---|---|
NVIDIA DGX Spark | 67 | 14.9 | 0.89 |
Deep X G20 | 85 | 11.8 | 0.89 |
Deep X G20 Pro | 142 | 7.0 | 0.89 |
Deep X G20 Pro Max | 195 | 5.1 | 0.89 |
测试条件: 批量大小=32,序列长度=512
型号 | 训练速度 (samples/s) | 收敛时间 (小时) | 能耗 (kWh) |
---|---|---|---|
NVIDIA DGX Spark | 320 | 8.2 | 1.39 |
Deep X G20 | 285 | 9.2 | 2.76 |
Deep X G20 Pro | 480 | 5.5 | 1.65 |
Deep X G20 Pro Max | 570 | 4.6 | 1.38 |
测试条件: 图文匹配任务,批量大小=128
型号 | 吞吐量 (pairs/s) | CPU利用率 | GPU利用率 |
---|---|---|---|
NVIDIA DGX Spark | 850 | 45% | 72% |
Deep X G20 | 920 | 38% | 88% |
Deep X G20 Pro | 1,450 | 42% | 91% |
Deep X G20 Pro Max | 1,880 | 35% | 93% |
型号 | 峰值功耗 (W) | AI算力 (TOPS) | 能效比 (TOPS/W) |
---|---|---|---|
NVIDIA DGX Spark | 170 | 1000 | 5.88 |
Deep X G20 | 300 | 798 | 2.66 |
Deep X G20 Pro | 300 | 1334 | 4.45 |
Deep X G20 Pro Max | 300 | 1824 | 6.08 |
在24小时连续推理测试中:
框架/工具 | Deep X G20系列 | NVIDIA DGX Spark |
---|---|---|
PyTorch | ✅ 100% | ✅ 需要ARM版本 |
TensorFlow | ✅ 100% | ✅ 部分功能受限 |
ONNX Runtime | ✅ 100% | ✅ 100% |
CUDA/cuDNN | ✅ 100% | ✅ 100% |
OpenVINO | ✅ 原生支持 | ❌ 不支持 |
DirectML | ✅ Windows原生 | ❌ 不支持 |
Docker/K8s | ✅ 100% | ✅ 需要ARM镜像 |
测试内容:32路1080p监控视频实时分析
指标 | Deep X G20 Pro Max | NVIDIA DGX Spark |
---|---|---|
并发处理路数 | 32 | 20 |
人脸识别准确率 | 99.2% | 99.1% |
行为分析延迟 | <50ms | <80ms |
24小时稳定性 | 100% | 100% |
测试内容:CT图像3D重建与病灶检测
指标 | Deep X G20 Pro Max | NVIDIA DGX Spark |
---|---|---|
3D重建速度 | 2.3秒/组 | 4.1秒/组 |
检测准确率 | 96.8% | 96.5% |
批处理能力 | 50组/小时 | 28组/小时 |
测试内容:PCB板缺陷检测,4K分辨率
指标 | Deep X G20 Pro Max | NVIDIA DGX Spark |
---|---|---|
检测速度 | 120片/分钟 | 72片/分钟 |
误检率 | 0.02% | 0.03% |
最小缺陷 | 0.1mm | 0.1mm |
测试项目 | Deep X G20 Pro Max | 测试结果 |
---|---|---|
连续运行时间 | 168小时 | ✅ 通过 |
性能衰减 | <1% | ✅ 优秀 |
内存泄漏 | 未检测到 | ✅ 通过 |
温度稳定性 | 65°C±3°C | ✅ 稳定 |
错误率 | 0 | ✅ 完美 |
在100% GPU负载下连续运行24小时:
场景 | 推荐型号 | 理由 |
---|---|---|
入门级AI开发 | G20 | 性价比最高,满足基础需求 |
企业级部署 | G20 Pro | 平衡的性能和成本 |
高性能计算 | G20 Pro Max | 最强性能,适合关键任务 |
边缘推理 | G20/G20 Pro | 功耗可控,性能充足 |
大模型服务 | G20 Pro Max | 大显存,高吞吐量 |
基于当前的性能测试结果,Deep X G20 Pro Max相比同类产品:
测试说明: