AI芯片推理卡集群:内存墙、互联与功耗的三体问题贺星·2026年5月28日·衡石计算一个朴素公式 有效吞吐 ≈ min(算力, 内存带宽, 互联带宽) ÷ 功耗 工程抓手 KV cache 分层与压缩策略 NCCL / 自定义集合通信的拓扑亲和 液冷与供电母线的联合仿真