AI 推论成本 以新的 GPU 优化策略降低40%Blockchain.News2026年1月22日分享AI一起揭示出经过生产测试的技术将推论延后性削减了50-100ms,同时通过量化和智能解码将每起推算的成本降低到5x. (多读)