关注 TensorPlay 团队的最新发布、教程和研究亮点。
深入探讨 TensorPlay “解耦优先”的设计哲学。通过将框架拆分为 P10、TPX、Stax 和 NN 四个独立且职责单一的库,我们实现了灵活性与高度可定制性的完美平衡。
揭秘 TensorPlay 如何在底层实现跨硬件的算子调度。通过 Dispatcher 机制与 TensorImpl 模式,P10 能够以极低的延迟将计算任务分发至最合适的硬件后端。
传统的 autograd 往往深度嵌入计算逻辑。TPX 采用了一种全新的“透明扩展”模式,在完全不侵入 P10 计算逻辑的前提下,实现了灵活的动态图追踪与梯度回传。