共计 29 篇文章
2022
关于知识蒸馏温度T的一个简单解释(最优化函数拟合角度)
深度分离卷积方法简介
论文阅读:MixFormer: End-to-End Tracking with Iterative Mixed Attention
1x1卷积方法及其作用
论文阅读:MoCo系列论文解读
Contrastive Loss 中超参数τ的研究
论文阅读:Attention Is All You Need
PyTorch 分布式训练
论文阅读:Deep Residual Learning for Image Recognition
论文阅读:Non-local Neural Networks