Harry Yu
首页
关于我
博客
项目
友链
English
首页
关于我
博客
项目
友链
English
博客
/
学习笔记
/
AI
AI
深度学习,大模型,算法
子分类
Transformer
(3)
文章
Agentic RL 基础理论&代码速递-基于TRL库源码解读
2026年6月17日
GRPO 训练中的量词
2026年6月17日
Temperature 的数学本质
2026年4月23日
数据归一化与层归一化概述
2026年1月1日
Softmax 结构:为什么指数归一化如此普遍?
2026年1月1日