摘要:
https://zhuanlan.zhihu.com/p/503321685 保姆级分析self Attention为何除根号d 阅读全文
posted @ 2025-12-15 21:54
blcblc
阅读(3)
评论(0)
推荐(0)
摘要:
https://github.com/BoXiaolei/MyTransformer_pytorch 这是一个transformer的实现 http://nlp.seas.harvard.edu/annotated-transformer/ (哈佛NLP团队实现版本) 阅读全文
posted @ 2025-12-15 17:38
blcblc
阅读(2)
评论(0)
推荐(0)
摘要:
https://zhuanlan.zhihu.com/p/583942614 pytorch tensor 操作:合并、分割、维度变换 其中expand有些补充,expand只能扩1的维度,或者在最前面维度新扩 repeat针对各个维度拷贝几倍 view和reshape的区别,可以参考这个: htt 阅读全文
posted @ 2025-12-15 16:52
blcblc
阅读(0)
评论(0)
推荐(0)

浙公网安备 33010602011771号