会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
有点锋芒
博客园
首页
新随笔
联系
订阅
管理
2026年5月18日
3. 注意力(attention)
摘要: 1. 向量的运算 1. 点积 / 内积 (Dot Product / Inner Product) 这是最基础的一种向量乘法,结果是一个标量。 代数定义:对两个同维向量 \(\mathbf{a}, \mathbf{b} \in \mathbb{R}^n\), \[\mathbf{a} \cdot \
阅读全文
posted @ 2026-05-18 14:13 ldfm
阅读(9)
评论(0)
推荐(0)
2026年5月7日
103. nn.Embedding
摘要: 1. 作用 构建词汇表,将索引映射为向量 核心参数 num_embeddings:词汇表的大小(即离散索引的总数,如词表有 10000 个词,则设为 10000)。 embedding_dim:输出向量的维度(如 128、256,需根据任务复杂度调整)。 padding_idx(可选):指定某个索引
阅读全文
posted @ 2026-05-07 16:38 ldfm
阅读(7)
评论(0)
推荐(0)
2026年2月11日
标准化(standardization)vs 归一化(normalization)vs 正则化(regularization)区别分析
摘要: 1. 标准化(Standardization / Z-Score Normalization) 1. 核心定义 通过线性变换,将数据转换为符合均值为0、标准差为1的标准正态分布。 2. 数学公式 \[z = \frac{x - \mu}{\sigma} \]其中: \(x\):原始数据值 \(\mu
阅读全文
posted @ 2026-02-11 14:36 ldfm
阅读(94)
评论(0)
推荐(0)
2025年11月12日
VLA1:思想萌芽期 (2022年以前) - “基础奠定”,《Gato: A Generalist Agent》(DeepMind, 2022)
摘要: 1. ViT(Vision Transformer) 中图像的序列化 \[z_0 = [x_{class}; x^1_pE; x^2_pE;\cdots; x^N_pE] + E_{pos}, E ∈ R^{(P 2 ·C)×D} , E_{pos} ∈ R^{(N +1)×D} \]2. toke
阅读全文
posted @ 2025-11-12 10:11 ldfm
阅读(23)
评论(0)
推荐(0)
2025年3月5日
100 TensorRT Puglin开发
摘要: 1. 核心原理 定义计算逻辑:告诉 GPU 如何执行这个特殊层的计算。 集成到 TensorRT:让 TensorRT 在推理时调用你的计算逻辑。 2. 开发步骤 1. 创建一个插件类,继承TensorRT的 IPluginV2 接口,实现关键函数 #include <NvInfer.h> clas
阅读全文
posted @ 2025-03-05 11:45 ldfm
阅读(120)
评论(0)
推荐(0)
2025年3月4日
05 感知 3D目标检测 模型导出和部署(基础知识)
摘要: 1. 模型导出基础介绍 torch.onnx.export中需要的模型实际上是一个torch.jit.ScriptModule。而要把普通 PyTorch 模型转一个这样的 TorchScript 模型,有跟踪(trace)和记录(script)两种导出计算图的方法。如果给torch.onnx.ex
阅读全文
posted @ 2025-03-04 09:38 ldfm
阅读(127)
评论(0)
推荐(0)
2025年2月28日
感知: 3D目标检测 Sparse BEV 补1
摘要: 随着BEV方法研究的越来越深入,BEV特征的构建方式也逐渐分为了dense特征和sparse两大类。 dense BEV特征的构建方法直观,性能也较好,但是难以避开计算复杂度的问题。 而基于sparse query的方法可以避免构建dense特征的大量无效计算,可以更高效,更快地实现有效特征提取。
阅读全文
posted @ 2025-02-28 16:54 ldfm
阅读(396)
评论(0)
推荐(0)
2025年2月27日
00 数据结构
摘要: 1. 数组 2. 链表 3. 栈 4. 队列 5. 树 红黑树(自平衡二叉树) 增删改查时间复杂度 O(log n) 二叉搜索树(BST):左子节点 < 父节点 < 右子节点。 问题:若插入顺序不当(如从小到大插入),BST 会退化为链表,查找效率从 O(log n) 降为 O(n)。 平衡二叉树(
阅读全文
posted @ 2025-02-27 09:46 ldfm
阅读(45)
评论(0)
推荐(0)
2025年2月26日
04 感知:3D目标检测 注意力机制
摘要: 1. DETR 2020(DEtection TRansformer)End-to-End Object Detection with Transformers Best Ref: 理解DETR 可以将DETR视为一个从图像序列到一个集合序列的转换过程。该集合实际上就是一个可学习的位置编码(文章中也
阅读全文
posted @ 2025-02-26 19:03 ldfm
阅读(212)
评论(0)
推荐(0)
【多视图几何】1. 概论
摘要: 1. 欧式空间 和 射影空间 欧式空间可以由射影空间导出。 例:2D射影空间可以表示具有无穷远的平面,表示范围包含2d欧式空间;3d 同理。 欧式空间 -> 射影空间 将坐标转换为齐次(homogeneous)坐标 (升维,齐次坐标表示一类性质相同坐标簇) 在二维欧式平面添加无穷远线(三维欧式空间添
阅读全文
posted @ 2025-02-26 19:01 ldfm
阅读(44)
评论(0)
推荐(0)
下一页
公告