魔改工程师 - 博客园

2026年4月1日

YOLOv11 改进 - SPPF模块发论文神器！LSKA注意力改进SPPF,增强多尺度特征提取能力，高效涨点！！！

摘要：本文介绍了Large Separable Kernel Attention (LSKA)模块及其在YOLOv11中的结合应用。LSKA旨在解决Visual Attention Networks (VAN)使用大内核卷积时的计算效率问题，通过将2D深度卷积层的卷积核分解为级联的水平和垂直1-D卷积核，降低了计算复杂度和内存占用，且使VAN更关注物体形状。我们将集成LSKA的SPPF_LSKA模块引入阅读全文

posted @ 2026-04-01 11:52 魔改工程师阅读(10) 评论(0) 推荐(0)

YOLOv11 改进 - SPPF模块 SPPELAN 空间金字塔池化与增强局部注意力：替代SPPF增强多尺度上下文捕获，提升检测精度

摘要：本文介绍了可编程梯度信息（PGI）和通用高效层聚合网络（GELAN），以及SPPELAN模块在YOLOv11中的结合应用。针对深度网络数据传输中的信息丢失问题，提出PGI概念以提供完整输入信息计算目标函数，获得可靠梯度更新网络权重；并基于梯度路径规划设计了GELAN架构。我们将SPPELAN模块集成进YOLOv11，在MS COCO目标检测任务中，GELAN展现出更好的参数利用率，PGI使模型表现阅读全文

posted @ 2026-04-01 11:50 魔改工程师阅读(9) 评论(0) 推荐(0)

2026年3月31日

YOLOv11 改进 - SPPF模块 AIFI基于注意力的尺度内特征交互：替代SPPF构建高效混合编码器，提升模型综合效能

摘要：本文介绍了实时检测Transformer（RT-DETR）及其核心AIFI模块在YOLOv11中的结合应用。RT-DETR旨在解决YOLO速度和准确性受NMS负面影响、DETRs计算成本高的问题，通过设计高效混合编码器和解码器层数调整来提升性能。AIFI作为Transformer编码器层，通过构建2D正弦 - 余弦位置嵌入处理多尺度特征。我们将AIFI集成进YOLOv11，实验表明，改进后的模型在阅读全文

posted @ 2026-03-31 21:10 魔改工程师阅读(35) 评论(0) 推荐(0)

YOLOv11 改进 - Mamba 集成Mamba-YOLO（AAAI 2025），Mamba-YOLOv11-T 替换骨干，破解全局依赖建模难题，实现高效实时检测

摘要：本文介绍Mamba YOLO，为图片物体识别提供了“又快又准”的新方案。传统CNN架构运行快但难以捕捉远距离关联物体，Transformer架构精度高但计算量呈平方级增长，而SSM虽计算量为线性级且能抓全局关联，但用于图片识别时细节定位不准。为此，Mamba YOLO做了三项关键优化：引入ODMamba骨干网络，解决自注意力的二次复杂度问题，且无需预训练；设计ODMamba宏观结构确定最佳阶段比例阅读全文

posted @ 2026-03-31 21:09 魔改工程师阅读(10) 评论(0) 推荐(0)

YOLOv11 改进 - Mamba 集成Mamba-YOLO（AAAI 2025），Mamba-YOLOv11-L 替换骨干，破解全局依赖建模难题，实现高效实时检测

posted @ 2026-03-31 13:51 魔改工程师阅读(13) 评论(0) 推荐(0)

YOLOv11 改进 - Mamba 集成Mamba-YOLO（AAAI 2025），Mamba-YOLOv11-B 替换骨干，破解全局依赖建模难题，实现高效实时检测

posted @ 2026-03-31 08:35 魔改工程师阅读(9) 评论(0) 推荐(0)

YOLOv11 改进 - C2PSA C2PSA融合TSSA(Token Statistics Self-Attention)令牌统计自注意力，优化遮挡目标感知

摘要：本文介绍了Token Statistics Self-Attention（TSSA）机制，并将其集成到YOLOv11中。传统自注意力计算复杂度高，TSSA进行了范式转变，基于token统计特征实现高效注意力交互。它通过“算法展开”推导得出，以“最大编码率降低”为目标，实现特征学习。TSSA包含动态分组和低秩投影优化两步创新，具备线性复杂度。我们将TSSA代码集成到YOLOv11的C2PSA模块中。阅读全文

posted @ 2026-03-31 08:34 魔改工程师阅读(5) 评论(0) 推荐(0)

2026年3月30日

YOLOv11 改进 - C2PSA C2PSA融合MSLA多尺度线性注意力（Arxiv2025 ）：并行多分支架构融合上下文语义，提升特征判别力

摘要：本文介绍了多尺度线性注意力机制MSLA，并将其集成进YOLOv11。现有基于CNN和Transformer的医学图像分割方法存在局限性，为解决这些问题，我们提出了MSLAU-Net架构，其中MSLA通过并行多尺度特征提取和低复杂度线性注意力计算，捕获细粒度局部细节与全局长程依赖。我们将MSLA的代码集成到YOLOv11中，创建C2PSA_MSLA模块，并在tasks文件中进行注册。实验证明，YOL 阅读全文

posted @ 2026-03-30 22:11 魔改工程师阅读(8) 评论(0) 推荐(0)

YOLOv11 改进 - C2PSA C2PSA融合Mona多认知视觉适配器(CVPR 2025)：打破全参数微调的性能枷锁：即插即用的提点神器，引领视觉微调新突破

摘要：本文介绍了新型视觉适配器微调方法Mona，并将其集成到YOLOv11中。传统全参数微调成本高、存储负担重且有过拟合风险，现有PEFT方法性能落后。Mona仅调整5%以内的骨干网络参数，在多个视觉任务中超越全参数微调。其核心亮点包括参数效率高、性能突破和即插即用。适配器模块包含降维、多认知视觉滤波器等单元，通过深度可分离卷积和多尺度卷积核处理视觉信号，还加入分布适配层优化输入分布。我们将Mona集成阅读全文

posted @ 2026-03-30 22:10 魔改工程师阅读(7) 评论(0) 推荐(0)

YOLOv11 改进 - C2PSA C2PSA融合Mask Attention掩码注意力，可学习掩码矩阵破解低分辨率特征提取难题 2025 预印

摘要：本文提出了用于低分辨率图像分割的MaskAttn - UNet框架，并将其核心的掩码注意力机制集成到YOLOv11中。传统U - Net类模型难以捕捉全局关联，Transformer类模型计算量大，而掩码注意力机制通过可学习的掩码，让模型选择性关注重要区域，融合了卷积的局部效率和注意力的全局视野。其工作流程包括特征适配、掩码生成、定向注意力计算和特征融合。我们将掩码注意力机制代码集成到YOLOv1 阅读全文

posted @ 2026-03-30 22:09 魔改工程师阅读(10) 评论(0) 推荐(0)

YOLOv8创新改进

公告