会员
周边
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
36
37
38
39
40
41
42
43
44
···
159
下一页
2025年4月10日
PyTorch CUDA内存管理优化:深度理解GPU资源分配与缓存机制
摘要: 在深度学习工程实践中,当训练大型模型或处理大规模数据集时,上述错误信息对许多开发者而言已不陌生。这是众所周知的 CUDA out of memory 错误——当GPU尝试为张量分配空间而内存不足时发生。这种情况尤为令人沮丧,特别是在已投入大量时间优化模型和代码后遭遇此类问题。 torch.cuda.
阅读全文
posted @ 2025-04-10 11:04 deephub
阅读(164)
评论(0)
推荐(0)
2025年4月9日
LangChain RAG入门教程:构建基于私有文档的智能问答助手
摘要: 本文详述了如何通过检索增强生成(RAG)技术构建一个能够利用特定文档集合回答问题的AI系统。通过LangChain框架,可以实现超越预训练模型知识范围的定制化问答能力,适用于专业领域的精准信息检索与生成。 https://avoid.overfit.cn/post/4c0590a63b77428f9
阅读全文
posted @ 2025-04-09 10:09 deephub
阅读(171)
评论(0)
推荐(0)
2025年4月8日
基于LlamaIndex实现CodeAct Agent:代码执行工作流的技术架构与原理
摘要: CodeAct作为AI辅助系统的一种先进范式,实现了自然语言处理与代码执行能力的深度融合。通过构建自定义代码执行代理,开发者能够精确控制应用程序中代码的生成、执行及管理流程。本文将详细阐述如何利用LlamaIndex框架从底层构建CodeAct Agent,深入剖析其内部工作机制,以及如何在预构建解
阅读全文
posted @ 2025-04-08 10:06 deephub
阅读(277)
评论(0)
推荐(0)
2025年4月7日
频率派与贝叶斯统计在营销组合建模中的应用比较:隐私优先时代的方法选择
摘要: 在营销分析领域的持续演进过程中,营销组合建模(Marketing Mix Modeling, MMM)作为一种核心分析技术,已经经受住了时间的考验。从财富500强企业到新兴的数字化初创公司,MMM始终是一种强大的分析工具,用于量化不同营销渠道对销售量、用户注册率或收入等关键业务指标的贡献程度。 随着
阅读全文
posted @ 2025-04-07 10:17 deephub
阅读(33)
评论(0)
推荐(0)
2025年4月6日
基于Transformer架构的时间序列数据去噪技术研究
摘要: Transformer是一种专为处理序列数据而设计的高效神经网络架构。自2017年问世以来,Transformer已在自然语言处理(NLP)领域取得显著成就,并成为现代人工智能平台的核心组件,如OpenAI的ChatGPT[1]、Anthropic的Claude[2]以及Google的Gemini[
阅读全文
posted @ 2025-04-06 17:48 deephub
阅读(142)
评论(0)
推荐(0)
2025年4月5日
英伟达新一代GPU架构(50系列显卡)PyTorch兼容性解决方案
摘要: 随着NVIDIA不断推出基于新架构的GPU产品,机器学习框架需要相应地更新以支持这些硬件。本文记录了在RTX 5070 Ti上运行PyTorch时遇到的CUDA兼容性问题,并详细分析了问题根源及其解决方案,以期为遇到类似情况的开发者提供参考。 在Anaconda虚拟环境("development")
阅读全文
posted @ 2025-04-05 19:58 deephub
阅读(869)
评论(0)
推荐(0)
2025年4月4日
FlashTokenizer: 基于C++的高性能分词引擎,速度可以提升8-15倍
摘要: 随着大型语言模型(LLMs)和基于人工智能的应用程序在各行业的广泛部署,对自然语言处理(NLP)工具性能的要求日益提高。分词处理作为NLP流程中的基础环节,对整体推理性能有着决定性影响。分词过程的计算效率直接关系到模型处理文本的速度和资源消耗。在此技术背景下出现了FlashTokenizer,这是一
阅读全文
posted @ 2025-04-04 19:18 deephub
阅读(35)
评论(0)
推荐(0)
2025年4月3日
计算加速技术比较分析:GPU、FPGA、ASIC、TPU与NPU的技术特性、应用场景及产业生态
摘要: 在计算技术快速迭代的今天,传统通用处理器(CPU)正逐步被专用硬件加速器补充或替代,尤其在特定计算领域。这些加速器通过针对性设计,在功耗效率、计算吞吐量(FLOPS)和内存带宽方面实现了显著优化。截至2025年4月,加速器市场需求呈指数级增长,主要驱动因素来自人工智能(AI)、机器学习(ML)、高性
阅读全文
posted @ 2025-04-03 09:58 deephub
阅读(210)
评论(0)
推荐(0)
2025年4月2日
标签噪声下的模型评估:如何准确评估AI模型的真实性能,提高模型性能测量的可信度
摘要: 真实标签的不完美性是机器学习领域一个不可避免的挑战。从科学测量数据到深度学习模型训练中的人工标注,真实标签总是包含一定比例的错误。即使像ImageNet这样精心策划的图像数据集,其人工标注的错误率仍达0.3%。在这种情况下,如何准确评估预测模型的性能就成为一个关键问题。本文将深入探讨如何在考虑测试数
阅读全文
posted @ 2025-04-02 12:12 deephub
阅读(68)
评论(0)
推荐(0)
2025年4月1日
VideoMind:Chain-of-LoRA突破时间盲区让AI真正看懂长视频
摘要: 视频作为一种富含信息且密集的媒介,已广泛应用于娱乐、社交媒体、安全监控和自动驾驶等领域。人类能够轻松理解视频内容,例如理解因果关系、定位特定时刻以及关联动作。但是人工智能,尤其是大型语言模型(LLM)及其多模态(MLLM)变体,在视频理解方面仍然面临挑战,尤其是在处理长视频时。尽管像 GPT-4V
阅读全文
posted @ 2025-04-01 10:00 deephub
阅读(81)
评论(0)
推荐(0)
上一页
1
···
36
37
38
39
40
41
42
43
44
···
159
下一页
公告