会员
周边
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
52
53
54
55
56
57
58
59
60
···
159
下一页
2024年11月1日
随机性、熵与随机数生成器:解析伪随机数生成器(PRNG)和真随机数生成器(TRNG)
摘要: 随机性在诸多领域中扮演着至关重要的角色,涵盖密码学、仿真和机器学习等方面。因为随机性为无偏决策、不可预测序列和安全加密提供了基础。然而生成随机数是一项复杂的任务,理解伪随机数生成(pseudo-random number generation, PRNG)与真随机数生成(true random nu
阅读全文
posted @ 2024-11-01 09:42 deephub
阅读(200)
评论(0)
推荐(0)
2024年10月31日
Github上的十大RAG(信息检索增强生成)框架
摘要: 信息检索增强生成(Retrieval-Augmented Generation,简称RAG)是一种强大的技术,能够显著提升大型语言模型的性能。RAG框架巧妙地结合了基于检索的系统和生成模型的优势,可以生成更加准确、符合上下文、实时更新的响应。随着对先进人工智能解决方案需求的不断增长,GitHub上涌
阅读全文
posted @ 2024-10-31 09:29 deephub
阅读(317)
评论(0)
推荐(0)
2024年10月30日
基于图论的时间序列数据平稳性与连通性分析:利用图形、数学和 Python 揭示时间序列数据中的隐藏模式
摘要: 时间序列数据表示了一个随时间记录的值的序列。理解这些序列内部的关系,尤其是在多元或复杂的时间序列数据中,不仅仅局限于随时间绘制数据点(这并不是说这种做法不好)。通过将时间序列数据转换为图,我们可以揭示数据片段内部隐藏的连接、模式和关系,帮助我们发现平稳性和时间连通性等性质,这就是图论发挥作用的地方。
阅读全文
posted @ 2024-10-30 09:40 deephub
阅读(89)
评论(0)
推荐(0)
2024年10月28日
深度学习中的学习率调度:循环学习率、SGDR、1cycle 等方法介绍及实践策略研究
摘要: 深度学习实践者都知道,在训练神经网络时,正确设置学习率是使模型达到良好性能的关键因素之一。学习率通常会在训练过程中根据某种调度策略进行动态调整。调度策略的选择对训练质量也有很大影响。 大多数实践者采用一些广泛使用的学习率调度策略,例如阶梯式衰减或余弦退火。这些调度策略中的许多是为特定的基准任务量身定
阅读全文
posted @ 2024-10-28 09:47 deephub
阅读(156)
评论(0)
推荐(0)
2024年10月27日
过采样与欠采样技术原理图解:基于二维数据的常见方法效果对比
摘要: 在现实场景中,收集一个每个类别样本数量完全相同的数据集是十分困难的。实际数据往往是不平衡的,这对于分类模型的训练可能会造成问题。当模型在这样一个不平衡数据集上训练时,由于某个类别的样本数量远多于其他类别,模型通常会更擅长预测样本量较大的类别,而在预测小类别时表现不佳。为了缓解这一问题,我们可以使用过
阅读全文
posted @ 2024-10-27 09:39 deephub
阅读(181)
评论(0)
推荐(0)
2024年10月26日
LLM-Mixer: 融合多尺度时间序列分解与预训练模型,可以精准捕捉短期波动与长期趋势
摘要: 近年来,大型语言模型(Large Language Models,LLMs)在自然语言处理领域取得了显著进展。受此启发,研究人员开始探索将LLMs应用于时间序列预测任务的可能性。由于时间序列数据与文本数据在特征上存在显著差异,直接将LLMs应用于时间序列预测仍面临诸多挑战。 为了解决这一问题,Jin
阅读全文
posted @ 2024-10-26 09:52 deephub
阅读(255)
评论(0)
推荐(0)
2024年10月25日
RAPTOR:多模型融合+层次结构 = 检索性能提升20%,结果还更稳健
摘要: 在现代信息检索领域,单一检索模型的局限性日益显现。本文深入探讨如何通过多模型集成技术提升检索系统的性能,并详细介绍RAPTOR(Recursive Abstractive Processing for Tree-Organized Retrieval)框架的实现机制。这一研究建立在之前探讨的RAG
阅读全文
posted @ 2024-10-25 09:42 deephub
阅读(107)
评论(0)
推荐(0)
2024年10月24日
梯度累积的隐藏陷阱:Transformer库中梯度累积机制的缺陷与修正
摘要: 在本地环境下对大规模语言模型(LLMs)进行微调时,由于GPU显存限制,采用大批量训练通常难以实现。为解决此问题,一般普遍会采用梯度累积技术来模拟较大的批量规模。该方法不同于传统的每批次更新模型权重的方式,而是通过在多个小批量上累积梯度,在达到预设的累积次数后才执行权重更新。这种方法有效地实现了大批
阅读全文
posted @ 2024-10-24 09:40 deephub
阅读(122)
评论(0)
推荐(0)
2024年10月23日
TimeDART:基于扩散自回归Transformer 的自监督时间序列预测方法
摘要: 近年来,随着机器学习技术的进步,深度神经网络已经成为解决时间序列预测问题的主流方法。这反映了学术界和工业界在利用先进技术处理序列数据复杂性方面的持续努力。 自监督学习概述 基本定义 自监督学习是一种创新的学习范式,其特点是模型能够从未标记数据中通过内部生成的监督信号进行学习,通常这种学习通过预文任务
阅读全文
posted @ 2024-10-23 11:36 deephub
阅读(129)
评论(0)
推荐(0)
2024年10月22日
11种经典时间序列预测方法:理论、Python实现与应用
摘要: 时间序列分析和预测在现代数据科学中扮演着关键角色,广泛应用于金融、经济、气象学和工程等领域。本文将总结11种经典的时间序列预测方法,并提供它们在Python中的实现示例。 这些方法包括: 自回归(AR) 移动平均(MA) 自回归移动平均(ARMA) 自回归积分移动平均(ARIMA) 季节性自回归积分
阅读全文
posted @ 2024-10-22 09:34 deephub
阅读(293)
评论(0)
推荐(0)
上一页
1
···
52
53
54
55
56
57
58
59
60
···
159
下一页
公告