摘要: 按照算法的类型对个人的 Paper Reading 博客进行汇总,涉及多个研究方向的论文将按照个人主观感觉的主要方向排列。 目录不平衡学习回归决策树决策森林进化计算计算机视觉神经决策模型神经网络生物信息学图学习特征工程 不平衡学习 A Novel Model for Imbalanced Data 阅读全文
posted @ 2023-08-17 00:19 乌漆WhiteMoon 阅读(1095) 评论(0) 推荐(2)
摘要: 目录操作系统进程管理同步与死锁存储器管理文件系统磁盘管理I/O 设备管理云计算系统分布式系统参考资料 这些博客都是根据《计算机操作系统(第四版)》、《操作系统导论》、《分布式系统概念与设计》等书籍整理的,因为这些书超级厚,不爱带来带去。如果在其他地方有看到相关的感兴趣的内容,也会整理到这里来。 操作 阅读全文
posted @ 2021-08-22 14:36 乌漆WhiteMoon 阅读(1790) 评论(0) 推荐(8)
摘要: #基础知识 CTF-WEB:PHP 弱类型 CTF-WEB:PHP 变量 CTF-WEB:PHP 伪协议 CTF-WEB:PHP 反序列化 CTF-WEB:字符串和正则匹配 CTF-WEB:后台扫描与备份泄露 CTF-WEB:BurpSuite 工具应用 CTF-WEB:文件上传和 webshell 阅读全文
posted @ 2021-07-30 12:20 乌漆WhiteMoon 阅读(2574) 评论(0) 推荐(5)
摘要: #基础理论 计算机网络这门课涵盖了 TCP/IP 协议栈的所有层,但是网络规划主要侧重于链路层(交换机)和网络层(路由器)。因此想要快速上手网络技术的学习,可以先从这些基本的理论入门。 网络技术:网络互联设备 网络技术:以太网 网络技术:网络互联模型 网络技术:IP 编址 网络技术:子网划分 #基础 阅读全文
posted @ 2021-07-23 00:21 乌漆WhiteMoon 阅读(1809) 评论(0) 推荐(2)
摘要: 目录数据库原理SqlServerMySQLOceanBase 数据库参考资料 数据库原理 数据库原理:数据库系统概述 数据库原理:数据模型和关系数据库 数据库原理:求最小依赖集和候选键 数据库原理:关系规范化 数据库原理:数据库设计 数据库原理:数据库恢复和并发控制 SqlServer SQL Se 阅读全文
posted @ 2021-06-04 21:47 乌漆WhiteMoon 阅读(1382) 评论(0) 推荐(2)
摘要: #DVWA 靶场 DVWA 靶场的网页应用程序很脆弱,它的主要目标是帮助安全专业人员在实际环境中测试他们的技能和工具,帮助 web 开发人员更好地理解保护 web 应用程序的过程,并帮助教师/学生在教室环境中教授/学习 web 应用程序安全。 Brute Force (爆破) Command Inj 阅读全文
posted @ 2020-11-19 01:54 乌漆WhiteMoon 阅读(4449) 评论(0) 推荐(2)
摘要: #预备知识 数据结构个人学习推荐 C++面向过程编程 C++ STL 库快速上手 #线性表 顺序表结构详解 链表结构和例题详解 SkipList (跳跃表)解析及其实现 静态链表及 PTA 重组链表 #栈和队列 栈结构解析及其应用 队列结构解析及其应用 栈和队列应用:迷宫问题 PTA习题解析——银行 阅读全文
posted @ 2020-08-05 00:07 乌漆WhiteMoon 阅读(1990) 评论(0) 推荐(7)
摘要: 目录计算机网络学习经验概述物理层链路层网络层运输层应用层多媒体网络安全网络管理无线网络通信编程网络配置(CCNA)参考资料 计算机网络 学习经验 计算机网络个人学习经验 概述 计算机网络:互联网概述 计算机网络:TCP/IP 协议栈概述 计算机网路:性能指标 Wireshark 实验:入门 物理层 阅读全文
posted @ 2020-08-04 00:14 乌漆WhiteMoon 阅读(2617) 评论(2) 推荐(7)
摘要: 针对现有方法(如因子分解机、Transformer)假设变量间为稠密交互、视角单一的局限性,本文提出双路由结构自适应图网络 DRSA-Net,其核心在于将无显式结构的表格数据建模为一个可学习的稀疏图上的消息传递问题。具体而言,模型首先通过低秩分解和 Top-K 操作,自适应地学习特征变量之间的最优稀疏图结构,从而精确控制交互的复杂性。在此基础上,模型设计了双路由注意力消息传递规则,同时从学得的图拓扑结构和基于注意力分数的特征相似性这两个互补的视角,来聚合信息并刻画变量间复杂的非线性交互。最终,通过一个分层聚合的读出函数得到样本的表示以进行预测。理论分析表明,经典的多层感知机和因子分解机均可视为该模型在完全图结构下的特例。通过大量实验验证了其有效性,消融实验、案例分析和复杂性评估共同表明,该模型在性能、效率、可解释性方面达到了良好的平衡。 阅读全文
posted @ 2026-05-04 21:58 乌漆WhiteMoon 阅读(6) 评论(0) 推荐(0)
摘要: 针对多病共存患者的重症风险预测难题,本文提出了一种名为 GATET 的混合神经网络模型。该模型的核心在于将 GAT 与 TabNet 融合,主要包含三个模块:依赖特征提取模块依据医学先验知识(如年龄)将患者样本构建并划分为依赖子图;注意力聚合构图模块在子图内使用图注意力机制聚合节点信息,以捕获复杂的样本间关系;特征加权模块则利用简化的 TabNet 计算特征重要性权重。三个模块协同有效应对了医疗表格数据中特征依赖关系复杂、样本关联缺失这两大挑战,在提升预测精度的同时保持了模型的可解释性。利用来自一家三甲医院的真实临床电子健康记录数据构建了数据集,实验表明 GATET 在多个指标上优于多种传统机器学习与前沿深度学习基线模型,并通过消融实验证实了各模块的必要性。 阅读全文
posted @ 2026-05-03 14:29 乌漆WhiteMoon 阅读(5) 评论(0) 推荐(0)
摘要: 本文提出了一个名为 INCE 的表格深度学习模型,其核心创新在于用 GNN 实现交互网络,用作表格特征的上下文嵌入器。模型将每个表格行转换为一个全连接图,其中每个节点对应一个特征的嵌入表示,并引入一个虚拟 CLS 节点。随后,一个 IN 层堆栈通过消息传递机制,动态地学习和更新图中所有节点(特征)之间连接的强度,从而建模复杂的特征交互。经过 IN 增强后的 CLS节点的最终表示,被用作整个表格行的上下文感知的全局嵌入,并送入一个 MLP 解码器进行预测。通过在公开数据集上与多个 baselines 的广泛对比实验,证明了 INCE 模型在深度学习模型中达到了最佳平均性能,并能与树模型形成有力竞争。 阅读全文
posted @ 2026-04-30 15:21 乌漆WhiteMoon 阅读(8) 评论(0) 推荐(0)
摘要: 本文提出了一个名为 Table2Graph​ 的框架,旨在将表格数据的特征交互建模问题转化为一个统一的加权图学习问题。其核心模型通过学习一个全局共享的概率邻接矩阵来显式地编码所有特征列之间的交互强度。为了解决图学习过程中的不稳定性和稀疏性控制难题,模型引入了强化学习策略以稳定地强化对提升预测性能至关重要的关键交互连接,并设计了一个可微的稀疏性约束损失来正则化图的连接结构,避免其过于平滑或稀疏。最终,模型在一个包含预测任务损失、强化损失和稀疏性约束损失的联合损失函数指导下,端到端地训练出这个统一图及相应的图神经网络模型,以实现高效且准确的预测。通过在多个真实世界和合成数据集上进行的广泛实验,本文严谨地验证了该框架的有效性、效率和可解释性。 阅读全文
posted @ 2026-04-27 00:39 乌漆WhiteMoon 阅读(8) 评论(0) 推荐(0)
摘要: 针对表格数据自动语义结构理解中的挑战,本文提出了一种名为 TabularNet​ 的神经网络架构,其核心在于同时建模了表格的空间信息和关系信息。TabularNet 采用了双重数据表示,将表格视为矩阵以利用空间敏感操作,并使用基于 WordNet 词汇树的语义图构建方法来表示单元格间的复杂关系。模型的主体由一个可堆叠的结构信息挖掘层构成,它集成了两个并行编码器:空间信息编码器结合了能敏感捕捉区域交界的行/列双向门控循环单元,以及用于提取统计特征的行/列平均池化;关系信息编码器在 WordNet 语义图上应用图卷积网络,以捕获层次与并列关系。TabularNet 被设计为一个统一的骨干网络,其输出的嵌入表示可通过简单的集成(如拼接、池化)适配于单元格级分类、行/列级检测等多种任务,并支持多任务学习。通过在 2 个大规模的真实电子表格数据集上进行单元格角色分类和表头区域检测实验,本文全面评估了 TabularNet 的有效性、通用性和组件必要性。 阅读全文
posted @ 2026-04-26 19:05 乌漆WhiteMoon 阅读(8) 评论(0) 推荐(0)
摘要: 针对现有可解释模型性能不足、运行效率低、可靠性低的问题,本文提出了一种用于处理表格数据的可解释图神经网络模型 IGNNet。它将传统表格数据中的每个数据实例转换成一个图结构,其中每个特征对应一个图节点,特征之间的线性相关关系(皮尔逊相关系数)构成图的边权重。在此基础上,IGNNet 通过一个经过特殊约束的图神经网络进行学习,并在最终输出层采用一个完全透明的线性分类器。这使得模型在做出预测的同时,能够精确地、可回溯地展示每个输入特征对最终预测结果的具体贡献,从而实现了内在可解释性,无需依赖计算成本高昂且保真度不保证的后验解释方法。在 35 个公开数据集上进行了大规模实证研究,从解释质量和预测性能两个维度全面评估 IGNNet,验证了其在保持高性能的同时,能提供高保真的解释。 阅读全文
posted @ 2026-04-25 15:55 乌漆WhiteMoon 阅读(15) 评论(0) 推荐(0)
摘要: 针对深度学习方法处理表格数据时忽视特征异质性的问题,本文提出了一种名为异质特征交互网络的图神经网络模型 HFIN。模型首先对数值、类别、二值特征进行分离嵌入,并优化了数值特征的嵌入方法。然后将异质列特征视为图中不同类型的节点,通过互信息与对称矩阵分解学习特征交互的图结构。并设计了包含关系内注意力和关系间注意力的双层消息传递机制,以动态捕捉和区分不同类型特征间的交互模式,从而有效利用表格数据中的异质信息。通过在六个公共数据集上的实验,验证了该模型在分类和回归任务上优于多数深度表格学习模型,并通过消融实验证明了各模块的有效性。 阅读全文
posted @ 2026-04-24 14:41 乌漆WhiteMoon 阅读(18) 评论(0) 推荐(0)
摘要: 针对经典决策树的不可微性和较低测试精度两个瓶颈,本文提出了一种名为 RADDT​ 的可微硬斜决策树模型。其核心是通过 ReLU + Argmin 的数学重构,将不可微的硬决策树训练问题转化为一个可微的无约束优化问题。首先,本文提出了 ReLU+Argmin 的重构方法,用 ReLU 函数量化样本在决策路径上的违规值,并用 Argmin 操作识别唯一零违规路径,从而在不引入任何软决策的前提下,为硬决策树建立了一个精确的数学表达。接着,为了解决重构中 Argmin 不可微的问题,采用缩放 Softmin 函数在训练时近似,并设计了多轮热启动退火策略来平衡近似精度与优化稳定性。最终,基于此重构构建了名为 RADDT 的可微决策树训练框架,实现了对整个决策树参数的梯度优化。大量实验表明,该方法不仅测试精度显著超越了包括 CART、ORT-LS 在内的多种基线决策树,甚至能与 RF、XGBoost 等集成方法媲美,并且展现出强大的可扩展性。 阅读全文
posted @ 2026-04-23 16:41 乌漆WhiteMoon 阅读(12) 评论(0) 推荐(0)
摘要: 针对传统方法在处理表格数据时特征视角与相似性视角分离的局限性,本文提出了一种名为基于图神经网络并使用监督对比损失的表格数据分析方法。模型的核心创新在于将传统的表格数据转化为图结构,从而融合了基于特征的方法和基于相似性的方法两种经典视角。首先,通过径向基函数(RBF)核计算所有观测样本之间的相似性,构建一个全连接相似性图,并使用稀疏化技术(如 ε-邻域图)保留关键连接;然后,以节点为原始特征、边为稀疏化后的相似性构建图,输入 GCN 进行训练。为了进一步提升性能,模型在标准交叉熵损失之外,引入了监督对比损失,其目标是拉近同类样本在嵌入空间的表示,并推远不同类样本的表示,从而学习到更具判别性和泛化能力的特征。最终,该模型通过 GCN 的邻居聚合机制,同时利用了节点自身特征和其相似邻居的信息,实现了对表格数据更全面、更鲁棒的分析。实验结果表明,所提方法在分类准确率、F1 分数上表现最优,尤其在小样本场景下优势显著。 阅读全文
posted @ 2026-04-22 14:39 乌漆WhiteMoon 阅读(4) 评论(0) 推荐(0)
摘要: 针对表格数据的排列不变性和局部依赖性两大特性,以及现有深度方法在建模特征交互和构建图结构方面的不足,本文提出了一种名为多路交叉特征交互网络的深度学习模型。MPCFIN 将表格数据的特征建模为图结构,其中每个特征列对应一个图节点。模型的自适应交叉特征嵌入模块通过学习特征间的相关性矩阵,动态地为每个特征生成融合了其最相关特征的交叉特征表示,从而有效捕获异构特征交互。多路图神经网络模块则构建了一个融合手工规则(CLS 连接与最小连通子图)与数据驱动学习(基于度量的图结构学习)的双路图,并利用交互网络进行消息传递,以同时建模特征间先验的与潜在的复杂关系。最终模型通过聚合双路图中的全局信息进行预测,在提升性能的同时保证了良好的可解释性。通过在 7 个数据集上进行的大量实验,本文从性能对比、消融分析、复杂度评估和可解释性可视化等多个方面,全面验证了 MPCFIN 在预测准确性、模型可靠性和逻辑合理性上均优于现有的多种深度神经网络基线模型。 阅读全文
posted @ 2026-04-20 15:13 乌漆WhiteMoon 阅读(11) 评论(0) 推荐(0)