摘要: 3 多语言数据集生成(Multilingual Dataset Generation)方法 一、核心目标 构建可扩展、高效的自动化流程,生成高质量多语言事实核查数据集,支持英语、西班牙语、德语及低资源语言,包含 “支持(Supports)”“反驳(Refutes)”“信息不足(Not-info)” 阅读全文
posted @ 2025-12-08 20:21 Blairs 阅读(6) 评论(0) 推荐(0)
摘要: 方法 主张类型分类:采用微调后的 DeBERTaV3-large 模型,识别输入主张的类型,具体包括 “立场声明”“事件 / 属性主张”“因果主张”“数值主张”“引文验证” 五类。 示例检索:运用 BM25 算法,从训练集中检索与输入主张类型一致的示例主张,同时获取这些示例主张对应的证据问题;该少量 阅读全文
posted @ 2025-12-08 19:48 Blairs 阅读(6) 评论(0) 推荐(0)
Live2D