摘要:
3 多语言数据集生成(Multilingual Dataset Generation)方法 一、核心目标 构建可扩展、高效的自动化流程,生成高质量多语言事实核查数据集,支持英语、西班牙语、德语及低资源语言,包含 “支持(Supports)”“反驳(Refutes)”“信息不足(Not-info)” 阅读全文
posted @ 2025-12-08 20:21
Blairs
阅读(6)
评论(0)
推荐(0)
摘要:
方法 主张类型分类:采用微调后的 DeBERTaV3-large 模型,识别输入主张的类型,具体包括 “立场声明”“事件 / 属性主张”“因果主张”“数值主张”“引文验证” 五类。 示例检索:运用 BM25 算法,从训练集中检索与输入主张类型一致的示例主张,同时获取这些示例主张对应的证据问题;该少量 阅读全文
posted @ 2025-12-08 19:48
Blairs
阅读(6)
评论(0)
推荐(0)

浙公网安备 33010602011771号