冷月醉夕阳 发表于 2025-3-20 08:58:18

求救啊有没有会用ai的我们要求从海量的数据里提取出出行链

我们要求从内容里提取出行链但是只能几条几条的让ai提取生成,数量一多就无法生成而且错误也很多,有没有什么直接的ai模型和指令让他能直接大量提取且不犯错啊

低吟·那微笑 发表于 2025-3-20 08:59:18

这种有多种方法。例如,可以长文分割成交叉覆盖的512或更大窗口尺寸的标准长度文样本,类似于向量数据库的分割法与上下文关联法,再用transformers小模型微调分类器集群分类筛选有行程的样本,再用微调后的大模型对有限的样本及上下文提炼行程。小模型集群可以灵活分工组织分类任务,就象RAID那样可省时间也可提高可靠性。

深拥他入梦 发表于 2025-3-20 09:00:08

传统NLP分类器也行,快是快,但质量比小模型还差些,分类后再用大模型对正样本加上有限上下文提取。

那年盛夏っ 发表于 2025-3-22 08:01:18

支持支持再支持
页: [1]
查看完整版本: 求救啊有没有会用ai的我们要求从海量的数据里提取出出行链