求救啊有没有会用ai的我们要求从海量的数据里提取出出行链
我们要求从内容里提取出行链但是只能几条几条的让ai提取生成,数量一多就无法生成而且错误也很多,有没有什么直接的ai模型和指令让他能直接大量提取且不犯错啊 这种有多种方法。例如,可以长文分割成交叉覆盖的512或更大窗口尺寸的标准长度文样本,类似于向量数据库的分割法与上下文关联法,再用transformers小模型微调分类器集群分类筛选有行程的样本,再用微调后的大模型对有限的样本及上下文提炼行程。小模型集群可以灵活分工组织分类任务,就象RAID那样可省时间也可提高可靠性。 传统NLP分类器也行,快是快,但质量比小模型还差些,分类后再用大模型对正样本加上有限上下文提取。 支持支持再支持
页:
[1]