温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本申请涉及计算机技术领域,具体提供一种文档数据过滤方法、大语言模型训练方法、设备及介质。旨在解决大语言模型的训练数据质量不佳的技术问题。本申请的文档数据过滤方法包括:获取文档数据集,文档数据集包括多个文档数据;对文档数据集中的文档数据执行分...该专利属于江苏云从曦和人工智能有限公司所有,仅供学习研究参考,未经过江苏云从曦和人工智能有限公司授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本申请涉及计算机技术领域,具体提供一种文档数据过滤方法、大语言模型训练方法、设备及介质。旨在解决大语言模型的训练数据质量不佳的技术问题。本申请的文档数据过滤方法包括:获取文档数据集,文档数据集包括多个文档数据;对文档数据集中的文档数据执行分...