System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种微纳加工工艺的信息交互方法、装置、计算机设备和存储介质制造方法及图纸_技高网

一种微纳加工工艺的信息交互方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:42815926 阅读:1 留言:0更新日期:2024-09-24 20:55
本申请提供了一种微纳加工工艺的信息交互方法、装置、计算机设备和存储介质。该方法包括:根据配置等级,从备选大模型中选择目标大模型,从备选嵌入模型中选择目标嵌入模型;备选大模型包括本地大模型和在线大模型,备选嵌入模型包括本地嵌入模型和在线嵌入模型;响应于用户输入的提问语句,利用目标嵌入模型将提问语句转换为提问向量;根据提问向量从本地知识库中找到匹配的知识文本;将知识文本和提问语句组合,得到输入提示词;将输入提示词输入到目标大模型,得到并输出回答。该方法根据需要灵活变通,合理的兼顾数据保密性和问答功能性,有利于工程师的提质增效,有广阔的应用前景。

【技术实现步骤摘要】

本申请涉及半导体微纳加工,尤其涉及一种微纳加工工艺的信息交互方法、装置、计算机设备和存储介质


技术介绍

1、随着半导体工艺的发展,微纳加工技术已经成为半导体行业的关键技术之一。随着器件尺寸的不断缩小和工艺复杂度的增加,传统的工艺设计和制造面临着越来越大的挑战。在传统工艺设计中,工程师需要依靠经验和试错来解决问题,这种方式效率低下且容易出现错误。因此,需要一种新的技术来提高半导体微纳加工工艺的设计和制造效率。

2、人工智能技术的快速发展为解决这一问题提供了新的可能。利用人工智能技术,特别是其中的大语言模型技术,可以实现对大量数据的分析和模式识别,从而提供准确的咨询和指导,从而为工程师和制造商提供实时、准确的指导,提高了工艺设计和制造的效率和质量。但是,微纳半导体加工领域许多知识对于保密性要求很高,而传统的基于大语言模型技术所研发出的垂直领域工艺顾问,存在着难以兼顾功能性和保密性的问题。


技术实现思路

1、本申请的目的旨在至少能解决上述的技术缺陷之一,特别传统技术中的难以兼顾功能性和保密性的问题。

2、第一方面,本申请提供了一种微纳加工工艺的信息交互方法,包括:

3、根据配置等级,从备选大模型中选择目标大模型,从备选嵌入模型中选择目标嵌入模型;备选大模型包括本地大模型和在线大模型,备选嵌入模型包括本地嵌入模型和在线嵌入模型;

4、响应于用户输入的提问语句,利用目标嵌入模型将提问语句转换为提问向量;

5、根据提问向量从本地知识库中找到匹配的知识文本;

6、将知识文本和提问语句组合,得到输入提示词;

7、将输入提示词输入到目标大模型,得到并输出回答。

8、在其中一个实施例中,本地大模型包括混合专家模型。

9、在其中一个实施例中,混合专家模型包括依次连接的嵌入层、多个解码器层、第一均方根标准化层和第一线性层。

10、在其中一个实施例中,解码器层包括第二均方根标准化层、第三均方根标准化层、第一求和单元、第二求和单元、掩码注意力层和稀疏混合专家模块;

11、第二均方根标准化层的输出连接掩码注意力层的输入;

12、第一求和单元的输入分别连接第二均方根标准化层的输入和掩码注意力层的输出,第一求和单元的输出连接第三均方根标准化层的输入;

13、第三均方根标准化层的输出连接稀疏混合专家模块的输入;

14、第二求和单元的输入分别连接第一求和单元的输出和稀疏混合专家模块的输出。

15、在其中一个实施例中,稀疏混合专家模块包括路由层和多个专家单元,专家单元包括依次连接的第二线性层、silu激活层、第三线性层和第四线性层;

16、路由层的输入连接第三均方根标准化层的输出,路由层的输出连接各第二线性层的输入。

17、在其中一个实施例中,掩码注意力层配置有多头注意力机制,多头注意力机制的输出线性层以及三个输入线性层、路由层中的线性层、第二线性层、第三线性层和第四线性层被配置了对应的lora分支,并基于微纳加工数据集对各lora分支进行训练,以对混合专家模型进行微调。

18、在其中一个实施例中,微纳加工数据集的生成过程包括:

19、在互联网中抓取半导体制造领域的初始数据,并对初始数据进行过滤;

20、将过滤后的各初始数据转换为纯文本格式,得到文本数据;

21、将文本数据转换为结构化数据,得到微纳加工数据集。

22、在其中一个实施例中,将文本数据转换为结构化数据,包括:

23、利用langchain架构,指示结构转换大模型根据文本数据提出问题和自行解答,并按照预设结构输出,得到结构化数据。

24、在其中一个实施例中,在抓取到初始数据后,还包括:

25、根据初始数据的来源设置对应的可靠性指数;

26、在得到微纳加工数据集后,还包括:

27、将微纳加工数据集中的各结构化数据进行问题查重,并将存在问题重复的结构化数据中,可靠性指数低的结构化数据删除。

28、在其中一个实施例中,在将文本数据转换为结构化数据之前,还包括:

29、对于存在缺失的文本数据,确定缺失比例;

30、若缺失比例大于可补全阈值,则将文本数据删除;

31、否则,将文本数据送入补全大模型中进行文本补全。

32、在其中一个实施例中,在得到微纳加工数据集后,还包括:

33、将微纳加工数据集送入审核模型中,得到各结构化数据的置信度和分类结果;审核模型是利用文本数据训练得到,用于判断输入数据是否符合文本数据中内容的分类模型;

34、若分类结果为正确,且置信度大于置信度阈值,则将结构化数据保留;

35、若分类结果为错误,且置信度大于置信度阈值,则将结构化数据删除;

36、若置信度小于置信度阈值,则将结构化数据送入人工审核。

37、在其中一个实施例中,本地知识库中以向量文本对的形式存储数据,根据提问向量从本地知识库中找到匹配的知识文本,包括:

38、将提问向量与本地知识库中的各向量文本对进行匹配,并从向量相似度大于相似度阈值的向量文本对中,按照向量相似度由高到低的顺序,选择预设数量个所述向量文本对中的文本作为知识文本。

39、在其中一个实施例中,本地嵌入模型包括m3e-large。

40、在其中一个实施例中,在线大模型包括gpt系列,在线嵌入模型包括text-embedding-ada-002。

41、在其中一个实施例中,输出回答的方式包括:

42、将回答展示在显示设备中,并根据回答驱动虚拟数字人动作。

43、第二方面,本申请提供了一种微纳加工工艺的信息交互装置,包括:

44、模型配置模块,用于根据配置等级,从备选大模型中选择目标大模型,从备选嵌入模型中选择目标嵌入模型;备选大模型包括本地大模型和在线大模型,备选嵌入模型包括本地嵌入模型和在线嵌入模型;

45、输入响应模块,用于响应于用户输入的提问语句,利用目标嵌入模型将提问语句转换为提问向量;

46、知识查找模块,用于根据提问向量从本地知识库中找到匹配的知识文本;

47、提示词生成模块,用于将知识文本和提问语句组合,得到输入提示词;

48、回答模块,用于将输入提示词输入到目标大模型,得到并输出回答。

49、第三方面,本申请提供了一种计算机设备,包括一个或多个处理器,以及存储器,存储器中存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时,执行上述任一实施例中的微纳加工工艺的信息交互方法的步骤。

50、第四方面,本申请提供了一种存储介质,存储介质中存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任一实施例中的微本文档来自技高网...

【技术保护点】

1.一种微纳加工工艺的信息交互方法,其特征在于,包括:

2.根据权利要求1所述的信息交互方法,其特征在于,所述本地大模型包括混合专家模型。

3.根据权利要求2所述的信息交互方法,其特征在于,所述混合专家模型包括依次连接的嵌入层、多个解码器层、第一均方根标准化层和第一线性层。

4.根据权利要求3所述的信息交互方法,其特征在于,所述解码器层包括第二均方根标准化层、第三均方根标准化层、第一求和单元、第二求和单元、掩码注意力层和稀疏混合专家模块;

5.根据权利要求4所述的信息交互方法,其特征在于,所述稀疏混合专家模块包括路由层和多个专家单元,所述专家单元包括依次连接的第二线性层、silu激活层、第三线性层和第四线性层;

6.根据权利要求5所述的信息交互方法,其特征在于,所述掩码注意力层配置有多头注意力机制;所述多头注意力机制的输出线性层以及三个输入线性层、所述路由层中的线性层、所述第二线性层、所述第三线性层和所述第四线性层被配置了对应的LoRA分支,并基于微纳加工数据集对各所述LoRA分支进行训练,以对所述混合专家模型进行微调。

7.根据权利要求6所述的信息交互方法,其特征在于,所述微纳加工数据集的生成过程包括:

8.根据权利要求7所述的信息交互方法,其特征在于,所述将所述文本数据转换为结构化数据,包括:

9.根据权利要求7所述的信息交互方法,其特征在于,在抓取到所述初始数据后,还包括:

10.根据权利要求7所述的信息交互方法,其特征在于,在所述将所述文本数据转换为结构化数据之前,还包括:

11.根据权利要求7所述的信息交互方法,其特征在于,在得到所述微纳加工数据集后,还包括:

12.根据权利要求1所述的信息交互方法,其特征在于,所述本地知识库中以向量文本对的形式存储数据,所述根据所述提问向量从本地知识库中找到匹配的知识文本,包括:

13.根据权利要求1所述的信息交互方法,其特征在于,所述本地嵌入模型包括m3e-large。

14.根据权利要求1所述的信息交互方法,其特征在于,所述在线大模型包括GPT系列,所述在线嵌入模型包括text-embedding-ada-002。

15.根据权利要求1所述的信息交互方法,其特征在于,输出回答的方式包括:

16.一种微纳加工工艺的信息交互装置,其特征在于,包括:

17.一种计算机设备,其特征在于,包括一个或多个处理器,以及存储器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述一个或多个处理器执行时,执行如权利要求1-15任一项所述的微纳加工工艺的信息交互方法的步骤。

18.一种存储介质,其特征在于,所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1-15任一项所述的微纳加工工艺的信息交互方法的步骤。

...

【技术特征摘要】

1.一种微纳加工工艺的信息交互方法,其特征在于,包括:

2.根据权利要求1所述的信息交互方法,其特征在于,所述本地大模型包括混合专家模型。

3.根据权利要求2所述的信息交互方法,其特征在于,所述混合专家模型包括依次连接的嵌入层、多个解码器层、第一均方根标准化层和第一线性层。

4.根据权利要求3所述的信息交互方法,其特征在于,所述解码器层包括第二均方根标准化层、第三均方根标准化层、第一求和单元、第二求和单元、掩码注意力层和稀疏混合专家模块;

5.根据权利要求4所述的信息交互方法,其特征在于,所述稀疏混合专家模块包括路由层和多个专家单元,所述专家单元包括依次连接的第二线性层、silu激活层、第三线性层和第四线性层;

6.根据权利要求5所述的信息交互方法,其特征在于,所述掩码注意力层配置有多头注意力机制;所述多头注意力机制的输出线性层以及三个输入线性层、所述路由层中的线性层、所述第二线性层、所述第三线性层和所述第四线性层被配置了对应的lora分支,并基于微纳加工数据集对各所述lora分支进行训练,以对所述混合专家模型进行微调。

7.根据权利要求6所述的信息交互方法,其特征在于,所述微纳加工数据集的生成过程包括:

8.根据权利要求7所述的信息交互方法,其特征在于,所述将所述文本数据转换为结构化数据,包括:

9.根据权利要求7所述的信息交互方法,其特征在于,在抓取到所述初...

【专利技术属性】
技术研发人员:熊威汪馨蕾王冠初李艺杰覃检兰陈雪娥徐巍
申请(专利权)人:香港科技大学广州
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1