本发明专利技术涉及一种使用机器学习构建非标准复杂材料色散模型的方法,对未知待测样品使用实验测量,获得的数据利用机器学习方法中的主成分分析算法进行压缩、初步筛选,再运用K均值聚类算法进行共性识别,最终获得未知待测样品的组成元素作为EMA模型基元,利用EMA模型获得未知待测样品材料参数。无需人为研究复杂材料的组分和光学性质,即可模拟集成电路中复杂材料的色散性能参数。该方法可以自动分析出组成复杂材料的“基元”,直接作为EMA模型的组成元素进行模型的拟合。解决新材料组分比较复杂且材料组分不清无法用现有模型拟合的问题。材料组分不清无法用现有模型拟合的问题。材料组分不清无法用现有模型拟合的问题。
【技术实现步骤摘要】
使用机器学习构建非标准复杂材料色散模型的方法
[0001]本专利技术涉及一种半导体生产测量技术技术,特别涉及一种使用机器学习构建非标准复杂材料色散模型的方法。
技术介绍
[0002]集成电路生产领域通常使用椭偏仪量测膜层材料的厚度、关键尺寸等参数,用于芯片产品生产流程中的质量检测环节。椭偏仪是一种基于光学原理的无损探测手段,且其可靠性经过了大量的理论和实践验证。集成电路中往往存在一些非常规材料以及多种材料的掺杂混合材料,无法得到其确切的色散性能参数。对于这些材料,一般使用有效介质近似(EMA,Effective Medium Approximation)模型,利用已知材料的色散性能参数来模拟这些新材料的色散性能参数。而当材料本身的组分比较复杂:如有机材料、复合掺杂材料等;或无法写出明确的材料组分时,很难找到合适的物理模型来拟合这些新材料的色散性能参数。因此无法有效利用EMA模型进行模拟分析。因此成为了目前集成电路生产和检测环节面临的一项巨大的挑战。
[0003]有效介质近似模型应用于两种或两种以上的不同组份合成的混合介质体系,在拟合时,有效介质模型通常用于薄膜的粗糙表面和过渡层分析。对两种材料组成的复合材料,其介电系数的统一公式为:
[0004][0005]其中,ε是有效介电常数;ε1和ε2分别为两种混合介质的介电常数;ε
c
是含有掺杂物的介质的介电常数;p是材料2的体积百分比;L是材料2的有效偏振系数,通常L=1/3。EMA模型需要知道混合的N种材料的介电常数ε。当材料本身的组分比较复杂或者无法写出可供分析的组分时,这些新材料的介电常数未知,并且很难找到合适的物理模型来拟合。
技术实现思路
[0006]针对新材料组分比较复杂且材料组分不清无法用现有模型拟合的问题,提出了一种使用机器学习构建非标准复杂材料色散模型的方法,利用机器学习方法自动分析出组成复杂材料的“基元”,并将其直接作为EMA模型的组成元素,用于拟合这些复杂材料色散性能参数。
[0007]本专利技术的技术方案为:一种使用机器学习构建非标准复杂材料色散模型的方法,具体包括如下步骤:
[0008]1)未知待测样品数据收集:根据未知待测样品的结构和不均匀度,限定测量范围和测样点位置、数量,对所有测样点进行测量,得到所有测样点相对应的椭偏光谱或测样点对应的傅里叶系数;
[0009]2)使用主成分分析算法对每一个测样点的数据进行维度压缩,获得压缩后维数数据;
[0010]3)采用K均值聚类算法对步骤2)每一个测样点压缩后维数数据进行聚类计算,计算结果得到的k1个聚类中心作为未知待测样品的基本元素,将此k1个聚类中心对应的测样点作为组成EMA模型的基元,利用EMA模型获得未知待测样品材料的色散性能参数,用以描述该未知待测样品材料的基本元素。
[0011]进一步,所述步骤1)中所有测样点是单个未知待测样品上不同位置的测样点,或是多个样品不同位置的测样点。
[0012]进一步,所述步骤1)测量可由每个测样点用某种材料模型拟合得到的模型参数代替。
[0013]进一步,所述材料模型为材料的光学响应模型,所述光学响应模型包括但不限于柯西模型、洛伦兹模型、简谐振子模型。
[0014]进一步,所述步骤2)压缩后维数数据为可代表原始数据的2维或3维数据。
[0015]进一步,所述步骤3)具体实现步骤如下:首先随机选取k个聚类中心;然后通过计算每一个步骤2)中压缩后的测样点数据到每一个聚类中心的欧式距离,依次比较每一个测样点数据到每一个聚类中心的距离,将测样点数据分配到距离最近的聚类中心的类簇中,经过聚类最终得到k1个类簇;计算k1个类簇的每一个类簇的中心,称为新的k1个聚类中心;重复以上过程,最终结果收敛;最后计算结果得到的k1个聚类中心作为未知待测样品的基本元素,将此k1个聚类中心对应的测样点作为组成EMA模型的基元,利用EMA模型获得该未知待测样品的色散性能参数,用以描述该未知待测样品的基本元素。
[0016]本专利技术的有益效果在于:本专利技术使用机器学习构建非标准复杂材料色散模型的方法,利用机器学习方法中的主成分分析(PCA,Principal Components Analysis)算法和K均值聚类算法(K
‑
means clustering algorithm),无需人为研究复杂材料的组分和光学性质,即可模拟集成电路中复杂材料的色散性能参数。该方法可以自动分析出组成复杂材料的“基元”,直接作为EMA模型的组成元素进行模型的拟合。
附图说明
[0017]图1为本专利技术压缩到2维的各个测量点的分布示意图;
[0018]图2为本专利技术各个测样点的折射率n
‑
波长曲线图;
[0019]图3为本专利技术各个测样点的吸收率k
‑
波长曲线图。
具体实施方式
[0020]下面结合附图和具体实施例对本专利技术进行详细说明。本实施例以本专利技术技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本专利技术的保护范围不限于下述的实施例。
[0021]本专利技术使用机器学习构建非标准复杂材料色散模型的方法,具体包括如下步骤:
[0022]1、数据准备:
[0023]传统的建模方法是已知待测样品的基本信息,如材料化学组分、适用的物理模型,然后通过调节模型参数来拟合椭偏仪(利用线偏振光经样品反射后转变为椭圆偏振光这一性质以获得样品的光学常数的光谱测量)测量的光谱,从而通过最优化方法得出模型的参数。但是对于非标准复杂材料而言,无法得知其化学组分,也不能提前确定物理模型。使用
EMA模型也无法找到合适的基元。
[0024]通过测量一系列测样点,可以得到测样点相对应的椭偏光谱或测样点对应的傅里叶系数。这一系列测量点可以是单个样品上不同位置的测样点,也可以是多个样品不同位置的测样点,测量范围和数量需要保证包含样品的不均匀度。
[0025]本专利技术方法使用的初始数据,可以是椭偏仪测量的原始光谱,或者是光谱计算得到的傅里叶系数,或者是每个测样点用某种材料模型拟合得到的模型参数,例如:包括但不限于柯西模型/洛伦兹模型/简谐振子模型等各种材料的光学响应模型。
[0026]2、数据维度压缩:
[0027]每一个测样点对应的初始数据可以从几个到几千个不等。如使用简谐振子模型,一般会有至少六个,一般都有十几个或几十个参数。如使用原始光谱或傅里叶系数作为初始数据,则每一个测量点对应的数据维度是几千个。
[0028]本专利技术使用主成分分析算法对每一个测样点的数据进行维度压缩,通常可以压缩到3维或者2维。
[0029]主成分分析方法通过正交变换将一组可能存在相关性的变量转换成一组线性不相关的变量,转换后的这组变量叫主成分。也就是约减掉线性相关的一些维度,只保留最线性不相关的几组维度。
[0030]根据经验,本专利技术涉及的数据若保留3个维度,则一般损失小于百分之二的信息,若保留本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种使用机器学习构建非标准复杂材料色散模型的方法,其特征在于,具体包括如下步骤:1)未知待测样品数据收集:根据未知待测样品的结构和不均匀度,限定测量范围和测样点位置、数量,对所有测样点进行测量,得到所有测样点相对应的椭偏光谱或测样点对应的傅里叶系数;2)使用主成分分析算法对每一个测样点的数据进行维度压缩,获得压缩后维数数据;3)采用K均值聚类算法对步骤2)每一个测样点压缩后维数数据进行聚类计算,计算结果得到的k1个聚类中心作为未知待测样品的基本元素,将此k1个聚类中心对应的测样点作为组成EMA模型的基元,利用EMA模型获得未知待测样品材料的色散性能参数,用以描述该未知待测样品材料的基本元素。2.根据权利要求1所述使用机器学习构建非标准复杂材料色散模型的方法,其特征在于,所述步骤1)中所有测样点是单个未知待测样品上不同位置的测样点,或是多个样品不同位置的测样点。3.根据权利要求1或2所述使用机器学习构建非标准复杂材料色散模型的方法,其特征在于,所述步骤1)测量可由每个测样点用某种材料模型拟合得到的模型参数代替。4.根据权...
【专利技术属性】
技术研发人员:孙璐,寇煦丰,
申请(专利权)人:上海科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。