System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 模式识别系统技术方案_技高网

模式识别系统技术方案

技术编号:43028003 阅读:14 留言:0更新日期:2024-10-18 17:28
本文描述了一种模式识别系统。专家系统包括计算设备,所述计算设备具有存储程序指令的存储器和执行所述程序指令的处理器。所述自适应专家系统从DNA分析设备接收包括原始数据、光学数据和电泳图数据中的至少一者的样本数据,所述数据从包含DNA的样本生成。所述自适应专家系统确定所述样本数据的至少一个特征。所述自适应专家系统利用所述至少一个特征对样本数据进行分类并将预定义参数集应用于所述样本数据以生成输出。

【技术实现步骤摘要】


技术介绍

1、人类基因组包括由短串联重复序列(str)组成的dna片段。人类基因组中有数十万个str基因座。对此类str基因座的分析是遗传连锁研究、法医和临床诊断学的重要工具。例如,在过去的四分之一个世纪里,dna指纹识别(用于鉴定的str表达谱的生成)已经在刑事司法调查中变得无价。快速dna鉴定使得能够在大约两小时或更短的时间内生成str表达谱。此外,用于快速dna鉴定的某些方法允许非技术人员在受控实验室的环境之外进行分析。因此,快速dna鉴定的出现允许进一步扩展dna指纹识别在世界范围内的利用,并且现在开始在军事、情报、灾难受害者识别、国民身份、公司安全、移民、边境和港口应用以及其他方面发挥重要作用。犯罪分子和恐怖分子的识别、身分不明的个人和遗体的识别、无辜者的罪名洗脱以及家庭团聚只是快速dna技术的少数应用。

2、生成dna id(也被称作str表达谱、dna表达谱、和dna指纹)的过程通常包括三个步骤。第一,从感兴趣的样本中提取并纯化dna(在所谓的“直接pcr(direct pcr)”协议中,可以取消此步骤)。第二,扩增感兴趣的str基因座,通常在包含多组引物对的多重反应中,每一对中的一个被荧光标记。第三,扩增之后通常通过电泳分离荧光标记的扩增子。当询问足够数量的基因座时,生成dna id,从而提供人类识别所需的辨别能力。

3、在法医实验室中,dna通常在纯化后进行量化。实际上,fbi已经要求人类特定dna量化,以便允许根据联邦和州dna数据库搜索所得dna指纹[fbi局长的用于dna数据库实验室的数据库质量保证标准(the fbidirector'sdatabasing quality assurancestandards for dna databasing laboratories)-09/01/2011生效,https://www.fbi.gov/file-repository/quality-assurance-standards-for-dna-databasing-laboratories.pdf/view]。

4、量化要求的主要原理是确定在给定样本中人类dna的数量,以防止在扩增反应中利用过少或过多的人类dna[janice a.nicklas·eric buel,法医样本中的dna量化(quantification of dna in forensic samples),anal bioanal chem(2003)376:1160–1167doi 10.1007/s00216-003-1924-z]。若在扩增中使用过少人类dna,则可能出现包括等位基因峰高失衡、等位基因脱扣以及等位基因插入之类的伪影。若使用过多dna样本,则可能出现包括影子增加、不完整的非模版添加增加、等位基因插入、由不完整颜色分离产生的上拉(或渗出)峰、由在电泳检测系统的动态范围上限处被切除的高信号峰导致的峰“平顶”以及由分离过程中在给定峰上信号过多导致的超宽峰之类的伪影。

5、这些伪影可能导致难以通过在str处理后用于解释电泳图的常规专家系统解释dna id。[综合刑事司法专家系统应用程序开发(development of integrated criminaljustice expert system applications),2002,人工智能集团管理信息系统部(artificial intelligence group management information systems department),亚利桑那大学实验室局(university of arizona laboratory bureau),菲尼克斯警察局(phoenix police department)]。许多常规专家系统已经被开发,包括hid,i-cubedtm,osiris,和truealleletm。[有关codis和ndis的常见问题,https://www.fbi.gov/services/laboratory/biometric-analysis/codis/codis-and-ndis-fact-sheet]。常规专家系统通常具有由用户定义的标准(或基线)规则以及标准(或基线)参数集,并且这些规则和参数或固定或需要手动处理更改;在任何情况下,它们都非常主观。除了需要大量的时间外,这些不确定的dna id还可能导致常规专家系统的呼叫错误(这可能导致误识别以及数据库搜索和匹配协议中的错误)并需要重新处理样本(无论是从净化、扩增或分离步骤开始重复过程)。重复的过程增加了dna指纹识别的时间和成本,并且由于样本或中间产品的限制,可能并不总是具有重复的可能。因此,对于犯罪现场样本的评估,fbi的dna咨询委员会推荐使用人类特异性量化而非全dna量化,这样能够确保即使样本中存在细菌、真菌或其他非人类dna,也能对适量的人类dna进行扩增。然而,人类特异性dna量化可能昂贵且费时——法医dna实验室中dna积压问题的另一个促成因素。并且人类特异性dna量化本身可能是不准确的,这导致了上面所讨论的无数伪影和解释问题。

6、无论是否具有dna量化,常规专家系统都具有严重的局限性。事实上,fbi仅批准了用于参考样本(例如直接从个体获得的口腔拭子或血液)的专家系统,并且规定“没有专家系统被批准用于个案(法医未知)样本”。[有关codis和ndis的常见问题(frequently askedquestions on codis and ndis),同上]。常规专家系统和训练有素的法医分析师通常按如下方式共同工作:

7、·专家系统将它的标准(或基线)规则和标准(或基线)参数集应用到原始数据从而生成基线dna id。

8、·专家系统强调dna id中的一些异常。

9、·分析人员评审该输出dna id。

10、·分析人员对一个或多个专家系统规则和参数进行手动修改,以优化结果。

11、·分析人员评审每个修改的结果,并继续修改和评审的循环。

12、·对于任何给定峰,分析人员都可以推翻专家系统的结果(例如,分析人员可以手动用红色标记峰,以表明他或她对专家系统的决定感到不安或不同意)。分析人员也可以接受未被专家系统通过的专家系统的峰。此外,分析人员可以拒绝专家系统已经识别无异常的峰的dna id或接受专家系统已经识别出一个或多个问题的峰的dna id。常规的专家系统并不会使dna id通过或通不过——该功能由分析人员在手动编辑和评审dna id后执行。

13、·其他分析人员通常需要评审这一过程以获得确认的结果。

14、·通常,最初的分析人员决定对样本进行再处理,以生成更适合常规专家系统的输入。再处理可以采取多种形式,包括从样本的另一部分(例如一段拭子)或完全从另一个样本(例如附近的血迹斑)中提取纯化的dna,再纯化或浓缩或以其他方式处理源自含有dna的样本的溶液,再扩增,或者通过在电泳系统中再注入相同或不同数量的扩增dna来再分散扩增dna。如果本文档来自技高网...

【技术保护点】

1.一种自适应专家系统,包括:

2.根据权利要求1所述的系统,其中所述分析物是以下中的一个或多个:蛋白质、肽、信使RNA、反义RNA、转移RNA、核糖体RNA、其他RNA、核酸、寡核苷酸、包含单核苷酸多态性的DNA或RNA片段、脂质、碳水化合物、代谢产物、类固醇、合成聚合物、其他大分子、无机或其他有机化学物质、或这些分析物的组合。

3.一种自适应专家系统,包括:

4.一种自适应专家系统,包括:

5.根据权利要求4所述的自适应专家系统,其中所述输出包括以下中的一个或多个:.xml文件、.fsa文件、.bmp文件、或等位基因表。

6.根据权利要求4所述的自适应专家系统,其中所述至少一个特征是信号强度。

7.根据权利要求4所述的自适应专家系统,其中所述至少一个特征是以下中的一个或多个:每个染料通道的信噪比、峰位置、峰基分配、峰段大小、峰颜色,峰基因座、峰等位基因#、峰高、峰宽、峰形状、峰形态、峰不对称性、峰宽偏差、峰形状偏差、基值置信度、杂合子峰高、杂合子峰高比、按颜色平均杂合子峰高、纯合子峰高、按颜色平均纯合子峰高、基因座内等位基因的相对信号强度、相较于等位基因大小(例如基值)的等位基因相对信号强度、iNTA峰高、iNTA峰高比、影子峰高、影子比、ILS成功、基因座中的峰的数量、调用的等位基因的数量、红色警告框中标记的等位基因的数量、未标记等位基因的数量、PH低于PH阈值的具有等位基因的基因座的数量、PH高于PH阈值的具有等位基因的基因座的数量、PHR低于PHR阈值的基因座的数量、PHR高于PHR阈值的基因座的数量、具有宽峰的基因座的数量、iNTA高于iNTA阈值的基因座的数量、具有红色警告框中标记的三个或更多峰的基因座的数量、具有红色警告框中标记的四个或更多峰的基因座的数量、红色警告框中标记的杂合子基因座的数量、红色警告框中标记的纯合子基因座的数量、渗透峰数量、调用的CODIS20基因座的数量、调用的CODIS18基因座的数量、调用的常染色体基因座的数量、调用的flex plex基因座的数量、DNA ID成功、基值分配、染料光谱、或处理后的染料痕迹。

8.根据权利要求4所述的自适应专家系统,其中所述输出被用于搜索DNA ID的数据库。

9.根据权利要求4所述的自适应专家系统,其中所述输出被用于比较两个或更多个DNAID以评估血缘关系。

10.根据权利要求4所述的自适应专家系统,其中当所述特征将所述样本数据分类为具有高DNA含量时,所应用的所述预定义参数集修改以下中的至少一个:杂合子峰高阈值、杂合子峰高比阈值、纯合子峰高阈值、第二峰的杂合子峰高阈值、纯合子峰高比阈值、半合子峰高最小阈值、区域1中的等位基因PH/PA阈值、区域2中的等位基因PH/PA阈值、区域3中的等位基因PH/PA阈值、区域4中的等位基因PH/PA阈值、插入的最大数量、脱扣的最大数量、每个染料通道的信噪比阈值、峰基分配限值、峰段大小阈值、峰高阈值、峰宽阈值、峰形状阈值、峰形态阈值、峰不对称性阈值、峰宽偏差限值、峰形状偏差限值、基值置信度阈值、杂合子峰高阈值、杂合子峰高比阈值、按颜色平均杂合子峰高阈值、纯合子峰高阈值、按颜色平均纯合子峰高阈值、基因座内等位基因的相对信号强度阈值、相较于等位基因大小(例如基值)的等位基因相对信号强度阈值、iNTA峰高阈值、iNTA峰高比阈值、影子峰高阈值、影子比阈值、三等位基因峰高阈值、三等位基因峰高比阈值、混合物峰高阈值、ILS成功限值、高iNTA规则状态、混合物样本保护规则状态、低信号保护规则状态、基因座中的峰的最大数量、调用的等位基因的最大数量、红色警告框中标记的等位基因的最大数量阈值、未标记等位基因的最大数量阈值、PH低于PH阈值的具有等位基因的基因座的最大数量、PH高于PH阈值的具有等位基因的基因座的最大数量、PHR低于PHR阈值的基因座的最大数量、PHR高于PHR阈值的基因座的最大数量、具有宽峰的基因座的最大数量、iNTA高于iNTA阈值的基因座的最大数量、具有红色警告框中标记的三个或更多峰的基因座的最大数量、具有红色警告框中标记的四个或更多峰的基因座的最大数量、红色警告框中标记的杂合子基因座的最大数量、红色警告框中标记的纯合子基因座的最大数量、渗透峰的最大数量、调用的CODIS20基因座的最小数量、调用的CODIS18基因座的最小数量、调用的常染色体基因座的最小数量、调用的flex plex基因座的最小数量、用于生成CMF文件的调用的基因座的最小数量、DNA ID质量阈值、或搜索和匹配质量阈值。

11.根据权利要求4所述的自适应专家系统,其中当所述特征将所述样本数据分类为具有低DNA含量时,所应用...

【技术特征摘要】

1.一种自适应专家系统,包括:

2.根据权利要求1所述的系统,其中所述分析物是以下中的一个或多个:蛋白质、肽、信使rna、反义rna、转移rna、核糖体rna、其他rna、核酸、寡核苷酸、包含单核苷酸多态性的dna或rna片段、脂质、碳水化合物、代谢产物、类固醇、合成聚合物、其他大分子、无机或其他有机化学物质、或这些分析物的组合。

3.一种自适应专家系统,包括:

4.一种自适应专家系统,包括:

5.根据权利要求4所述的自适应专家系统,其中所述输出包括以下中的一个或多个:.xml文件、.fsa文件、.bmp文件、或等位基因表。

6.根据权利要求4所述的自适应专家系统,其中所述至少一个特征是信号强度。

7.根据权利要求4所述的自适应专家系统,其中所述至少一个特征是以下中的一个或多个:每个染料通道的信噪比、峰位置、峰基分配、峰段大小、峰颜色,峰基因座、峰等位基因#、峰高、峰宽、峰形状、峰形态、峰不对称性、峰宽偏差、峰形状偏差、基值置信度、杂合子峰高、杂合子峰高比、按颜色平均杂合子峰高、纯合子峰高、按颜色平均纯合子峰高、基因座内等位基因的相对信号强度、相较于等位基因大小(例如基值)的等位基因相对信号强度、inta峰高、inta峰高比、影子峰高、影子比、ils成功、基因座中的峰的数量、调用的等位基因的数量、红色警告框中标记的等位基因的数量、未标记等位基因的数量、ph低于ph阈值的具有等位基因的基因座的数量、ph高于ph阈值的具有等位基因的基因座的数量、phr低于phr阈值的基因座的数量、phr高于phr阈值的基因座的数量、具有宽峰的基因座的数量、inta高于inta阈值的基因座的数量、具有红色警告框中标记的三个或更多峰的基因座的数量、具有红色警告框中标记的四个或更多峰的基因座的数量、红色警告框中标记的杂合子基因座的数量、红色警告框中标记的纯合子基因座的数量、渗透峰数量、调用的codis20基因座的数量、调用的codis18基因座的数量、调用的常染色体基因座的数量、调用的flex plex基因座的数量、dna id成功、基值分配、染料光谱、或处理后的染料痕迹。

8.根据权利要求4所述的自适应专家系统,其中所述输出被用于搜索dna id的数据库。

9.根据权利要求4所述的自适应专家系统,其中所述输出被用于比较两个或更多个dnaid以评估血缘关系。

10.根据权利要求4所述的自适应专家系统,其中当所述特征将所述样本数据分类为具有高dna含量时,所应用的所述预定义参数集修改以下中的至少一个:杂合子峰高阈值、杂合子峰高比阈值、纯合子峰高阈值、第二峰的杂合子峰高阈值、纯合子峰高比阈值、半合子峰高最小阈值、区域1中的等位基因ph/pa阈值、区域2中的等位基因ph/pa阈值、区域3中的等位基因ph/pa阈值、区域4中的等位基因ph/pa阈值、插入的最大数量、脱扣的最大数量、每个染料通道的信噪比阈值、峰基分配限值、峰段大小阈值、峰高阈值、峰宽阈值、峰形状阈值、峰形态阈值、峰不对称性阈值、峰宽偏差限值、峰形状偏差限值、基值置信度阈值、杂合子峰高阈值、杂合子峰高比阈值、按颜色平均杂合子峰高阈值、纯合子峰高阈值、按颜色平均纯合子峰高阈值、基因座内等位基因的相对信号强度阈值、相较于等位基因大小(例如基值)的等位基因相对信号强度阈值、inta峰高阈值、inta峰高比阈值、影子峰高阈值、影子比阈值、三等位基因峰高阈值、三等位基因峰高比阈值、混合物峰高阈值、ils成功限值、高inta规则状态、混合物样本保护规则状态、低信号保护规则状态、基因座中的峰的最大数量、调用的等位基因的最大数量、红色警告框中标记的等位基因的最大数量阈值、未标记等位基因的最大数量阈值、ph低于ph阈值的具有等位基因的基因座的最大数量、ph高于ph阈值的具有等位基因的基因座的最大数量、phr低于phr阈值的基因座的最大数量、phr高于phr阈值的基因座的最大数量、具有宽峰的基因座的最大数量、inta高于inta阈值的基因座的最大数量、具有红色警告框中标记的三个或更多峰的基因座的最大数量、具有红色警告框中标记的四个或更多峰的基因座的最大数量、红色警告框中标记的杂合子基因座的最大数量、红色警告框中标记的纯合子基因座的最大数量、渗透峰的最大数量、调用的codis20基因座的最小数量、调用的codis18基因座的最小数量、调用的常染色体基因座的最小数量、调用的flex plex基因座的最小数量、用于生成cmf文件的调用的基因座的最小数量、dna id质量阈值、或搜索和匹配质量阈值。

11.根据权利要求4所述的自适应专家系统,其中当所述特征将所述样本数据分类为具有低dna含量时,所应用的所述预定义参数集修改以下中的至少一个:杂合子峰高阈值、杂合子峰高比阈值、纯合子峰高阈值、第二峰的杂合子峰高阈值、纯合子峰高比阈值、半合子峰高最小阈值、区域1中的等位基因ph/pa阈值、区域2中的等位基因ph/pa阈值、区域3中的等位基因ph/pa阈值、区域4中的等位基因ph/pa阈值、插入的最大数量、脱扣的最大数量、每个染料通道的信噪比阈值、峰基分配限值、峰段大小阈值、峰高阈值、峰宽阈值、峰形状阈值、峰形态阈值、峰不对称性阈值、峰宽偏差限值、峰形状偏差限值、基值置信度阈值、杂合子峰高阈值、杂合子峰高比阈值、按颜色平均杂合子峰高阈值、纯合子峰高阈值、按颜色平均纯合子峰高阈值、基因座内等位基因的相对信号强度阈值、相较于等位基因大小(例如基值)的等位基因相对信号强度阈值、inta峰高阈值、inta峰高比阈值、影子峰高阈值、影子比阈值、三等位基因峰高阈值、三等位基因峰高比阈值、混合物峰高阈值、ils成功限值、高inta规则状态、混合物样本保护规则状态、低信号保护规则状态、基因座中的峰的最大数量、调用的等位基因的最大数量、红色警告框中标记的等位基因的最大数量阈值、未标记等位基因的最大数量阈值、ph低于ph阈值的具有等位基因的基因座的最大数量、ph高于ph阈值的具有等位基因的基因座的最大数量、phr低于phr阈值的基因座的最大数量、phr高于phr阈值的基因座的最大数量、具有宽峰的基因座的最大数量、inta高于inta阈值的基因座的最大数量、具有红色警告框中标记的三个或更多峰的基因座的最大数量、具有红色警告框中标记的四个或更多峰的基因座的最大数量、红色警告框中标记的杂合子基因座的最大数量、红色警告框中标记的纯合子基因座的最大数量、渗透峰的最大数量、调用的codis20基因座的最小数量、调用的codis18基因座的最小数量、调用的常染色体基因座的最小数量、调用的flex plex基因座的最小数量、用于生成cmf文件的调用的基因座的最小数量、dna id质量阈值、或搜索和匹配质量阈值。

12.根据权利要求4所述的自适应专家系统,其中当所述特征将所述样本数据分类为混合物时,所应用的所述预定义参数集修改以下中的至少一个:杂合子峰高阈值、杂合子峰高比阈值、纯合子峰高阈值、第二峰的杂合子峰高阈值、纯合子峰高比阈值、半合子峰高最小阈值、区域1中的等位基因ph/pa阈值、区域2中的等位基因ph/pa阈值、区域3中的等位基因ph/pa阈值、区域4中的等位基因ph/pa阈值、插入的最大数量、脱扣的最大数量、每个染料通道的信噪比阈值、峰基分配限值、峰段大小阈值、峰高阈值、峰宽阈值、峰形状阈值、峰形态阈值、峰不对称性阈值、峰宽偏差限值、峰形状偏差限值、基值置信度阈值、杂合子峰高阈值、杂合子峰高比阈值、按颜色平均杂合子峰高阈值、纯合子峰高阈值、按颜色平均纯合子峰高阈值、基因座内等位基因的相对信号强度阈值、相较于等位基因大小(例如基值)的等位基因相对信号强度阈值、inta峰高阈值、inta峰高比阈值、影子峰高阈值、影子比阈值、三等位基因峰高阈值、三等位基因峰高比阈值、混合物峰高阈值、ils成功限值、高inta规则状态、混合物样本保护规则状态、低信号保护规则状态、基因座中的峰的最大数量、调用的等位基因的最大数量、红色警告框中标记的等位基因的最大数量阈值、未标记等位基因的最大数量阈值、ph低于ph阈值的具有等位基因的基因座的最大数...

【专利技术属性】
技术研发人员:E·谭H·蒋R·F·塞尔登
申请(专利权)人:安德股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1