【技术实现步骤摘要】
【国外来华专利技术】基于人工智能的癌症诊断和癌症类型预测方法
[0001]本专利技术涉及一种基于人工智能的用于诊断癌症和预测癌症类型的方法,以及更具体地说,涉及一种基于人工智能的通过从生物样品中提取核酸以获得序列信息,基于比对的读段
(reads)
生成矢量化数据,并分析通过将矢量化数据输入至经训练的人工智能模型获得的计算值来诊断癌症和预测癌症类型的方法
。
技术介绍
[0002]临床实践中的癌症诊断通常在病史检查
、
体格检查和临床评估后通过组织活检来进行
。
只有当癌细胞的数量为
10
亿或更多且癌的直径为
1cm
或更大时,基于临床试验的癌症诊断才是可行的
。
在这种情况下,癌细胞已经具有转移的潜力,并且其中至少一半已经转移
。
此外,组织活检是侵入性的,这不利地引起患者相当大的不适,并且通常无法适应癌症治疗
。
此外,用于监测由癌直接或间接产生的物质的肿瘤标志物用于癌症筛查
。
然而,肿瘤标志物的准确度有限,因为即使在存在癌的情况下超过一半的肿瘤标志物筛查结果也显示正常,并且即使在不存在癌的情况下肿瘤标志物筛查结果也通常显示阳性
。
[0003]最近,响应于对癌症诊断方法的要求,诸如相对容易
、
非侵入性
、
高灵敏度和高特异性,使用来自患者的体液的液体活检已经广泛用于癌症诊断和随访复查
。
液体活检是一种非侵入性的 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.
一种基于人工智能提供信息以诊断癌症和预测癌症类型的方法,所述方法包括
:(a)
从生物样品中提取核酸以获得序列信息;
(b)
将所述序列信息
(
读段
)
与参考基因组数据库进行比对;
(c)
基于比对的序列信息
(
读段
)
使用核酸片段生成矢量化数据;
(d)
将生成的矢量化数据输入至经训练的人工智能模型,分析所得的输出值,并将所述所得的输出值与截断值进行比较,以确定是否存在癌症;以及
(e)
通过所述输出值的比较来预测所述癌症类型
。2.
根据权利要求1所述的方法,其中,步骤
(a)
包括:
(a
‑
i)
从血液
、
精液
、
阴道细胞
、
毛发
、
唾液
、
尿液
、
口腔细胞
、
含有胎盘细胞或胎儿细胞的羊水
、
组织细胞或其混合物中获得核酸;
(a
‑
ii)
使用盐析法
、
柱色谱法或珠粒法从获得的核酸中去除蛋白质
、
脂肪和其它残余物,以获得纯化的核酸;
(a
‑
iii)
为所述纯化的核酸或通过酶消化
、
粉碎或水力剪切方法随机片段化的核酸制备单端测序或双端测序文库;
(a
‑
iv)
用下一代测序仪反应所制备的文库;以及
(a
‑
v)
获得下一代测序仪中所述核酸的序列信息
(
读段
)。3.
根据权利要求1所述的方法,其中,步骤
(c)
的所述矢量化数据是
GrandCanyon
图
(GC
图
)。4.
根据权利要求3所述的方法,其中,所述
GC
图的特征在于,通过基于每个
bin
中核酸片段的计数或核酸片段之间的距离计算每个染色体
bin
中的比对的核酸片段的分布来生成所述矢量化数据
。5.
根据权利要求4所述的方法,其中,基于核酸片段的计数来计算在每个染色体
bin
中的比对的序列信息的分布是使用包括以下步骤的方法进行的:
i)
将染色体分成预定的
bin
;
ii)
确定在每个
bin
中的比对的核酸片段的所述计数;
iii)
将确定的每个
bin
中核酸片段的计数除以所述样品中核酸片段的总数以进行归一化;以及
iv)
创建
GC
图,其中
X
轴上是相应
bin
的顺序,
Y
轴上是步骤
iii)
中计算的归一化值
。6.
根据权利要求4所述的方法,其中,基于核酸片段之间的所述距离计算在每个染色体
bin
中的所述比对的序列信息的分布是使用包括以下步骤的方法进行的:
i)
将染色体分成预定的
bin
;
ii)
计算在每个
bin
中的比对的核酸片段之间的所述距离
(
片段距离,
FD)
;
iii)
基于每个
bin
中计算的片段距离,确定每个
bin
的片段之间的代表性距离
(RepFD)
;
iv)
将步骤
iii)
中计算的片段之间的代表性距离
(RepFD)
除以代表性总核酸片段距离以进行归一化;以及
iv)
创建<...
【专利技术属性】
技术研发人员:奇昌锡,赵银海,李俊男,安眞模,孙周爀,金建旼,金旼焕,
申请(专利权)人:血液诊断株式会社,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。