·205·
·论著·
基于NGS-SNP分型和IBS策略进行全同胞关系鉴定
2
王致远1,,王迪佳3,李燃1,李海霞1,汪娜娜1,孙宏钰1
(1.中山大学中山医学院法医学系,广东广州510089;2.佛山市公安局,广东佛山528000;3.深圳市公安局龙华分局,广东深圳518109)摘
要:目的评估单核苷酸多态性(singlenucleotidepolymorphism,SNP)分型结合状态一致性(identity
bystate,IBS)分析策略进行全同胞鉴定的效能。方法收集一个四代家系共35个成员的血样,采用Preci⁃sionIDIdentityPanel对90个常染色体SNP进行分型。统计并比较全同胞与其他亲缘关系IBS评分分布的差异,分别采用Fisher判别函数法和阈值法进行各种亲缘关系判定。结果基于家系和前期研究,分别获得全同胞、祖孙、叔侄(姨甥)、第一代堂表亲关系共44、30、111、71对以及无关个体1000对,平均IBS评分分别为148、130、132、124、120。除祖孙与叔侄(姨甥)关系外,其余关系之间的IBS评分差异均有统计学意义(P<0.05)。基于IBS评分建立的Fisher判别函数对于全同胞、祖孙、叔侄(姨甥)、第一代堂表亲关系的错判率分别为1.3%、22.3%、17.0%、38.7%。基于10000对模拟样本的IBS评分分布,推荐使用t1=128、t2=传标记可满足全同胞关系的鉴定要求,基于IBS评分的阈值法的错判率更低,使用更加灵活。关键词:法医遗传学;单核苷酸多态性;同胞关系;状态一致性;下一代测序中图分类号:DF795.2
文献标志码:A
141作为全同胞判定的IBS阈值(错判率≤0.05%)。结论PrecisionIDIdentityPanel包含的90个SNP遗
doi:10.12116/j.issn.1004-5619.2019.02.014
文章编号:1004-5619(2019)02-0205-05
FullSiblingTestingBasedonNGS-SNPGenotypingMethodandIBSStrategy
WANGZhi-yuan1,2,WANGDi-jia3,LIRan1,LIHai-xia1,WANGNa-na1,SUNHong-yu2
(1.DepartmentofForensicMedicine,ZhongshanSchoolofMedicine,SunYat-senUniversity,Guangzhou510089,China;2.FoshanPublicSecurityBureau,Foshan528000,GuangdongProvince,China;3.Long⁃huaBranchofShenzhenPublicSecurityBureau,Shenzhen518109,GuangdongProvince,China)
Abstract:ObjectiveToevaluatetheeffectivenessofsinglenucleotidepolymorphism(SNP)genoty-pingincombinationwithidentitybystate(IBS)strategyinfullsiblingtesting.MethodsThirty-fivebloodsampleswerecollectedfromafour-generationfamily.NinetyautosomalSNPsweregenotypedusingPrecisionIDIdentityPanel.ThedistributionofIBSscoresforfullsiblingsandotherrelation-shipswerecalculatedandcompared.TherelationshipsweredeterminedusingFisherdiscriminantfunc-tionandthresholdmethod,respectively.ResultsBasedonfamilymembersandpreviousresearch,44,30,111,71and1000pairsoffullsiblings(FS),grandparent-grandchild(GG),uncle/aunt-nephew/niece(UN),firstcousins(FC)andunrelatedindividuals(UI)wereobtained,respectively.TheaverageIBSscoreswere148,130,132,124and120,respectively.ExceptfortheGGandUNpairs,thedistri-butiondifferencesamongtheotherrelationshipshadstatisticalsignificance(P<0.05).ThefalseratesofFisherdiscriminantfunctiontodeterminerelationshipswere1.3%,22.3%,17.0%and38.7%forFS,GG,UNandFC,respectively.Basedonthesimulationdata,thethresholdst1=128andt2=141wererecommendedtodeterminefullsiblingrelationships(thefalserate≤0.05%).ConclusionThe90SNPgeneticmarkersincludedinthePrecisionIDIdentityPanelmeetthetestingrequirementsforfullsiblingrelationships.ThethresholdmethodbasedonIBShasarelativelylowerfalserateandismoreflexible.
Keywords:forensicgenetics;singlenucleotidepolymorphism;siblingrelations;identitybystate;nextgenerationsequencing
基金项目:国家自然科学基金面上资助项目(81671873)作者简介:王致远(1986—),男,硕士研究生,主要从事法医物证学研究;E-mail:316439357@qq.com通信作者:孙宏钰,女,教授,博士研究生导师,主要从事法医物证学研究;E-mail:sunhongyu2002@163.com
·206·
SNP片段短、)单核苷酸多态性具有突变率低数量丰富等特点,(仅为(single被称为第三代遗传标记STRnucleotide的十万分之一)polymorphism、扩增
,
[1-3]。但是,由于单个SNP位点通常只有两个等位基因,多态
性较STR相对低,因此要检测更多的SNP位点才能达到法医学个体识别和亲子鉴定的检测需求。SANCHEZ等[4-5]CE)技术开发了包含基于传统的毛细管电泳52个(SNPcapillary位点的electrophoresisSNPforID检测
,体系,研究结果显示,其可以应用于个体识别,但是仍然难以满足亲缘关系分析的要求。
quencing近年来,throughput,MPS大规模平行测序)技术,又称为(massively高parallelse⁃
generationsequencing步检测的遗传数目增多,sequencing,,HTS通量测序(high-NGS)检测成本降低)技术或下一代测序技术,发展迅速,(next[6-7]。本课题
能够同
Identity组前期基于PanelIon分TorrentTM型体系,平台的探索了HID-Ion90AmpliSeqTM
位点在广东汉族群体的多态性[8],本研究拟基于状态个常染色体SNP
一致性SNP(identitybystate,IBS)分析策略,探索这90个
1
位点在全同胞关系分析中的效能。
1.1样本收集和材料与方法
在知情同意原则下,DNA提取
采集中国汉族一个四代家系
共35个成员的血样,个体之间关系如图1所示。使用
(美国AutoMateThermoExpressTMFisherForensicScientificDNA公司)Extraction提取DNASystem,Fisher
并使
Scientific用QubitTMdsDNAHSAssayKit(美国ThermoFisher课题组前期研究中的无关个体Scientific公司)在公司QubitTM)上进行3.0荧光定量仪DNASNP定量。另外,(美国Thermo分型数据[8]随机组根据本
合获得1000对无关个体(unrelatedindividual,UI)。
A1
A2
A3A4A5A6A7A8A9A10A11A12A13A14A15A16A17A18A19
A20A21A22A23A24A25A26A27A28A29A30A31A32A33A34
A35A36
图1本研究对象的四代家系系谱图
A13个体未采样
1.2常染色体采用GoldenSTReye分型
DNA身份鉴定系统25A[基点认知技术(北京)公司]对23个常染色体STR基因座进行扩增,Scientific公司)在3500xL上进行检测,基因分析仪并使用(美国GeneMapperThermoFisherID-
JournalofForensicMedicine,April2019,Vol.35,No.2
XSTRv1.5软件(美国ThermoFisherScientific公司)进行
1.3常染色体分型。
采用PrecisionSNP分型
IDIdentityPanel(美国Thermo(美国FisherThermoScientificFisher公司)Scientific和IonAmpliSeqTM公司)进行文库构建LibraryKit[8]。该检测体系可同时检测90个常染色体身份信息SNP(identityinformativeSNP,iiSNP)以及34个Y-SNP位点。扩增产物使用FisherIonChefTMSystem(美国Thermo520TM或ScientificIon530TM公司)进行自动化模板制备,应用Ion公司tific)在IonS5TMXLKitSystem(美(国美国ThermoThermoFisherFisherScientificv5.2.2公司)分析,软件上进行测序。测序结果采用同时结合(美国TorrentSuiteScien⁃TMHIDThermoSNPFisherGenotyperScientificPlugin公司)v4.3.1进行软件1.4(美国数据分析
ThermoFisherScientific公司)进行SNP分型。对于家系中的所有父-母-子关系,根据23个常染色体PI),依照行业技术规范STR的分型结果,计算亲权指数(paternityindex,[9]bined,如果累积亲权指数(com⁃间的亲子关系。基于该家系共获得全同胞paternityindex,CPI)大于10000,则支持他们之ling甥)(,FSuncle/aunt-nephew/niece)、祖孙(grandparent-grandchild(fullsib⁃,UN)和第,GG一)代、叔侄堂表(姨亲(firstcousin,FC)共4种亲缘关系类型。参考《生物学
全同胞鉴定实施规范》[10]
,分别计算各种关系类型的IBS评分,采用R语言绘制各关系类型的IBS分布图[11]。采用Wilcoxon秩和检验比较全同胞与其他亲缘关系类型20.0IBS软件建立各种关系的评分分布的差异,检验水准IBS评分作为判别因子Fisher判别函数α=0.05。采用SPSS[12]。以待鉴定个体对的(S),分别代入相应的判别函数获得判别评分L值,并将该对个体的关系类型归为L值较大的组别。同时,基于前期研究获得的频率数据[8],分别模拟10000对4种亲缘关系和
无关个体样本对。参考《生物学全同胞关系鉴定实施规
范》[10],对于待鉴定个体对,如果其IBS评分小于或等
于某一阈值(下限值t1或等于另一阈值(上限值),则判定为无关个体;t如果大于
2如果在t),则判定为对应亲缘关系;1和t2判率分别为≤0.01%之间,则无法判定。基于此设定探索错、≤0.05%、≤0.1%、≤0.5%和≤1%
时的判定阈值以及相应的系统效能。
2
2.1SNP结对于该家系的测序概况
果
35个样本共进行了3批测序,装载
法医学杂志2019年4月第35卷第2期
·207·
型之间差异均有统计学意义(P<0.05)。
(chiploading)比例分别为62%、70%、73%,富集率(enrichment)分别为93%、95%、95%,单克隆(mono⁃
clonal)比例分别为64%、67%、67%,总计获得超过1400万条序列(reads)。35个样本在90个SNP位点
均获得完整分型,分型率为100%。
2.2家系成员关系确认
根据23个常染色体STR分型结果对本研究四代家系中所有的父-母-子关系进行了确认,基于该家系样本可获得的亲缘关系类型及数量如表1所示。
表1本研究四代家系样本的关系类型及数量关系类型全同胞祖孙叔侄(姨甥)第一代堂表亲合计
数量/对443011171256140
IBS120100
FS
GG
UN关系类型
FC
UI
2.3各类亲缘关系的IBS评分分布
基于该90个SNP分型结果,在256对亲缘关系中,全同胞的平均IBS评分最高(IBS=148),第一代堂表亲的平均IBS评分最低(IBS=124)。祖孙、叔侄(姨甥)的平均IBS分值分别为130、132。相比之下,无关个体的IBS评分最低,平均仅为120。各种关系类型的IBS分布情况如图2所示。
经Wilcoxon秩和检验,除了祖孙与叔侄(姨甥)的IBS评分差异无统计学意义(P=0.719)外,其余关系类
关系类型全同胞祖孙叔侄(姨甥)第一代堂表亲
判别函数
(姨甥)关系、第一代堂表亲关系、无关个体
FS、GG、UN、FC、UI分别代表全同胞关系、祖孙关系、叔侄
图25种关系类型基于90个SNP分型的IBS分布
2.4Fisher判别函数法进行亲缘关系判定
通过Fisher判别函数进行4种亲缘关系的判定,结果见表2。其中,全同胞关系全部被正确评判为相
应的亲缘关系,对于更远的亲缘关系,错判率显著升高。综合考虑无关个体的判定结果,判别函数法对全同胞关系判定的准确率最高(98.7%),对第一代堂表亲判定的准确率最低(61.3%)。
表2基于90个SNP分型建立的4种关系判别函数及分析结果
判定类型
特定亲缘关系/对无关个体/对
44014986273227773981317682449223936070.100.08概率密度全同胞
无关个体
错判率/%总错判率/%准确率/%
注:L表示判别评分,S表示IBS评分分值
LFS=3.9×S-289.7LUI=3.2×S-189.6LGG=3.4×S-221.1LUI=3.1×S-187.4LUN=3.5×S-233.4LUI=3.2×S-192.5LFC=3.3×S-204.5LUI=3.2×S-191.40.01.410.022.711.717.631.039.3无关个体
1.322.317.038.7
98.777.783.061.3
2.5IBS阈值法进行亲缘关系判定
基于前期研究,本研究模拟了10000对4种亲缘关系和无关个体样本,全同胞的IBS分布情况见图3。
参考《生物学全同胞关系鉴定实施规范》,本研究计算了在不同错判率下各类亲缘关系IBS评分的判定阈值及相应的系统效能,结果见表3。
从表3可以看出,在相同错判率下,全同胞关系鉴定的系统效能最高,第一代堂表亲关系鉴定效能最低。
[10]
t1
无法判定
t2
全同胞
0.060.040.020.00
90
100
110
120
130IBS
140
150
160
170
虚线位置代表错判率为0.05%时的判定阈值
图3基于90个SNP分型的全同胞IBS分布
·208·
表3基于90个SNP分型建立的各种亲缘关系IBS判定阈值及系统效能关系类型
错判率%/
系统
下限值IBSt1上限值t2全同胞1.000.501330.985效能0.101321350.97240.051291371281401410.91290.8814祖孙、叔侄(姨甥)0.011.00126144
0.76440.50117135
0.29400.101160.20990.051131371131401410.09380.0824第一代堂表亲0.011.00111144
0.03890.50111135
0.06270.101101370.03720.051080.01520.011071401051411440.01030.00308另外,可根据此表灵活选择判定阈值。以全同胞
IBS关系评分为例≤128,当,设则判定为无关个体,定错判率≤0.05%时如果,如≥141果某,对则判定
样本为全同胞,相应的系统效能为0.8814,即88.14%的案
例可以获得明确的鉴定意见。
3讨论
目前,国内司法系统使用的《生物学全同胞关系鉴定实施规范》基于STR分型结果,采用IBS评分法提出判断全同胞、无法判断、无关个体的标准和检测效能[10]。相对于似然比(likelihoodratio)法,IBS评分法无需考虑等位基因频率,只需要根据等位基因共享情况即可进行亲缘关系判定,具有分析直观、简单、快速的优势
[11,13-15]
。另一方面,对于特殊案例,如高度腐
败或者降解检材,常常无法获得完整STR分型,而SNP
SNP由于扩增片段短可以获得完整分型。并且随着分型体系的日益成熟,将越来越广泛地应用于法NGS-[16]sion医学个体识别和亲缘鉴定IDIdentityPanel分型体系对,因此本研究采用90个SNP位点进
Preci⁃行分型,结合IBS策略探索了该检测体系在全同胞关
系鉴定中的应用价值。
本研究结果显示,全同胞、祖孙、叔侄(姨甥)和第
一代堂表亲4种亲缘关系中,除了祖孙与叔侄(姨甥)关系外,其余关系类型的IBS评分差异均有统计学意义,且均高于无关个体。祖孙与叔侄(姨甥)的IBS评分无显著差异,可解释为这两类亲缘关系同属于二级亲缘关系,理论上他们之间均共有四分之一的亲代遗传物质。另外,随着亲缘关系的疏远,IBS分值逐渐降
JournalofForensicMedicine,April2019,Vol.35,No.2
低。亲缘关系中的第一代堂表亲与无关个体的IBS差异最小。
本研究根据90个SNP分型数据建立了4种亲缘关系的Fisher判别函数,综合无关个体的判定结果后对全同胞关系的错判率为1.3%,低于赵书民等[12]研究中的2.98%。分析原因为本研究包含的90个SNP位点相当于22个STR基因座的多态性[17],多于赵书民等研究中采用的Identifiler系统STR数目(15个STR)。但是,对于其他较远亲缘关系的错判率较高,尚不能满足实践需求。
此外,由于判别函数法具有“是”或者“否”的二分类特征,不存在无法判定的“灰色区域”,系统效能高,但是错判率相对也较高。本研究采用判别函数法进行全同胞关系的错判率为1.3%,显著高于根据《生物学全同胞关系鉴定实施规范》及赵书民等[12-13]研究采用19个STR和IBS阈值法(t1≤0.05%)。本研究基于前期获得的频率数据,=13,t2=22)的错判模拟
率
IBS了10000对各种亲缘关系和无关个体,获得了相应的
行全同胞鉴定的系统效能为判定阈值。结果表明,当错判率低至STR时的效能(0.75)0.8814,高于采用0.05%时,19进
个
[10],提示这90个SNP可以应用于
全同胞关系鉴定。因此,当采用这90个SNP进行鉴
定时,推荐使用对应的阈值t1的判定标准。如果允许的错判率提高,=128、t2=141相应的系统效作为全同胞
能更大。实际工作中可以根据需要,选择不同的标准和阈值进行判定,这也显示了IBS阈值法的灵活性。
值得一提的是,检测体系包含的SNP位点数目越多,对于各类亲缘关系鉴定的鉴别能力以及准确率越高。KLING等[18-19]应用高密度SNP芯片技术检测了超过90万个SNP位点,以共有等位基因数目作为判定参数,发现可以区分至第二代堂兄弟(姐妹)的关系。这也显示了SNP遗传标记和IBS策略在亲缘关系鉴定中的应用潜力,本研究下一步拟基于更大数量的实验样本和实际案例进行验证。
参考文献:
[1]LIR,ZHANGC,LIH,etal.SNPtypingusingthe
HID-IonAmpliSeqTMIdentityPanelinasouthernChinesepopulation[J].IntJLegalMed,2018,132(4):997-1006.
[2]BESENBACHERS,SULEMP,HELGASONA,
etal.Multi-nucleotidedenovomutationsinHu-mans[J].PLoSGenet,2016,12(11):e1006315.
[3]WANGY,ZHANGYJ,ZHANGCC,etal.Ge-neticpolymorphismsandmutationratesof27Y-chromosomalSTRsinaHanpopulationfromGuang-dongProvince,SouthernChina[J].ForensicSciInt
(法医学杂志2019年4月第35卷第2期
Genet,2016,21:5-9.
[4]
SANCHEZJJ,PHILLIPSC,BØRSTINGC,etal.Amultiplexassaywith52singlenucleotidepolymorphismsforhumanidentification[J].Electro-phoresis,2006,27(9):1713-1724.
[5]
MUSGRAVE-BROWNE,BALLARDD,BALOGHK,etal.ForensicvalidationoftheSNPforID52-plexassay[J].ForensicSciIntGenet,2007,1(2):186-190.
[6]
LOMANNJ,MISRARV,DALLMANTJ,etal.Performancecomparisonofbenchtophigh-throughputsequencingplatforms[J].NatBiotechnol,2012,30(5):434-439.
[7]
JÄGERAC,ALVAREZML,DAVISCP,etal.DevelopmentalvalidationoftheMiSeqFGxFo-rensicGenomicsSystemforTargetedNextGenera-tionsequencinginforensicDNAcaseworkandda-tabaselaboratories[J].ForensicSciIntGenet,2017,28:52-70.[8]
李海燕,张楚楚,唐振亚,等.基于二代测序平台的90个常染色体SNP分型研究[J].中国法医学杂志,2016,31(6):557-562.
[9]中华人民共和国司法部司法鉴定管理局.亲权鉴定技术规范:SF/ZJD0105001—2016[S].2016.
[10]
中华人民共和国司法部司法鉴定管理局.生物学全同胞关系鉴定实施规范:SF/ZJD0105002—2014[S].2014.
[11]
TheRProjectforStatisticalComputing[Z/OL].[2018-07-02].https://www.r-project.org/.
·209·
[12]赵书民,李成涛,张素华,等.应用常染色体STR基因
座共有等位基因数判别全同胞关系[J].法医学杂志,2009,25(4):267-270.[13]李燃,李成涛,赵书民,等.IBS评分法鉴定全同胞关系
及其临界值查询表的构建[J].法医学杂志,2017,33(2):136-140,147.[14]袁丽,徐旭,任贺,等.共有等位基因数判别函数法在
全同胞关系鉴定中的应用[J].中国法医学杂志,2014,29(4):308-312.[15]王静,刘雅诚,唐晖,等.共有基因数在同胞鉴定中应
用的研究[J].中国法医学杂志,2004,19(4):216-218.[16]SOBRINOB,BRIÓNM,CARRACEDOA.SNPs
inforensicgenetics:areviewonSNPtypingmetho-dologies[J].ForensicSciInt,2005,154(2/3):181-194.[17]GUOF,ZHOUY,SONGH,etal.Nextgenera-tionsequencingofSNPsusingtheHID-IonAm-pliSeqTMIdentityPanelontheIonTorrentPGMTMplatform[J].ForensicSciIntGenet,2016,25:73-84.[18]KLINGD,WELANDERJ,TILLMARA,etal.
DNAmicroarrayasatoolinestablishinggeneticrelatedness--Currentstatusandfutureprospects[J].ForensicSciIntGenet,2012,6(3):322-329.
[19]LAREUMV,GARCÍA-MAGARIÑOSM,PHIL-LIPSC,etal.Analysisofaclaimeddistantrela-tionshipinadeficientpedigreeusinghighdensitySNPdata[J].ForensicSciIntGenet,2012,6(3):350-353.
(收稿日期:2018-12-18)
(本文编辑:张素华)
因篇幅问题不能全部显示,请点此查看更多更全内容