




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
高密度遺傳圖譜構(gòu)建及QTL定位項(xiàng)結(jié)題報(bào)客戶(hù)單位 報(bào)告單位 百邁客生物科 聯(lián)系人 傳真 XXXXXXXX項(xiàng)目概 項(xiàng)目研究背 項(xiàng)目報(bào)告重要名詞及術(shù) 材料基本信 合同關(guān)鍵指標(biāo)情 項(xiàng)目執(zhí)行情 分析結(jié)果概 項(xiàng)目流 酶切方案設(shè) 文庫(kù)構(gòu)建及信息分析流 生物信息學(xué)分析結(jié) 酶切方案設(shè) 數(shù)據(jù)統(tǒng)計(jì)與評(píng) 3.2.1質(zhì)量值分布檢 3.2.2堿基分布檢 3.2.3數(shù)據(jù)產(chǎn)出和質(zhì)量統(tǒng) 實(shí)驗(yàn)建庫(kù)評(píng) 比對(duì)效率統(tǒng) 酶切效率評(píng)估統(tǒng) 片段選擇評(píng) SLAF開(kāi) SLAF多態(tài)性分 多態(tài)性SLAF編 遺傳圖譜構(gòu) 上圖標(biāo)記篩 繪制連鎖 連鎖分 遺傳圖譜評(píng) 遺傳圖譜基本信息統(tǒng) 上圖標(biāo)記SNP信息統(tǒng) 偏分離標(biāo)記信息統(tǒng) 上圖標(biāo)記深度信息統(tǒng) 上圖標(biāo)記完整度統(tǒng) 單體來(lái)源評(píng) 連鎖關(guān)系評(píng) 性狀關(guān)聯(lián)分 QTL分 3.7數(shù)據(jù)可視 項(xiàng)目總 數(shù)據(jù)查 結(jié)果文件查看說(shuō) SVG文件格式的查 附件1生物信息分析流 附件2英文材料方 項(xiàng)目研究背遺傳連鎖圖譜(GeneticMap),是指分子標(biāo)記在上的相對(duì)位置與遺傳距離,通常以或DN段在交換過(guò)程中的分離頻率厘摩(cM)來(lái)比較組,輔助組組裝等科研工作。本項(xiàng)目利 百邁客生物科技自主研發(fā)的SLAF-seq[1]技術(shù)HighMap[2]XX
遺傳分離群體(2
個(gè) 發(fā)密度分子,進(jìn)行遺傳圖譜構(gòu)建和相關(guān)性狀的QTL關(guān)聯(lián)分析,獲得與性狀緊密關(guān)聯(lián)的分子和候選區(qū)域。項(xiàng)目報(bào)告重要名詞及術(shù)Pair-end雙端序產(chǎn)生的reads,SLAF采用的是雙 的是雙端 SLAF經(jīng)過(guò)SLAF-seq建庫(kù)產(chǎn)生的特異酶切片段,一個(gè)酶切段就是一個(gè)SLAFPolymorphic 多態(tài)性SLAF群體中存在多態(tài)性的SLAF,多態(tài)性的SLAF中要存在的變異類(lèi)型是Repetitive 重復(fù)序列區(qū)中的 位于重復(fù)序列區(qū)的SLAF,在數(shù)據(jù)上的表現(xiàn) DNA序列上binant兩個(gè)標(biāo)記間的連鎖強(qiáng)度,LOD=3表示兩個(gè)標(biāo)記的連鎖可能性是不連鎖的1000倍Map 圖 兩個(gè)分子標(biāo)記之間的遺傳距離,單位為厘摩1cM表示兩個(gè)標(biāo)記間的重組率約為Genetic 分子標(biāo)記在上的相對(duì)位置與遺傳距離通常以因或因或交換過(guò)程中的 數(shù)量性狀 控制數(shù)量性狀的一個(gè)片QTLMapQTL定 根據(jù)標(biāo)記型與數(shù)量性狀表型,應(yīng)用一定的統(tǒng)計(jì)法,在遺傳連鎖圖上標(biāo)定有關(guān)的QTL位置(以重組率材料基本信合同關(guān)鍵指標(biāo)情指 合同要 210,4849.59%為4,155,上圖標(biāo)記親本平均深度為114.81X;子代平均深度18.24X,項(xiàng)目執(zhí)行情 XXXX月XX XXXX月XX XXXX月XX分析結(jié)果概2 Clean平均平均GC含開(kāi)發(fā)SLAF總連鎖群性狀數(shù)酶切方案設(shè)根 組[3]大小以及GC含量等信息,最終選取棉花組作為參所用參考組地址 所用參考組具體信息如下表所示表3參考組具體信GC棉 利用自主研發(fā)的酶切預(yù)測(cè)軟件對(duì)參考組進(jìn)行酶切預(yù)測(cè)選擇最適酶切方酶切片段在組上盡量均勻分布酶切片段長(zhǎng)度與具體實(shí)驗(yàn)體系的吻合程度最終獲得酶切片段(SLAF)數(shù)滿(mǎn)足預(yù)期數(shù)根據(jù)選定的最適酶切方案,對(duì)檢測(cè)合格的各樣品組DNA分別進(jìn)行酶切PCRIllumina平臺(tái)。為評(píng)估建庫(kù)實(shí)驗(yàn)的準(zhǔn)確性,選用晴水稻(Oryzasativajaponica)作為對(duì)照(Control)進(jìn)行相同的處理參與建庫(kù)和。1SLAF信息分析流利用Dual-index對(duì)得到的原始數(shù)據(jù)進(jìn)行識(shí)別,得到各個(gè)樣品的reads。對(duì)過(guò)濾完接頭的reads進(jìn)序質(zhì)量和數(shù)據(jù)量的評(píng)估。通過(guò)Control數(shù)據(jù)的比對(duì)效率評(píng)估酶的酶切效率,判斷實(shí)驗(yàn)過(guò)程的準(zhǔn)確性和有效性。通過(guò)reads聚類(lèi)的方法,在親本和子代中開(kāi)發(fā)SLAF,尋找多態(tài)性的SLAF[1]。對(duì)多態(tài)性的SLAF進(jìn)行型編碼后,通過(guò)HighMap作圖軟件[2],構(gòu)建遺傳圖譜,進(jìn)行圖譜評(píng)估。通過(guò)QTL定位軟件進(jìn)行QTL關(guān)聯(lián)分析獲得與性狀緊密關(guān)聯(lián)的SLAF和關(guān)聯(lián)區(qū)域。生物信息分析流程見(jiàn)下圖,詳細(xì)流程見(jiàn)附件1。2酶切方案設(shè)對(duì)參考物種組序列進(jìn)行電子酶切預(yù)測(cè)根據(jù)酶切方案選擇原(見(jiàn)2.1RsaI+EcoRV-HF314-444bp的序列定義為SLAF,預(yù)測(cè)可得到238,105個(gè)SLAF,具體酶切方案信息見(jiàn)下表:4SLAF
注InsertSize:酶切片段的長(zhǎng)度范圍;SLAFNumber:酶切方案預(yù)測(cè)的可以得到的SLAF數(shù)需要過(guò)濾掉含有接頭序列的當(dāng)read中含有的N的含量超過(guò)該條read長(zhǎng)度比例的10%質(zhì)量值分布。,堿基識(shí)別(BaseCalling)過(guò)程中每個(gè)堿基都會(huì)得到一個(gè)質(zhì)量值,用于評(píng)估該堿基的準(zhǔn)確性質(zhì)量值是評(píng)估高通量單堿基錯(cuò)誤率的重要指標(biāo)質(zhì)量值越高對(duì)應(yīng)的堿基錯(cuò)誤率越低。堿基錯(cuò)誤率e和質(zhì)量值Q的對(duì)應(yīng)公式:,如果某堿基出錯(cuò)的概率為0.001,則該堿基的質(zhì)量值Q應(yīng)該為30。本項(xiàng)目母本樣品(客戶(hù)75)樣品質(zhì)量分布情況見(jiàn)下圖:。,圖3質(zhì)量值分布注:橫坐標(biāo)為reads的堿基位置,縱坐標(biāo)為單堿基的質(zhì)量值。前150bp為雙端序列的第一端reads的質(zhì)量值分布,后150bp為另一端reads的質(zhì)量值分布。同一個(gè)位置對(duì)應(yīng)的不同質(zhì)量的reads,顏堿基分布檢AT、GC分離現(xiàn)象,而這種現(xiàn)象可能是測(cè)序或者建庫(kù)所帶來(lái)的,并且會(huì)影響后續(xù)分析。由于SLAF-seqreads為組DNA的酶切片段其堿基分布會(huì)受到酶切位點(diǎn)和PCR擴(kuò)增的影響堿基分布會(huì)呈現(xiàn)不同程度的波動(dòng)本項(xiàng)目母本樣品(客戶(hù)75)樣品堿基分布情況見(jiàn)GC含量分布基本正常。4為雙端序列的第一端Reads的堿基分布,后125/150bp為另一端reads的堿基分布。如第一個(gè)位置代表的reads在第一個(gè)堿基的 數(shù)據(jù)產(chǎn)出和質(zhì)量統(tǒng)對(duì)各樣品的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),包括reads數(shù)量、bases數(shù)量、Q30和GC含表5各樣品數(shù)據(jù)統(tǒng)計(jì)
1-M2-P注SampleID:樣品信息單中樣品BMKID:百邁客對(duì)樣品的統(tǒng)一,P代表父本,M代表母本TotalReads:各樣品的reads數(shù)TotalBases:各樣品的bases數(shù)Q30Percentage:質(zhì)量值大于或等于30的堿基所占百分比;GCPercentage:結(jié)果中G和C兩種堿基所占總堿基的百分比;Total:整體數(shù)據(jù)信息(除control數(shù)據(jù)外)實(shí)驗(yàn)建庫(kù)評(píng)本實(shí)驗(yàn),晴水稻(rytivL.japonia作為ontrol,通過(guò)對(duì)ontrol數(shù)據(jù)的評(píng)估實(shí)驗(yàn)過(guò)程是否正常,確定酶切方案實(shí)施的有效性。本項(xiàng)目中ontrol所用晴水稻(rytivL.japonia),組大小為382.8b,下載地址:。比對(duì)效率統(tǒng)用于評(píng)估實(shí)驗(yàn)建庫(kù)準(zhǔn)確性的Control獲得538,614reads的數(shù)據(jù)量,通過(guò)SOAP[5]軟件將Control的reads與參考組進(jìn)行比對(duì),比對(duì)結(jié)果見(jiàn)下表,90.37%,比對(duì)效率基本正常。表6Controlreads比對(duì)結(jié)果統(tǒng)計(jì)
MappedReads
MappedReads
Unmapped 注Paired-EndMappedReads:一條序列兩端在參考組上的比對(duì)跨度介于50bp~1kb的reads占總reads的比Single-EndMappedReads:一條序列兩端在參考組上的比對(duì)跨度小于50bp,或大于1kb的reads占readsUnmappedReads:未比對(duì)到組上的reads占總reads的比例Single-EndMappedReads和UnmappedReads來(lái)源:由于接頭過(guò)濾不全,reads中堿基錯(cuò)配,異常的片酶切效率評(píng)估統(tǒng)酶切效率是評(píng)價(jià)簡(jiǎn)化組實(shí)驗(yàn)是否成功的一個(gè)關(guān)鍵指標(biāo)組上的復(fù)雜結(jié)構(gòu)區(qū)(如環(huán)狀結(jié)構(gòu)域連續(xù)酶切位點(diǎn)等)組NA樣品純度較低酶rds片段中殘留酶切位點(diǎn)的比例,統(tǒng)計(jì)比例越低,酶切效率越好[6]。從下表中可知,本項(xiàng)目ontrol95.23%7ControlDigestion Digestion 注DigestionNormally:reads中間不存在未被酶切開(kāi)的酶切位點(diǎn);DigestionPartly:reads中間存在未被酶切開(kāi)的酶切位點(diǎn);Total:reads片段總數(shù)。片段選擇評(píng)根據(jù)ControlPair-endmappedreads在組中的位置計(jì)算SLAF的實(shí)際長(zhǎng)度,Controlreads片段分布見(jiàn)下圖圖5Controlreads片段分布注:橫坐標(biāo)表示reads的片段長(zhǎng)度,縱坐標(biāo)表示reads所占的比例SLAF開(kāi)利用自主研發(fā)的SLAF開(kāi)發(fā)流程將同一個(gè)位置的reads作為一個(gè),本項(xiàng)目共開(kāi)發(fā)210,484個(gè)SLAF,SLAF親本平均深度8SampleBMKSLAFTotal1-M2-P注SampleID:樣品信息單中樣品;BMKID:百邁客對(duì)樣品的統(tǒng)一;SLAFNumber:SLAF數(shù)量;TotalDepth:reads數(shù);AverageDepth:平均每個(gè)SLAF上該樣品的reads數(shù)SLAF多態(tài)性分共開(kāi)發(fā)得到的210,484個(gè)SLAF,各類(lèi)型SLAF結(jié)果統(tǒng)計(jì)見(jiàn)下表。從下表可以看出,多態(tài)性SLAF共有47,832個(gè),多態(tài)性比例達(dá)到22.72%。表9SLAF類(lèi)型統(tǒng)Non-注PolymorphicSLAF:表示在一個(gè)SLAF中存在多態(tài)性位點(diǎn),多態(tài)性位點(diǎn)主要包括是SNP和InDel;Non-PolymorphicSLAF:表示在SLAF中沒(méi)有多態(tài)性位點(diǎn);RepetitiveSLAF:指位于重復(fù)序列區(qū)的SLAFTotalSLAF:所有的SLAF多態(tài)性SLAF編,為了便于后續(xù)的遺傳學(xué)分析,需要對(duì)多態(tài)性進(jìn)行型編碼型編aa(父本)和bb(母本),子代型ab則表示該樣品在這個(gè)標(biāo)記的編碼類(lèi)型型適用于近交群體(如F2,RIL,DH),其余標(biāo)記適用于雜交群體(如:CP),表10型編碼規(guī)
ac,bc,- ac,bc,- 注PaternalGenotype:父本型;MaternalGenotype:母本型;碼規(guī)則對(duì)本項(xiàng)目獲得的47,832個(gè)多態(tài)性SLAF進(jìn)行分型有37,603個(gè)成功編碼,各類(lèi)型統(tǒng)計(jì)分布見(jiàn)下圖:圖6各個(gè)類(lèi)型分布注:橫坐標(biāo)表示所有的類(lèi)型,縱坐標(biāo)代表該類(lèi)型個(gè)數(shù)選擇aaxbb類(lèi)型(純合)的多態(tài)性作為符合群體特征的有效,本項(xiàng)目構(gòu)9.59%。遺傳圖譜構(gòu)上圖標(biāo)記篩為保證遺傳圖譜質(zhì)量,將多態(tài)性SLAF按照以下規(guī)則進(jìn)行過(guò)濾SNP數(shù)目大于5。由于SNP長(zhǎng)度為200bp,出現(xiàn)過(guò)多的SNP被親本完全純合的多態(tài)性的剔除代中至少有70個(gè)有確定型。QTL定位有影響。借鑒多數(shù)文獻(xiàn)對(duì)偏分離標(biāo)記處理方法對(duì)嚴(yán)重偏分離(卡方檢驗(yàn)P<0.01)的多態(tài)性標(biāo)記進(jìn)行過(guò)濾。最終得到可用于作圖的SLAF4765個(gè)。各類(lèi)型統(tǒng)計(jì)見(jiàn)下表表11用于圖譜構(gòu)建的SLAF類(lèi)型統(tǒng) SLAF 注SLAFNumber:用于構(gòu)建遺傳圖譜的SLAF數(shù);Percentage:各類(lèi)型SLAF占有效SLAF總數(shù)百分比;Total:有效SLAF總數(shù)。繪制連鎖將篩選出的4765個(gè)SLAF,通過(guò)兩兩之間計(jì)算MLOD值[7],設(shè)置最小群與最大群數(shù)預(yù)設(shè)MLOD值區(qū)間按的MLOD值從小到大排列之間MLOD值最高的分在同鎖群過(guò)濾掉與其他SLAF的值均低于5的,定位為上圖標(biāo)記(Marker)12MarkerMarker注LGID:連鎖群ID號(hào)MarkerNumber:上圖標(biāo)記數(shù)目連鎖分HighMap[2]Marker的線(xiàn)性排列,并估算相鄰Marker間的遺傳距離,最終得到總圖距為1,976.68cM的遺傳圖7遺傳圖譜評(píng)遺傳圖譜基本信息統(tǒng)各個(gè)連鎖群Marker13Group<5注LinkagegroupID:連鎖群,本項(xiàng)目與組的一致AverageDistance:平均圖距,表示平均一條連鎖群上標(biāo)記的平均遺傳距離;Gap<5cM:gap小于5cM占總gap數(shù)的比例,比例越高,代表圖譜越均勻;MaxGap:連鎖群中最大的gap,最大gap越小,表示圖譜越均勻;Total:所有連鎖群總的數(shù)、總圖距、平均圖距和最大的Gap信息上圖標(biāo)記SNP信息統(tǒng)各個(gè)連鎖群上圖SNP5,323個(gè)上圖LinkageGroupSNP 注LinkageGroupID:連鎖群SNPNumber:SNP類(lèi)型的MarkerTotal:連鎖群SNP標(biāo)記轉(zhuǎn)換/顛換總數(shù)偏分離標(biāo)記信息偏分離標(biāo)記(Segregationdistortion)普遍存在,并且會(huì)影響圖譜構(gòu)建結(jié)果及15LinkageGroupMP00000060600000020200000000000000000000000001014040000注LinkageGroupID:本項(xiàng)目連鎖群M:在這條連鎖群上子代型偏向母本的SLAF個(gè)數(shù)P:在這條連鎖群上子代型偏向父本的SLAF個(gè)數(shù)上圖標(biāo)記深度信息統(tǒng)16SampleBMKMarker1-M2-PAverageof注SampleID:樣品信息單中樣品;BMKID:百邁客對(duì)樣品的統(tǒng)一;MarkerNumber:各樣品的上圖標(biāo)記數(shù);TotalDepth:各樣品上圖標(biāo)記總深度;AverageofOffspring:代表所有子代的平均值,分別是平均Marker數(shù),上圖標(biāo)記總深度的平均值(所有標(biāo)上圖標(biāo)記完整度統(tǒng)標(biāo)記的比例)如下圖所示。本項(xiàng)目完整度平均為98.06%,保證了圖譜分型圖8所 單體來(lái)源評(píng)雙交換位點(diǎn)產(chǎn)生的原因有兩個(gè):1)組的重組熱點(diǎn)區(qū)域;2)由于導(dǎo)致的定的問(wèn)題,通常雙交換控制在3%以下,LG1的單體來(lái)源評(píng)估如下圖所示。本項(xiàng)目每個(gè)中較大區(qū)段的來(lái)源會(huì)保持一致,說(shuō)明遺傳圖譜質(zhì)量高。9LG1注個(gè)橫代一個(gè)ake照連群的順排列一代一樣中一條,Group03000000注LinkageGroupID:連鎖群ID;SingletonPercent:雙交換的位點(diǎn)比例;MissingPercent:缺失的比例。連鎖關(guān)系評(píng)遺傳圖譜實(shí)質(zhì)上是多點(diǎn)重組分析,Marker間距離越近,重組率越小。分析10LG1Marker紅到紫的變化代表重組率從小到大變化。距離越近的Marker重組率越小,顏色越接近黃色,距離越遠(yuǎn)的Marker重組率越大,越接近紫色。性狀關(guān)聯(lián)分QTL分本項(xiàng)目采用/qtl進(jìn)行L定位分析,首先通過(guò)PT檢驗(yàn)1000次設(shè)定閾值,先考慮0.99置信度對(duì)應(yīng)的閾值,若沒(méi)有定位區(qū)間則考慮0.95置信度對(duì)應(yīng)的閾值;若沒(méi)有定位區(qū)間則考慮0.90PT手動(dòng)降低閾值到3.0;若3.0沒(méi)有區(qū)間則降到.;若2.5沒(méi)有區(qū)間則降到2。18GroupGroup38--39
注LODthreshold:該性狀的關(guān)聯(lián)閾值;LinkageGroupID:連鎖群;MaxLOD:該性狀的關(guān)聯(lián)的最大LOD值;QTL分布圖,19QTL注:橫坐標(biāo)是連鎖群Marker的排列順序,左縱坐標(biāo)是LOD值,右縱坐標(biāo)是表型貢獻(xiàn)率,藍(lán)線(xiàn)表示marker對(duì)應(yīng)的LOD值,紅線(xiàn)表示marker對(duì)應(yīng)的表型貢獻(xiàn)率,灰線(xiàn)是閾值線(xiàn),閾值線(xiàn)以上的區(qū)域即關(guān)聯(lián)到的QTL3.7數(shù)據(jù)可視結(jié)合上述內(nèi)容,將圖譜基本信息,SLAF信息,QTL繪制到Circos圖距;第二圈為SLAF標(biāo)記連鎖群分布,區(qū)域內(nèi)SLAF標(biāo)記越多,顏色越深;第20Circos數(shù)據(jù)總結(jié):本項(xiàng)目共獲得835.3Mbp數(shù)據(jù),平均Q30為90.87%,平均GC含量為40.43%,樣本GC分布正常。綜上所述,數(shù)據(jù)量、質(zhì)量均達(dá)到實(shí)驗(yàn)建庫(kù)評(píng)估總結(jié):Control數(shù)據(jù)的雙端比對(duì)效90.37%,酶切效率為95.23%,SLAF建庫(kù)正常。酶切方案總結(jié)本項(xiàng)目通過(guò)棉花組進(jìn)行酶切預(yù)測(cè)選擇ao-HF酶切組合進(jìn)行酶切SF長(zhǎng)度選擇在31-444b預(yù)測(cè)到238,15個(gè)S。多態(tài)性SLAF開(kāi)發(fā)總結(jié):本項(xiàng)目共獲得210,484個(gè)SLAF,其中多態(tài)性SLAF有47,832個(gè),共有37,603個(gè)成功編碼,過(guò)濾前滿(mǎn)足群體分離類(lèi)型編碼的數(shù)為21,153個(gè),構(gòu)建遺傳圖譜時(shí)有效多態(tài)性為9.59%。本項(xiàng)目共構(gòu)建18條連鎖群,上圖4,155Marker,總圖距為1,976.68cM,上圖標(biāo)記完整度為98.06%,發(fā)生雙交換的比例為0.36%,親本深度為114.81X,子代為18.24X。結(jié)合18個(gè)連鎖群的圖譜和分型數(shù)據(jù),以及14個(gè)數(shù)量性狀表型數(shù)據(jù),進(jìn)行數(shù)量性狀QTL定位分析,14個(gè)性狀用MapQTL獲得了52個(gè)性狀關(guān)聯(lián)區(qū)域。 中有Readme.txt說(shuō)明詳細(xì)介紹了每個(gè)文件所代表的內(nèi)容上傳的結(jié)果數(shù)據(jù)文件多以文本格式為主(fa文件、txt文件、detail文件、xls文件等)。在Windows系統(tǒng)下查看文件推薦使用Editplus或UltraEdit作為文本瀏覽程序,否則會(huì)因文件過(guò)大造成死機(jī)在Unix或Linux系統(tǒng)下可以瀏覽較大的文本文件,用Less等操作命令可以順利地查看。SVG文件格式的查報(bào)告文件含有SVG格式的文件,SVG是矢量化的文件,可以隨意放大而不失真。要查看SVG格式的文件,請(qǐng)先安裝SVG插件?!緟⒖嘉墨I(xiàn)SunX,LiuD,ZhangX,etal.SLAF-seq:anefficientmethodoflarge-scaleDenovoSNPdiscoveryandgenotyusinghigh-throughputsequencing[J].PloSONE,2013,8(3):e58700.LiuD,MaC,HongW,HuangL,LiuM,etal.ConstructionandysisofHigh-DensityLinkageMapUsingHigh-ThroughputSequencingData[J].PLoSONE,2014,9(6):e98855.DaveyJW,CezardT,Fuentes‐UtrillaP,etal.SpecialfeaturesofRADSequencingdata:implicationsforgenoty[J].Molecularecology,2013,22(11):3151-3164.KozichJJ,WestcottSL,BaxterNT,etal.Developmentofadual-indexsequencingstrategyandcurationpipelineforyzingampliconsequencedataontheMiSeqIlluminasequencingplatform[J].Appliedandenvironmentalmicrobiology,2013,79(17):5112-5120.LiR,LiY,KristiansenK,etal.SOAP:shortoligonucleotidealignmentBioinformatics,2008,24(5):713-ArabidopsisGenomeInitiative.ysisofthegenomesequenceofthefloweringplantArabidopsisthaliana[J].Nature,2000,408(6814):796.Stam.Constructionofintegratedgeneticlinkagemapsbymeansofanewcomputerpackage:JOINMAP.ThePlantJournal,19933(5):739-744.1需要過(guò)濾掉含有接頭序列的當(dāng)read中含有的N的含量超過(guò)該條read長(zhǎng)度比例的10%SLAF將產(chǎn)生的reads通過(guò)blat軟件進(jìn)行序列比對(duì)按照相似度90%進(jìn)行聚類(lèi),groupSLAFSLAF,進(jìn)行分子標(biāo)記的開(kāi)發(fā)。針對(duì)每一個(gè)SLAF,根據(jù)親本深度大于10X的序列確定每個(gè)SLAF標(biāo)記的型,要求每個(gè)型序列包含30%的子代信根據(jù)每個(gè)SLAF中SLAF標(biāo)記的型的個(gè)數(shù),區(qū)分SLAF的類(lèi)型,其中有5個(gè)型以上的SLAF確認(rèn)為在重復(fù)序列上的SLAF,2~4個(gè)型的SLAF為多態(tài)性SLAF,1個(gè)型的即為非多態(tài)的SLAF。對(duì)多態(tài)性的SLAF進(jìn)對(duì)已經(jīng)成功編碼的SLAF標(biāo)記進(jìn)行過(guò)濾,篩選高質(zhì)量的SLAF標(biāo)記進(jìn)行后續(xù)的圖譜構(gòu)建和分析,標(biāo)記過(guò)濾的標(biāo)準(zhǔn)為:1每個(gè)SLAF3個(gè)SNP2子代完整度70%以上;3偏分離標(biāo)記(p<0.01);4親本深度小于QTL與標(biāo)記之間的重組率和MLODMLOD值將分子標(biāo)記分為不同的連Kosambi函數(shù)完成。QTLR/qtlCIMPermutationtest(P<0.05)QTL閾值的QTL區(qū)域。HighMap、HighMap是百邁客自主研發(fā)的高密度遺傳圖譜構(gòu)建軟件,HighMap構(gòu)圖過(guò)程主要包括連鎖分群標(biāo)記排序型糾錯(cuò)和圖譜評(píng)估4部分采用多次排序JoinMap4.1JoinMap4.0。利用該構(gòu)、R/qtlR/qtl是在實(shí)驗(yàn)群體中定位數(shù)量性狀位點(diǎn)的一個(gè)可擴(kuò)展的交互環(huán)境。它作為RR的一個(gè)附加包,R里面最基本的數(shù)學(xué)、統(tǒng)計(jì)以及作圖功能。更可以方便使用者將一般的統(tǒng)計(jì)分析程序和QTL定位軟件完美結(jié)合。目前的R/qtl版本,通過(guò)利用區(qū)間作圖(EM算法),Haley-Knott回歸和多重插補(bǔ),包括了估算遺傳圖譜,鑒定型錯(cuò)誤,進(jìn)行單QTL組掃描,雙QTL和二因組掃描。所SOAPSOAP,全稱(chēng)短寡聚核苷酸分析包,已經(jīng)從一個(gè)單一的比對(duì)工具進(jìn)化成為二代數(shù)據(jù)提供數(shù)據(jù)分析的軟件包。當(dāng)前,它包含有新型比對(duì)程序結(jié)構(gòu)差異掃描程序(SOAPsv)和短序列片段reads從頭開(kāi)始組裝程序BlatBlatTheBLAST-LikeAlignmentTool,類(lèi)BLAST比對(duì)工具,由W.JamesKent于2002年開(kāi)發(fā)。當(dāng)時(shí)隨著人類(lèi)組計(jì)劃的進(jìn)展,把大量和ESTs快速定位到較大的組上成為一種迫切需要。Blast相對(duì)于這種比對(duì)有幾個(gè)缺陷:速度偏慢、結(jié)果難于處理、無(wú)法表示出包含intron的定位。于是用于比較小的序列(如cDNA等)對(duì)大組的比對(duì)。Blast會(huì)把每一個(gè)比對(duì)作Blat把相關(guān)的呈共線(xiàn)性的比對(duì)結(jié)果連接成為更大的比對(duì)結(jié)果,exonsintrons。因此,在相近物種的同源性分析和EST分析中,blat得到了廣泛的應(yīng)用。2SLAFlibraryconstructionandhigh-throughputAnimprovedSLAF-seqstrategywasutilizedinourexperiment.FortheXXEnglandBiolabs,NEB,USA)wereusedtodigestthegenomicDNA.Asinglenucleotide(A)overhangwasaddedsubsequentlytothedigestedfragmentsusingKlenowFragment(3′→5′exo–)(NEB)anddATPat37°C.Duplextag-labeledsequencingadapters(purified,LifeTechnologies,USA)werethenligatedtotheA-tailedfragmentsusingT4DNAligase.Polymerasechainreaction(PCR)wasperformedusingdilutedrestriction-ligationDNAsamples,dNTP,Q5?High-FidelityDNAPolymeraseandPCRprimers(Forwardprimer: 5’-CAAGCAGAAGACGGCG-3’)(purified,LifeTechnologies).PCRproductswerethenpurifiedusingAgencourtAMPureXPbeads(BeckmanCoulter, be,UK)andpooled.Pooledsampleswereseparatedby2%agarosegelelectrophoresis.FragmentsrangingfromXXtoXX(切膠范圍)basepairs(withindexesandadaptors)insizewereexcisedandpurifiedusingaQIAquickgelextractionkit(Qiagen,Hilden,Germany).Gel-purifiedproductswerethendiluted.Andpair-endsequencing(Eachend125bp)wasperformedonanIlluminaHiSeq2500system(Illumina,Inc;SanDiego,CA,USA)accordingtotheSequencedatagrouandSLAFmarkeridentificationandgenotywereperformedusingproceduresdescribedbySunetal1.Briefly,low-qualityreads(qualityscore<20e)werefilteredoutandthenrawreadsweresortedtoeachprogenyaccordingtoduplexbarcodesequences.Afterthebarcodesandtheterminal5-bppositionsweretrimmedfromeachhigh-qualityreads,cleanreadswereclusteredbysimilarityabove90%.SequencesclusteredtogetherweredefinedasoneSLAFlocus3.Singlenucleotidepolymorphism(SNP)lociofeachSLAFlocuswerethendetectedparents,andSLAFswithmorethan3SNPswerefilteredoutfirstly.AllelesofeachSLAFlocuswerethendefinedaccordingtoparentalreadswithdepth>XX-fold(親本深度),whileforeachoffspringthereadswithsequencedepth>X-fold(子代深度)wereusedtodefinealleles.Fordiploidspecies,oneSLAFlocuscancontainatmost4genotypes,soSLAFlociwithmorethanfourallelesweredefinedasrepetitiveSLAFsanddiscardedsubsequently.OnlySLAFswithtwotofouralleleswereidentifiedaspolymorphicandconsideredpotentialmarkers.AllpolymorphismSLAFslociweregenotypedwithconsistencyintheparentalandoffspringSNPloci.ThemarkercodeofthepolymorphicSLAFswereysedaccordingtothepopulationtypeXX(群體類(lèi)型),whichconsistofonesegregationtypesGenotypescoringwasthenperformedusingaBayesianapproachtofurtherensurethegenotyquality1.Firstly,aposterioriconditionalprobabilitywascalculatedusingthecoverageofeachalleleandthenumberofsinglenucleotidepolymorphism.Then,genotyqualityscoretranslatedfromtheprobabilitywasusedtoselectqualifiedmarkersforsubsequentysis.{Sun,2013#26}Low-qualitymarkersforeachmarkerandeachindividualwerecountedandtheworsemarkerorindividualweredeletedduringthedynamicprocess.WhentheaveragegenotypequalityscoresofallSLAFmarkersreachedthecutoffvalue,theprocessstopped.High-qualitySLAFmarkersforthegeneticmapwerefilteredbythefollowingcriteria.First,averagesequencedepthsshould>X-foldineachprogenyand>XX-foldintheparents.Second,markerswithmorethanXX%missingdatawerefiltered.Third,thechi-squaretestwasperformedtoexaminethesegregationdistortion.Markerswithsignificantsegregationdistortion(P<0.05)wereinitiallyexcludedfromthemapconstructionandwerethenaddedlaterasaccessorymarkers.LinkagemapMarkerlociwerepartitionedprimarilyintolinkagegroups(LGs)bythemodifiedlogarithmofodds(MLOD)scores>5.Toensureefficientconstructionofthehigh-densityandhigh-qualitymap,anewlydevelopedHighMapstrategywasutilizedtoordertheSLAFmarkersandcorrectgenotyerrorswithinLGs.4Firstly,binantfrequenciesandLODscoreswerecalculatedbytwo-pointysis,whichwereappliedtoinferlinkagephases.Then,enhancedgibbssampling,spatialsamplingandsimulatedannealingalgorithmswerecombinedtoconductaniterativeprocessofmarkerordering.5,6Briefly,inthefirststageoftheorderingprocedure,SLAFmarkerswereselectedusingspatialsampling.Onemarkerwastakenrandomlyinapriorityorderoftestcross,andmarkerswitha binationfrequencysmallerthanagivensamplingradiusareexcludedfromthemarkerset.simulatedannealingwasappliedtosearchingforthebestmaporder.Summationof binationfractionswascalculatedasillustratedbyLiuetal4.Theannealingsystemcontinueduntil,inanumberofsuccessivesteps,thenewlygeneratedmaporderisrejected.BlockedGibbssamplingwasemployedtoestimate binationfrequenciesoftheparentsaftertheoptimalmaporderofsamplemarkerswereobtained4.Theupdated binationfrequencieswereusedtointegratethetwoparentalmaps,whichoptimizethemaporderinthenextcycleofsimulatedannealing.Onceastablemaporderwasobtainedafter3-4cycles,weturnedtothenextmapbuildinground.Asubsetofcurrentlyunmappedmarkerswasselectedandaddedtotheprevioussamplewithdecreasedsampleradius.mapalgorithmrepea
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 智慧養(yǎng)老模式探索考核試卷
- 數(shù)字化創(chuàng)業(yè)生態(tài)系統(tǒng)的創(chuàng)新生態(tài)系統(tǒng)構(gòu)建策略考核試卷
- 期末應(yīng)用題易錯(cuò)題:三角形、平行四邊形和梯形(含答案)-蘇教版四年級(jí)數(shù)學(xué)下冊(cè)
- 勞務(wù)派遣服務(wù)合規(guī)性咨詢(xún)服務(wù)的質(zhì)量評(píng)估標(biāo)準(zhǔn)考核試卷
- 燃料使用環(huán)境影響評(píng)估考核試卷
- 名詞性從句-2024年高中英語(yǔ)學(xué)業(yè)水平考試考點(diǎn)歸納與測(cè)試(江蘇專(zhuān)用)解析版
- 化學(xué)實(shí)驗(yàn)中規(guī)范答題(練)-2023年高考化學(xué)一輪復(fù)習(xí)
- 遼寧省沈陽(yáng)市于洪區(qū)2023-2024學(xué)年八年級(jí)下學(xué)期期末學(xué)業(yè)水平測(cè)試英語(yǔ)試題(解析版)
- 中小企業(yè)融資困境下供應(yīng)鏈金融創(chuàng)新模式探索與實(shí)踐報(bào)告
- 集合中的新定義 重點(diǎn)練-高考數(shù)學(xué)復(fù)習(xí)備考(含答案)
- 2025年藥劑科轉(zhuǎn)正考試題及答案
- 2025年《中小學(xué)校會(huì)計(jì)制度》試題及答案
- 基孔肯雅熱防控技術(shù)指南2025版培訓(xùn)課件
- 2025發(fā)展對(duì)象考試試題庫(kù)(附含答案)
- 2025年法院書(shū)記員招聘考試筆試試題含答案
- 中醫(yī)婦科醫(yī)師晉升副主任醫(yī)師高職稱(chēng)病例分析專(zhuān)題報(bào)告(痛經(jīng)的中醫(yī)辨證論治)
- 2025年公路交通運(yùn)輸技能考試-道路巡視工考試歷年參考題庫(kù)含答案解析(5套共100道單選合輯)
- 腹透的居家護(hù)理
- 心功能IV級(jí)個(gè)案護(hù)理
- 危險(xiǎn)化學(xué)品企業(yè)安全生產(chǎn)標(biāo)準(zhǔn)化評(píng)審標(biāo)準(zhǔn)
- 新22J01 工程做法圖集
評(píng)論
0/150
提交評(píng)論