突變擴增阻滯系統(amplification refractory mutation system, ARMS)能夠利用單個PCR反應體系同時檢測兩個等位基因,不需要限制性核酸內切酶,具有快速、價廉的優點,并可以區分等位基因是否純和。目前,ARMS系統已成為國際上腫瘤個體化分子檢測最重要、最先進的技術之一,其在臨床應用中的優勢已被業內專家廣泛認可。
ARMS技術利用特異引物對突變靶序列進行高精準PCR擴增放大,與此同時,利用探針對擴增產物進行檢測,在實時熒光定量 PCR平臺上實現對樣品DNA中稀有突變的檢測,以達到對基因突變檢測的高特異性和高靈敏度。ARMS方法檢測靈敏度明顯高于直接測序法等其他方法,可檢測出樣品中含量低至0.1-1.0%的突變基因;該方法在設計上可以最大限度地縮短目標產物的長度,可以解決石蠟包埋組織標本提取的DNA大部分片段化而無法得到準確檢測結果的難點;該方法結合實時PCR平臺實現擴增時閉管操作,操作簡單,無需產物的后處理,能最大程度地避免擴增產物的污染。
目前,全球只有兩家企業擁有ARMS技術和相應產品,廈門艾德生物醫藥科技有限公司擁有自主知識產權的ADx-ARMS專利——引物改造技術、獨特的緩沖體系以及二次擴增放大的多重設計,廈門艾德憑借ADx-ARMS?技術成功開發了一系列的分子診斷產品(ADx?-EGFR、ADx?-KRAS、ADx?-BRAF等),是我國首批獲得國家藥監局《醫療器械注冊證》和歐盟認證的產品,已在我國100多家三甲醫院使用,并遠銷30多個國家和地區;跨國制藥公司阿斯利康等國內外知名機構通過對ADx?-EGFR等產品的嚴格對比和論證,認為艾德生物醫藥的技術和產品均已達到國際先進水平,其用于檢測EGFR、KRAS、BRAF等基因突變具有簡單、方便、快速、靈敏、準確等優點,在臨床上有著重要的應用價值。
染色體核型分析(karyotype analysis):將待測的細胞的染色體按照該生物固有的染色體形態特征和規定,進行配對、編號和分組,并進行形態分析的過程。不同物種的染色體都有各自特定的形態結構(包括染色體的長度、著絲點位置、臂比、隨體大小等)特征,而且這種形態特征是相對穩定的。
染色體核型分析是細胞遺傳學研究的基本方法,是研究物種演化、分類以及染色體結構、形態與功能之間人類G顯帶核型圖譜關系所不可缺少的重要手段。經行核型分析后,可以根據染色體結構和數目的變異來判斷生物的病因,比如是由于缺少了什么樣的基因才導致的這種疾病。還可根據單個堿基的差異,精確判斷染色體DNA鏈中的基因突變。
正常人的體細胞染色體數目為46條,并有一定的形態和結構。染色體在形態結構或數量上的異常被稱為染色體異常,由染色體異常引起的疾病為染色體病。現已發現的染色體病有100余種,染色體病在臨床上常可造成流產、先天愚型、先天性多發性畸形、以及癌癥等。臨床上染色體檢查的目的就是為了發現染色體異常和診斷由染色體異常引起的疾病。
人類染色體用Giemsa染料染色呈均質狀,但是如果染色體經過變性和(或)酶消化等不同處理后,再染色可呈現一系列深淺交替的帶紋,這些帶紋圖形稱為染色體帶型。顯帶技術就是通過特殊的染色方法使染色體的不同區域著色,使染色體在光鏡下呈現出明暗相間的帶紋。每個染色體都有特定的帶紋,甚至每個染色體的長臂和短臂都有特異性。根據染色體的不同帶型,可以更細致而可靠地識別染色體的個性。染色體特定的帶型發生變化,則表示該染色體的結構發生了改變。一般染色體顯帶技術有G顯帶(最常用),Q顯帶和R顯帶等。
在核型圖的組成中,人類常染色體依照長度遞減的順序用數字1到22表示,性染色體用X和Y標示。依照染色體大小遞減的順序和著絲粒的位置,可將其分為七組(A-G組):
|
染色體號 |
染色體大小 |
著絲粒位置 |
隨體 |
次縊痕 |
A |
1-3 |
最大 |
中著絲粒 亞中著絲粒 中著絲粒 |
無 |
常見于1號 |
B |
4-5 |
次大 |
亞中著絲粒 |
無 |
|
C |
6-12+X |
中等 |
亞中著絲粒 |
無 |
常見于9號 |
D |
13-15 |
中等 |
近端著絲粒 |
有 |
常見于13號 |
E |
16-18 |
較小 |
中著絲粒 亞中著絲粒 亞中著絲粒 |
無 |
常見于16號 |
F |
19-20 |
較小 |
中著絲粒 |
無 |
|
G |
21-22+Y |
最小(Y有變異) |
近端著絲粒 |
有(Y無) |
|
(表1)人染色體分組
圖1:人類染色體核型G顯帶標準圖譜
圖2:人類(男性)正常染色體核型(G顯帶)
第二代測序技術的核心思想是邊合成邊測序(Sequencing by Synthesis),即通過捕捉新合成的末端的標記來確定DNA的序列,現有的技術平臺主要包括Roche/454 FLX、Illumina/Solexa Genome Analyzer和Applied Biosystems SOLID system。在Sanger等測序方法的基礎上,通過技術創新,用不同顏色的熒光標記四種不同的dNTP,當DNA聚合酶合成互補鏈時,每添加一種dNTP就會釋放出不同的熒光,根據捕捉的熒光信號并經過特定的計算機軟件處理,從而獲得待測DNA的序列信息。
概述
DNA測序(DNA sequencing)作為一種重要的實驗技術,在生物學研究中有著廣泛的應用。早在DNA雙螺旋結構(Watson and Crick,1953)被發現后不久就有人報道過DNA測序技 術,但是當時的操作流程復雜,沒能形成規模。隨后在1977年Sanger發明了具有里程碑意義的末端終止測序法,同年A.M.Maxam和 W.Gilbert發明了化學降解法。Sanger法因為既簡便又快速,并經過后續的不斷改良,成為了迄今為止DNA測序的主流。然而隨著科學的發展,傳 統的Sanger測序已經不能完全滿足研究的需要,對模式生物進 行基因組重測序以及對一些非模式生物的基因組測序,都需要費用更低、通量更高、速度更快的測序技術,第二代測序技術(Next-generation sequencing)應運而生。這三個技術平臺各有優點,454 FLX的測序片段比較長,高質量的讀長(read)能達到400bp;Solexa測序性價比最高,不僅機器的售價比其他兩種低,而且運行成本也低,在數 據量相同的情況下,成本只有454測序的1/10;SOLID測序的準確度高,原始堿基數據的準確度大于99.94%,而在15X覆蓋率時的準確度可以達 到99.999%,是目前第二代測序技術中準確度最高的。雖然第二代測序技術的工作一般都由專業的商業公司來完成,但是了解測序原理、操作流程等會對后續 的數據分析有很重要的作用,下文將以Illumina/Solexa Genome Analyzer 測序為例,簡述第二代測序技術的基本原理、操作流程等方面。
基本原理
Illumina/Solexa Genome Analyzer測序的基本原理是邊合成邊測序。在Sanger等測序方法的基礎上,通過技術創新,用不同顏色的熒光標記四種不同的dNTP,當DNA聚合酶合成互補鏈時,每添加一種dNTP就會釋放出不同的熒光,根據捕捉的熒光信號并經過特定的計算機軟件處理,從而獲得待測DNA的序列信息。
操作流程
1)測序文庫的構建(Library Construction)
首先準備基因組(雖然測序公司要求樣品量要達到200ng,但是Gnome Analyzer系統所需的樣品量可低至100ng,能應用在很多樣品有限的實驗中),然后將DNA隨機片段化成幾百堿基或更短的小片段,并在兩頭加上特定的接頭(Adaptor)。如果是轉錄組測序,則文庫的構建要相對麻煩些,RNA片段化之后需反轉成cDNA,然后加上接頭,或者先將RNA反轉成cDNA,然后再片段化并加上接頭。片段的大小(Insert size)對于后面的數據分析有影響,可根據需要來選擇。對于基因組測序來說,通常會選擇幾種不同的insert size,以便在組裝(Assembly)的時候獲得更多的信息。
2)錨定橋接(Surface Attachment and Bridge Amplification)
Solexa測序的反應在叫做flow cell的玻璃管中進行,flow cell又被細分成8個Lane,每個Lane的內表面有無數的被固定的單鏈接頭。上述步驟得到的帶接頭的DNA 片段變性成單鏈后與測序通道上的接頭引物結合形成橋狀結構,以供后續的預擴增使用。
3)預擴增(Denaturation and Complete Amplification)
添加未標記的dNTP 和普通Taq 酶進行固相橋式PCR 擴增,單鏈橋型待測片段被擴增成為雙鏈橋型片段。通過變性,釋放出互補的單鏈,錨定到附近的固相表面。通過不斷循環,將會在Flow cell 的固相表面上獲得上百萬條成簇分布的雙鏈待測片段。
4)單堿基延伸測序(Single Base Extension and Sequencing)
在測序的flow cell中加入四種熒光標記的dNTP 、DNA聚合酶以及接頭引物進行擴增,在每一個測序簇延伸互補鏈時, 每加入一個被熒光標記的dNTP就能釋放出相對應的熒光,測序儀通過捕獲熒光信號,并通過計算機軟件將光信號轉化為測序峰,從而獲得待測片段的序列信息。 從熒光信號獲取待測片段的序列信息的過程叫做Base Calling,Illumina公司Base Calling所用的軟件是Illumina’s Genome Analyzer Sequencing Control Software and Pipeline Analysis Software。讀長會受到多個引起信號衰減的因素所影響,如熒光標記的不完全切割。隨著讀長的增加,錯誤率也會隨之上升。
5)數據分析(Data Analyzing)
這一步嚴格來講不能算作測序操作流程的一部分,但是只有通過這一步前面的工作才顯得有意義。測序得到的原始數據是長度只有幾十個堿基的序列,要通過生物信息學工具將這些短的序列組裝成長的Contigs甚至是整個基因組的框架,或者把這些序列比對到已有的基因組或者相近物種基因組序列上,并進一步分析得到有生物學意義的結果。
表觀遺傳學(Epigenetics)指DNA序列不變,而基因表達卻發生了可遺傳的改變。這種改變是細胞內除了遺傳信息以外的其他可遺傳物質發生的改變,且這種改變在發育和細胞增殖過程中能穩定傳遞。表觀遺傳調控包括DNA甲基化,組蛋白修飾(磷酸化,乙酰化,甲基化等)和小RNA調節,是在DNA序列的基礎上對基因表達的調節,是細胞分化的本質。
DNA甲基化是指在DNA甲基化轉移酶的作用下,在基因組CpG二核苷酸的胞嘧啶5'碳位以共價鍵結合一個甲基基團。正常情況下,人類基因組中的“垃圾”序列的CpG二核苷酸相對稀少,并且總是處于甲基化狀態;與之相反,人類基因組中大小為100-1000 bp左右且富含CpG二核苷酸的CpG島則總是處于未甲基化狀態,并且與56%的人類基因組編碼基因相關。由于DNA甲基化與人類發育和腫瘤疾病的密切關系,特別是CpG島甲基化所致抑癌基因轉錄失活問題,DNA甲基化已經成為表觀遺傳學和表觀基因組學的重要研究內容。
焦磷酸測序(Pyrosequencing)技術作為一種新的序列分析技術,該技術無須進行電泳,DNA片段也無須熒光標記,操作極為簡便,能夠快速地檢測甲基化的頻率,對樣品中的甲基化位點進行定性及定量檢測,為甲基化研究提供了新的途徑。