19年以來,染色體外環狀DNA(extrachromosomal circular DNA)連續登上Nature,Cell等重磅期刊,成為了**的前沿熱點。近日,云序客戶鄭州大學王立東教授團隊在環狀DNA領域取得重大突破,在國際**期刊Nature Communications(IF=17.69)上發表了環狀DNA成果。云序生物也成為國內shou家并且wei一有10分以上文章發表的
環狀DNA測序(circle-seq)
服務平臺。通過circle-seq等高通量測序技術,作者揭示了賁門*中ERBB2,EGFR等致*基因以環形DNA形式存在并形成了局部擴增,建立了ERBB2局部擴增與賁門*預后之間的關系。
發表期刊:Nature Communications
發表日期:2021年11月11日
影響因子:17.69
研究方法:環狀 DNA 測序(circle-seq)、全基因組測序、全外顯子測序、
文章鏈接:Focal amplifications are associated with chromothripsis events and diverse prognoses in gastric cardia adenocarcinoma
技術路線
研究背景
真核生物當中的染色體外環狀 DNA ***早發現于半個多世紀以前,長期以來被認為與基因組的不穩定性有關。隨著高通量測序技術的逐漸普及,越來越多的染色體外環狀 DNA 被發現。在**研究中,ecDNA 表現出作為**內分區標志物以及**發展分期標志物的潛能。許多全基因組測序的數據分析表明,ecDNA 在不同***類型中具有特異性,并且與致*基因的擴增以及*癥患者的不良預后存在關聯。在*細胞當中,不同染色**點之間可能發生重排、連接和擴增,引發基因組的“局部擴增”(Focal amplification)。早前的研究顯示,超過半數的**樣本中的局部擴增事件,可以用 ecDNA 來解釋。因此,在臨床**樣品中檢測基因組的局部擴增現象,對于理解 ecDNA 在**中的功能具有重大意義。
賁門位于食管和胃的交界處。食管胃結合部腺*(Esophagogastric junction adenocarcinoma)是指起源于上消化道腺上皮并侵犯食管胃結合部的腺***變。傳統上,根據形態解剖上的特征,Siewert 分型法將食管胃結合部腺*分為3型:Ⅰ型:遠端食管腺*,其范圍自齒狀線上5 cm至齒狀線上1 cm;Ⅱ型:真正意義的賁門腺*,范圍自齒狀線近心端1 cm至遠心端2 cm內;Ⅲ型:賁門下腺*,自齒狀線下2~5 cm。目前,東西方學者對于如何定義食管胃結合部腺*仍存在爭議。在西方國家,因為巴雷特食管(Barrett’s esophagus,BE)病變高發,發生在食管和胃結合部的腺*往往被診斷為 Siewert II 型食管胃結合部腺*(Esophagogastric junction adenocarcinoma)。然而,在中國的太行山區的胃賁門腺*(Gastric cardia adenocarcinom,后文簡稱為賁門*)患者中,巴雷特食管病變的發生率很低,此地的賁門*反而與食管鱗*(esophageal squamous cell carcinoma)更具相似性。
研究內容
一、全基因組測序發現局部擴增現象
研究者首先對 36 例賁門*組織進行了全基因組測序(WGS),通過 AmpliconArchitect 軟件分析基因拷貝數異變(CNV)和局部擴增(Focal Amplifications)的情況。共計 28 位病人的 WGS 分析中有檢出局部擴增現象,比例高達 77.8%(28/36),與其它研究報道中食管*的局部擴增的比例(約 80%)相仿,但高于胃*中局部擴增的比例(約 50%)。
圖1.36 位賁門*病人中有 28 位發生了局部擴增
使用 AmpliconArchitect 軟件,研究者進一步將局部擴增的類型細分為環狀 DNA 型、線性 DNA 型、復雜型、“斷裂-融合-橋”型以及其它。對于其中的環狀 DNA 型局部擴增,研究者使用另一種軟件 Circle-finder 進行了**驗證,發現 AmpliconArchitect 方法所發現的環狀 DNA 絕大多數都能在 Circle-finder 中驗證(Fig1),說明軟件對環狀 DNA 的預測是真實可靠的。
圖2.AmpliconArchitect 發現的環狀 DNA 絕大多數能被 Circle-finder 驗證
隨后,研究者對所有的局部擴增位點進行了基因組注釋,發現其中絕大多數位點位于蛋白質編碼區;除此以外,局部擴增在lncRNA 基因區、miRNA 基因區、snRNA 基因區、snoRNA基因區、rRNA 基因區等均有分布;值得注意的是,也有 82 個局部擴增事件發生在致*基因區域。
圖3. 局部擴增位的基因組區域注釋
研究者對這些發生在致*區域的局部擴增事件進行了統計排序,發現發生在 CCNE1 基因的局部擴增事件的頻率**,ERBB2 基因緊隨其后,后文中扮演重要角色的 EGFR 基因上發生局部擴增事件的頻率也不低。研究者利用 TCGA 數據庫中的公開數據,在食管*、賁門*、胃*這三種臨床上相似的*癥之間,比較局部擴增事件出現在各致*基因上的頻率排序,發現賁門*與胃*近似(前兩名都是 CCNE1 和 ERBB2),但與食管*有差異。研究者進一步發生了局部擴增的對環狀 DNA 進行分類,將含有兩個或以上致*基因的環狀 DNA 的局部擴增稱為“共擴增”(co-amplification),單個致*基因來源的則為“非共擴增”(none co-amplification)。依照這一分類標準,可以發現:
(1)超過一半病人有發生兩個或以上致*基因的“共擴增”現象;
(2)在發生了“共擴增”的病人當中,”共擴增“在所有局部擴增事件中所占的比例很高,從50%到100%不等;
(3)有一些致*基因的“共擴增”組合,例如 ERBB2 和 CDK12 的組合,RARA 和 SMARCE1 的組合等,在多個病人當中發生;
(4)EGFR 和 CDK6 的“共擴增”組合,這兩個致*基因在基因組上的距離長達 40 Mbp,但仍形成了一個環狀DNA,并且其局部擴增水平相較于基因組其他區域高出了 40 倍之多。
以上現象強烈暗示,同一個環狀 DNA 上共擴增的多個致*基因,可在賁門*發展過程**同發揮作用。
圖4.致病基因的“共擴增”現象在各個病例中的分布
圖5.致*基因 EGFR 和 CDK6 在同一個環狀 DNA 上共擴增
二、環狀 DNA 測序驗證環狀局部擴增事件的真實性
為了驗證 AmpliconArchitect 軟件預測的環狀 DNA 型局部擴增事件的真實性,研究者將前述 36 位賁門*患者當中的 10 份賁門*組織及其*旁正常組織送來云序生物進行了環狀 DNA 測序(circle-seq)。在 circle-seq流程中,采用 A&A Biotechnology 的純化柱進行環狀DNA富集,并輔以外切酶消化,能**消除線性 DNA 的干擾,保留高純度的環狀 DNA 用于測序。在這 10 份樣品中,AmpliconArchitect軟件預測認為其中 4 份賁門*組織樣品發生了環狀 DNA 型局部擴增,另外 6 份賁門*組織樣品則沒有。Circle-seq 結果顯示,10 份賁門*組織中均有檢出環狀 DNA 的存在。對于 4 份軟件預測認為存在環狀 DNA 型局部擴增的賁門*樣品,絕大多數原先預測存在的環狀 DNA 都被 Circ-seq 驗證發現真實存在。對于局部擴增頻率**的致*基因 CCNE1,在 2 份樣品中,Circle-seq 實驗結果和 AmpliconArchitect 軟件預測都認為 CCNE1 發生了局部擴增;但在所有的正常組織樣品中,Circle-seq 和 AmpliconArchitect 軟件預測都認為不存在 CCNE1 的局部擴增事件——這進一步驗證了 AmpliconArchitec 軟件預測的可靠性。
圖6.四例(S25、S26、S30、S31)AmpliconArchitect 軟件認為存在環狀 DNA 型局部擴增的病例當中,絕大多數環狀 DNA 都可被 Circle-seq 實驗結果驗證
那么,6 份基于 WGS 數據進行軟件預測認為沒有發生環狀 DNA型局部擴增的賁門*組織樣品,為何在 Circle-seq 當中也檢出了環狀 DNA 的存在呢?原來,環狀 DNA 可以被細分為 ecDNA 和 eccDNA,其中 ecDNA 長度較長、拷貝數較高(本文定義為拷貝數>=7),大量研究已經證明 ecDNA 與**的發展和耐藥性有關;eccDNA 長度較短、拷貝數較低(本文定義為拷貝數<7),在真核細胞當中普遍存在,與**的關系不大。在本研究中,在6份基于 WGS 數據進行軟件預測認為沒有發生環狀 DNA型局部擴增的賁門*組織樣品里面,有 4 份當中的環狀 DNA 全都是與**無關的 eccDNA(S21、S28、S29、S32),因此 AmpliconArchitect 軟件其實相對準確地預測出了與**息息相關的 ecDNA 的存在。
圖7.四個病例(S21、S28、S29、S32)當中 Circle-seq 檢測到的環狀 DNA 均為與**無關的eccDNA
三、染色體碎裂是局部擴增的原因
雖然局部擴增現象在多種*癥中都已被發現,但造成局部擴增事件發生的原因,仍然撲朔迷離。"染色體碎裂"(Chromothripsis ,或 Chromosome shattering)是染色體的大片區域發生大規模的重新排列的現象。染色體碎裂使得染色體小片段重新排列,并重新連接,導致形成新的基因組配置。有文獻報道認為,染色體碎裂促使來自不同染色**點的 DNA 重排片段并列在一起,有助于*癥的進展。并且,在染色體碎裂的過程中,伴隨有局部擴增事件以及 ecDNA 擴增子的發生。
因此,研究者下一步就探究了賁門*中染色體碎裂與局部擴增事件之間的關系。對于前述的 36 例賁門* WGS 測序數據,研究者使用 ShatterSeek 軟件包鑒定其中的染色體碎裂事件,發現其中 34 例個案發生了染色體碎裂。研究者進一步制定標準將染色體碎裂事件細分為“高可信度染色體碎裂”(HC)和“低可信度染色體碎裂”(LC),發現高達61%的個案中存在 HC 事件,而 LC 事件更是在接近 90% 的個案中存在。然而,這些染色體碎裂事件的發生次數以及染色**置卻不存在特征規律,在不同個案之間差異很大。作者隨后比較了染色體碎裂以及局部擴增發生的染色**置,發現二者在多個致*基因處都有發生。統計顯示,總計有高達 33.11% 的局部擴增事件發生的位點處也發生了染色體碎裂事件,染色體碎裂與局部擴增之間皮爾森關聯系數達到 0.42,暗示染色體碎裂很可能是局部擴增發生的一種重要來源。由此,作者推測認為,在賁門*中,很可能是因為染色體的碎裂,引發了局部擴增事件的增加,進而促進了賁門*的發展。
圖8.染色體碎裂與局部擴增之間存在正相關關系
四、亞硝胺引發的DNA 損傷是染色體碎裂的原因
那么,又是什么原因導致了染色體的碎裂呢?早前的研究顯示,染色體碎裂與基因組的不穩定性以及 DNA 損傷有關。研究者對多種可能造成基因組不穩定和 DNA 損傷的原因進行了逐一排查,排除了微衛星不穩定性(MSI)和染色體不穩定性(CIN)在賁門*中造成染色體碎裂的可能性,但發現 DNA 雙鏈斷裂與賁門*高度相關——在 34 例發生了染色體碎裂的個案當中,有 29 例通過免疫組化實驗檢出了 DNA 雙鏈斷裂的指標蛋白 γH2AX;并且,在唯二未發生染色體碎裂事件的個案中,均未檢出 γH2AX,說明 DNA 雙鏈斷裂指標蛋白 γH2AX 與染色體碎裂事件的發生高度正相關。研究者還發現,γH2AX 陽性個案當中的染色體碎片長度比 γH2AX 陰性個案中更長,與先前提到的*癥相關的 ecDNA 長度更長的特征不謀而合。因此,作者推測,在賁門*中,很可能是因為 DNA 雙鏈的斷裂,引發了染色體碎裂事件的增加,進而促進了賁門*的發展。
圖9. DNA 雙鏈斷裂指標蛋白 γH2AX 與染色體碎裂事件的發生高度正相關
追根溯源,那么究竟又是什么原因導致賁門*患者的 DNA 雙鏈發生斷裂呢?作者觀察到,原來本研究中所收集的賁門*病例,均來自中國河南省的太行山區,該地區是賁門*的高發區域。太行山區的居民喜食酸菜等富含DNA 烷化劑亞硝胺的食物,作者推測認為,很可能是因為當地居民的飲食傳統導致了亞硝胺的攝入過量,進而引發 DNA 損傷-染色體碎裂-局部擴增,***終導致了賁門*的高發。
五、不同的致*基因局部擴增對賁門*的預后有不同的影響
在多種*癥中都有研究報道,ecDNA 與致*基因的擴增以及*癥的不良預后高度相關。沿著這一思路,研究者在賁門*中,探究了致*基因拷貝數、局部擴增事件、病人預后情況三者之間的關系。
首先,研究者考查了致*基因拷貝數與賁門*與預后之間的關系。在賁門*的 11 個出現頻率**的致*基因當中,研究者將這些致*基因在各個賁門*病人中的拷貝數分為高、中、低三檔,發現局部擴增的致*基因的拷貝數普遍較高。對于 EGFR、MYC、BIRC3 這幾個致*基因,高拷貝數預示著病人較短的存活時長;然而,對于CCNE1、ERBB2 等致*基因,高拷貝數卻預示著病人較長的存活時長。
圖10.基于 WGS 數據的局部擴增分析顯示,EGFR 高拷貝病人存活時間短,CCNE1、ERBB2 高拷貝病人存活時間長
為了更好地確認致*基因拷貝數與賁門*病人存活時長之間的關系,研究者在前述 36 例賁門*病人的基礎上,額外追加了另外 39 例賁門*病人,對共計 75 例病人進行了全外顯子測序(WES)。結果顯示,36 例進行了兩種測序的個案當中,WGS 和 WES 檢出的致*基因拷貝數基本吻合,說明前述基于 WGS 數據所做的研究是可靠的;全體 75 例賁門*病人的 WES 結果也顯示,ERBB2 的擴增預示著病人較長的存活時長。除此之外,作者還從 TCGA 數據庫中獲取公開病例數據,在賁門*病人中,EGFR 高拷貝病人存活時間短,ERBB2 和 CCNE1 高拷貝病人存活時間長,與之前發現的規律相同。由此說明,作者先前得出的致*基因拷貝數與病人存活時長之間的規律關系是具有普適性的,并非先前 36 例小范圍樣本中的個別現象。
圖11.ERBB2 基因的拷貝數與病例生存期之間的關聯關系。左:基于 WES 數據;右:基于 WGS 數據。
隨后,研究者又考查了致*基因局部擴增事件與賁門*預后之間的關系。CCNE1 的局部擴增與病人預后之間沒有**相關關系;EGFR 的局部擴增預示著較短的存活時長;而 ERBB2 的局部擴增則預示著較長的存活時長。
圖12. 不同致*基因局部擴增事件與賁門*預后之間的不同關系
研究者試圖將致*基因 ERBB2 對賁門*預后的影響精確到詳細的*癥分期,但因為測序研究的樣本量太小,不足以得出統計學上有說服力的結論。雖然缺乏大規模的賁門*測序研究的機會,但鄭州大學**附屬醫院自1973 年以來,收集了數以千計的賁門*樣本。研究者從 1668 份賁門*樣本進行了免疫組化實驗,檢驗其中是否存在 ERBB2 蛋白的表達。對于術后存活時長超過兩年的個案而言,免疫組化 ERBB2 陽性的患者的生存率要高于ERBB2 陰性的患者。研究者先前已經發現, ERBB2 的蛋白表達水平與 RNA 表達水平之間的皮爾森關聯系數高達0.79,具有很強的正相關關系。假若 ERBB2 的局部擴增可導致 ERBB2 蛋白的表達水平升高,那么 ERBB2 局部擴增或將可在臨床實踐中作為賁門*良好預后的一個生物標志物。有文獻報道,食道鱗*當中的 ERBB2 蛋白表達水平也與患者的生存率正相關,由此也暗示了賁門*與食道*之間的相似性。
圖13. 對于術后存活時長超過兩年的個案而言,免疫組化 ERBB2 陽性的患者的生存率要高于 ERBB2 陰性的患者。
小結
在這篇論文的研究中,作者們利用WGS數據確定了賁門*患者的局部擴增和ecDNA擴增子,并利用Circle-seq驗證了這些ecDNA擴增子。局部擴增現象存在于大多數賁門*患者中,并在不同的病例中表現出異質性。此外,有一些**基因在賁門*患者中以共擴增的形式存在。進一步,研究者發現,致*基因的局部擴增與染色體碎裂事件高度相關,而該研究所收集的病例當中如此高頻率的染色體碎裂事件的發生,很可能是由于當地飲食中過量攝入的亞硝胺損傷了DNA 雙鏈?;谝陨习l現,作者們推斷,如果對鄭州大學**附屬醫院所收集的大量的賁門*患者樣本進行環狀DNA 檢測,對于未來設計賁門***策略將是大有裨益的。
近年來,由于實驗技術和生信分析技術的進步,環狀DNA相關研究發表 SCI 論文的數量呈井噴之勢增長。PubMed 搜索數據顯示,2017 年環狀DNA 相關論文全世界* 4 篇,后續幾年逐步增長為 6、7、10 篇,而到了現在的 2021 年,***個月,就已經有 15 篇 環狀DNA 相關論文見刊,其中還不乏 Nature、Cancer Cell 等高分期刊,環狀DNA已成為生命科學的**科研熱點之一。
云序生物是國內***早提供環狀DNA測序服務的公司,早在2018年已啟動了環狀DNA測序技術的開發。2019年,云序率先發布了組織細胞環狀 DNA 測序(circle-seq),,并成為A&A Bio**代理(該品牌的環狀 DNA 純化柱被絕大部分環狀DNA高分文章采用)。2020年,云序又相繼發布了血清血漿環狀DNA測序及血清血漿環狀DNA甲基化測序服務,均為全國shou發,并成為國內環狀DNA產品線***全的測序公司。迄今為止,我們已經完成上千例樣品的環狀 DNA 測序,積累了豐富的項目經驗,樣品類型涵蓋:組織﹑細胞﹑血清﹑血漿﹑尿液等,物種涵蓋:人﹑小鼠﹑大鼠﹑擬南芥﹑果蠅﹑酵母﹑非洲爪蟾等。
云序生物 eccDNA 相關產品
云序生物服務優勢
優勢一:國內shou家提供環狀 DNA 測序服務和環狀 DNA 甲基化測序的公司。
優勢二:國內提供環狀 DNA 相關服務產品線j***全的公司。
優勢三:采用 A&A Biotechnology 環狀 DNA 純化柱,環狀 DNA 純化效果好。
優勢四:一站式服務:您只需按照送樣要求向云序生物寄送樣品,我們就能為您完成從環狀 DNA 提取,文庫制備,上機測序到數據分析整套服務流程。
優勢五:嚴格質控流程:云序生物質控流程嚴格,層層把關,為客戶提供高準確度的結果。
優勢六:專業化生物信息分析:云序生物強大生物信息團隊,滿足客戶個性化數據分析要求。
往期回顧