退化性關節炎 與GDF5基因的增強子
這樣說或許有點不公平,不過大部分的醫學研究的方法學並不複雜,不難歸納出有點類似公式化的模式。偶爾就會出現跳脫出公式化研究方式的論文,得到比套公式更精緻的研究結果。以下要介紹有關退化性關節炎跟GDF5基因增強子(Enhancer)關係的論文,是篇結合公式化醫學研究的方法學,斜槓加上硬派分子生物研究的傑作,深入探索GDF5基因的增強子如何左右一個人會不會得退化性關節炎。
增強子(Enhancer)
介紹正文之前,先用比喻的方式解釋一下什麼是增強子,增強子又跟基因表達有什麼關係。會用到一種直觀但是比較簡陋的比喻,跟另一複雜,又有點抽象的比喻。身體中不同細胞會選擇性地表達一群獨特屬於自己的基因組合,產生跟其他細胞非常不同的蛋白質組合,蛋白質就像細胞使用的工具,利用不同組合的工具,不同的細胞例如神經細胞跟軟骨細胞就長成不同的形狀,執行不同的生理功能。但是仔細想想,自己身體裡的神經細胞跟軟骨細胞都帶著相同的一套基因體DNA序列當藍圖,第二種複雜的比喻比較能夠解釋,怎樣從模擬用相同的一套基因體DNA序列出發,神經細胞跟軟骨細胞最終有辦法表達一群屬於他們自己獨特的基因組合。稍微誇張一點說,細胞基因體處在活化態的增強子的集合,基因表達的集合,蛋白質表達的集合,跟細胞的身份跟宿命 (cell identity, cell fate)有著幾乎是等價的關係,說不定以後會有機會再另闢一篇文章專門說明這種幾乎是等價的關係。
首先直觀的比喻是用燈泡亮不亮來說明基因表達跟不表達 (活化不活化,轉錄或不轉錄出mRNA)。一般基因定序中說的基因序列是燈泡本體 (也就是會轉錄出mRNA的部分),而增強子就像是開關,按開關的手就相當於細胞內的轉錄因子。轉錄因子結合到增強子序列上,會呼叫一整組的蛋白質讓附近的染色體變成適合RNA聚合酶到這裡對這個特定基因進行轉錄的工作。有時燈泡跟開關在基因體中不會隔很遠,甚至躲在基因序列中的内含子(Intron)的序列裡面。有時燈泡跟開關隔非常遠,例如增強子ZRS上的變異點會造成多指症,是因為它影響了一百萬個鹼基配對(鹼基配對是基因體長度的單位,一百萬個鹼基配對是1 million base pairs, 1Mb)以外的sonic hedgehog 基因表現 (參考資料https://pubmed.ncbi.nlm.nih.gov/17152067/)。
比較複雜的比喻是有用個別獨立開關的插座延長線作比喻,它長這個樣子。
在這個比喻裡,基因序列是手機電池,而增強子就像是延長線中透明開關控制的正常插座跟紅色開關控制的USB插座。就像延長線的插頭只有當透明或紅色開關開著時,插上充電線才能幫手機充電,增強子也不是無時無刻都開著,當它處於關閉的狀態,所調控的基因不會活化。圖黑色的轉接頭跟USB插頭類似細胞核裏頭的轉錄因子,插到開著的插頭才能活化下游基因(幫手機電池充電)。圖中iphone lightning充電接頭好比是RNA聚合酶。手機上的lightning插座則類似基因最前面的啟動子(promoter)。當所有東西都到位之後手機電池就能充電。
妳/你身體裡的神經細胞,軟骨細胞,雖然都有一模一樣的基因體序列,就好像是不同的兩個人,雖然都有相同的延長線、lightning充電線、跟iphone,但可能神經細胞完全不用手機,所以有延長線的開關關著,黑色轉接頭,lightning充電線也沒插在上面,iphone也沒接lightning充電線,iphone裡的電池自然沒電。經常使用iphone的軟骨細胞則相反,為了保持iphone的電力足夠,三不五時,延長線、黑色的轉接頭、lightning充電線、跟iphone會接在一起進行充電。到目前為止,簡單版的燈泡開關跟複雜版的iphone充電似乎沒什麼不同,不過神奇的地方在於USB插座並不是多餘的裝置。如果仔細看髖關節、膝關節的軟骨細胞,增強子神奇的地方在於,兩種不同部位的軟骨細胞,其手機充電的方式有著看似細微,但是結果截然不同的差別。
身為軟骨細胞,不論身在髖關節或膝關節都愛用iphone,經常要幫手機電池充電(充電相當於活化GDF5這個等一下要介紹的基因)。在髖關節軟骨細胞中,延長線上只有110伏特插頭的開關是開的,手機用黑色的轉接頭加上lightning充電線進行充電器。但在膝關節軟骨細胞中,延長線上除了110伏特插頭的開關是開之外,USB插頭開關也是開的,手機只需要用lightning充電線,直接接USB插頭就可以進行充電。設計上USB插頭跟110伏特插頭加轉接頭的供電功率不同,所以在髖關節手機電池充飽的程度,常常會跟膝關節手機不一樣。動物演化的過程中,同樣是軟骨細胞,必須先靠著延長線上演化出有多個功率不同,各自有獨立開關的插座(增強子),接下來髖關節跟膝關節各自選擇使用了不同的插座(增強子),才能演化出適合在髖關節或在膝關節兩種不同地方的充電模式(GDF5基因表達模式),讓髖關節跟膝關節的軟骨細胞有不同的特性。
————————–休息分隔線———————正文開始—————————
聰明假說一 GDF5蛋白質的品質跟產生時間,與身體許多不同部位的關節健康息息相關。
繞了一大圈解釋完增強子跟髖關節、膝關節兩種軟骨細胞裡基因表達的關係,回到要介紹的論文,如果要知道退化性關節炎是不是跟基因遺傳有關,公式化的醫學研究就是收集非常多的患者跟正常人,用基因定序或是微陣列基因型分析患者組跟正常對照組中,每個人的全基因體的各個區間的基因型,然後在基因體中找出特殊區間,其患者中出現特定基因型的頻率顯著高於或顯著低於正常人。這種方法學就是報章雜誌越來越常提到的全基因組關聯分析 (genome-wide association study (GWAS)。以現在基因定序,或是微陣列基因型分析自動化的程度,要生出退化性關節炎的全基因組關聯分析的資料,只要很高的研究經費,跟龐大的基因體資料庫,換句話說只是荷包痛而已,還不需要到頭痛。全基因組關聯分析後會有個清單,標示出基因體中數個到上百個區間,這些區間的基因型跟發生膝關節炎有統計學上顯著的意義。根據研究,至少有35個區間基因型跟退化性關節炎有統計上意義的高度相關(參考資料 https://www.nature.com/articles/s41467-019-10439-y)。如果統計方法再放寬一些,跟退化性關節炎相關的基因還會更多。要從數十到上百個基因型篩出講得出道理的特定基因,跟特定基因型,才是開始屬於研究中透腦筋的部分。這篇論文有個聰明的點,研究者先篩出了GDF5這個基因,因為加上退化性關節炎,GDF5區間 (正確的說是GDF5-UQCC1 locus這個連鎖不平衡(Linkage Disequilibrium ; LD) 區間) 的基因型,總共跟13種關節性疾病或表現型有關,暗示GDF5基因產生的GDF5蛋白質的品質跟產生的GDF5蛋白質的時間,與身體許多不同部位的關節健康息息相關。
聰明假說二 GDF5附近兩個不同的增強子變異造成膝關節和髖關節表現不同
生物上會有一個基因跟多於一種疾病有關的情況發生。以關節炎為例個別患者只會得13種關節性疾病或表現型其中的少數一些症狀,而不會所有13種的疾病或表現型都同時出現在一個人身上。想起來有些詭異,同一個基因壞掉,不同壞法會造成不同症狀的病。發生這種情況的分子機制很多,第一種情況是,位在基因本體的不同變異點造成蛋白質功能下降的程度跟性質不同,所以在身體不同的部位造成疾病,或是造成不同類型的疾病,這種狀況叫做allelic diseases,多半是屬於盛行率低,但外顯率高的罕見疾病,跟關節炎這類常見疾病有所不同。關節炎這類常見疾病比較可能屬於第二種情形,即變異點出現在基因體中增強子的位置。GWAS 研究中。被報告跟疾病有相關的變異點,通常是代表一整段連鎖不平衡(Linkage Disequilibrium ; LD)區間跟疾病有相關性。這整段連鎖不平衡區間裡,常常包含多個增強子(Enhancer)跟基因本體上的各個變異點。這些變異點因為連鎖不平衡得關係,在人群的基因體分析中,總是同進同出,如果帶有A變異點就同時帶有B、C、D變異點,如果不帶A變異點就同時不帶有B、C、D變異點,所以很難分清楚A、B、C、D其中誰才是導致疾病發生得元凶。在GDF5例子正是如此,這是醫學研究的瓶頸,無法從GWAS結果直接推論出疾病的致病機轉。為了突破這個瓶頸,作者做了一個聰明的假說,假設跟退化性膝關節相關的變異點,與跟髖關節發育不良(developmental dysplasia of the hip),雖然都跟GDF5附近的變異點有關,但其實是由兩個不同的增強子的變異點所造成的。
用ATAC-seq 找不同插座 rs4911178 rs6060369
如果這個假說成立,那回到手機電池的比喻,研究者要先找到相當於髖關節軟骨細胞手機充電器插在哪種插座(增強子)上,也要找到相當於膝蓋軟骨細胞手機充電器插在哪種插座。實驗上的做法是利用定序轉座酶可接觸的染色質分析法(assay for transposase-accessible chromatin using sequencing,以下都簡稱 ATAC-seq),先問髖關節軟骨細胞跟膝蓋軟骨細胞中的延長線上,哪幾個開關是開著可以使用的。這個分析方法等於是拿三用電表對著插頭,一個一個測試不是可以通電,測試的結果就可以分別知道兩個關節中究竟哪幾個插座是通電的。為此研究者很神奇地收集到發育到第67天的”人類”胚胎,取胚胎膝關節跟髖關節的軟骨細胞,進行ATAC-seq實驗。結果發現,GDF5基因附近有個被研究過並且命名為GROW1的增強子(110V 開關),在髖關節與膝關節軟骨細胞都處於活化態,而且剛好有個rs4911178變異點在GROW1序列裡面。另外還有一個也被研究過會並且命名為R4的增強子(USB開關),只在膝關節軟骨細胞活化,在髖關節軟骨細胞則是關閉的狀態,R4增強子序列中也包含了一個rs6060369變異點。到此算是離開公式化的醫學研究,邁向創新研究的第一關。
小規模研究結果證明兩個插座和疾病相關性
第二關研究者正式算一下rs4911178 (G → A)變異點,是不是真的在髖關節發育不良的病人比較高,論文中提供的證據有好幾個,其中一個是在113 確診髖關節發育不良的病人中,83 個病人這個位置上帶有疾病關聯的 “A/ A” 基因型,只有5個病人是非疾病關聯 “G/G” 基因型,暗示GROW1的序列真的會影響髖關節的健康。同樣的R4增強子上 rs6060369 (C → T)變異點,也會影響退化性關節炎,兩年追蹤的研究,在膝關節沒有惡化的受試者中,rs6060369 (C → T)基因型的比例比較少,膝關節持續惡化的人,rs6060369 (C → T)基因型的比例比較高。更神奇的是實際測量顯示,這個rs6060369位置上是 “T/T”基因型的人,膝關節面積比較小,構成膝關節下緣的股骨頭比較突起,加起來膝關節面承受的壓力比較大。到這裡算是過了第二關。大部分的醫學研究不得已只能停在這裡,如果考慮變異點通常是代表一整段連鎖不平衡(Linkage Disequilibrium ; LD),rs4911178 (G → A),rs6060369 (C → T)都在所謂的GDF5-UQCC1 locus這個LD 區間,目前還沒有排除是GDF5-UQCC1 locus這個LD 區間內另一個變異點才是主導 GDF5 功能性變化,導致退化性關節炎跟髖關節發育不良這兩個病的原因。我們一直強調 ” 相關性不一定是因果關係”(association is not causation),到目前為止雖然ATAC-seq是神來一筆的研究結果,鎖定了GROW1裡的rs4911178 (G → A),R4裡的,也有病人的統計資料支持,但是還沒能脫離相關性,進入推導因果關係的研究範疇。
基因小鼠重現單點變異=>疾病
第三關,理論上要證明R4裡的rs6060369 (C → T)是退化性關節炎的原因,我們需要將病人膝關節軟骨細胞裡rs6060369 T/T基因型改成C/C基因型,但整個GDF5-UQCC1這個LD 區間的其他序列都不改變,然後看臨床症狀是不是有改善。可惜這種基因剪輯的研究技術目前還不到位,醫學倫理上也會有爭議。為了解決這個困境,這篇研究作者硬是神奇地變出rs6060369 T/T點突變的小鼠。跟對照組小鼠比較,rs6060369 T/T的小鼠一樣會發生膝關節面積比較小,股骨頭比較突起,膝關節面承受的壓力比較大的情形。論文裡對於髖關節發育不良也建立了rs4911178 A/A點突變小鼠,跟對照組小鼠比較發現rs4911178 A/A小鼠的髖關節出生即有異常發育的現象。因為rs6060369 T/T,rs4911178 A/A小鼠跟對照組的基因體幾乎一模一樣,只在GROW1跟R4兩個增強子序列中有個鹼基的差異,所以可以排除在小鼠GDF5-UQCC1 locus區間有其他序列變異點造成類似退化性關節炎跟髖關節發育不良的狀況,強烈暗示在人的基因體中應該也是rs6060369 T/T,rs4911178 A/A主導產生這兩種病態性狀。如果在此結束,其實論文已經夠有深度了,不過研究者又往下走了一步。
第四關,作者進一步測量UQCC1跟GDF5表現量,發現GROW1增強子剔除小鼠跟R4增強子剔除小鼠的軟骨細胞中,只有GDF5的表現量受影響,UQCC1的表現量則不變,說明增強子剔除突變鼠的關節問題根本的原因是GDF5表現量不足的緣故。作者也將rs6060369 T/T,rs4911178 A/A,GROW1增強子剔除,跟R4增強子剔除四種小鼠的關節變形成度跟GDF5表現量下降程度作回歸,發現兩者正相關並且統計上有顯著意義。
科學上這篇論文還有超乎GDF5、髖關節、膝關節疾病的價值,它很細膩地說明在基因體中,演化出多個不同增強子(GROW1增強子跟R4增強子,延長線兩種獨立開關,且輸出功率不同的插座),在不同的時空負責同一個基因(GDF5)表達的好處。這種多對一的基因調控模式,豐富了GDF5基因在身體不同部位表達方式的多樣性。有了這種多樣性,演化中可以不至於牽一髮動全身的前提下,出現只對髖關節作改變的GDF5 變異點(突變),而增加產生適應新環境的性狀的可能性。想想,在演化的路上,我們跟黑猩猩這兩個分支,肩關節,髖關節是走不同的方向,人類愈往直立行走演化,人類的髖關節比大猩猩承受愈多比例的身體重量。相反的肩關節承受更少比例的身體重量。如果沒有多個增強子,分別負責肩關節,髖關節的發育,那就不可能演化出人類直立行走的能力。同樣的,說不定不用等很久,科學家也會發現發育中調控長骨粗細長短的基因(或者基因組合)。如果肱骨(上臂的骨頭),跟股骨(大腿骨)不能演化出獨立的基因調控機制,那人類的腳永遠不能變長,不能演化出適合在非洲草原奔跑狩獵的祖先。人類跟黑猩猩得 基因體序列只有2%的不同,不同處也多半落在基因本體之外,推測,數百萬年的演化過程,靠增強子跟基因有著多個增強子調控單一基因的架構,人類跟黑猩猩得用幾乎一樣的工具(基因做出來的蛋白質),但各自演化出不同的使用方式跟時間,才會長得那麼不一樣。以上增強子跟演化的關係一直以來都還只是臆測,本篇論文雖然只觸及人類跟小鼠演化上功能性保留的GROW1增強子跟R4增強子,但說明了用工具(基因做出來的蛋白質)一樣,使用方式跟時間各有巧妙的原理,也增強了增強子跟演化關係臆測的可信度。
最後討論一下,雖然讀完論文覺得GDF5真的能決定膝關節會不會發生退化性關節炎,不過還是好奇其影響的程度是多少呢?GWAS的統計結果會給個危險對比值 (Odds Ratio,OR),查起來GDF5基因型導致退化性關節炎發生的危險對比值是1.08-1.12,也就是最壞最壞增加10%左右的風險,所以如果事先知道自己帶著rs6060369 T/T基因型,因此運動前熱身,選擇膝關節負擔小的運動,說不定長時間提醒自己要小心保護自己的膝蓋,結果變成是件好事,四五十年下來,膝關節反而保養得比帶有rs6060369 C/C基因型,但揮霍自己膝關節的人還好。或許看到這裡,您會想,搞什麼,花了那麼多研究力氣,衝到第四關,結果是對沒有決定性角色的GDF5作研究?這樣想好像對,又好像錯。10%左右的風險在單基因遺傳疾病中,或許真的是笑話,但對多基因遺傳性疾病而言,10%左右的風險可是大咖噢!
參考文獻:
rs4911178,rs6060369變異點的精緻研究
https://www.nature.com/articles/s41467-021-24345-9
GDF5影響退化性關節的程度
https://www.nature.com/articles/s41588-018-0327-1