基因定序到手 番外篇 多基因性狀/疾病
前面講完了正規軍路程
基因定序正規三部曲 ->
ACMG 59:大概有85%的人目前沒事
藥物基因檢測:好嘛,我也不是天天吃藥,雖然你說藥物基因會影響台灣人86%的用藥,我也還沒到那個天天吃藥的年齡…(迷之音,要用時再測就來不及了)
帶因者篩檢:我篩到幾個少見的隱性遺傳致病變異點,那也還是生小孩的時候才要面對啊……
那,做基因定序似乎只是追尋自我的過程。追尋自我這個名詞有點中二,像是我們家小朋友耍廢時的藉口,莊重中帶點輕浮,嘿嘿嘿!
真的只是這樣嗎?
其實還有更大的一塊,也是最大最大的一塊,多基因遺傳疾病/性狀。高矮胖瘦智力高血壓糖尿病都屬這一塊。現在其實算得出來,但準確性要看問的問題是什麼?
單基因疾病好預測,是因為這些生產線就只有一條路走,沒有備援功能,中間一個零件壞了就壞了,後果很嚴重,所以很早就被人們注意到,因果關係明顯。像蘇伊士運河的長賜號,它塞在那裏,無法規避,嚴重非常。我們拿到的ACMG/藥物基因/帶因者篩檢,講的都是單基因疾病,有致病變異點,發病的機會就是一般人的幾十倍到幾百倍。
多基因疾病就不一樣了,俗話說條條大路通羅馬,鐵路斷了坐高鐵,高鐵沒了坐飛機,忠孝東路塞了走市民大道,再不成鑽小巷子,鑽來鑽去總能到羅馬,達到堪用的生理要求。厲害的人就是一路綠燈,路上無車,一路順風,半點不浪費,一百公尺跑個9秒8;一般人就是塞塞停停,到處爭道一百公尺要跑個20秒。如果我們把疾病的標準訂在一百公尺跑25秒以上,總是會有人每個基因都差一點,每條路都塞一點,最後弄到25秒以上,我們就說他生病了…哈哈,人為的疾病。就像高血壓,我們就是訂130/90mmHg以上是高血壓,目前和血壓相關的基因超過200個,沒有一個一錘定音的基因,它壞了(或變強了)就一定高血壓。
拿身高來當例子好了,我們要長高(要到羅馬),可以走好多條路,上面有ABCDEFGHIJ幾個基因,每條基因個人變異點不同,做出來的蛋白質效果不同,彼此還會相互影響。要到羅馬(要長高),右邊的基因因素佔了86%左右,其它還有十多趴要靠環境因素,要吃飽睡好運動不要小小就得個結核病。
那怎麼找這些位點咧? 要找多多的人(有些高/有些矮),看好多位點(高的人帶哪些位點基因型/矮的人帶哪些位點基因型),先建立這些位點影響身高的關聯性,然後算出每點的基因型影響身高的權重(effect size),最後,導出來一個polygenic score(多基因分數)幫我們預測性狀,或生病與否。這一套處理的學問叫GWAS(genome wide association study)。
最近最有名的應用是covid 19重症預測的多基因分數,像下表(https://doi.org/10.1038/s41586-020-03065-y)
茫茫基因海中,就是第3條,第6條,第12條,或是尾巴的幾個位點,他們是A還是T/C/G,可以代表當地一整套的基因功能,也就可以預測我們遇到covid 19時重症的機率。掌握基因定序,就可以輕鬆算出自己的風險高低。
譬如我在上述八個位點的基因型分別為
這樣我的分數概算為 1*ln(1.5)+1*ln(1.3)+2*ln(1.3) = 1.19。(現在在商業上賣的癌症預測基因產品哪,藝術天份產品哪,都是這樣算的。但恕我直言,都是摸大象耳朵的層級。)
如果我們有了國家級的biobank,整個族群在上述位點的位點頻率也可以算得出來。譬如我們知道第三條染色體上rs73064425這個位點是T的頻率在台灣只有0.003(TWBB),而在南亞會佔到0.3-0.5,這也許可以解釋covid 19在印度造成重大損害的原因。更引人想像的是,這個位點為T的代表意義是那附近約50kb的區塊是來自尼安德塔人,尼尼的基因藉由covid 19得到存在感!!
再多點想像力,我們的智力和身高,目前看來可以歸納為幾百個位點來決定,如果我們可以篩選出胚胎,盡可能地拿到智力身高都高的基因型,再植回子宮,那麼訂製優生兒就成為事實……嗎? 好喔,多基因性狀的決定除基因外,還有環境的因素在啦,相較於單基因疾病,多基因性狀的未知比已知多得多。還是一句話,一德二命三風水,人生的意義在於把手上分到的牌打好,今天認為的「好」牌,可能下一分鐘天擇就改寫規則。(2019年時誰會知道covid 19對A型血不友善呢? 是吧!)