由中國企業(yè)家俱樂部主辦的“2017中國綠公司年會(huì)”于4月22日-24日在河南鄭州召開,貝瑞和康CEO周代星出席并發(fā)言。周代星介紹,人類的23對(duì)染色體各司其職,如同一本書的23個(gè)章節(jié),每個(gè)章節(jié)都起非常重要的作用,有的基因突變直接和一些疾病有關(guān),有的突變則影響到人的性格,比如,有的會(huì)使人變得懶惰,有的則使人喜歡冒險(xiǎn),追求刺激。
科學(xué)研究也表明,實(shí)際上確實(shí)有一些基因會(huì)給人類似“超人”的能力,現(xiàn)在發(fā)現(xiàn)有5種基因與此有關(guān)。有的能讓人表現(xiàn)為耐受力更強(qiáng),更精力旺盛,有的基因突變后,人只需要四小時(shí)的睡眠就夠了。
他表示,現(xiàn)在的無穿透檢測(cè)技術(shù),可以把所有遺傳疾病,在小孩出生前查出來,只要能承擔(dān)這個(gè)成本。從某種程度上,腫瘤比胎兒更容易做。因?yàn)閺牡谝粋€(gè)細(xì)胞變成腫瘤細(xì)胞,到能被影像學(xué)識(shí)別的腫瘤,一般情況下差不多要十年左右,如果檢測(cè)手段非常準(zhǔn)確的話,有足夠長時(shí)間把這些腫瘤查出來。
周代星認(rèn)為,人類基因測(cè)序成本每六個(gè)月下降一次,人類對(duì)自身的認(rèn)識(shí)越來越深,它的應(yīng)用也開始出現(xiàn)。今后的方向是把檢測(cè)成本不斷降低?,F(xiàn)在要做的是把更多疾病的基因數(shù)據(jù)庫建立起來,對(duì)治療產(chǎn)生影響。
以下為發(fā)言實(shí)錄:
基因究竟是什么?在座的各位可能多多少少有一點(diǎn)了解,但怎么定義一個(gè)基因?其實(shí)在人類知識(shí)發(fā)展過程中花了很長時(shí)間才對(duì)基因有所認(rèn)識(shí)。我們今天能夠講得比較清楚是因?yàn)榍叭撕芏嗟墓ぷ鳌?/p>
這張圖顯示了我們?nèi)藦囊粋€(gè)細(xì)胞到基因的結(jié)構(gòu)過程。我們?nèi)擞?7萬億的細(xì)胞,細(xì)胞有各種各樣的功能。除了一些比較特殊的細(xì)胞之外,每一個(gè)細(xì)胞都有一個(gè)細(xì)胞核,還有染色體。這個(gè)染色體你要不斷拉伸之后,會(huì)得到脫氧核糖核酸的成分,由四個(gè)堿基組成,這些成分在我們這里用GATC來代表。
基因是什么?基因就是染色體里面的一個(gè)片斷,有大有小,大到80多萬個(gè)堿基,小到幾十個(gè)堿基。人的基因組由23對(duì)染色體組成,每一個(gè)染色體就像一根彈簧。
發(fā)現(xiàn)人有23對(duì)染色體其實(shí)不是那么簡(jiǎn)單。在1955年之前,整個(gè)人類認(rèn)為我們有48條染色體。人只有23對(duì)染色體是由一位印尼華僑蔣有興1955年12月22號(hào)到瑞士去做研究的時(shí)候發(fā)現(xiàn)的。他發(fā)現(xiàn)人的染色體實(shí)際上只有23對(duì),總共46條。從那兒就開始23對(duì)染色體就成了大家的共識(shí)。
我們后面會(huì)提到的,人類基因組測(cè)序結(jié)束之后,我們知道23對(duì)染色體各司其職,你要是把染色體存在的信息看作是一本書的話,這本書共有23個(gè)章節(jié),每個(gè)章節(jié)都起非常非常重要的作用。這些章節(jié)如果出現(xiàn)了偏差會(huì)對(duì)人產(chǎn)生什么樣的影響?當(dāng)然有一些偏差,大家也都知道,會(huì)產(chǎn)生疾病。那疾病又是什么樣的?
我們先說大的偏差,這23個(gè)章節(jié)如果有一個(gè)章節(jié)出現(xiàn)重復(fù),人會(huì)是怎么樣?這個(gè)圖顯示的是一種疾病,叫唐氏綜合癥,是21號(hào)染色體重復(fù)。那有沒有其他的染色體重復(fù)呢?比如1號(hào)、5號(hào)染色體重復(fù)會(huì)是什么樣?現(xiàn)在沒有看到其它染色體重復(fù)的疾病,是因?yàn)檫@樣的重復(fù)對(duì)發(fā)育太重要了,人生不出來,。所以我們只看到對(duì)唐氏綜合體的存在。這是整條染色體重復(fù)的狀態(tài)。
那么有沒有染色體部分的重復(fù)或缺失,有的話,對(duì)人產(chǎn)生什么影響?我們看小一點(diǎn),一條染色體里面的一部分重復(fù)或缺失了。這張圖列了幾種重復(fù)缺失的存在。有一個(gè)疾病是22號(hào)染色體上面有200萬個(gè)堿基缺失了。我們會(huì)看到右邊這個(gè)小孩生出來是兔唇,這是DiGeorge疾病(音)的小孩。DiGeorge病人并不是所有的都兔唇。70%的DiGeorge病人有先天性心臟病,30%有先天性腎臟病。這是一個(gè)案例,就是我們?nèi)旧w缺了一段,多了一段的案例。
如果再進(jìn)一步,我的染色體并不是多了或少了一段,而是只有一個(gè)字節(jié),就一個(gè)堿基發(fā)生了改變。后面會(huì)提到人的基因組有30億對(duì)堿基。整個(gè)信息的量相當(dāng)于一部稍微長一點(diǎn)的電影的信息量。這個(gè)電影里面有一個(gè)字節(jié)出現(xiàn)了偏差,會(huì)產(chǎn)生什么樣的情況?
這張圖顯示的是是一個(gè)案例,這是最早被人類發(fā)現(xiàn)的一個(gè)疾病,叫黑尿癥,1905年發(fā)現(xiàn)的,跟遺傳有關(guān),但那個(gè)時(shí)候并不知道遺傳信息是什么。在接近100年的努力之后,1996年才把黑尿癥的基因突變定位在3號(hào)染色體這個(gè)位置上面,到了那時(shí)候這個(gè)基因才被克隆。
人類最普遍的遺傳疾病是色盲,8%的男人是色盲。色盲為什么會(huì)這么普遍?色盲主要由三個(gè)基因主導(dǎo),有兩個(gè)基因在X染色體上。女性有2條X染色體,男性有一條X染色體。如果這些控制顏色識(shí)別的基因出現(xiàn)差錯(cuò)就會(huì)產(chǎn)生色盲,所以男性比較容易得色盲。
我們仔細(xì)想一想這個(gè)事情,實(shí)際上我們?cè)谧哪行砸牢覀兪翘幱诹觿?shì)的,人類的另一個(gè)分支女性實(shí)際上比我們要有優(yōu)勢(shì),就是因?yàn)樗?條X染色體。
我剛才提到的基因突變好像都不是那么嚴(yán)重,要么是尿黑了,要么識(shí)別不了顏色,都跟顏色有關(guān)。其實(shí)不然,我們?nèi)祟愌芯苛嘶蚝图膊『芏嗄辏袔浊ХN疾病和基因突變有關(guān),有一些突變導(dǎo)致非常嚴(yán)重的疾病。
這里舉一個(gè)例子,NF1基因的突變,會(huì)導(dǎo)致一種疾病,叫Neuofibromatosis Type1,表現(xiàn)為外表皮膚會(huì)產(chǎn)生肉瘤,多了會(huì)把人的眼睛、嘴巴蓋住,這些人經(jīng)常會(huì)引起呼吸困難,甚至導(dǎo)致死亡。當(dāng)然這個(gè)疾病會(huì)有一個(gè)怪的現(xiàn)象,每個(gè)人的身上出現(xiàn)的程度不太一樣。最右邊圖顯示的是這些人得的是同樣位置的突變,但是他的程度不是那么嚴(yán)重,這牽扯到基因表達(dá)的問題,人的基因有兩個(gè)拷貝,如果一個(gè)拷貝表達(dá)量超過另外一個(gè)拷貝,雖然另外一個(gè)拷貝有異常,但不一定能顯示出來,這在遺傳學(xué)上叫基因的穿透。
剛才提到基因有那么多跟疾病關(guān)的突變,有沒有跟疾病沒有關(guān)系的突變呢?這個(gè)基因是DRD5,這個(gè)基因有4個(gè)外顯子,即表達(dá)蛋白質(zhì)的部分。其中第三個(gè)外顯子有一個(gè)48個(gè)堿基的重復(fù),有的人是兩個(gè)重復(fù),有的人只有一個(gè)重復(fù),有的人有11個(gè),平均起來差不多是4個(gè)重復(fù),這個(gè)重復(fù)跟人的性格有很大關(guān)系。動(dòng)物也有這個(gè)基因,跟動(dòng)物的性格也有非常大的關(guān)系。人們?cè)?jīng)做過一個(gè)實(shí)驗(yàn),如果把長的重復(fù)片斷去掉,或者把整個(gè)基因去掉的話,小鼠會(huì)變得很懶惰,甚至懶惰到看到食物不愿意吃,最后饑餓而死的狀態(tài)。在人群里面沒有看到這么懶惰的人,但這個(gè)基因的重復(fù)度對(duì)性格還是起一定的作用。
這個(gè)基因如果含有長的重復(fù),這種人就很喜歡冒險(xiǎn),早上會(huì)去坐過山車,中午還覺得不夠過癮,到晚上還希望做上飛機(jī)跳個(gè)傘,很喜歡刺激。這些人靜不下來。這個(gè)關(guān)聯(lián)以前有人認(rèn)為跟性格疾病沒關(guān),科學(xué)依據(jù)不強(qiáng)。一直到最近,美國一個(gè)大學(xué)做了一項(xiàng)研究,大學(xué)生經(jīng)常有一些一夜情等的人。這項(xiàng)研究對(duì)他們做一個(gè)調(diào)研,發(fā)現(xiàn)這些人大部分都是長的重復(fù),就是7對(duì)以上重復(fù)的人比較多,所以基因跟性格是有一定的關(guān)系。
當(dāng)然對(duì)基因想象力最大的,是大家想有沒有超人基因。這張圖顯示的是加州東面,有一個(gè)滑雪圣地,叫Olympic Valley。這是我兩個(gè)星期之前在那個(gè)地方拍的,那個(gè)地方現(xiàn)在在下雪。這個(gè)地方著名之處是在1960年的時(shí)候,第8屆冬奧會(huì)在這兒舉行。你會(huì)覺得第8屆冬奧會(huì)會(huì)有什么稀奇的?冬奧會(huì)都開了7屆了,第8屆有什么稀奇?但第8屆是第一次通過電視直播的,所以它的影響力非常非常大。
這個(gè)冬奧會(huì)上有個(gè)芬蘭的一個(gè)運(yùn)動(dòng)員Erro歐若(音),獲得越野滑雪的冠軍,大家覺得他體內(nèi)有跟別人不一樣的地方,是不是吃興奮劑,最后他也承認(rèn)確實(shí)吃了荷爾蒙,但那個(gè)時(shí)候在冬奧會(huì)吃點(diǎn)荷爾蒙是合法的。到1991年大家對(duì)他家族做了一個(gè)基因檢測(cè),發(fā)現(xiàn)有一個(gè)突變,19號(hào)染色體上的一個(gè)基因有一個(gè)突變,這個(gè)突變導(dǎo)致他體內(nèi)紅血球比正常增長50%。所以他的耐力非常非常強(qiáng),輸氧能力非常強(qiáng)。
這個(gè)故事后來刺激了很多電影屆的想象力,覺得人是不是有超人的基因。大家都知道,這方面有各種各樣的電影,比如說X-MAN系列電影里的RavenDarkholme,能把自己的體型膚色變掉。我們?cè)诳茖W(xué)界,在生物界也進(jìn)行了研究,想弄清楚究竟超人的基因有多少,到現(xiàn)在只發(fā)現(xiàn)了幾種,其中這5種比較靠譜點(diǎn),其一就是歐若的耐力比較強(qiáng);還有一個(gè)生物鐘調(diào)控能力比較強(qiáng)的基因突變,這基因突變了之后,人只睡四個(gè)小時(shí)就夠了。
相較于超人基因,與疾病相關(guān)的基因突變還是主要研究對(duì)象。這張圖是2009年公布的基因和疾病圖譜??吹贸鑫覀儺?dāng)時(shí)已經(jīng)能把很多疾病跟23對(duì)染色體對(duì)應(yīng)起來。這個(gè)圖里的疾病數(shù)量一直在增長,增長到現(xiàn)在,你們看得出來密密麻麻每一個(gè)染色體上面都有對(duì)應(yīng)的疾病。這是我今年4月15日重新更新的圖譜。托爾斯泰說的,幸福家族的幸福都相似,不幸家族都他的不幸之處,像歐若的家族他們有幸之處是有了一個(gè)獲益的突變,但是大部分家族歷史遺留下來的突變基本上和疾病有關(guān)。
既然基因信息這么重要,能不能非常簡(jiǎn)單地獲取人的基因信息也就變得非常重要。剛才提到人的基因信息量猶如一部稍微長一點(diǎn)的電影的信息量。要獲取這個(gè)信息量就需要一種好工具。這種工具叫做測(cè)序器。這個(gè)工具是從一九七幾年開始發(fā)展。當(dāng)時(shí)英國劍橋大學(xué)的Fred Sanger發(fā)明了第一代測(cè)序技術(shù)。這個(gè)技術(shù)到目前還在用,并且以他的名字命名。
第一代測(cè)序技術(shù)目前產(chǎn)出最好的通量是每年產(chǎn)出7兆堿基對(duì)的數(shù)據(jù)。我們基因組數(shù)據(jù)量有如一部電影,是3個(gè)GB。用一臺(tái)這樣的機(jī)器,得好幾年才能把這個(gè)數(shù)據(jù)產(chǎn)出來。這個(gè)機(jī)器雖然產(chǎn)出數(shù)據(jù)不是那么快,但是對(duì)人類基因組的認(rèn)識(shí)起了很大的作用。從1989年到2001年之間人類做了一件大事兒,把人類基因組破解了,就是用這個(gè)機(jī)器破解的。
這件事總共花了13年的時(shí)間,花了30億美金,得到的就是我們剛才說的30億堿基的數(shù)據(jù),所以30億美元破譯30億堿基,每個(gè)堿基1美元的代價(jià)。這個(gè)對(duì)于第一代測(cè)序技術(shù)已經(jīng)是非常好的結(jié)果。我們當(dāng)時(shí)從1997年開始就想,如果是這樣的話,我們每個(gè)人都有一部電影要拍攝出來,這個(gè)成本和時(shí)間根本就不能適應(yīng)這個(gè)需求,所以就開始研發(fā)第二代測(cè)序技術(shù)。
經(jīng)過20年左右的努力,1997年開始,到2006年第二代測(cè)序技術(shù)正式上市,到現(xiàn)在差不多20年的時(shí)間,我們今年能做到的當(dāng)初真的不可想象。Illumina公司今年年初公布的一個(gè)測(cè)序儀,它的通量能做到每年測(cè)30萬人類基因組,相當(dāng)于攝制30萬部電影的數(shù)據(jù)量。當(dāng)然為了精確度,我們行業(yè)內(nèi)不會(huì)只攝制一次,要攝制30次左右才能把這個(gè)電影拍的精準(zhǔn)一點(diǎn),所以一臺(tái)機(jī)器一年可以拍攝1萬個(gè)人類基因組的數(shù)據(jù)量。
在這個(gè)過程中,我們做了很多工作讓攝制的成本不斷地降下來。目前的成本,差不多是800美金。剛才提到目標(biāo)是100美金,以現(xiàn)在的技術(shù)儲(chǔ)備今后差不多一年半時(shí)間會(huì)到100美金。我們算了一下降低的速度,每六個(gè)月下降一半的成本,從2007年開始到目前,這個(gè)速度是超摩爾定律。摩爾定律是在固定成本下每18個(gè)月計(jì)算的速度增加一倍,即在固定計(jì)算能力下每18個(gè)月計(jì)算成本縮減一半。人類基因組測(cè)序成本每六個(gè)月下降一半。這么快速的下降,這么快速的技術(shù)更新會(huì)出現(xiàn)什么情況?人類對(duì)自身的認(rèn)識(shí)越來越深,測(cè)序技術(shù)的應(yīng)用也開始出現(xiàn)。
第一個(gè)應(yīng)用來自我非常好的朋友,香港中文大學(xué)的盧煜明教授的發(fā)現(xiàn)。他1997年發(fā)現(xiàn)母體血液中存在著胎兒的游離DNA。這當(dāng)時(shí)覺得有點(diǎn)不可思議,現(xiàn)在覺得很簡(jiǎn)單。但是就是這么一個(gè)簡(jiǎn)單的發(fā)現(xiàn),在2007年的時(shí)候,我們一塊設(shè)計(jì)怎么用它來檢測(cè)胎兒的異常,并實(shí)現(xiàn)了產(chǎn)前無創(chuàng)檢測(cè)技術(shù)?,F(xiàn)在有一百多個(gè)國家正在使用這個(gè)技術(shù)。最新的技術(shù)可以把所有的遺傳疾病,在小孩還沒有出生之前通過母親外周血查出來,只要孕婦(能承擔(dān))這個(gè)成本的話。
我們國內(nèi)和一百多個(gè)國家目前推廣的是比較簡(jiǎn)單但比較重要的疾病的檢測(cè)?,F(xiàn)在能檢測(cè)的疾病數(shù)量還比較少,成本已經(jīng)壓得非常非常低。今后的方向是把成本繼續(xù)下降,下降到檢查所有疾病的時(shí)候還有一個(gè)非常低的成本。
同樣一個(gè)概念,能否將腫瘤在還沒有征兆時(shí)檢查出來?胎兒在母親體內(nèi)有十個(gè)月的過程,我們?cè)谶@十個(gè)月內(nèi)就能抓住異常,將疾病查出來。
腫瘤在沒有出現(xiàn)征兆的時(shí)候能不能查的出來?從某種程度上,腫瘤比胎兒應(yīng)該更容易檢查。從第一個(gè)細(xì)胞變成腫瘤細(xì)胞,到能被影像學(xué)識(shí)別的腫瘤,一般情況下這個(gè)過程差不多需要十年左右的時(shí)間。剛才說胎兒發(fā)育過程是十個(gè)月,對(duì)于腫瘤來說是十年,我們?nèi)绻麢z測(cè)的手段非常非常準(zhǔn)確的話,我們有足夠長的時(shí)間把這些腫瘤沒有被影像學(xué)技術(shù)發(fā)現(xiàn)前就能查出來。
但是現(xiàn)在問題是,大家還沒有看到這樣的應(yīng)用。沒有實(shí)現(xiàn)的原因是因?yàn)槟[瘤沒有胎兒那么大。腫瘤的DNA跟胎兒一樣都會(huì)進(jìn)入到血液里面,但是它的DNA含量特別低,這樣對(duì)檢測(cè)技術(shù)的要求就非常非常高。這是我們這個(gè)行業(yè),包括我們自己公司都在積極努力的,研發(fā)出一種高度靈敏的檢測(cè)技術(shù)。我們一定要實(shí)現(xiàn)這個(gè)目標(biāo)。
假定我們真的實(shí)現(xiàn)這個(gè)目標(biāo),能把腫瘤的突變找到,那還存在一個(gè)問題,這個(gè)突變是各種各樣的突變都有,有一些有意義,有一些沒意義,我們還要建一個(gè)數(shù)據(jù)庫。要建這個(gè)數(shù)據(jù)庫,首先得建一個(gè)基線即參照數(shù)據(jù)庫。幾年前我們和阿里云開始合作,建立中國人的數(shù)據(jù)庫,到去年為止,有40多萬中國人的數(shù)據(jù)在我們數(shù)據(jù)庫里面,今天可以說我們實(shí)際上擁有中國人的突變圖譜。不管這些突變致病也好,還是不致病也好,我們擁有參照數(shù)據(jù)庫。光有基線也不行,我們要有病變數(shù)據(jù)庫。
這個(gè)案例大家也比較清楚,安吉麗娜朱莉的乳腺癌。我們選乳腺癌作為第一個(gè)疾病數(shù)據(jù)庫。我們通過這幾年努力,知道差不多有60個(gè)基因跟乳腺癌有關(guān)。安吉麗娜朱莉的突變是發(fā)生在第17號(hào)染色體上,叫BRCA1基因,在美國有3.5%的乳腺癌病人是由于這個(gè)基因的突變導(dǎo)致的。
那我們中國人是怎么樣?我們?nèi)ツ旰捅贝竽[瘤醫(yī)院進(jìn)行了合作,對(duì)中國乳腺癌病人進(jìn)行遺傳突變分析。我們把1萬個(gè)乳腺癌病人的基因組測(cè)了一下,發(fā)現(xiàn)乳腺癌病人里面有10%的人是由于已知的遺傳缺陷導(dǎo)致。
但跟茱莉不太一樣的地方,在中國人群里BRCA1基因不是導(dǎo)致中國人乳腺癌發(fā)病最高的基因。我們發(fā)現(xiàn)中國乳腺癌病人里有3.5%左右的病人是由另外一個(gè)基因BRCA2的突變導(dǎo)致的。BRCA1的突變只占1.5%左右。這個(gè)工作還在進(jìn)行之中。我們現(xiàn)在正在建立不同的疾病突變數(shù)據(jù)庫。我們希望幾年之后更多的疾病基因數(shù)據(jù)庫都能建立起來,對(duì)治療產(chǎn)生影響。
這幾年基于基因的治療手段進(jìn)展迅速。主要分兩類。一種是小核酸為主的核酸藥。這些藥跟以往的化學(xué)藥不一樣。不一樣的地方在那兒?比如左邊這個(gè)圖是波士頓一家公司叫Alnylan正在研發(fā)的藥。這是這個(gè)公司做的第一期臨床實(shí)驗(yàn)的結(jié)果。這個(gè)藥注射一針,接受實(shí)驗(yàn)的病人的血脂六個(gè)月之內(nèi)維持降低50%左右,對(duì)應(yīng)的基因能降低75%左右。這就代表了一種新型的治療方案。今后很有可能注射一針能夠?qū)崿F(xiàn)六個(gè)月、一年,甚至更久的治療效果。有其還他幾個(gè)類似的藥,現(xiàn)在的臨床實(shí)驗(yàn)也證實(shí)六個(gè)月內(nèi)一針就夠了。
當(dāng)然長遠(yuǎn)的解決疾病問題,是小孩剛出生,甚至還沒出生的時(shí)候就進(jìn)行基因治療,比如基因剪輯。這個(gè)治療方案是另外一個(gè)跟基因有關(guān)的治療方案。
今后如果有了基因數(shù)據(jù),有治療方案,就會(huì)形成另外一個(gè)局面。這個(gè)局面對(duì)人會(huì)是什么樣的狀態(tài)?最近有一本書,《人類未來簡(jiǎn)史》。這本書對(duì)今后的預(yù)期實(shí)際上不那么好,就是人今后信息累計(jì)太多的時(shí)候,會(huì)變成對(duì)人類自身不利,人會(huì)演變到更新的層次,跟現(xiàn)在完全不一樣的層次。
這現(xiàn)在還不是我們關(guān)注的地方,我認(rèn)為今后我們要打造的社會(huì),最起碼在今后幾年之內(nèi),先從基因的信息開始,通過檢測(cè)把它聚集起來,聚集之后,我們有知識(shí)能用這個(gè)基因的信息知道醫(yī)院該怎么做,治療該怎么用,再往后很有可能進(jìn)入另外一個(gè)狀態(tài),改變我們基因的信息,這是另外一個(gè)階段。到那個(gè)階段,可能跟這本書里面寫的狀態(tài)有關(guān)。希望有關(guān)是良好的有關(guān),而不像這本書里面寫的那樣。