由中國企業(yè)家俱樂部主辦的“2017中國綠公司年會”于4月22日-24日在河南鄭州召開,貝瑞和康CEO周代星出席并發(fā)言。周代星介紹,人類的23對染色體各司其職,如同一本書的23個章節(jié),每個章節(jié)都起非常重要的作用,有的基因突變直接和一些疾病有關(guān),有的突變則影響到人的性格,比如,有的會使人變得懶惰,有的則使人喜歡冒險,追求刺激。
科學(xué)研究也表明,實際上確實有一些基因會給人類似“超人”的能力,現(xiàn)在發(fā)現(xiàn)有5種基因與此有關(guān)。有的能讓人表現(xiàn)為耐受力更強,更精力旺盛,有的基因突變后,人只需要四小時的睡眠就夠了。
他表示,現(xiàn)在的無穿透檢測技術(shù),可以把所有遺傳疾病,在小孩出生前查出來,只要能承擔這個成本。從某種程度上,腫瘤比胎兒更容易做。因為從第一個細胞變成腫瘤細胞,到能被影像學(xué)識別的腫瘤,一般情況下差不多要十年左右,如果檢測手段非常準確的話,有足夠長時間把這些腫瘤查出來。
周代星認為,人類基因測序成本每六個月下降一次,人類對自身的認識越來越深,它的應(yīng)用也開始出現(xiàn)。今后的方向是把檢測成本不斷降低?,F(xiàn)在要做的是把更多疾病的基因數(shù)據(jù)庫建立起來,對治療產(chǎn)生影響。
以下為發(fā)言實錄:
基因究竟是什么?在座的各位可能多多少少有一點了解,但怎么定義一個基因?其實在人類知識發(fā)展過程中花了很長時間才對基因有所認識。我們今天能夠講得比較清楚是因為前人很多的工作。
這張圖顯示了我們?nèi)藦囊粋€細胞到基因的結(jié)構(gòu)過程。我們?nèi)擞?7萬億的細胞,細胞有各種各樣的功能。除了一些比較特殊的細胞之外,每一個細胞都有一個細胞核,還有染色體。這個染色體你要不斷拉伸之后,會得到脫氧核糖核酸的成分,由四個堿基組成,這些成分在我們這里用GATC來代表。
基因是什么?基因就是染色體里面的一個片斷,有大有小,大到80多萬個堿基,小到幾十個堿基。人的基因組由23對染色體組成,每一個染色體就像一根彈簧。
發(fā)現(xiàn)人有23對染色體其實不是那么簡單。在1955年之前,整個人類認為我們有48條染色體。人只有23對染色體是由一位印尼華僑蔣有興1955年12月22號到瑞士去做研究的時候發(fā)現(xiàn)的。他發(fā)現(xiàn)人的染色體實際上只有23對,總共46條。從那兒就開始23對染色體就成了大家的共識。
我們后面會提到的,人類基因組測序結(jié)束之后,我們知道23對染色體各司其職,你要是把染色體存在的信息看作是一本書的話,這本書共有23個章節(jié),每個章節(jié)都起非常非常重要的作用。這些章節(jié)如果出現(xiàn)了偏差會對人產(chǎn)生什么樣的影響?當然有一些偏差,大家也都知道,會產(chǎn)生疾病。那疾病又是什么樣的?
我們先說大的偏差,這23個章節(jié)如果有一個章節(jié)出現(xiàn)重復(fù),人會是怎么樣?這個圖顯示的是一種疾病,叫唐氏綜合癥,是21號染色體重復(fù)。那有沒有其他的染色體重復(fù)呢?比如1號、5號染色體重復(fù)會是什么樣?現(xiàn)在沒有看到其它染色體重復(fù)的疾病,是因為這樣的重復(fù)對發(fā)育太重要了,人生不出來,。所以我們只看到對唐氏綜合體的存在。這是整條染色體重復(fù)的狀態(tài)。
那么有沒有染色體部分的重復(fù)或缺失,有的話,對人產(chǎn)生什么影響?我們看小一點,一條染色體里面的一部分重復(fù)或缺失了。這張圖列了幾種重復(fù)缺失的存在。有一個疾病是22號染色體上面有200萬個堿基缺失了。我們會看到右邊這個小孩生出來是兔唇,這是DiGeorge疾病(音)的小孩。DiGeorge病人并不是所有的都兔唇。70%的DiGeorge病人有先天性心臟病,30%有先天性腎臟病。這是一個案例,就是我們?nèi)旧w缺了一段,多了一段的案例。
如果再進一步,我的染色體并不是多了或少了一段,而是只有一個字節(jié),就一個堿基發(fā)生了改變。后面會提到人的基因組有30億對堿基。整個信息的量相當于一部稍微長一點的電影的信息量。這個電影里面有一個字節(jié)出現(xiàn)了偏差,會產(chǎn)生什么樣的情況?
這張圖顯示的是是一個案例,這是最早被人類發(fā)現(xiàn)的一個疾病,叫黑尿癥,1905年發(fā)現(xiàn)的,跟遺傳有關(guān),但那個時候并不知道遺傳信息是什么。在接近100年的努力之后,1996年才把黑尿癥的基因突變定位在3號染色體這個位置上面,到了那時候這個基因才被克隆。
人類最普遍的遺傳疾病是色盲,8%的男人是色盲。色盲為什么會這么普遍?色盲主要由三個基因主導(dǎo),有兩個基因在X染色體上。女性有2條X染色體,男性有一條X染色體。如果這些控制顏色識別的基因出現(xiàn)差錯就會產(chǎn)生色盲,所以男性比較容易得色盲。
我們仔細想一想這個事情,實際上我們在座的男性要知道我們是處于劣勢的,人類的另一個分支女性實際上比我們要有優(yōu)勢,就是因為她有2條X染色體。
我剛才提到的基因突變好像都不是那么嚴重,要么是尿黑了,要么識別不了顏色,都跟顏色有關(guān)。其實不然,我們?nèi)祟愌芯苛嘶蚝图膊『芏嗄?,有幾千種疾病和基因突變有關(guān),有一些突變導(dǎo)致非常嚴重的疾病。
這里舉一個例子,NF1基因的突變,會導(dǎo)致一種疾病,叫Neuofibromatosis Type1,表現(xiàn)為外表皮膚會產(chǎn)生肉瘤,多了會把人的眼睛、嘴巴蓋住,這些人經(jīng)常會引起呼吸困難,甚至導(dǎo)致死亡。當然這個疾病會有一個怪的現(xiàn)象,每個人的身上出現(xiàn)的程度不太一樣。最右邊圖顯示的是這些人得的是同樣位置的突變,但是他的程度不是那么嚴重,這牽扯到基因表達的問題,人的基因有兩個拷貝,如果一個拷貝表達量超過另外一個拷貝,雖然另外一個拷貝有異常,但不一定能顯示出來,這在遺傳學(xué)上叫基因的穿透。
剛才提到基因有那么多跟疾病關(guān)的突變,有沒有跟疾病沒有關(guān)系的突變呢?這個基因是DRD5,這個基因有4個外顯子,即表達蛋白質(zhì)的部分。其中第三個外顯子有一個48個堿基的重復(fù),有的人是兩個重復(fù),有的人只有一個重復(fù),有的人有11個,平均起來差不多是4個重復(fù),這個重復(fù)跟人的性格有很大關(guān)系。動物也有這個基因,跟動物的性格也有非常大的關(guān)系。人們曾經(jīng)做過一個實驗,如果把長的重復(fù)片斷去掉,或者把整個基因去掉的話,小鼠會變得很懶惰,甚至懶惰到看到食物不愿意吃,最后饑餓而死的狀態(tài)。在人群里面沒有看到這么懶惰的人,但這個基因的重復(fù)度對性格還是起一定的作用。
這個基因如果含有長的重復(fù),這種人就很喜歡冒險,早上會去坐過山車,中午還覺得不夠過癮,到晚上還希望做上飛機跳個傘,很喜歡刺激。這些人靜不下來。這個關(guān)聯(lián)以前有人認為跟性格疾病沒關(guān),科學(xué)依據(jù)不強。一直到最近,美國一個大學(xué)做了一項研究,大學(xué)生經(jīng)常有一些一夜情等的人。這項研究對他們做一個調(diào)研,發(fā)現(xiàn)這些人大部分都是長的重復(fù),就是7對以上重復(fù)的人比較多,所以基因跟性格是有一定的關(guān)系。
當然對基因想象力最大的,是大家想有沒有超人基因。這張圖顯示的是加州東面,有一個滑雪圣地,叫Olympic Valley。這是我兩個星期之前在那個地方拍的,那個地方現(xiàn)在在下雪。這個地方著名之處是在1960年的時候,第8屆冬奧會在這兒舉行。你會覺得第8屆冬奧會會有什么稀奇的?冬奧會都開了7屆了,第8屆有什么稀奇?但第8屆是第一次通過電視直播的,所以它的影響力非常非常大。
這個冬奧會上有個芬蘭的一個運動員Erro歐若(音),獲得越野滑雪的冠軍,大家覺得他體內(nèi)有跟別人不一樣的地方,是不是吃興奮劑,最后他也承認確實吃了荷爾蒙,但那個時候在冬奧會吃點荷爾蒙是合法的。到1991年大家對他家族做了一個基因檢測,發(fā)現(xiàn)有一個突變,19號染色體上的一個基因有一個突變,這個突變導(dǎo)致他體內(nèi)紅血球比正常增長50%。所以他的耐力非常非常強,輸氧能力非常強。
這個故事后來刺激了很多電影屆的想象力,覺得人是不是有超人的基因。大家都知道,這方面有各種各樣的電影,比如說X-MAN系列電影里的RavenDarkholme,能把自己的體型膚色變掉。我們在科學(xué)界,在生物界也進行了研究,想弄清楚究竟超人的基因有多少,到現(xiàn)在只發(fā)現(xiàn)了幾種,其中這5種比較靠譜點,其一就是歐若的耐力比較強;還有一個生物鐘調(diào)控能力比較強的基因突變,這基因突變了之后,人只睡四個小時就夠了。
相較于超人基因,與疾病相關(guān)的基因突變還是主要研究對象。這張圖是2009年公布的基因和疾病圖譜??吹贸鑫覀儺敃r已經(jīng)能把很多疾病跟23對染色體對應(yīng)起來。這個圖里的疾病數(shù)量一直在增長,增長到現(xiàn)在,你們看得出來密密麻麻每一個染色體上面都有對應(yīng)的疾病。這是我今年4月15日重新更新的圖譜。托爾斯泰說的,幸福家族的幸福都相似,不幸家族都他的不幸之處,像歐若的家族他們有幸之處是有了一個獲益的突變,但是大部分家族歷史遺留下來的突變基本上和疾病有關(guān)。
既然基因信息這么重要,能不能非常簡單地獲取人的基因信息也就變得非常重要。剛才提到人的基因信息量猶如一部稍微長一點的電影的信息量。要獲取這個信息量就需要一種好工具。這種工具叫做測序器。這個工具是從一九七幾年開始發(fā)展。當時英國劍橋大學(xué)的Fred Sanger發(fā)明了第一代測序技術(shù)。這個技術(shù)到目前還在用,并且以他的名字命名。
第一代測序技術(shù)目前產(chǎn)出最好的通量是每年產(chǎn)出7兆堿基對的數(shù)據(jù)。我們基因組數(shù)據(jù)量有如一部電影,是3個GB。用一臺這樣的機器,得好幾年才能把這個數(shù)據(jù)產(chǎn)出來。這個機器雖然產(chǎn)出數(shù)據(jù)不是那么快,但是對人類基因組的認識起了很大的作用。從1989年到2001年之間人類做了一件大事兒,把人類基因組破解了,就是用這個機器破解的。
這件事總共花了13年的時間,花了30億美金,得到的就是我們剛才說的30億堿基的數(shù)據(jù),所以30億美元破譯30億堿基,每個堿基1美元的代價。這個對于第一代測序技術(shù)已經(jīng)是非常好的結(jié)果。我們當時從1997年開始就想,如果是這樣的話,我們每個人都有一部電影要拍攝出來,這個成本和時間根本就不能適應(yīng)這個需求,所以就開始研發(fā)第二代測序技術(shù)。
經(jīng)過20年左右的努力,1997年開始,到2006年第二代測序技術(shù)正式上市,到現(xiàn)在差不多20年的時間,我們今年能做到的當初真的不可想象。Illumina公司今年年初公布的一個測序儀,它的通量能做到每年測30萬人類基因組,相當于攝制30萬部電影的數(shù)據(jù)量。當然為了精確度,我們行業(yè)內(nèi)不會只攝制一次,要攝制30次左右才能把這個電影拍的精準一點,所以一臺機器一年可以拍攝1萬個人類基因組的數(shù)據(jù)量。
在這個過程中,我們做了很多工作讓攝制的成本不斷地降下來。目前的成本,差不多是800美金。剛才提到目標是100美金,以現(xiàn)在的技術(shù)儲備今后差不多一年半時間會到100美金。我們算了一下降低的速度,每六個月下降一半的成本,從2007年開始到目前,這個速度是超摩爾定律。摩爾定律是在固定成本下每18個月計算的速度增加一倍,即在固定計算能力下每18個月計算成本縮減一半。人類基因組測序成本每六個月下降一半。這么快速的下降,這么快速的技術(shù)更新會出現(xiàn)什么情況?人類對自身的認識越來越深,測序技術(shù)的應(yīng)用也開始出現(xiàn)。
第一個應(yīng)用來自我非常好的朋友,香港中文大學(xué)的盧煜明教授的發(fā)現(xiàn)。他1997年發(fā)現(xiàn)母體血液中存在著胎兒的游離DNA。這當時覺得有點不可思議,現(xiàn)在覺得很簡單。但是就是這么一個簡單的發(fā)現(xiàn),在2007年的時候,我們一塊設(shè)計怎么用它來檢測胎兒的異常,并實現(xiàn)了產(chǎn)前無創(chuàng)檢測技術(shù)?,F(xiàn)在有一百多個國家正在使用這個技術(shù)。最新的技術(shù)可以把所有的遺傳疾病,在小孩還沒有出生之前通過母親外周血查出來,只要孕婦(能承擔)這個成本的話。
我們國內(nèi)和一百多個國家目前推廣的是比較簡單但比較重要的疾病的檢測。現(xiàn)在能檢測的疾病數(shù)量還比較少,成本已經(jīng)壓得非常非常低。今后的方向是把成本繼續(xù)下降,下降到檢查所有疾病的時候還有一個非常低的成本。
同樣一個概念,能否將腫瘤在還沒有征兆時檢查出來?胎兒在母親體內(nèi)有十個月的過程,我們在這十個月內(nèi)就能抓住異常,將疾病查出來。
腫瘤在沒有出現(xiàn)征兆的時候能不能查的出來?從某種程度上,腫瘤比胎兒應(yīng)該更容易檢查。從第一個細胞變成腫瘤細胞,到能被影像學(xué)識別的腫瘤,一般情況下這個過程差不多需要十年左右的時間。剛才說胎兒發(fā)育過程是十個月,對于腫瘤來說是十年,我們?nèi)绻麢z測的手段非常非常準確的話,我們有足夠長的時間把這些腫瘤沒有被影像學(xué)技術(shù)發(fā)現(xiàn)前就能查出來。
但是現(xiàn)在問題是,大家還沒有看到這樣的應(yīng)用。沒有實現(xiàn)的原因是因為腫瘤沒有胎兒那么大。腫瘤的DNA跟胎兒一樣都會進入到血液里面,但是它的DNA含量特別低,這樣對檢測技術(shù)的要求就非常非常高。這是我們這個行業(yè),包括我們自己公司都在積極努力的,研發(fā)出一種高度靈敏的檢測技術(shù)。我們一定要實現(xiàn)這個目標。
假定我們真的實現(xiàn)這個目標,能把腫瘤的突變找到,那還存在一個問題,這個突變是各種各樣的突變都有,有一些有意義,有一些沒意義,我們還要建一個數(shù)據(jù)庫。要建這個數(shù)據(jù)庫,首先得建一個基線即參照數(shù)據(jù)庫。幾年前我們和阿里云開始合作,建立中國人的數(shù)據(jù)庫,到去年為止,有40多萬中國人的數(shù)據(jù)在我們數(shù)據(jù)庫里面,今天可以說我們實際上擁有中國人的突變圖譜。不管這些突變致病也好,還是不致病也好,我們擁有參照數(shù)據(jù)庫。光有基線也不行,我們要有病變數(shù)據(jù)庫。
這個案例大家也比較清楚,安吉麗娜朱莉的乳腺癌。我們選乳腺癌作為第一個疾病數(shù)據(jù)庫。我們通過這幾年努力,知道差不多有60個基因跟乳腺癌有關(guān)。安吉麗娜朱莉的突變是發(fā)生在第17號染色體上,叫BRCA1基因,在美國有3.5%的乳腺癌病人是由于這個基因的突變導(dǎo)致的。
那我們中國人是怎么樣?我們?nèi)ツ旰捅贝竽[瘤醫(yī)院進行了合作,對中國乳腺癌病人進行遺傳突變分析。我們把1萬個乳腺癌病人的基因組測了一下,發(fā)現(xiàn)乳腺癌病人里面有10%的人是由于已知的遺傳缺陷導(dǎo)致。
但跟茱莉不太一樣的地方,在中國人群里BRCA1基因不是導(dǎo)致中國人乳腺癌發(fā)病最高的基因。我們發(fā)現(xiàn)中國乳腺癌病人里有3.5%左右的病人是由另外一個基因BRCA2的突變導(dǎo)致的。BRCA1的突變只占1.5%左右。這個工作還在進行之中。我們現(xiàn)在正在建立不同的疾病突變數(shù)據(jù)庫。我們希望幾年之后更多的疾病基因數(shù)據(jù)庫都能建立起來,對治療產(chǎn)生影響。
這幾年基于基因的治療手段進展迅速。主要分兩類。一種是小核酸為主的核酸藥。這些藥跟以往的化學(xué)藥不一樣。不一樣的地方在那兒?比如左邊這個圖是波士頓一家公司叫Alnylan正在研發(fā)的藥。這是這個公司做的第一期臨床實驗的結(jié)果。這個藥注射一針,接受實驗的病人的血脂六個月之內(nèi)維持降低50%左右,對應(yīng)的基因能降低75%左右。這就代表了一種新型的治療方案。今后很有可能注射一針能夠?qū)崿F(xiàn)六個月、一年,甚至更久的治療效果。有其還他幾個類似的藥,現(xiàn)在的臨床實驗也證實六個月內(nèi)一針就夠了。
當然長遠的解決疾病問題,是小孩剛出生,甚至還沒出生的時候就進行基因治療,比如基因剪輯。這個治療方案是另外一個跟基因有關(guān)的治療方案。
今后如果有了基因數(shù)據(jù),有治療方案,就會形成另外一個局面。這個局面對人會是什么樣的狀態(tài)?最近有一本書,《人類未來簡史》。這本書對今后的預(yù)期實際上不那么好,就是人今后信息累計太多的時候,會變成對人類自身不利,人會演變到更新的層次,跟現(xiàn)在完全不一樣的層次。
這現(xiàn)在還不是我們關(guān)注的地方,我認為今后我們要打造的社會,最起碼在今后幾年之內(nèi),先從基因的信息開始,通過檢測把它聚集起來,聚集之后,我們有知識能用這個基因的信息知道醫(yī)院該怎么做,治療該怎么用,再往后很有可能進入另外一個狀態(tài),改變我們基因的信息,這是另外一個階段。到那個階段,可能跟這本書里面寫的狀態(tài)有關(guān)。希望有關(guān)是良好的有關(guān),而不像這本書里面寫的那樣。