|
另一方面,真核生物的基因中卻含有大量的內含子。而且越是高級的生物(例如哺乳動物和開花植物),基因中內含子的數量越多。為蛋白質編碼的基因,幾乎都含有內含子。例如人類,每個基因平均含有8.1個內含子,擬南芥(Arabidopsis thaliana,一種開花植物)每個基因平均含有4.4個內含子,就連低等動物如果蠅(Drosophila melanogaster)每個基因也平均有3.4個內含子,而許多原核生物總共也只有幾個內含子。看到這裡,估計有人會產生疑問:原核生物想盡量去掉的東西,真核生物怎麼會讓它存在並且讓它繁榮起來呢?原因看來有兩個。一是真核生物因為有線粒體提供能量,「財大氣粗」,不在乎這點「廢物」的存在。真核生物是以質取勝,即通過自己更強大多樣的功能取勝,而不是像原核生物那樣以量取勝,所以不必拚命繁殖。二是真核生物巧妙地利用了內含子的存在來形成更多的蛋白質。在原核生物中,因為編碼序列是連續的,沒有「花樣」可玩。編碼序列什麼樣,蛋白質就什麼樣,一個編碼程序就只能生成一種蛋白質,真是「一個基因對應一種蛋白質」。而在真核生物中,由於編碼序列是最後「拼接」起來的,如果改變拼接方法,只使用其中的一些編碼區段,讓外顯子以不同的方式結合,就可以從同一個基因形成不同的蛋白質。這種不同的拼接外顯子的方法叫做選擇性剪接(alternative splicing)。例如果蠅的dsx基因是控制性別的基因。它有6個外顯子。如果把外顯子1、2、3、5、6拼接在一起,就會形成的一個使果蠅向雄性發育的轉錄因子。但是如果把外顯子1、2、3、4拼接在一起,就會形成一個使果蠅向雌性發育的轉錄因子。這樣,同一個基因就可以產生功能完全相反的兩種蛋白質。一個基因產生巨大數量蛋白質的「冠軍」,要數果蠅的DSCAM基因。它有95個外顯子,可以形成38,016種不同的組合,即生成38,016種蛋白質,而果蠅的全部基因數才15,016個!在人的全部DNA序列測定以後,發現其中只有大約21,000個基因。這個結果出乎人們的預料,甚至有人認為這是對人類的羞辱,因為那麼低級的原核生物大腸桿菌(菌種K-12)都有4,377個基因,其中4,290個基因為蛋白質編碼。考慮到人的複雜性遠遠超過大腸桿菌,21,000個基因似乎是太「少」了,人類好像應該至少有100,000個以上的基因才「合理」。其中的奧妙就在人的基因能夠活躍地進行選擇性剪接,所以兩萬個左右的基因可以形成10萬種以上的蛋白質。這就可以解釋為什麼生物越高級,為蛋白質編碼的基因中內含子越多。
為蛋白質編碼的基因中出現內含子,轉錄生成的最初的mRNA就不能直接在核糖體中指導蛋白質的合成了,因為那樣會把內含子中的序列也當作是編碼,合成出錯誤的蛋白質,所以必須先把mRNA中的內含子部分去掉,然後才能用來合成蛋白質。而去掉內含子的剪接過程又是比較慢的,怎麼才能防止內含子去掉之前合成蛋白質的過程就開始呢?唯一的辦法就是不讓核糖體接觸到還沒有「加工」完畢的mRNA。換句話說,就是轉錄和蛋白質合成必須在空間上分開,而這正是細胞核的作用。細胞核的膜能夠防止完整的核糖體進入細胞,而mRNA在剪接完成前,又不會離開細胞核,這樣核糖體能夠接觸的,就只能是加工完畢的mRNA。其實真核生物加工mRNA還不只是去掉內含子,還要給mRNA「穿靴戴帽」。「穿靴」就是給mRNA分子加上一個由100-250個由字母A(腺苷酸)組成的「尾巴」,叫做「多聚A尾巴」。「戴帽」是在mRNA的「頭」(5』端)的「字母」G(鳥苷酸中的嘌呤)上面加一個甲基(-CH3)。這兩個修飾都使mRNA分子更穩定,也等於是給mRNA分子戴上了「放行徽章」,可以離開細胞核了。所以細胞核的出現,是為蛋白質編碼的基因中出現內含子的必然結果。
如果把各種真核生物同種基因中內含子的位置做比較,發現許多這些內含子的位置是相同的。例如動物和植物之間有17%的內含子位置是相同的,真菌和植物之間有13%的內含子位置相同,甚至人類和開花植物擬南芥之間,都有25%的內含子在基因中的位置相同。這些事實說明,真核生物的內含子出現的時間非常早,在所有真核生物的共同祖先中就出現了。據各種模型的推測,在最早的真核生物中,為蛋白質編碼的每個基因平均含有2-3個內含子。由於細菌的DNA含有的內含子數量極少,在最初的真核生物形成時,一定有一個內含子數量突然大量增加的事件。由於原核生物經過數億年的進化,已經將內含子基本消除,真核生物的共同祖先又是從原核生物進化而來的,內含子的突然增加是如何發生的呢?2006年,美國科學家尤金·庫寧(Eugene V. Koonin)提出一個假說,他認為是後來要變成線粒體的 alpha-變形菌進入寄主細胞后,其DNA中的內含子「入侵」寄主的DNA並在那裡繁殖,使得最初的真核細胞含有大量的內含子。
真核生物為了適應這種情況,發展出了細胞核把DNA和核糖體分開,同時發展出了更有效的方式來剪除掉mRNA中的內含子序列,這就是剪接體(spliceosome)。剪接體是由5個細胞核內的小分子RNA(snRNA,包括U1、U2、U4、U5、和U6)和蛋白質組成的巨型複合物。5個snRNA分別識別內含子的各個部位,例如U1會先辨識內含子的5』端剪接點( 內含子5』端與外含子結合的地方),而U2 識別3』端剪接點(內含子3′ 端與另一個外含子結合的地方)上游的「分支點」。這個步驟將mRNA上要被剪切除去的內含子定位。然後,由U4-U5-U6組成的三聚體加入,使得分支位點上的一個字母A被連到內含子的5』端上,使它脫離外含子,同時內含子的RNA鏈形成一個「套馬索」那樣的環狀結構。脫離了內含子的5』外含子再與3』的外含子結合,內含子就被剪切掉了。
剪切體剪除內含子的過程與II型內含子「自我」剪切的過程極為相似,例如都形成「套馬索」那樣的結構和中間步驟,RNA分子的空間結構也高度一致。所以真核生物的剪切體應該是從原核生物的II型內含子進化而來的。II型內含子是自己切割自己,而剪切體的5個snRNA則是II型內含子分開的片斷,再與蛋白質形成複合體。所有的原核生物都沒有剪切體,剪切體是被真核生物發展出來的,即把原核生物自我剪切的內含子分成幾段,再分別和蛋白質結合。但即使是在人類的細胞里,實際剪切內含子的分子還是剪切體中的snRNA,蛋白質只起輔助作用。核糖體合成蛋白質時,起催化作用的仍然是RNA(rRNA)分子。這些事實都說明,最初的生命是RNA的世界,真核生物的內含子也是由RNA分子中的II型內含子進化而來的。
有趣的是,並不是所有的真核生物都含有大量的內含子。對於那些單細胞的真核生物,繁殖速度對於生存還是很重要的。俗話說,「活在狼群中,就得學狼叫」,所以這些單細胞的真核生物,像同樣是單細胞的原核生物一樣,都去除了大量的內含子。例如裂殖酵母(Schizosaccharomyces pombe)每個基因平均只有0.9個內含子,出芽酵母(Saccharomyces cerevisae)的內含子含量更低,每個基因平均只有0.05個內含子。而多細胞的真核生物,則在演化過程中不斷增加內含子的數量,在人身上甚至達到每個基因平均有8個以上的內含子。
線粒體的出現給真核生物帶來充足能源的同時,也帶來了內含子的入侵。為蛋白質編碼的基因中內含子的出現,又迫使細胞形成細胞核以把DNA和核糖體分隔開來。這大概就是真核細胞出現的根本原因。其它的改變都是在這個基礎上進行的
|
|