這種「編碼序列是連續的」的觀念在1977年被打破了。在這一年,美國冷泉港實驗室的里查德·羅伯茲(Richard J. Roberts)和麻州理工學院的飛利浦·夏普(Phillip A. Sharp)同時在研究引起人感冒的腺病毒(adenovirus)。這種腺病毒的主要蛋白叫做六鄰體(Hexon),是包裹病毒DNA的表面蛋白質。他們先從被病毒感染的細胞中提取到六鄰體的mRNA。為了尋找病毒DNA中為六鄰體蛋白編碼的部位,他們讓這種mRNA和病毒的DNA「雜交」,即讓mRNA的序列和DNA分子上相應的序列通過鹼基配對彼此結合。出乎他們意料的是,六鄰體mRNA和DNA上四個互不相連的區段結合,這四個區段之間沒有和mRNA結合的部分則遊離出來,形成三個環。這個結果使他們認識到,腺病毒DNA為六鄰體蛋白質編碼的序列不是連續的,而是分為許多段,中間被不為蛋白質編碼的DNA序列隔開。
如果把各種真核生物同種基因中內含子的位置做比較,發現許多這些內含子的位置是相同的。例如動物和植物之間有17%的內含子位置是相同的,真菌和植物之間有13%的內含子位置相同,甚至人類和開花植物擬南芥之間,都有25%的內含子在基因中的位置相同。這些事實說明,真核生物的內含子出現的時間非常早,在所有真核生物的共同祖先中就出現了。據各種模型的推測,在最早的真核生物中,為蛋白質編碼的每個基因平均含有2-3個內含子。由於細菌的DNA含有的內含子數量極少,在最初的真核生物形成時,一定有一個內含子數量突然大量增加的事件。由於原核生物經過數億年的進化,已經將內含子基本消除,真核生物的共同祖先又是從原核生物進化而來的,內含子的突然增加是如何發生的呢?2006年,美國科學家尤金·庫寧(Eugene V. Koonin)提出一個假說,他認為是後來要變成線粒體的 alpha-變形菌進入寄主細胞后,其DNA中的內含子「入侵」寄主的DNA並在那裡繁殖,使得最初的真核細胞含有大量的內含子。