
增強子及超級增強子序列查找
2024-11-12 14:27:23
來源/作者:普拉特澤-生物醫(yī)學整體課題外包平臺
一、什么是增強子?
增強子是指能夠增加啟動子活性, 從而增加基因轉(zhuǎn)錄效率的DNA序列。增強子分為細胞特異性增強子和誘導(dǎo)性增強子兩種類型:細胞特異性增強子是在特定的細胞或特定的細胞發(fā)育階段, 有選擇性的調(diào)控基因轉(zhuǎn)錄表達。誘導(dǎo)性增強子在特定刺激因子的誘導(dǎo)下才能發(fā)揮起增強基因轉(zhuǎn)錄活性的增強子,。在我們NCBI第一講視頻也介紹了,增強子具有遠距離效應(yīng)、無方向性、無物種和基因的特異性、具有組織特異性、等特點。

圖一、增強子結(jié)構(gòu)示意圖
二、增強子和啟動子的相互作用
我們已經(jīng)知道啟動子決定轉(zhuǎn)錄的起始位點,而增強子決定轉(zhuǎn)錄的效率及轉(zhuǎn)錄的時間和地點,但是增強子如何促進啟動子的轉(zhuǎn)錄,是轉(zhuǎn)錄領(lǐng)域里面懸而未決的問題。啟動子的位置一般是確定的,即與基因之間有特定的距離和方向,增強子則不同,由于它的遠距離效應(yīng),它可能與其調(diào)節(jié)的啟動子相距數(shù)千Kb,可以位于基因上游或下游。那增強子是如何跟啟動子相互作用從而影響基因的轉(zhuǎn)錄的呢?一般認為當處于非活性狀態(tài)時,二者不會靠近,但在活性狀態(tài)下,增強子通過形成環(huán)狀結(jié)構(gòu)而在三維空間上接近啟動子,并將相應(yīng)轉(zhuǎn)錄因子募集到該區(qū)域,從而促進基因表達。
(下圖顯示了增強子如何與啟動子相互作用從而增強基因的表達。藍色線條代表染色體,左邊形成環(huán)狀的這個區(qū)域叫做染色的凸環(huán)loop,這個環(huán)是怎么形成的呢?假設(shè)染色體上這個紫色區(qū)域就是一個基因,這個基因左邊是它的基因的啟動子promoter,在這個基因的上游區(qū)域或者下游區(qū)域會存在增強子即enhancer,這個染色體的這個凸環(huán)就是靠這個增強子和啟動子之間的關(guān)聯(lián)而形成的,一旦形成了這種折疊染色體凸環(huán),增強子和啟動子之間的距離就被拉進。它們又是如何保持這種結(jié)構(gòu)關(guān)系的呢?這兩個紅色的鋸齒狀代表兩個結(jié)構(gòu)蛋白,上面這個鋸齒狀結(jié)構(gòu)蛋白它錨定在增強子上面,下面這個鋸齒狀的結(jié)構(gòu)蛋白它錨定在啟動子上面,這兩個蛋白連接在一起形成了一個二聚體的穩(wěn)定結(jié)構(gòu),這個二聚體有助于染色體保持現(xiàn)在這種形狀。
圖中的梯形狀的結(jié)構(gòu)代表轉(zhuǎn)錄因子,在轉(zhuǎn)錄因子那節(jié)的視頻中我們介紹了,轉(zhuǎn)錄因子分為通用轉(zhuǎn)錄因子和激活因子,通用轉(zhuǎn)錄因子只能激活很低水平的轉(zhuǎn)錄,細胞中活躍基因的轉(zhuǎn)錄通常遠遠高于本地轉(zhuǎn)錄,要達到所需的轉(zhuǎn)錄增強,通常需要激活因子來激活高水平的轉(zhuǎn)錄,而激活因子通常需要跟增強子結(jié)合從而才能達到激發(fā)高水平轉(zhuǎn)錄的作用。特定的轉(zhuǎn)錄因子(也就是激活因子)與增強子結(jié)合,而普通轉(zhuǎn)錄因子和啟動子結(jié)合。激活因子結(jié)合到增強子上(圖中紅色五角星),增強子被激活,被激活的增強子進一步激活靶基因的啟動子,遠距離的啟動子是如何被激活的呢?在增強子和啟動子之間會有一個酶介,這個酶介叫Mediator protein中介蛋白,這個蛋白大約由26個蛋白組成的復(fù)合物,被激活的這個增強子通過中間這個蛋白復(fù)合體,將信號傳遞給啟動子,從而激活啟動子開始轉(zhuǎn)錄,開始轉(zhuǎn)錄以后在RNA聚合酶2的作用下就可以開始轉(zhuǎn)錄形成mRNA,同時這個增強子它也會在這個RNA聚合酶2的作用下形成eRNA。)

圖二、真核基因轉(zhuǎn)錄調(diào)控(增強子和啟動子的相互作用)
三、什么是超級增強子?
除了增強子是調(diào)控細胞基因時空表達關(guān)鍵的順式作用元件外,2013年有科學家基于當時增強子的研究,第一次提出了超級增強子(Super-enhancer, SE)概念,并將相關(guān)研究結(jié)果發(fā)表在Cell期刊上。超級增強子(Super-enhancer, SE)是基因組中大量增強子富集的轉(zhuǎn)錄調(diào)控區(qū)域,能夠大幅度地激活基因的表達,且具有較高的組織特異性。與普通增強子相比,超級增強子的區(qū)域跨度范圍通??蛇_820Kb,遠高于普通增強子的200-300bp跨度范圍。此外,超級增強子比普通增強子具有更強的轉(zhuǎn)錄激活相關(guān)組蛋白修飾、輔因子及轉(zhuǎn)錄因子富集密度,可以富集高密度的關(guān)鍵轉(zhuǎn)錄因子(Master transcription factors)、Bromodomain containing4蛋白(BRD4)、輔因子(Mediator,cohesin)和增強子表觀修飾標記(H3K27ac,H3Kme1等)、染色質(zhì)修飾因子(P300、Pol2和DNAseⅠ等),通過這些特征我們可以識別增強子或者超級增強子。
圖三、超級增強子結(jié)構(gòu)示意圖
四、為什么要研究超級增強子
一個課題最開始往往是研究某個基因的序列信息以及基因所行駛的功能作用,這些是屬于基因的下游研究。但當下游研究累積到一定經(jīng)驗之后,大家往往開始著手于研究基因的上游調(diào)控機理,即不單關(guān)注某個基因如何影響細胞活動,更關(guān)注哪些因素影響這個基因的功能發(fā)揮。調(diào)控機理研究理論上會涉及多個層面的因素,例如:轉(zhuǎn)錄因子、增強子、蛋白激酶、miRNA、DNA甲基化、組蛋白修飾、lncRNA等。上節(jié)視頻我們學習了轉(zhuǎn)錄因子的相關(guān)內(nèi)容,而增強子跟轉(zhuǎn)錄因子一樣,也會影響基因轉(zhuǎn)錄。其中普通增強子影響的基因范圍比較小,而超級增強子會影響大量的基因,如果我們能抓住上游的超級增強子,也就意味著我們能拿捏下游很多的靶基因(打個比方:擒賊先擒王。。。),幫助我們?nèi)ジ玫耐诰蚧虻恼麄€表達調(diào)控網(wǎng)絡(luò)。從2013年至今,以SE為研究對象的高分文章不斷涌現(xiàn),文章已有6000多篇(雖然多,但是不算多,且由于疫情的影響2023年發(fā)文數(shù)量明顯下降,非常具有研究前景),目前對于超級增強子的大部分研究是在惡性腫瘤中進行的,涉及到多種癌癥類型包括白血病、結(jié)直腸癌/大腸癌、乳腺癌、肝癌、膠質(zhì)瘤、肺癌等,表明其在惡性腫瘤發(fā)生、細胞分化、免疫應(yīng)答等重要生物學過程中發(fā)揮著重要調(diào)控功能。
五、如何對增強子和超級增強子進行鑒定
我們要研究某個基因的增強子和超級增強子的功能,首先需要用實驗(如經(jīng)典的ChIP-seq實驗)來識別目的樣本中的增強子序列(增強子一般具有組織或細胞特異性,許多增強子只在某些細胞或組織中表現(xiàn)活性);然后基于基因敲除或基因干擾技術(shù),研究SE的功能。
根據(jù)目前已有的研究,增強子區(qū)域有許多特定的特征,可以幫助我們鑒定基因組中的增強子,包括輔因子(Mediator、cohesion)、組蛋白修飾標記(H3K27ac和H3K4me1)、染色體修飾分子(p300)、BET家族蛋白(BRD4)、RNA聚合酶II等。Mediator是轉(zhuǎn)錄因子和RNA聚合酶II的橋梁,用于調(diào)節(jié)基因的轉(zhuǎn)錄;而cohesion是染色質(zhì)三維結(jié)構(gòu)的重要角色;H3K27ac可以識別大部分由主轉(zhuǎn)錄因子形成的超級增強子以及數(shù)據(jù)的準確,目前以 H3K27ac為標記的識別最為廣泛;BRD4和p300是轉(zhuǎn)錄因子結(jié)合的共激活因子,同時P300作為組蛋白乙酰轉(zhuǎn)移酶,是增強子活性標志物,能夠通過染色質(zhì)重塑來調(diào)節(jié)轉(zhuǎn)錄(為了更好地預(yù)測和表征增強子,應(yīng)該并行研究多個特征,因為具有單一特征的區(qū)域也可能是其他順式調(diào)控元件或基因編碼區(qū))。識別到增強子之后,利用ROSE軟件,根據(jù)增強子轉(zhuǎn)錄活性標記分子結(jié)合水平強度的差異鑒定超級增強子和普通增強子,繼而進行后續(xù)的功能實驗。
圖四、超級增強子鑒定流程
六、怎么通過數(shù)據(jù)庫查找增強子和超級增強子序列
利用上述實驗辦法鑒定增強子和超級增強子耗時且需要投入大量財力,隨著計算機的發(fā)展,逐漸開發(fā)出許多的增強子數(shù)據(jù)庫,這些數(shù)據(jù)庫可以幫助我們預(yù)測增強子的位置、所包括的活性修飾及可對增強子進行系統(tǒng)的整合和分析,后續(xù)也可以輔助驗證CHIP實驗數(shù)據(jù)。目前主要有這幾個數(shù)據(jù)庫可供使用:SEA(包含人類、 小鼠、果蠅和秀麗隱桿線蟲、斑馬魚、雞、黑猩猩、恒河猴、綿羊、非洲爪蟾和棘魚等11個物種的增強子信息);dbSuper(包含人和小鼠的增強子數(shù)據(jù));SEanalysis和SEdb(包含人的增強子數(shù)據(jù)),我們將給大家演示如何利用上述數(shù)據(jù)庫進行增強子和超級增強子的預(yù)測,希望能給大家?guī)硇碌难芯恳暯?。大家想看版本的可直接點擊↓↓↓
《【Up主爆肝輸出】全網(wǎng)最全:基因的表達調(diào)控之—增強子/超級增強子(理論+在線數(shù)據(jù)庫操作演示)。視頻有一定深度,云里霧里的小伙伴可以把前面幾期視頻一起看完哦》
→→還可以和小伙伴加入交流群一起探討哦
