
增強子操作
2024-11-13 15:01:39
來源/作者:普拉特澤-生物醫(yī)學整體課題外包平臺
上一篇師姐帶我們一起學習了增強子的理論知識,那現(xiàn)在我們就一起來學習一下如何用增強子數(shù)據(jù)來進行增強子的預測以及序列下載吧。
一、數(shù)據(jù)庫EnhancerAtlas(http://www.enhanceratlas.org/index2.php)
首先先給大家介紹一下如何用EnhancerAtlas來進行增強子的預測和序列下載。演示:首先在瀏覽器中輸入EnhancerAtlas,進入該網(wǎng)站的首頁,首頁顯示了該數(shù)據(jù)庫的數(shù)據(jù)來源及增強子的數(shù)量:這個數(shù)據(jù)庫包含了來自170種細胞或組織共4,506,217個人類增強子信息和來自150種細胞或組織共2,811,699個小鼠增強子信息。

該數(shù)據(jù)庫有多種檢索方式,支持直接輸入基因名稱或者基因組特定區(qū)域,查看在該區(qū)域內(nèi)的增強子,同時還能比較增強子在不同細胞系中的表達。以鼠源基因klf4為例來演示如何在這個數(shù)據(jù)庫中預測增強子,在選框中選擇物種,選擇細胞或組織,輸入基因名稱,點擊search,跳轉(zhuǎn)到結(jié)果頁面。
該數(shù)據(jù)庫采用了基因組瀏覽器的展示形式,每一行稱之為track。最上方顯示了檢索的范圍為小鼠4號染色體的55342150-55750150bp,即目的基因上下游各20kb,可調(diào)節(jié)滑輪來控制檢索的位置。黑色字體對應行表示每種方法檢測到的該區(qū)域reads覆蓋結(jié)果(如P300、DNA超敏位點、轉(zhuǎn)錄因子結(jié)合位點、組蛋白修飾及染色質(zhì)修飾因子等),有些基因還會有紅色字體,為對應行為綜合多種方法得到的增強子區(qū)域的結(jié)果。由圖可知,該數(shù)據(jù)庫在這個范圍內(nèi)共預測到6個與該基因相關(guān)的增強子,從左到右依次為1-6,2號、3號、6號增強子在幾種增強子特征物處都被檢測到,說明這個位置是潛在的增強子所處的位置,可作為我們的重點關(guān)注對象。點擊show the details可查看每個增強子的細節(jié)(包括增強子ID、增強子在染色體上的位置等),點擊download也可下載預測到的每個增強子的序列,用于后續(xù)CHIP實驗的引物設計。



同時該數(shù)據(jù)庫也可以比較增強子在不同細胞或組織中的表達,檢索框示意如下:選擇想要比較的細胞系或組織,結(jié)果顯示了該基因在不同細胞中的增強子情況,可以看到2號增強子在各細胞或組織中相對保守,在后續(xù)研究中可作為重點關(guān)注對象。同樣可以點擊進去查看各細胞系中的增強子信息細節(jié)及下載增強子序列。
二、dbSuper數(shù)據(jù)庫(http://asntech.org/dbsuper/)
dbSUPER是超級增強子數(shù)據(jù)庫的開山之作,收錄了人和小鼠中的超級增強子信息(兩種方式:一是從PubMed中收集已發(fā)表的,有文獻支持的超級增強子;二是利用ENCODE, GEO等公共數(shù)據(jù)庫下載H3K27ac chip_seq數(shù)據(jù)后采用MACS識別增強子區(qū),ROSE識別超級增強子區(qū))。對于human而言共收錄了來自102種不同細胞/組織共69205個超級增強子;對于mouse而言共收錄了來自25種不同細胞/組織共13029個超級增強子信息。但是該數(shù)據(jù)庫只是提供了超級增強子區(qū)域的染色體位置等基本信息,缺乏對超級增強子區(qū)域內(nèi)的其他基功能元件的注釋。
進入該數(shù)據(jù)庫首頁,點擊左邊的Detailed Search,然后選擇參考基因組(人或鼠),選擇細胞或組織類型,輸入基因名稱,選擇增強子識別因子類型點擊search,即可得到預測結(jié)果,預測結(jié)果顯示了根據(jù)不同的增強子結(jié)合蛋白鑒定出來的超級增強子和增強子,并顯示了該結(jié)果的細胞或組織來源。點擊超級增強子ID進去后會呈現(xiàn)該增強子和關(guān)聯(lián)基因的相關(guān)信息(該超級增強子的位置等),右邊為關(guān)聯(lián)基因的相關(guān)信息,有些基因的信息會有錯誤,建議直接點進NCBI的鏈接進去看基因的相關(guān)信息。然后將左側(cè)的超級增強子的序列位置輸入進來,即為超級增強子的序列。下方還顯示了超級增強子的組分增強子的信息,同樣將這些位置輸入到NCBI中,可查看每個組分增強子的序列。

如果需要查看基因、增強子/超級增強子、轉(zhuǎn)錄因子等調(diào)控網(wǎng)絡,可用下面兩個數(shù)據(jù)庫。
三、SEdb數(shù)據(jù)庫(http://www.licpathway.net/sedb/)
該包含了來自542個樣本的總共331601個超級增強子,采用了H3K27ac組蛋白修飾作為增強子區(qū)的標記,和dbSuper一樣,該數(shù)據(jù)庫也利用從ENCODE、 RoadMap、 GEO等公共數(shù)據(jù)庫中下載的H3K27ac chip-seq數(shù)據(jù)后采用MACS識別增強子區(qū),ROSE識別超級增強子區(qū)。該數(shù)據(jù)庫包含許多超級增強子注釋(SNP位點、Enhancers、TFBS等),且可通過6種不同策略對超級增強子的靶基因進行預測。
瀏覽器中輸入這個網(wǎng)址:http://www.licpathway.net/sedb。這個網(wǎng)站不太好找。然后可以根據(jù)基因名稱或基因位置來進行檢索。以基因SOX4為例,選擇物種,輸入基因名稱,點擊search,得到預測結(jié)果,點擊SE ID可查看詳細信息,右邊還能看到基因、轉(zhuǎn)錄因子、超級增強子及信號通路的共同調(diào)控網(wǎng)絡,往下翻可以看到與超級增強子結(jié)合的轉(zhuǎn)錄因子及與超級增強子關(guān)聯(lián)的信號通路,下方還有SNP位點的分析(網(wǎng)絡不好的時候加載不出來)。
四、SEA數(shù)據(jù)庫(http://sea.edbc.org)
該數(shù)據(jù)庫包含了11個物種164,545個超級增強子(人,小鼠,果蠅,線蟲,斑馬魚,雞,黑猩猩,恒河猴,綿羊,非洲爪蟾和棘背魚)以及3,361,785個典型增強子。同時提供超級增強子區(qū)域的染色質(zhì)相互作用、SNPs、轉(zhuǎn)錄因子結(jié)合位點信息。
瀏覽器中輸入網(wǎng)站,進入官網(wǎng)后點擊上方的Search Engine,根據(jù)自己的實驗需求選擇物種,識別因子,選擇檢索增強子或超級增強子,選擇在編碼區(qū)或非編碼區(qū)檢索,選擇染色體,輸入基因名稱,選擇細胞或組織類型。這里以人源TP53基因為例,選擇human,識別因子,檢索增強子或超級增強子,在編碼區(qū)或非編碼區(qū)檢索這三項都選擇All,選擇17號染色體,輸入基因名稱,點擊search。結(jié)果顯示了增強子和超級增強子的信息,包括在染色體上的位置,長度,關(guān)聯(lián)基因,細胞組織來源,增強子識別因子等。點擊Visual就可以跳轉(zhuǎn)到UCSC上看到可視化的信息了(目前無法查看)。點擊關(guān)聯(lián)我們的目的基因的增強子ID即可查看詳細信息。左側(cè)展示了該超級增強子的基本信息以及轉(zhuǎn)錄因子的情況,右側(cè)展示了增強子、基因,轉(zhuǎn)錄因子的調(diào)控網(wǎng)絡。
大家可以分別用這些數(shù)據(jù)庫去預測,綜合分析后篩選出符合自己實驗需求的增強子或超級增強子。那關(guān)于增強子部分的內(nèi)容就介紹到這里了,紙上得來終覺淺,絕知此事要躬行,希望大家打開電腦跟著一起操作。同時別忘了給我們一鍵三連喲!祝大家科研順利!還有實驗相關(guān)的疑問可以加入我們實驗交流群哦!
