利用Map viewer 查找基因序列、mRNA 序列、啟動子(Promoter)
NCBI (National Center for Biotechnology Information)是指美國國立生物技術信息中心。理解自然無聲但精妙的關于生命細胞的語言是現代分子生物學的要求。
發現新的手段去處理這些數據的容量和復雜性,并且為研究人員提供更好的便利來獲得分析和計算的工具,以便推動對我們遺傳之物和其在健康和疾病中角色的理解。
NCBI首先創建GenBank數據庫,在重點開發GenBank的同時,又于1991年開發了Entrez 數據庫檢索系統。該系統整合了GenBank、EMBL、PIR和SWISS-PROT等數據庫的序列信息以及MEDLINE有關序列的文獻信息,并通過相關鏈接,將他們有機地結合在一起。NCBI還提供了其它數據庫,包括在線人類孟德爾遺傳(OMIM)、三維蛋白結構的分子模型數據庫(MMDB)、人類基因序列集成(UniGene)、人類基因組基因圖譜(GMHG)、生物門類(Taxonomy) 等數據庫。上海創賽科技提供豬白細胞介素6Elisa試劑盒,Porcine Interleukin-6,IL-6 ELISA Kit ,商品編號:LH-E10103PO-96T,價格1530元。
下面以人的IL6(白細胞介素6)為例講述一下具體的操作步驟
1.打開Map viewer 頁面,網址為:http://www.ncbi.nlm.nih.gov/mapview/index.html在search 的下拉菜單里選擇物種,for 后面填寫你的目的基因。操作完畢如圖所示:
2.點擊“GO”出現如下頁面:
3.在步驟二圖示的右下角有一個Quick Filter,下面是讓你選擇的幾個復選框,在Gene前面的小方框里打勾,然后點擊Filter. 出現下圖:
4.點擊上述三條序列第一條序列(即reference)對應的"Genes seq",出現新的頁面,頁面下方為:
5.點擊上圖出現的“Download/View Sequence/Evidence ”,即下載查看序列等功能,結果如圖所示:
先對上面這張圖做點簡要的說明,在Sequence Format(序列輸出格式)后面是一個下拉式選擇菜單,默認的為FASTA 格式,還有一個是GenBank 格式。我推薦大家選擇GenBnak格式,因為這個格式提供了很多該基因的信息,而FASTA 格式只有基因序列。
6.在Sequence Format 后選擇GenBank,然后點擊下面的Display,目的基因的相關信息和序列就出現在眼前了。在上述打開的網頁中,你可以看到基因長度,基因序列,以及這個基因是如何被報道出來的等各種信息。
圖中: mRNA join(3598..3678,3841..4031,5090..5203,5911..6057, 7803..8394)這代表了從基因的3598 位開始就是轉錄區了,即我們常說的mRNA 片斷,由于內含子的存在,所以mRNA 在DNA 序列上分成了幾段。
CDS join(3660..3678,3841..4031,5090..5203,5911..6057, 7803..7970)
CDS 代表編碼序列,即蛋白編碼區是從3660 開始的(ATG),由于剪接作用所以CDS 區也是不連續的。
說到這里,可能很多朋友都已經明白了promoter 即啟動子區域在哪里了:轉錄起始位點前面是基因的調控區,啟動子區沒有明顯的位置定義,大家也只是猜測它的大體位置,如果要研究promoter 區的話,建議選擇轉錄起始位點前的2000個堿基進行研究,一般默認的是這樣。當然如果覺得長度太長不好研究的話,也可以只研究-1000 到0 這一千個堿基,因為一般情況下,啟動子區的變異都在這個區域內。
CANSPEC品質提供的性能卓越,其優秀的品質滿足您不同實驗的多種需求,生化試劑,細胞因子,胎牛血清,電泳設備,實驗室耗材,上海創賽,海量產品特價促銷中,歡迎來電咨詢!