2015年1月15日 星期四

分子生物學資料庫專論期末作業

1. 請選出一個跟你論文主題相關的基因 (gene X)。

我們實驗室的研究主要探討一個存在Vibrio vulnificus創傷弧菌裡的蛋白Leucine-responsive regulatory protein (Lrp)。在學長姊的實驗中已知突變掉或剔除此Lrp基因V. vulnificus則會喪失毒力,而我們希望了解其中原因,但在V.v中有關Lrp的文獻相當稀少,有關Lrp的研究以E.coli最多。Lrp是一個普遍存在細菌與古細菌的global regulator,能夠藉由與DNA的結合來調控許多基因的表現,調控的基因包含參與代謝、物質運送及毒力相關的反應路徑。而在V. vulnificus我們希望透過RNA-seq以及ChIP-seq的實驗來分析Lrp的毒力調控網絡。


2. 將gene X於PubMed或相關文獻探勘軟體,進行篇數,年代,作者趨勢分析。

利用EndNote X7軟體搜尋近二十年於PubMed有關Lrp的文獻,共有268篇(以title or abstract搜尋Leucine-responsive regulatory protein),下圖呈現每年有關Lrp文獻的篇數,折線圖可發現Lrp的研究呈現震盪趨式,且有日趨緩慢下降,可能的原因為Lrp是較上游的基因調控者,許多研究已開始探索下游的路徑,包含怎麼直接影響生理反應,且現今的技術已可以快速研究全基因體的調控,因此只發現Lrp能直接調控某基因可能也無法發表paper了。















從Endnote X7搜尋結果不難發現Calvo, J. M.作者在Lrp早期的文獻不斷出現,而且其實驗室是最早從E.coli中被發現Lrp在調控基因上扮演重要角色,且會受到leucine濃度的影響而改變調控基因的能力(雖然後面有其他實驗室證明不是每個基因的調控都受leucine影響),所以此作者是最先為Lrp取名為Leucine-responsive regulatory protein的。

後來開始不斷有其他實驗室也開始在E.coli中發現其他能被Lrp調控的基因,也就開始對Lrp有global regulator的稱號。Dr. Calvo, J. M一直到2005年還有持續對E.coli Lrp有所研究,從一開始的基因調控,接下來對Lrp的蛋白結構分析,甚至是DNA-binding的研究都有涉及到,在這期間他也是首先發現在非E.coli細菌Salmonella typhimurium中Lrp能夠調控其毒力基因(1993年),同年Sokatch, J.R.實驗室也在Pseudomonas putida發現Lrp能夠調控其轉錄因子的表現, 從此之後除了上述兩隻非E.coli細菌,也開始陸續有在其他細菌中開始探討Lrp的角色,例如Bacillus subtilis及Vibrio vulnificus(只有兩篇,相對算少),但主流一直都是E.coli

一直到2001年開始,Oost, J.實驗室首先在古細菌中發現Lrp-like的蛋白(Pyrococcus furiosus),並且在隔年也發現另一古細菌Sulfolobus solfataricus發現Lrp-like的蛋白能夠調控胺基酸的代謝,至今古細菌的Lrp研究仍持續不斷,但相對的E.coli的研究已逐漸變少。也由於技術的進步,近幾年的文獻蠻多都直接呈現全基因體的profile data,全方位探討Lrp的調控機制。


3. 將gene X利用NCBI Gene入口,獲得相關序列資訊(包括 genomic, reference sequence, peptide sequence)

我們所分析的對象為台灣創傷弧菌的臨床strain YJ016,其基因體序列已在先前被我們實驗室與陽明大學合作而定序完成,且上傳至NCBI上。Lrp此基因位於YJ016的一號染色體上,編號為VV1312,DNA長度495 bp,胺基酸長度為164 aa。以下為Lrp的核甘酸序列及胺基酸序列(從NCBI網站搜尋,以Fasta形式下載)。

>gi|37509034:1347408-1347902 Vibrio vulnificus YJ016 DNA, chromosome I, complete sequence

ATGGTAGATAACTACAAAAAGCCGTCCAAGGATCTAGACCGTATCGATCGCAATATTTTGAATGAATTGCAGAAAGATGGTCGAATTTCAAACGTTGAACTCTCTAAACGCGTGGGGCTTTCTCCAACTCCATGTTTAGAGCGTGTTCGTCGCTTAGAGCGTCAAGGATACATTACGGGTTATACCGCATTGTTAAACCCTCAATACCTAGACGCCTCATTGCTCGTGTTTGTTGAAATTACGTTAAATCGTGGTGCGCCCGATGTATTTGAACAGTTTAATGCCGCGGTTCAAAAACTGGATGATATCCAAGAGTGTCATCTTGTTTCTGGTGATTTCGACTATCTATTAAAAACGCGTGTATCTGATATGGGTGCTTACCGTAAATTGCTCGGTGATACTCTGCTTCGTTTACCAGGTGTAAATGACACTCGAACCTACGTTGTAATGGAAGAAGTGAAGCAAACCAACCAACTTGTGATTAAAACACGTTAA

>gi|37198249|dbj|BAC94085.1| leucine-responsive regulatory protein [Vibrio vulnificus YJ016]

MVDNYKKPSKDLDRIDRNILNELQKDGRISNVELSKRVGLSPTPCLERVRRLERQGYITGYTALLNPQYLDASLLVFVEITLNRGAPDVFEQFNAAVQKLDDIQECHLVSGDFDYLLKTRVSDMGAYRKLLGDTLLRLPGVNDTRTYVVMEEVKQTNQLVIKTR


4. 利用gene X的序列進行Blastn或Blastp,找出至少10條以上,20條以下,不同種 (species)的序列,進行Phylip分析。使用方法為NJ與ML。bootstrap設定在n = 250。

將創傷弧菌YJ016 Lrp核酸序列進行nucleotide blast分析,並選擇More dissimilar sequences (discontiguous megablast)來搜尋其他較相似的序列。

在高相似性序列中不難發現都是屬於創傷弧菌但為不同strains,可達98%以上相似;接下來次等相似序列的,可發現多為弧菌屬(Vibrio)的細菌,也都有85%以上的相似;再下來就可發現其他種的細菌之Lrp,相似性也可達79%以上,可證明Lrp應該是普遍存在細菌且高度保留的基因。 














進而從中隨機挑選十隻都含有Lrp而不同種的細菌(包含創傷弧菌YJ016,100%),藉由下載各Lrp序列來分析細菌之間的親緣關係。
Strain
Lrp nucleotide sequence identity
Vibrio vulnificus YJ016
100%
Vibrio splendidus LGP32
88%
Vibrio parahaemolyticus UCM-V493
87%
Vibrio harveyi strain ATCC 33843
87%
Vibrio coralliilyticus strain RE98
86%
Vibrio alginolyticus NBRC
86%
Vibrio campbellii ATCC BAA-1116
86%
Vibrio anguillarum strain NB10
85%
Listonella anguillarum M3
85%
Photorhabdus luminescens strain NC19
84%

先以BioEdit軟體比對來自十種不同菌株的Lrp核甘酸序列,並存檔至phylip-3.69資料夾 > exe資料夾,而檔名改Infile (消附檔名.phy)。












按照下圖流程,不斷利用程式進行比對,最終可得到outfile及outtree兩個檔。
















以記事本檔可打開outfile檔,可看到unrooted tree結果。















開啟另一程式TreeViewX,並開啟剛剛建立的outtree檔,即可得到親緣關係樹圖。













5. 將gene X於NCBI GEO profile中尋找相關的表達資訊,至少10個以上,20個以下。製成 tab txt file。再用TMeV畫出聚類分析圖形(至少三種)。

進入NCBI GEO網站後搜尋leucine-responsive regulatory protein,可發現有篇研究在探討E. coli在營養環境環境惡劣時,Lrp是否會進而調控基因的表現來應變環境的變化。利用isogenic Lrp(+) and Lrp(-) 突變株培養在 glucose minimal medium,進而使用Microarrays去比較各基因的表現是否有差異,結果發現有超過400多個基因有顯著的差異,其中有被正調控也有負調控,以參與代謝相關基因最多。















將其MINiML formatted family file(s)檔案下載下來,以TMeV軟體打開,此結果尚未分類。















點入Hierarchical Clustering畫出聚類分析,點開HCL tree而得分類結果。











6. 將上述5. 所得與gene X表達相關基因,利用STRING預測交互作用網路,並列出最有興趣的GO關係圖形 (CC, MF, BF) 三種。

進入STRING網站搜尋leucine-responsive regulatory protein,可發現有許多細菌的Lrp都有被研究過,我們點選由上題引用的GEO文獻中所使用的菌株E. coli K-12,按下continue搜尋與Lrp相關的基因。












搜尋到的結果有一半都與胺基酸代謝相關,包含tyrosine、leucine、lysineru及serine,與上述GEO profile吻合。另外Lrp也跟一些毒力因子的表現有關,例如type 1 subunit fimbrin (pilin),也與膜上運輸蛋白表現也有關。









7. 預測gene X 的蛋白結構圖。

目前還沒有創傷弧菌的Lrp蛋白結構被解析,但在Lrp相關的文獻中知道E. coli及Pyrococcus furiosus的Lrp已被解出。因Lrp是高度保留的蛋白,不同菌株之間DNA序列相似度都可達78%以上,所以蛋白來我們可以從E. coliP. furiosus參考已被解結構的Lrp,並當作模板來預測創傷弧菌的Lrp蛋白結構。

利用RCSB PDB線上網路資料庫 http://www.rcsb.org/可搜尋已被解結構的蛋白,在首頁上直接輸入欲搜尋的蛋白-Leucine-responsive regulatory protein。的確可在搜尋結果上找到E. coliP. furiosus的Lrp蛋白結構,當然還有其他細菌的Lrp已被解出,例如B. subtilisMycobacterium tuberculosis。在網站上所呈現的結構圖往往是Lrp的多聚體形式顯示,複雜、難比較且不好直接看出Lrp monomer的結構,所以可利用PyMol軟體只顯示Lrp單體的結構,以利觀察。






















隨機以E. coliM. tuberculosis的Lrp當作模板,將各蛋白結構下載下來,以PyMol軟體打開並根據胺基酸序列找出單體的部分而顯示出來,可發現在單體的部分的確很好看出兩者的結構上的相似程度,可再次證明Lrp具有高度保留性。

E.coli Lrp monomer





















M. tuberculosis Lrp monomer




















E.coli and M. tuberculosis Lrp monomer alignment




















根據 EMBO Journal Vol. 20 No. 5 pp. 990-997, 2001可找到Pyrococcus furiosus Lrp卡通圖,內文有提到Lrp的保守序列(如下),其保守序列所對應到的結構與上述E.coliM. tuberculosis 的Lrp都有吻合,而細對我們的創傷弧菌Lrp胺基酸序列也可明顯發現保守序列的存在,因此可推測創傷弧菌Lrp結構應該與上述在其他菌找到的相差不多。

Pyrococcus furiosus Lrp卡通圖(上端為N端)



Pyrococcus furiosus E.coli Lrp胺基酸比對(Box為保守序列)。












Lrp N端helix部分被認為與DNA-binding有關,進而能調控特定基因。













8. 預測gene X 的microRNA binding site。

由於細菌是原核生物,目前在原核生物中還未發現有microRNA存在,所以在Lrp基因不會有miRNA的結合位置。有關尋找microRNA binding site在先前作業中有利用真核基因當作作業而練習過,方法以記錄在部落格中。

沒有留言:

張貼留言