我們實驗室的研究主要探討一個存在Vibrio vulnificus創傷弧菌裡的蛋白Leucine-responsive regulatory protein (Lrp)。在學長姊的實驗中已知突變掉或剔除此Lrp基因V. vulnificus則會喪失毒力,而我們希望了解其中原因,但在V.v中有關Lrp的文獻相當稀少,有關Lrp的研究以E.coli最多。Lrp是一個普遍存在細菌與古細菌的global regulator,能夠藉由與DNA的結合來調控許多基因的表現,調控的基因包含參與代謝、物質運送及毒力相關的反應路徑。而在V. vulnificus我們希望透過RNA-seq以及ChIP-seq的實驗來分析Lrp的毒力調控網絡。
2. 將gene X於PubMed或相關文獻探勘軟體,進行篇數,年代,作者趨勢分析。
利用EndNote X7軟體搜尋近二十年於PubMed有關Lrp的文獻,共有268篇(以title or abstract搜尋Leucine-responsive regulatory protein),下圖呈現每年有關Lrp文獻的篇數,折線圖可發現Lrp的研究呈現震盪趨式,且有日趨緩慢下降,可能的原因為Lrp是較上游的基因調控者,許多研究已開始探索下游的路徑,包含怎麼直接影響生理反應,且現今的技術已可以快速研究全基因體的調控,因此只發現Lrp能直接調控某基因可能也無法發表paper了。
從Endnote X7搜尋結果不難發現Calvo, J. M.作者在Lrp早期的文獻不斷出現,而且其實驗室是最早從E.coli中被發現Lrp在調控基因上扮演重要角色,且會受到leucine濃度的影響而改變調控基因的能力(雖然後面有其他實驗室證明不是每個基因的調控都受leucine影響),所以此作者是最先為Lrp取名為Leucine-responsive regulatory protein的。
後來開始不斷有其他實驗室也開始在E.coli中發現其他能被Lrp調控的基因,也就開始對Lrp有global regulator的稱號。Dr. Calvo, J. M一直到2005年還有持續對E.coli Lrp有所研究,從一開始的基因調控,接下來對Lrp的蛋白結構分析,甚至是DNA-binding的研究都有涉及到,在這期間他也是首先發現在非E.coli細菌Salmonella typhimurium中Lrp能夠調控其毒力基因(1993年),同年Sokatch, J.R.實驗室也在Pseudomonas putida發現Lrp能夠調控其轉錄因子的表現, 從此之後除了上述兩隻非E.coli細菌,也開始陸續有在其他細菌中開始探討Lrp的角色,例如Bacillus subtilis及Vibrio vulnificus(只有兩篇,相對算少),但主流一直都是E.coli。
一直到2001年開始,Oost, J.實驗室首先在古細菌中發現Lrp-like的蛋白(Pyrococcus furiosus),並且在隔年也發現另一古細菌Sulfolobus solfataricus發現Lrp-like的蛋白能夠調控胺基酸的代謝,至今古細菌的Lrp研究仍持續不斷,但相對的E.coli的研究已逐漸變少。也由於技術的進步,近幾年的文獻蠻多都直接呈現全基因體的profile data,全方位探討Lrp的調控機制。
3. 將gene X利用NCBI Gene入口,獲得相關序列資訊(包括 genomic, reference sequence, peptide sequence)
我們所分析的對象為台灣創傷弧菌的臨床strain YJ016,其基因體序列已在先前被我們實驗室與陽明大學合作而定序完成,且上傳至NCBI上。Lrp此基因位於YJ016的一號染色體上,編號為VV1312,DNA長度495 bp,胺基酸長度為164 aa。以下為Lrp的核甘酸序列及胺基酸序列(從NCBI網站搜尋,以Fasta形式下載)。
>gi|37509034:1347408-1347902 Vibrio vulnificus YJ016 DNA, chromosome I, complete sequence
ATGGTAGATAACTACAAAAAGCCGTCCAAGGATCTAGACCGTATCGATCGCAATATTTTGAATGAATTGCAGAAAGATGGTCGAATTTCAAACGTTGAACTCTCTAAACGCGTGGGGCTTTCTCCAACTCCATGTTTAGAGCGTGTTCGTCGCTTAGAGCGTCAAGGATACATTACGGGTTATACCGCATTGTTAAACCCTCAATACCTAGACGCCTCATTGCTCGTGTTTGTTGAAATTACGTTAAATCGTGGTGCGCCCGATGTATTTGAACAGTTTAATGCCGCGGTTCAAAAACTGGATGATATCCAAGAGTGTCATCTTGTTTCTGGTGATTTCGACTATCTATTAAAAACGCGTGTATCTGATATGGGTGCTTACCGTAAATTGCTCGGTGATACTCTGCTTCGTTTACCAGGTGTAAATGACACTCGAACCTACGTTGTAATGGAAGAAGTGAAGCAAACCAACCAACTTGTGATTAAAACACGTTAA
>gi|37198249|dbj|BAC94085.1| leucine-responsive regulatory protein [Vibrio vulnificus YJ016]
MVDNYKKPSKDLDRIDRNILNELQKDGRISNVELSKRVGLSPTPCLERVRRLERQGYITGYTALLNPQYLDASLLVFVEITLNRGAPDVFEQFNAAVQKLDDIQECHLVSGDFDYLLKTRVSDMGAYRKLLGDTLLRLPGVNDTRTYVVMEEVKQTNQLVIKTR
4. 利用gene X的序列進行Blastn或Blastp,找出至少10條以上,20條以下,不同種 (species)的序列,進行Phylip分析。使用方法為NJ與ML。bootstrap設定在n = 250。
將創傷弧菌YJ016 Lrp核酸序列進行nucleotide blast分析,並選擇More dissimilar sequences (discontiguous megablast)來搜尋其他較相似的序列。
在高相似性序列中不難發現都是屬於創傷弧菌但為不同strains,可達98%以上相似;接下來次等相似序列的,可發現多為弧菌屬(Vibrio)的細菌,也都有85%以上的相似;再下來就可發現其他種的細菌之Lrp,相似性也可達79%以上,可證明Lrp應該是普遍存在細菌且高度保留的基因。
進而從中隨機挑選十隻都含有Lrp而不同種的細菌(包含創傷弧菌YJ016,100%),藉由下載各Lrp序列來分析細菌之間的親緣關係。
Strain
|
Lrp nucleotide
sequence identity
|
Vibrio vulnificus YJ016
|
100%
|
Vibrio splendidus LGP32
|
88%
|
Vibrio
parahaemolyticus UCM-V493
|
87%
|
Vibrio harveyi strain
ATCC 33843
|
87%
|
Vibrio
coralliilyticus strain RE98
|
86%
|
Vibrio alginolyticus NBRC
|
86%
|
Vibrio campbellii ATCC
BAA-1116
|
86%
|
Vibrio
anguillarum strain NB10
|
85%
|
Listonella
anguillarum M3
|
85%
|
Photorhabdus
luminescens strain NC19
|
84%
|
以記事本檔可打開outfile檔,可看到unrooted tree結果。
開啟另一程式TreeViewX,並開啟剛剛建立的outtree檔,即可得到親緣關係樹圖。
5. 將gene X於NCBI GEO profile中尋找相關的表達資訊,至少10個以上,20個以下。製成 tab txt file。再用TMeV畫出聚類分析圖形(至少三種)。
進入NCBI GEO網站後搜尋leucine-responsive regulatory protein,可發現有篇研究在探討E. coli在營養環境環境惡劣時,Lrp是否會進而調控基因的表現來應變環境的變化。利用isogenic Lrp(+) and Lrp(-) 突變株培養在 glucose minimal medium,進而使用Microarrays去比較各基因的表現是否有差異,結果發現有超過400多個基因有顯著的差異,其中有被正調控也有負調控,以參與代謝相關基因最多。
6. 將上述5. 所得與gene X表達相關基因,利用STRING預測交互作用網路,並列出最有興趣的GO關係圖形 (CC, MF, BF) 三種。
進入STRING網站搜尋leucine-responsive regulatory protein,可發現有許多細菌的Lrp都有被研究過,我們點選由上題引用的GEO文獻中所使用的菌株E. coli K-12,按下continue搜尋與Lrp相關的基因。
搜尋到的結果有一半都與胺基酸代謝相關,包含tyrosine、leucine、lysineru及serine,與上述GEO profile吻合。另外Lrp也跟一些毒力因子的表現有關,例如type 1 subunit fimbrin (pilin),也與膜上運輸蛋白表現也有關。
7. 預測gene X 的蛋白結構圖。
目前還沒有創傷弧菌的Lrp蛋白結構被解析,但在Lrp相關的文獻中知道E. coli及Pyrococcus furiosus的Lrp已被解出。因Lrp是高度保留的蛋白,不同菌株之間DNA序列相似度都可達78%以上,所以蛋白來我們可以從E. coli及P. furiosus參考已被解結構的Lrp,並當作模板來預測創傷弧菌的Lrp蛋白結構。
利用RCSB PDB線上網路資料庫 http://www.rcsb.org/可搜尋已被解結構的蛋白,在首頁上直接輸入欲搜尋的蛋白-Leucine-responsive regulatory protein。的確可在搜尋結果上找到E. coli及P. furiosus的Lrp蛋白結構,當然還有其他細菌的Lrp已被解出,例如B. subtilis、Mycobacterium tuberculosis。在網站上所呈現的結構圖往往是Lrp的多聚體形式顯示,複雜、難比較且不好直接看出Lrp monomer的結構,所以可利用PyMol軟體只顯示Lrp單體的結構,以利觀察。
隨機以E. coli及M. tuberculosis的Lrp當作模板,將各蛋白結構下載下來,以PyMol軟體打開並根據胺基酸序列找出單體的部分而顯示出來,可發現在單體的部分的確很好看出兩者的結構上的相似程度,可再次證明Lrp具有高度保留性。
M. tuberculosis Lrp monomer
E.coli and M. tuberculosis Lrp monomer alignment
Pyrococcus furiosus Lrp卡通圖(上端為N端)
Lrp N端helix部分被認為與DNA-binding有關,進而能調控特定基因。
8. 預測gene X 的microRNA binding site。
由於細菌是原核生物,目前在原核生物中還未發現有microRNA存在,所以在Lrp基因不會有miRNA的結合位置。有關尋找microRNA binding site在先前作業中有利用真核基因當作作業而練習過,方法以記錄在部落格中。