2015年1月15日 星期四

分子生物學資料庫專論期末作業

1. 請選出一個跟你論文主題相關的基因 (gene X)。

我們實驗室的研究主要探討一個存在Vibrio vulnificus創傷弧菌裡的蛋白Leucine-responsive regulatory protein (Lrp)。在學長姊的實驗中已知突變掉或剔除此Lrp基因V. vulnificus則會喪失毒力,而我們希望了解其中原因,但在V.v中有關Lrp的文獻相當稀少,有關Lrp的研究以E.coli最多。Lrp是一個普遍存在細菌與古細菌的global regulator,能夠藉由與DNA的結合來調控許多基因的表現,調控的基因包含參與代謝、物質運送及毒力相關的反應路徑。而在V. vulnificus我們希望透過RNA-seq以及ChIP-seq的實驗來分析Lrp的毒力調控網絡。


2. 將gene X於PubMed或相關文獻探勘軟體,進行篇數,年代,作者趨勢分析。

利用EndNote X7軟體搜尋近二十年於PubMed有關Lrp的文獻,共有268篇(以title or abstract搜尋Leucine-responsive regulatory protein),下圖呈現每年有關Lrp文獻的篇數,折線圖可發現Lrp的研究呈現震盪趨式,且有日趨緩慢下降,可能的原因為Lrp是較上游的基因調控者,許多研究已開始探索下游的路徑,包含怎麼直接影響生理反應,且現今的技術已可以快速研究全基因體的調控,因此只發現Lrp能直接調控某基因可能也無法發表paper了。















從Endnote X7搜尋結果不難發現Calvo, J. M.作者在Lrp早期的文獻不斷出現,而且其實驗室是最早從E.coli中被發現Lrp在調控基因上扮演重要角色,且會受到leucine濃度的影響而改變調控基因的能力(雖然後面有其他實驗室證明不是每個基因的調控都受leucine影響),所以此作者是最先為Lrp取名為Leucine-responsive regulatory protein的。

後來開始不斷有其他實驗室也開始在E.coli中發現其他能被Lrp調控的基因,也就開始對Lrp有global regulator的稱號。Dr. Calvo, J. M一直到2005年還有持續對E.coli Lrp有所研究,從一開始的基因調控,接下來對Lrp的蛋白結構分析,甚至是DNA-binding的研究都有涉及到,在這期間他也是首先發現在非E.coli細菌Salmonella typhimurium中Lrp能夠調控其毒力基因(1993年),同年Sokatch, J.R.實驗室也在Pseudomonas putida發現Lrp能夠調控其轉錄因子的表現, 從此之後除了上述兩隻非E.coli細菌,也開始陸續有在其他細菌中開始探討Lrp的角色,例如Bacillus subtilis及Vibrio vulnificus(只有兩篇,相對算少),但主流一直都是E.coli

一直到2001年開始,Oost, J.實驗室首先在古細菌中發現Lrp-like的蛋白(Pyrococcus furiosus),並且在隔年也發現另一古細菌Sulfolobus solfataricus發現Lrp-like的蛋白能夠調控胺基酸的代謝,至今古細菌的Lrp研究仍持續不斷,但相對的E.coli的研究已逐漸變少。也由於技術的進步,近幾年的文獻蠻多都直接呈現全基因體的profile data,全方位探討Lrp的調控機制。


3. 將gene X利用NCBI Gene入口,獲得相關序列資訊(包括 genomic, reference sequence, peptide sequence)

我們所分析的對象為台灣創傷弧菌的臨床strain YJ016,其基因體序列已在先前被我們實驗室與陽明大學合作而定序完成,且上傳至NCBI上。Lrp此基因位於YJ016的一號染色體上,編號為VV1312,DNA長度495 bp,胺基酸長度為164 aa。以下為Lrp的核甘酸序列及胺基酸序列(從NCBI網站搜尋,以Fasta形式下載)。

>gi|37509034:1347408-1347902 Vibrio vulnificus YJ016 DNA, chromosome I, complete sequence

ATGGTAGATAACTACAAAAAGCCGTCCAAGGATCTAGACCGTATCGATCGCAATATTTTGAATGAATTGCAGAAAGATGGTCGAATTTCAAACGTTGAACTCTCTAAACGCGTGGGGCTTTCTCCAACTCCATGTTTAGAGCGTGTTCGTCGCTTAGAGCGTCAAGGATACATTACGGGTTATACCGCATTGTTAAACCCTCAATACCTAGACGCCTCATTGCTCGTGTTTGTTGAAATTACGTTAAATCGTGGTGCGCCCGATGTATTTGAACAGTTTAATGCCGCGGTTCAAAAACTGGATGATATCCAAGAGTGTCATCTTGTTTCTGGTGATTTCGACTATCTATTAAAAACGCGTGTATCTGATATGGGTGCTTACCGTAAATTGCTCGGTGATACTCTGCTTCGTTTACCAGGTGTAAATGACACTCGAACCTACGTTGTAATGGAAGAAGTGAAGCAAACCAACCAACTTGTGATTAAAACACGTTAA

>gi|37198249|dbj|BAC94085.1| leucine-responsive regulatory protein [Vibrio vulnificus YJ016]

MVDNYKKPSKDLDRIDRNILNELQKDGRISNVELSKRVGLSPTPCLERVRRLERQGYITGYTALLNPQYLDASLLVFVEITLNRGAPDVFEQFNAAVQKLDDIQECHLVSGDFDYLLKTRVSDMGAYRKLLGDTLLRLPGVNDTRTYVVMEEVKQTNQLVIKTR


4. 利用gene X的序列進行Blastn或Blastp,找出至少10條以上,20條以下,不同種 (species)的序列,進行Phylip分析。使用方法為NJ與ML。bootstrap設定在n = 250。

將創傷弧菌YJ016 Lrp核酸序列進行nucleotide blast分析,並選擇More dissimilar sequences (discontiguous megablast)來搜尋其他較相似的序列。

在高相似性序列中不難發現都是屬於創傷弧菌但為不同strains,可達98%以上相似;接下來次等相似序列的,可發現多為弧菌屬(Vibrio)的細菌,也都有85%以上的相似;再下來就可發現其他種的細菌之Lrp,相似性也可達79%以上,可證明Lrp應該是普遍存在細菌且高度保留的基因。 














進而從中隨機挑選十隻都含有Lrp而不同種的細菌(包含創傷弧菌YJ016,100%),藉由下載各Lrp序列來分析細菌之間的親緣關係。
Strain
Lrp nucleotide sequence identity
Vibrio vulnificus YJ016
100%
Vibrio splendidus LGP32
88%
Vibrio parahaemolyticus UCM-V493
87%
Vibrio harveyi strain ATCC 33843
87%
Vibrio coralliilyticus strain RE98
86%
Vibrio alginolyticus NBRC
86%
Vibrio campbellii ATCC BAA-1116
86%
Vibrio anguillarum strain NB10
85%
Listonella anguillarum M3
85%
Photorhabdus luminescens strain NC19
84%

先以BioEdit軟體比對來自十種不同菌株的Lrp核甘酸序列,並存檔至phylip-3.69資料夾 > exe資料夾,而檔名改Infile (消附檔名.phy)。












按照下圖流程,不斷利用程式進行比對,最終可得到outfile及outtree兩個檔。
















以記事本檔可打開outfile檔,可看到unrooted tree結果。















開啟另一程式TreeViewX,並開啟剛剛建立的outtree檔,即可得到親緣關係樹圖。













5. 將gene X於NCBI GEO profile中尋找相關的表達資訊,至少10個以上,20個以下。製成 tab txt file。再用TMeV畫出聚類分析圖形(至少三種)。

進入NCBI GEO網站後搜尋leucine-responsive regulatory protein,可發現有篇研究在探討E. coli在營養環境環境惡劣時,Lrp是否會進而調控基因的表現來應變環境的變化。利用isogenic Lrp(+) and Lrp(-) 突變株培養在 glucose minimal medium,進而使用Microarrays去比較各基因的表現是否有差異,結果發現有超過400多個基因有顯著的差異,其中有被正調控也有負調控,以參與代謝相關基因最多。















將其MINiML formatted family file(s)檔案下載下來,以TMeV軟體打開,此結果尚未分類。















點入Hierarchical Clustering畫出聚類分析,點開HCL tree而得分類結果。











6. 將上述5. 所得與gene X表達相關基因,利用STRING預測交互作用網路,並列出最有興趣的GO關係圖形 (CC, MF, BF) 三種。

進入STRING網站搜尋leucine-responsive regulatory protein,可發現有許多細菌的Lrp都有被研究過,我們點選由上題引用的GEO文獻中所使用的菌株E. coli K-12,按下continue搜尋與Lrp相關的基因。












搜尋到的結果有一半都與胺基酸代謝相關,包含tyrosine、leucine、lysineru及serine,與上述GEO profile吻合。另外Lrp也跟一些毒力因子的表現有關,例如type 1 subunit fimbrin (pilin),也與膜上運輸蛋白表現也有關。









7. 預測gene X 的蛋白結構圖。

目前還沒有創傷弧菌的Lrp蛋白結構被解析,但在Lrp相關的文獻中知道E. coli及Pyrococcus furiosus的Lrp已被解出。因Lrp是高度保留的蛋白,不同菌株之間DNA序列相似度都可達78%以上,所以蛋白來我們可以從E. coliP. furiosus參考已被解結構的Lrp,並當作模板來預測創傷弧菌的Lrp蛋白結構。

利用RCSB PDB線上網路資料庫 http://www.rcsb.org/可搜尋已被解結構的蛋白,在首頁上直接輸入欲搜尋的蛋白-Leucine-responsive regulatory protein。的確可在搜尋結果上找到E. coliP. furiosus的Lrp蛋白結構,當然還有其他細菌的Lrp已被解出,例如B. subtilisMycobacterium tuberculosis。在網站上所呈現的結構圖往往是Lrp的多聚體形式顯示,複雜、難比較且不好直接看出Lrp monomer的結構,所以可利用PyMol軟體只顯示Lrp單體的結構,以利觀察。






















隨機以E. coliM. tuberculosis的Lrp當作模板,將各蛋白結構下載下來,以PyMol軟體打開並根據胺基酸序列找出單體的部分而顯示出來,可發現在單體的部分的確很好看出兩者的結構上的相似程度,可再次證明Lrp具有高度保留性。

E.coli Lrp monomer





















M. tuberculosis Lrp monomer




















E.coli and M. tuberculosis Lrp monomer alignment




















根據 EMBO Journal Vol. 20 No. 5 pp. 990-997, 2001可找到Pyrococcus furiosus Lrp卡通圖,內文有提到Lrp的保守序列(如下),其保守序列所對應到的結構與上述E.coliM. tuberculosis 的Lrp都有吻合,而細對我們的創傷弧菌Lrp胺基酸序列也可明顯發現保守序列的存在,因此可推測創傷弧菌Lrp結構應該與上述在其他菌找到的相差不多。

Pyrococcus furiosus Lrp卡通圖(上端為N端)



Pyrococcus furiosus E.coli Lrp胺基酸比對(Box為保守序列)。












Lrp N端helix部分被認為與DNA-binding有關,進而能調控特定基因。













8. 預測gene X 的microRNA binding site。

由於細菌是原核生物,目前在原核生物中還未發現有microRNA存在,所以在Lrp基因不會有miRNA的結合位置。有關尋找microRNA binding site在先前作業中有利用真核基因當作作業而練習過,方法以記錄在部落格中。

2015年1月11日 星期日

PyMOL簡單操作&動畫製作

為期三個禮拜的課程王老師教我們利用PyMOL軟體
來分析蛋白的結構以及3D動畫的製作。
而作業則是自己挑選一個有興趣或跟自己實驗相關的蛋白
並利用課堂所教利用PyMOL製作蛋白結構的3D動畫,以下呈現
PyMOL軟體的簡單操作過程,以及動畫的製作結果。


1. 我們實驗室的研究主要focus在一個存在Vibrio vulnificus裡的蛋白
Leucine-responsive regulatory protein (Lrp)。已知突變掉或剔除此Lrp基因
V. vulnificus則會喪失毒力,但在V.v中有關Lrp的文獻相當稀少。有關
Lrp的研究以E.coli最多,Lrp是一個global regulator能夠藉由與DNA的結
合來調控許多基因的表現,調控的基因包含參與代謝、物質運送
及毒力相關的反應路徑

2. 利用RCSB PDB線上網路資料庫 http://www.rcsb.org/來搜尋已被解結構
的蛋白,在首頁上可即時觀看到現今以上傳至資料庫的所有蛋白分子個
數(至今已有105499個),可在首頁上直接輸入欲搜尋的蛋白-Leucine-responsive
 regulatory protein 。

3. 輸入後,由分類欄可看到有用NMR或X-ray所分析到的Lrp結構,網頁再往
下會看到所有搜尋到的Lrp蛋白結構圖,而第一個即是E.coli的Lrp,並點選進
去。



4. 點選進去後可看到完整E.coli Lrp結構圖。此結構圖是用X-ray所分析,且以四聚
體方式呈現,在Lrp結構圖的周邊為蛋白的N端有helix-turn-helix motif,被認為是
與DNA結合的地方;而在結構圖中間的凹洞,被認為是effector分子所結合的
地方,例如leucine,可改變Lrp的結構而影響調控基因的能力。在網頁中也可知道
此結構圖的代號為2GQQ。

5. 開啟PyMOL軟體,按下上面的選項Plugin-->PDB loader service,並輸入2GQQ,
即可出現E.coli的Lrp結構圖,其所顯示並不是網在上的四聚體結構,而是二聚體!。
在圖層欄隱藏(H) lines並顯示(S)cartoon結構,即會改變結構顯示方式。



























6. 可在Display--> background改成白色,加上按下Ray鍵可讓構圖便清晰。
在指令對話框輸入"color red, chain A",以此類推格式可在不同chain(A~D)
換上不同顏色即可將四個不同的Lrp分別出來。可隨時存檔(Save session)
,以免指令輸入錯誤而更動了圖層(就回不去了~~~)。














7. 也可設定不同的chain用不同的結構顯示。可在Display欄選擇顯示sequence,
以指標圈選指定序列而改變此圖層之結構呈現(S)方式。
chain A: sticks
chain B: ribbon
chain C: spheres
chain D: surface














8. 圖層欄Action(A)下選擇generate--> vacuum electrostatic--> protein contact
potential (local),即可分析蛋白區域的帶電性,越偏紅色就帶負電;越藍則帶正電
;白色則是中性,藍色的地方即很有可能為DNA結合的區域。














9. 製作Lrp 3D結構之360度動畫。在指令欄依序輸入如下:
mset 1x120 --> util.mroll 1,120,1 --> set ray_trace_frames=1 --> mpng mov
,指令都正確之後就會開始拍攝不同角度的照片,共有120張。以Movie Maker
匯入這120張照片,在設定0.05秒就顯示一張照片的速度匯出成影片檔,如下。


2014年12月22日 星期一

尋找miRNA target sites

這次上課介紹了真核生物才有的抑制基因表現系統-micro RNA(miRNA)。利用miRNA一些特性(例如大小 迴文序列 有stem loop等)可以預測特定基因上可能被miRNA辨識的位置。

1. 此次操作隨機選了人類miRNA編號18中的hsa-mir-18a-5p來當作主角,並透過http://mirtarbase.mbc.nctu.edu.tw/index.php網站來搜尋人類可被hsa-mir-18a-5p target的基因。















2. 老師再從中隨機指派一個能被hsa-mir-18a-5p target基因-PTEN,反過來我們可再由另一網站https://cm.jefferson.edu/rna22v2.0/來線上預測此基因可能的miRNA target sites。


2-1 進入頁面後,進入網站選擇HOMO SAPIENS,在最下面一欄直接打上欲搜尋的基因名"PTEN",並按下subunit搜尋。

2-2 搜尋後會進入一頁面,再按下View Predictions as cDNA map


2-3 之後會挑出一個新頁面,紅色box就是此基因被預測能與不同miRNA結合的序列,點開choose location/miF可在對應的序列位置找到可能會辨認此位置的miRNA(可有多種,但有些未經證實)。



2-4 尋找hsa-mir-18a-5p在PTEN基因辨認序列。回到2-2圖示頁面,並按下View Predictions as Table搜尋,即可以table的方式得到所有能target PTEN基因的miRNA,可直接利用Ctrl + F搜尋hsa-mir-18a-5p,可發現此miRNA所辨認的序列位置在8037bp。


2-5 回到2-3圖示頁面直接尋找8037bp位置,按下相對應choose location鍵,即可發現hsa-mir-18a-5p此miRNA確實能辨認PTEN基因序列,完成此次作業。





2014年12月10日 星期三

Small Molecular Interaction I- 利用VMD軟體模擬蛋白與水分子間的交互作用

這次上課介紹一個新軟體"VMD",跟PyMol軟體很像,可探討及分析蛋白質的結構。
第一堂課的作業即是自己找一個已被解結構的蛋白,並用VMD軟體模擬此蛋白如何與水分子進行交互作用。

1. 利用RCSB網站 http://www.rcsb.org去搜尋有興趣且被解結構的蛋白。
我找了一個自己實驗中所分析的蛋白Leucine-responsive regulatory protein (Lrp),但是我所研究的細菌Vibrio vulnificus的Lrp尚未被分析結構,但在E.coli中Lrp已被研究很多,包含結構的部分。
搜尋結果如下圖,可知道此Lrp的結構代碼為2GQQ。

2. 打開VMD軟體,開啟蛋白的結構圖。
打開軟體後,在File選項中選擇New molecule,並在filename中輸入利用RCSB網站找到的蛋白結構代碼2GQQ,按下Load鍵稍等片刻即會顯示蛋白結構圖,圖中是三D空間可用滑鼠左右上下翻轉蛋白結構,也可用滑鼠滾輪向前zoom in或向後zoom out,下載此結構檔案(File->Save Visualization State-->存檔)。



3. 改變蛋白結構的顯示。
在Graphics選項中,點選representation會跑出一個視窗,在Drawing Method選項挑選Newcartoon (原本為Line),按下Apply按鍵即可改變蛋白結構的顯示方式。


4. 建立psf檔。
從Extensions選項點選Modelling -> Automatic PSF Builder,直接按下左下角I'm feelinf lucky按鍵,等待片刻會跳出一個視窗,按下確定鍵及建立好psf檔案,結構圖會有稍微不同。 



















5. 加入水分子至蛋白結構圖周圍。
Extensions選項點選Modelling -> Solvation Box,會跳出一個視窗,勾選裡面Rotate to minimize volume,並在Box size X,Y,Z欄都填入15 A(0.1 nm),按下下方Solvate鍵,即完成water box。


2014年11月18日 星期二

利用STRING來預測蛋白與蛋白之間的交互作用

STRING是一個線上網路工具http://string-db.org/,可以用來分析或預測protein-protein interaction。
此網站所分析的結果是根據文獻而整理出來的,利用點與線的關係來呈現目標蛋白與其他蛋白之間的關係。

進入網站後可在首頁上輸入欲分析的蛋白,這裡以Leucine-responsive regulatory protein(Lrp)為例。

搜尋之後,會發現有許多細菌的Lrp都有被研究過(會以A~Z排列),包含文獻最大宗的E.coli
Salmonella。

點選Vibrio vulnificus YJ016,按下網頁最下面的Continue進行預測。

進入新頁面後,即可看到點與線的圖,中間的點為Lrp,周圍是其他跟Lrp相關的蛋白,線代表有直接的關係。由於Vibrio vulnificus YJ016有關Lrp的文獻不多,只有顯示與10個蛋白有直接的關係。

下面有這10個蛋白的全名及胺基酸長度,也有圖示說明上圖的symbol(包含線的顏色)。

這些與Lrp相關的蛋白包含一些與胺基酸代謝的蛋白、膜上運輸蛋白、有關tRNA synthetase及細胞分裂的蛋白,再次證明Lrp是一個能調控很多基因的蛋白。可點開特定蛋白,會顯示蛋白結構、胺基酸序列及一些簡單的蛋白資訊。

按下網頁下面Textmining鍵也可進一步了解這些結果的文獻出處及摘要,了解實驗的內容。