2014年11月18日 星期二

利用STRING來預測蛋白與蛋白之間的交互作用

STRING是一個線上網路工具http://string-db.org/,可以用來分析或預測protein-protein interaction。
此網站所分析的結果是根據文獻而整理出來的,利用點與線的關係來呈現目標蛋白與其他蛋白之間的關係。

進入網站後可在首頁上輸入欲分析的蛋白,這裡以Leucine-responsive regulatory protein(Lrp)為例。

搜尋之後,會發現有許多細菌的Lrp都有被研究過(會以A~Z排列),包含文獻最大宗的E.coli
Salmonella。

點選Vibrio vulnificus YJ016,按下網頁最下面的Continue進行預測。

進入新頁面後,即可看到點與線的圖,中間的點為Lrp,周圍是其他跟Lrp相關的蛋白,線代表有直接的關係。由於Vibrio vulnificus YJ016有關Lrp的文獻不多,只有顯示與10個蛋白有直接的關係。

下面有這10個蛋白的全名及胺基酸長度,也有圖示說明上圖的symbol(包含線的顏色)。

這些與Lrp相關的蛋白包含一些與胺基酸代謝的蛋白、膜上運輸蛋白、有關tRNA synthetase及細胞分裂的蛋白,再次證明Lrp是一個能調控很多基因的蛋白。可點開特定蛋白,會顯示蛋白結構、胺基酸序列及一些簡單的蛋白資訊。

按下網頁下面Textmining鍵也可進一步了解這些結果的文獻出處及摘要,了解實驗的內容。

2014年11月5日 星期三

建立物種親緣關係 by Phylogenetic Tree (Part II)

接續上次進度,這次要利用上禮拜所下載下來的10個胺基酸序列做出親緣關係樹圖
操作流程圖:















1. 打開phylip-3.69中的exe資料夾,將上次存取的檔案取消附檔名(.phy),並改成infile檔名,方便待會程式辨認而開啟。














2. 打開seqboot程式,若上述檔案格式及檔名正確會呈現下圖所示:
入指令: R --> enter --> Numbers of replicates --> 200 --> Y --> enter --> Random number seed --> 1
輸入完指令,會得到outfile檔案,將原本infile檔名改成其他名稱,並再將outfile改成infile檔名,方便下個程式開啟。














3. 打開protdist程式,若上述有將檔名弄對就可以成功開啟程式,如下圖所示
輸入指令: M --> enter --> multiple data sets (type D) --> How many data sets --> 200 --> Y
輸入完指令,等待系統作業,之後會得到另一個outfile,將上個infile檔名改成其他名稱,並再將剛到的outfile改成infile檔名,方便下個程式開啟。


4.打開neighbor程式,若上述檔案名稱都改正確就可以成功開啟此程式,如下圖
輸入指令: M --> enter --> How many data sets --> 200 --> Random number seed --> 1 --> Y
輸入完指令,等待系統作業,之後會得到outfile及outtree兩個檔。
















5. 以記事本打開 "outfile" 可察看詳細資料,如下圖。並將之前infile及outfile檔名都改掉且outtree檔名改成intree,後續程序才能讀取此檔案。
















6. 開啟consense程式,若成功開啟會呈現下圖所示。輸入Y之後程式會產生 "outfile" 及 "outtree" 兩個檔案,以記事本打開 "outfile" 可察看詳細資料。
















7. 開啟另一程式TreeViewX,並開啟剛剛建立的outtree檔,即可得到親緣關係樹圖。








建立物種親緣關係 by Phylogenetic Tree (Part I)

利用NCBI BLAST線上分析工具 http://blast.ncbi.nlm.nih.gov/Blast.cgi 來搜尋與目標基因相似的序列。我們以Vibrio vulnificusleucine-responsive regulatory protein(Lrp)來當做此次目標基因,來搜尋相似序列並在下次建立親緣關係。

1. 進入BLAST網站, 並點選nucleotide blast。














2. 貼上部分V. vulnificusleucine-responsive regulatory protein(Lrp) gene序列(61~180)。














3. 在Program Selection選擇 More dissimilar sequences (discontiguous megablast),可搜尋較多的相似序列,按下BLAST選項,等待系統作業時間。














4. BLAST之後,系統會跑出序列相似的基因及哪一物種所擁有,其中包含我們的V. vulnificus YJ016 strain (序列比對為100%符合)及其他V. vulnificus strains (99%相似)及其他系統顯示的結果會依序遞減基因相似性。














5. 在左邊勾選10個帶有lrp相似基因序列的菌株,並下載各個基因序列(GeneBank)。
以BioEdit開啟10個基因序列 --> 點選Accessory Application--> ClustalW Multiple Alignment --> RunClustal
--> 完成基因alignment -->














6. 存檔下次使用,點選file-->Save as -->phylip-3.69資料夾 > exe資料夾 > 檔名改Infile.phy (Phylip 4 格式)