2014年12月22日 星期一

尋找miRNA target sites

這次上課介紹了真核生物才有的抑制基因表現系統-micro RNA(miRNA)。利用miRNA一些特性(例如大小 迴文序列 有stem loop等)可以預測特定基因上可能被miRNA辨識的位置。

1. 此次操作隨機選了人類miRNA編號18中的hsa-mir-18a-5p來當作主角,並透過http://mirtarbase.mbc.nctu.edu.tw/index.php網站來搜尋人類可被hsa-mir-18a-5p target的基因。















2. 老師再從中隨機指派一個能被hsa-mir-18a-5p target基因-PTEN,反過來我們可再由另一網站https://cm.jefferson.edu/rna22v2.0/來線上預測此基因可能的miRNA target sites。


2-1 進入頁面後,進入網站選擇HOMO SAPIENS,在最下面一欄直接打上欲搜尋的基因名"PTEN",並按下subunit搜尋。

2-2 搜尋後會進入一頁面,再按下View Predictions as cDNA map


2-3 之後會挑出一個新頁面,紅色box就是此基因被預測能與不同miRNA結合的序列,點開choose location/miF可在對應的序列位置找到可能會辨認此位置的miRNA(可有多種,但有些未經證實)。



2-4 尋找hsa-mir-18a-5p在PTEN基因辨認序列。回到2-2圖示頁面,並按下View Predictions as Table搜尋,即可以table的方式得到所有能target PTEN基因的miRNA,可直接利用Ctrl + F搜尋hsa-mir-18a-5p,可發現此miRNA所辨認的序列位置在8037bp。


2-5 回到2-3圖示頁面直接尋找8037bp位置,按下相對應choose location鍵,即可發現hsa-mir-18a-5p此miRNA確實能辨認PTEN基因序列,完成此次作業。





2014年12月10日 星期三

Small Molecular Interaction I- 利用VMD軟體模擬蛋白與水分子間的交互作用

這次上課介紹一個新軟體"VMD",跟PyMol軟體很像,可探討及分析蛋白質的結構。
第一堂課的作業即是自己找一個已被解結構的蛋白,並用VMD軟體模擬此蛋白如何與水分子進行交互作用。

1. 利用RCSB網站 http://www.rcsb.org去搜尋有興趣且被解結構的蛋白。
我找了一個自己實驗中所分析的蛋白Leucine-responsive regulatory protein (Lrp),但是我所研究的細菌Vibrio vulnificus的Lrp尚未被分析結構,但在E.coli中Lrp已被研究很多,包含結構的部分。
搜尋結果如下圖,可知道此Lrp的結構代碼為2GQQ。

2. 打開VMD軟體,開啟蛋白的結構圖。
打開軟體後,在File選項中選擇New molecule,並在filename中輸入利用RCSB網站找到的蛋白結構代碼2GQQ,按下Load鍵稍等片刻即會顯示蛋白結構圖,圖中是三D空間可用滑鼠左右上下翻轉蛋白結構,也可用滑鼠滾輪向前zoom in或向後zoom out,下載此結構檔案(File->Save Visualization State-->存檔)。



3. 改變蛋白結構的顯示。
在Graphics選項中,點選representation會跑出一個視窗,在Drawing Method選項挑選Newcartoon (原本為Line),按下Apply按鍵即可改變蛋白結構的顯示方式。


4. 建立psf檔。
從Extensions選項點選Modelling -> Automatic PSF Builder,直接按下左下角I'm feelinf lucky按鍵,等待片刻會跳出一個視窗,按下確定鍵及建立好psf檔案,結構圖會有稍微不同。 



















5. 加入水分子至蛋白結構圖周圍。
Extensions選項點選Modelling -> Solvation Box,會跳出一個視窗,勾選裡面Rotate to minimize volume,並在Box size X,Y,Z欄都填入15 A(0.1 nm),按下下方Solvate鍵,即完成water box。


2014年11月18日 星期二

利用STRING來預測蛋白與蛋白之間的交互作用

STRING是一個線上網路工具http://string-db.org/,可以用來分析或預測protein-protein interaction。
此網站所分析的結果是根據文獻而整理出來的,利用點與線的關係來呈現目標蛋白與其他蛋白之間的關係。

進入網站後可在首頁上輸入欲分析的蛋白,這裡以Leucine-responsive regulatory protein(Lrp)為例。

搜尋之後,會發現有許多細菌的Lrp都有被研究過(會以A~Z排列),包含文獻最大宗的E.coli
Salmonella。

點選Vibrio vulnificus YJ016,按下網頁最下面的Continue進行預測。

進入新頁面後,即可看到點與線的圖,中間的點為Lrp,周圍是其他跟Lrp相關的蛋白,線代表有直接的關係。由於Vibrio vulnificus YJ016有關Lrp的文獻不多,只有顯示與10個蛋白有直接的關係。

下面有這10個蛋白的全名及胺基酸長度,也有圖示說明上圖的symbol(包含線的顏色)。

這些與Lrp相關的蛋白包含一些與胺基酸代謝的蛋白、膜上運輸蛋白、有關tRNA synthetase及細胞分裂的蛋白,再次證明Lrp是一個能調控很多基因的蛋白。可點開特定蛋白,會顯示蛋白結構、胺基酸序列及一些簡單的蛋白資訊。

按下網頁下面Textmining鍵也可進一步了解這些結果的文獻出處及摘要,了解實驗的內容。

2014年11月5日 星期三

建立物種親緣關係 by Phylogenetic Tree (Part II)

接續上次進度,這次要利用上禮拜所下載下來的10個胺基酸序列做出親緣關係樹圖
操作流程圖:















1. 打開phylip-3.69中的exe資料夾,將上次存取的檔案取消附檔名(.phy),並改成infile檔名,方便待會程式辨認而開啟。














2. 打開seqboot程式,若上述檔案格式及檔名正確會呈現下圖所示:
入指令: R --> enter --> Numbers of replicates --> 200 --> Y --> enter --> Random number seed --> 1
輸入完指令,會得到outfile檔案,將原本infile檔名改成其他名稱,並再將outfile改成infile檔名,方便下個程式開啟。














3. 打開protdist程式,若上述有將檔名弄對就可以成功開啟程式,如下圖所示
輸入指令: M --> enter --> multiple data sets (type D) --> How many data sets --> 200 --> Y
輸入完指令,等待系統作業,之後會得到另一個outfile,將上個infile檔名改成其他名稱,並再將剛到的outfile改成infile檔名,方便下個程式開啟。


4.打開neighbor程式,若上述檔案名稱都改正確就可以成功開啟此程式,如下圖
輸入指令: M --> enter --> How many data sets --> 200 --> Random number seed --> 1 --> Y
輸入完指令,等待系統作業,之後會得到outfile及outtree兩個檔。
















5. 以記事本打開 "outfile" 可察看詳細資料,如下圖。並將之前infile及outfile檔名都改掉且outtree檔名改成intree,後續程序才能讀取此檔案。
















6. 開啟consense程式,若成功開啟會呈現下圖所示。輸入Y之後程式會產生 "outfile" 及 "outtree" 兩個檔案,以記事本打開 "outfile" 可察看詳細資料。
















7. 開啟另一程式TreeViewX,並開啟剛剛建立的outtree檔,即可得到親緣關係樹圖。








建立物種親緣關係 by Phylogenetic Tree (Part I)

利用NCBI BLAST線上分析工具 http://blast.ncbi.nlm.nih.gov/Blast.cgi 來搜尋與目標基因相似的序列。我們以Vibrio vulnificusleucine-responsive regulatory protein(Lrp)來當做此次目標基因,來搜尋相似序列並在下次建立親緣關係。

1. 進入BLAST網站, 並點選nucleotide blast。














2. 貼上部分V. vulnificusleucine-responsive regulatory protein(Lrp) gene序列(61~180)。














3. 在Program Selection選擇 More dissimilar sequences (discontiguous megablast),可搜尋較多的相似序列,按下BLAST選項,等待系統作業時間。














4. BLAST之後,系統會跑出序列相似的基因及哪一物種所擁有,其中包含我們的V. vulnificus YJ016 strain (序列比對為100%符合)及其他V. vulnificus strains (99%相似)及其他系統顯示的結果會依序遞減基因相似性。














5. 在左邊勾選10個帶有lrp相似基因序列的菌株,並下載各個基因序列(GeneBank)。
以BioEdit開啟10個基因序列 --> 點選Accessory Application--> ClustalW Multiple Alignment --> RunClustal
--> 完成基因alignment -->














6. 存檔下次使用,點選file-->Save as -->phylip-3.69資料夾 > exe資料夾 > 檔名改Infile.phy (Phylip 4 格式)




2014年10月22日 星期三

NCBI GenBank 與CLC sequience viewer 基本操作


NCBI 網址:      http://www.ncbi.nlm.nih.gov/

1.尋找一個gene, Coremine網址來繪製一個與此基因有關的圖譜。













2.Search 欄中輸入基因ZNF41,會出現如下圖













3.NCBI 的使用。選定目標基因 ZNF41 搜尋














4.選擇 Nucleotide 的格式,下拉點擊 GenBank













5. Gene Bank 的模式中,可以看到此段基因的詳細訊息。如:基因長度、參考文獻,PubMed ID













6.點擊右上角的 Send: ,選擇 File,最後按下 create file 下載。


7.使用CLC sequence viewer 打開下載的基因序列。點選左上方的 "File" → "Import" → 開啟剛剛下載的檔案。可以看到下圖所示。




2014年10月8日 星期三

DisGeNET 網路工具的應用

DisGeNET網址如下:

http://www.disgenet.org/web/DisGeNET/v2.1/home


 1. 進入頁面(home)後,會看到有關DisGeNET的簡介
     包含網站設置原因及特點,且任何的資料庫更新也都有做紀錄。













2. 看完簡介後之後,可點選"Search" 搜尋想要了解的基因
    此次我搜尋了一個在seminar paper裡提到的基因cxcr2。













3. 等待一陣子,就會跳出搜尋結果
    顯示的結果可確定是我要找的基因cxcr2, chemokine (C-X-C motif) receptor 2
    可繼續點選底下的連結,進一步了解此基因相關的疾病及其他基因。




4.  搜尋Top10 disease associations for cxcr2
     點數最高的前三名相關疾病為 結腸炎,乳腺炎及敗血症
     與之前所學符合,CXCR2與發炎反應相關。













點選左下Browse details還可以得到詳細的疾病資訊包含疾病的編號,類型,文獻等等。













5. 另外也可以搜尋Table of genes that share diseases with cxcr2
    可發現前十名相關基因大部分都是cytokine與chemokine的基因













    一樣點選左下Browse details會出現這些相關基因的簡介
    譬如參與的機制以及其蛋白的角色,
    可發現很多都是參與訊號傳遞的分子也與免疫機制相關。