《生物信息學(xué)基礎(chǔ)教程》根據(jù)兩位作者張洛欣、馬斌多年的教學(xué)與科研經(jīng)驗(yàn)創(chuàng)作而成,兼顧學(xué)科基礎(chǔ)和研究前沿。全書(shū)著重于生物信息學(xué)的基礎(chǔ)理論和主要軟件,覆蓋該學(xué)科幾乎所有的主要方面:雙序列的比較、快速比對(duì)和序列數(shù)據(jù)庫(kù)的查詢(xún)方法、多序列比較、DNA序列中的信號(hào)元素、分子進(jìn)化樹(shù)分析、基因組重組、蛋白質(zhì)組學(xué)中的質(zhì)譜分析等。書(shū)中配有大量習(xí)題,其難易程度用星號(hào)標(biāo)注,其中個(gè)別未解決問(wèn)題特別注明,可以作為研究生的研究課題。
本書(shū)不僅適合作為高年級(jí)本科生和研究生開(kāi)設(shè)生物信息學(xué)或計(jì)算生物學(xué)的教材,也可供希望了解生物信息理論和工具的生命科學(xué)、數(shù)學(xué)和計(jì)算機(jī)等方向的科研人員閱讀參考。
第一章 生物序列比對(duì)
§1.1 DNA、RNA和蛋白質(zhì)
§1.1.1 DNA分子
§1.1.2 蛋白質(zhì)分子
§1.1.3 RNA分子
§1.1.4 從基因到蛋白質(zhì)的信息傳遞
§1.2 比對(duì):序列比較的模型
§1.3 比對(duì)圖
§1.3.1 定義
§1.3.2 雙序列之間比對(duì)的總數(shù)目
§1.4 比對(duì)的記分法則
§1.5 全序列比對(duì):動(dòng)態(tài)規(guī)劃算法
§1.5.1 基本算法
§1.5.2 使用仿射空位罰分的算法
§1.5.3 *全序列比對(duì)的C語(yǔ)言程序 第一章 生物序列比對(duì)
§1.1 DNA、RNA和蛋白質(zhì)
§1.1.1 DNA分子
§1.1.2 蛋白質(zhì)分子
§1.1.3 RNA分子
§1.1.4 從基因到蛋白質(zhì)的信息傳遞
§1.2 比對(duì):序列比較的模型
§1.3 比對(duì)圖
§1.3.1 定義
§1.3.2 雙序列之間比對(duì)的總數(shù)目
§1.4 比對(duì)的記分法則
§1.5 全序列比對(duì):動(dòng)態(tài)規(guī)劃算法
§1.5.1 基本算法
§1.5.2 使用仿射空位罰分的算法
§1.5.3 *全序列比對(duì)的C語(yǔ)言程序
§1.6 局部比對(duì):Smith-Waterman算法
§1.6.1 Smith-Waterman算法
§1.6.2 *局部比對(duì)的C語(yǔ)言程序
§1.7 最優(yōu)占用空間的比對(duì)算法
§1.8 比對(duì)蛋白質(zhì)序列所使用的打分矩陣
§1.8.1 打分的統(tǒng)計(jì)基礎(chǔ)
§1.8.2 BLOSUM矩陣系列
參考文獻(xiàn)
練習(xí)題
第二章 快速比對(duì)方法
§2.1 同源序列查詢(xún)和數(shù)據(jù)庫(kù)搜索
§2.2 序列中的字分布
§2.2.1 DNA序列的隨機(jī)模型I:一致獨(dú)立分布
§2.2.2 DNA序列的隨機(jī)模型II:馬爾可夫鏈.
§2.3 字匹配的散列表方法
§2.4 點(diǎn)陣法
§2.5 *FASTA程序
§2.6 BLAST程序
§2.6.1 基本算法:連續(xù)核的概念
§2.6.2 E-值的計(jì)算公式
§2.6.3 BLAsT程序系列
§2.7 散核方法
§2.7.1 散核模型
§2.7.2 散核的優(yōu)化
§2.7.3 基于散核的相似性查找的程序?qū)崿F(xiàn)
§2.7.4 多散核
§2.7.5 *其他有關(guān)散核的研究
參考文獻(xiàn)
練習(xí)題
第三章 多序列比對(duì)
§3.1 為什么需要比對(duì)多個(gè)生物序列?
§3.2 模體、譜、共識(shí)序列
§3.3 Logo:一個(gè)序列保守區(qū)域的可視化方法
§3.4 多序列比對(duì)的SP分?jǐn)?shù)
§3.5 多序列比對(duì)的復(fù)雜性
§3.5.1 動(dòng)態(tài)規(guī)劃算法
§3.5.2 NP-難解性
§3.6 漸進(jìn)式比對(duì)
§3.6.1 漸進(jìn)式的基本策略
§3.6.2 Feng-Doolittle比對(duì)算法
§3.7 近似算法
§3.7.1 序列編輯距離
§3.7.2 星型比對(duì)算法
§3.8 多序列比對(duì)實(shí)用程序
§3.8.1 ClustalW
§3.8.2 MUSCLE
§3.8.3 其他多序列比對(duì)程序
§3.9 基因組的比對(duì)
參考文獻(xiàn)
練習(xí)題
第四章 隱馬爾可夫模型及基因序列的識(shí)別
§4.1 隱馬爾可夫模型
§4.1.1 隱馬爾可夫模型的定義
§4.1.2 隱馬爾可夫模型的基本問(wèn)題
§4.2 基本算法
§4.2.1 前向算法和后向算法
§4.2.2 viterbi算法
§4.2.3 建模算法
§4.3 蛋白質(zhì)簇的隱馬爾可夫鏈模型
§4.3.1 譜HMM
§4.3.2 從多序列比對(duì)到譜HMM
§4.3.3 從譜HMM到多序列比對(duì)
§4.3.4 Pfam數(shù)據(jù)庫(kù)
§4.4 GENSCAN:預(yù)測(cè)人基因組中的全基因結(jié)構(gòu)程序
§4.4.1 真核生物基因的結(jié)構(gòu)
§4.4.2 半HMM
§4.4.3 基因的Burge-Karlin模型
§4.4.4 自動(dòng)識(shí)別人基因組中的基因序列
參考文獻(xiàn)
練習(xí)題
第五章 分子進(jìn)化樹(shù)分析
§5.1 達(dá)爾文的進(jìn)化樹(shù)
§5.2 進(jìn)化樹(shù)的數(shù)學(xué)性質(zhì)
§5.2.1 基本概念
§5.2.2 進(jìn)化樹(shù)的個(gè)數(shù)
§5.2.3 常見(jiàn)的無(wú)根進(jìn)化樹(shù)變換
§5.2.4 進(jìn)化樹(shù)之間的距離
§5.2.5 二叉樹(shù)和多叉樹(shù)
§5.3 構(gòu)建分子進(jìn)化樹(shù)I:Parsimony方法
§5.3.1 Fitch算法
§5.3.2 尋找簡(jiǎn)約進(jìn)化樹(shù)
§5.4 構(gòu)建分子進(jìn)化樹(shù)II:基于距離的方法
§5.4.1 加權(quán)進(jìn)化樹(shù)和距離矩陣
§5.4.2 計(jì)算序列間的距離
§5.4.3 Neighbor-Joining算法
§5.4.4 UPGMA算法
§5.5 構(gòu)建分子進(jìn)化樹(shù)III:最大似然法和貝葉斯方法
§5.5.1 最大似然法
§5.5.2 *貝葉斯方法
§5.6 *構(gòu)建分子進(jìn)化樹(shù)的兩個(gè)實(shí)際問(wèn)題
§5.6.1 一致性和長(zhǎng)分支相吸現(xiàn)象
§5.6.2 Bootstrap分析
§5.7 祖先狀態(tài)的推斷
§5.7.1 問(wèn)題的定義
§5.7.2 sankoff算法
§5.7.3 最大似然法
§5.7.4 推斷方法的準(zhǔn)確率
§5.8 基因樹(shù)和物種樹(shù)的融合
§5.8.1 基因簇和基因樹(shù)
§5.8.2 基因樹(shù)和物種樹(shù)的融合的定義
§5.8.3 推斷基因復(fù)制事件
參考文獻(xiàn)
練習(xí)題
第六章 計(jì)算蛋白質(zhì)組學(xué)
§6.1 基礎(chǔ)知識(shí)
§6.1.1 氨基酸和肽的質(zhì)量
§6.1.2 質(zhì)譜儀和質(zhì)譜
§6.1.3 同位素峰、誤差和噪音
§6.1.4 連續(xù)質(zhì)譜
§6.1.5 復(fù)雜蛋白樣本的處理
§6.1.6 肽鑒定的基本方式
§6.2 肽從頭測(cè)序
§6.2.1 打分函數(shù)
§6.2.2 PEAKS算法
§6.2.3 譜圖算法
§6.3 搜庫(kù)及其統(tǒng)計(jì)學(xué)驗(yàn)證
§6.3.1 打分函數(shù)
§6.3.2 對(duì)結(jié)果的質(zhì)控
§6.4 翻譯后修飾
§6.5 其他研究課題
§6.5.1 定量分析
§6.5.2 糖鑒定
§6.5.3 新型肽鑒定方法
§6.5.4 其他分子的鑒定
參考文獻(xiàn)
練習(xí)題
索引
英漢術(shù)語(yǔ)對(duì)照