跳转至

课程介绍

课程来源与翻译声明

  • 原著版权:本教程翻译自瓦赫宁根大学(Wageningen University & Research)的经典开源课程 Introduction to Bioinformatics
  • 翻译说明:本版本主要采用人工智能(机器翻译)进行全文本地化,并由团队进行了初步校对。部分专业术语可能存在翻译不够地道或准确的地方。
  • 勘误反馈:若你在学习过程中遇到语病、错别字、代码失效或概念歧义,欢迎随时点击页面右上角的 :material-edit: 编辑此页(或联系课题组/在 GitHub Issue 中)提交反馈,帮助我们持续完善本教程。

什么是生物信息学?

生物信息学领域致力于研究、开发和应用计算工具与方法,以拓展分子、生物、医学、行为或健康数据的应用范围。它还涉及获取、存储、组织、归档、分析或可视化此类数据的方法。生物信息学是一门交叉学科,处于生物学、计算机科学和统计学等多个学科的交汇处。

生物信息学的早期活动可追溯至 20 世纪 50 年代,当时 Frederick Sanger 等研究者开始通过实验方法阐明蛋白质以及后来的 DNA 序列。Margaret Dayhoff 是最早开发序列分析算法的研究者之一[@dayhoff_comprotein_1962]。此后,Paulien Hogeweg 和 Ben Hesper 于 1970 年首次提出了"生物信息学"(bioinformatics)一词[@hesper_bioinformatics_2021],用于描述"生物系统中的信息过程研究",该术语逐渐被用来指代整个领域。

20 世纪 90 年代,随着组学技术(DNA 测序、基因表达微阵列、蛋白质与代谢物质谱分析等)的引入和广泛应用,以及人类基因组计划的实施,生物信息学研究真正迎来了蓬勃发展。这些实验产生的大量数据以及从中获得的知识,以计算机数据库的形式向研究人员免费开放。处理和分析这些关于分子及其相互作用的海量数据,需要开发专门的算法和软件。因此,生物信息学进一步发展成为一个繁荣的研究领域,为当今大多数生物研究所必不可少的计算方法提供了支撑。如今,计算生物学家甚至无需走进实验室,就能通过以新颖的方式整合和查询现有数据,来解答复杂的生物学和进化问题。

生物信息学教学

生物信息学可以在多个层次上进行教学,涵盖从高中生物学学生到生物或生物技术专业的本科生,甚至生物信息学方向的硕士和博士研究生。虽然生物信息学或计算生物学领域的研究人员需要在统计学、编程和数据分析/机器学习方面建立扎实的基础,但更广泛的生命科学群体——本书的目标受众——将生物信息学方法作为日常科研工作的一部分,主要需要的是实用知识。对于这些学生而言,深入理解底层数学和计算机科学的细节相对不那么重要;但他们应当了解有哪些主要方法和数据库可供使用,它们各自的具体用途和局限性是什么,以及如何正确解读计算分析的结果。

为了帮助生命科学学生实现这些学习目标,我们在瓦赫宁根大学(Wageningen University)开设了一门"生物信息学导论"本科课程。我们围绕研究者研究一段未知序列所经历的"旅程"来组织课程内容,如下图所示。

本书各章节概览 本书各章节概览。 许可协议:CC BY 4.0 [@own_I_2024]。

为什么编写一本新书?

生物信息学是一个快速发展的领域,新技术、新工具和新的生物学洞见不断涌现。虽然已有一些本科生教材涉及该主题,但它们普遍难以跟上这种高速变化的步伐。作为生物信息学导论本科课程的授课教师,我们每年都面临收集与教学主题相关的合适阅读材料的困难。可能某一本书适合某一周的内容,但另一周的相关章节可能已经过时,迫使我们不得不使用不同的书籍。此外,现有书籍中的详细程度也并不总能与我们期望学生达到的理解水平相匹配。

因此,我们决定将前沿知识和我们的专业经验整合成一本教材,使其与我们本科课程的教学目标相匹配。上述"旅程"中的五个步骤体现在五个章节的架构中,每章均包含基础文本、不同类型的内容框(见下文)、实践练习和参考文献:

  1. 基因、蛋白质、数据库与基因组注释
  2. 序列比对、序列搜索与引物设计
  3. 系统发育学与系统发育树构建
  4. 蛋白质结构预测
  5. 组学数据分析

经过多年的开发和完善,我们相信现在已准备好将其以在线教材的形式向社区发布,供大家免费使用。希望它能对你有所帮助!

请注意,实践练习主要依赖在线数据库和工具,这些资源有时可能无法访问,且其界面、操作方式或使用政策会定期变更。每年秋季,我们都会重新检查这些练习以确保它们能在课堂上正常运行,但在其他时间你可能会遇到问题。此外,目前阅读器尚未内置图片放大功能。如需放大图片,请右键点击图片并选择"在新标签页中打开图片"(操作方式因浏览器而异)。

与所有教材一样,你可能发现其中存在错误或遗漏。如果发现任何问题,请通过 introduction@bioinformatics.nl 联系我们。你也可以在本书的 GitHub 仓库中提出 Issue 或参与讨论。我们正在探索更好地支持读者在线反馈甚至扩展本书内容的方式。我们已尽力确保所有材料(图片等)仅在版权允许的情况下使用,但如果你仍发现某些材料被不当使用或引用,请告知我们。

Dick de Ridder、Anne Kupczok、Rens Holmer、Freek Bakker、Justin van der Hooft、Judith Risse、Jorge Navarro 和 Tomer Sardjoe(瓦赫宁根,2025 年 9 月)

阅读指南

正文中配有不同类型的信息框,用于展示附加信息或突出和阐明重要内容。黄色和蓝色框属于本课程的考试范围,绿色框提供有用的补充信息或链接。

重要信息

表示你需要牢记的重要信息,属于考试范围。

提示 1:值得注意的信息

被视为考试范围内的内容。提示按编号排列,便于引用。

拓展 1:补充信息

通常提供正文中提及内容的额外示例。不属于考试范围,但有助于理解考试相关内容。拓展框按编号排列,便于引用。

另请参阅

指向外部信息的链接,如视频或博客。不属于考试范围,但有助于理解考试相关内容。

参考文献

{{ bibliography }}

本文阅读量  次
本站总访问量  次
Authors: Wind