#基因测序 #DNA #全基因组测序
【国际科学团队完成人类最完整的基因组序列】
国际科研团队“端粒到端粒联盟” 在3月31日正式公布了首个完整、无间隙的人类基因组序列。补全先前相关研究缺失部分,有助科学家进一步解开人类生命密码。人类基因组含有约30亿个DNA(脱氧核糖核酸)碱基对,完成这些碱基对的完整、无间隙测序对于了解人类基因组变异全谱、掌握基因对某些疾病的影响至关重要。
2001年,由包括中国在内的6国科学家共同参与的国际“人类基因组计划”,在英国《自然》杂志上发布了人类基因组草图及初步分析。由于当时的测序技术所限,这份人类基因组草图中留有许多空白。之后在2003年,发布人类基因组图谱。然而,这份图谱只完成人类92%的基因组测序,剩下8%因为含有重复DNA片段,难以测序。10年来,随着基因测序技术提高,研究人员得以对最后8%测序,绘制出人类基因组完整图谱。
为补全人类基因组图谱缺失的8%,研究人员为人体染色体和基因基本化学结构约2亿碱基对测序。最后的完整图谱包括逾30亿碱基对序列和近2万个蛋白质编码基因。这些基因中,有约2000个基因为这次研究新发现。研究人员还新发现了200万个基因变异,其中622处存在于与医学相关的基因中。
当时使用的测序方法是“短读长测序”技术,一次只能读取很短的一段基因序列。打个比方,如果把基因组的一部分想象成段落中的一句话,比如“今天早上小明吃了个包子”,通过短读长测序,研究者能得到很多简短的小部件,比如“今天”、“小明”、“明吃”、“包子”;再经过“拼图”式的分析,他们就可以拼凑出这句完整的话,但却不知道这句话在整个段落里是否重复出现、重复了多少次。正因缺少这些信息,在过去的20年里,重复序列一直是基因组学研究的一大难题。
直到两种属于“长读长测序”的新技术诞生,人类基因组学的研究才迎来了转折点。这两种技术一种是牛津纳米孔测序,它可以一次读取多达100万个DNA碱基,准确度中等;另一种是PacBio HiFi测序,一次只能读取2万个碱基,但准确度近乎完美。通过这两种技术,研究者可以直接看到一整个句子甚至段落,也就能知道某个序列连续重复了多少次。
从2019年初开始,科学家们将这两种新技术结合起来,致力于攻克这些重复序列,填补缺失的空白。2020年底,他们公布了阶段性成果——X染色体和8号染色体的完整组装。现在,他们终于揭开了真正完整的人类基因组序列,从端粒到端粒,包含了每一条染色体。
参与此次研究的一位科学家大卫·豪斯勒说:“现在我们可以站在山顶,俯瞰下面的所有景色,看到我们人类全部的基因遗产。”
美国国家人类基因组研究所所长埃里克·格林表示,完成完整的人类基因组测序是一项重要科学成就,为了解人类DNA提供了首个全面视角。这些最基本的信息将增进对人类基因组所有细微功能差别的了解,促进对人类疾病的基因研究。(澎湃新闻)(果壳 @微博)(新华社)
【国际科学团队完成人类最完整的基因组序列】
国际科研团队“端粒到端粒联盟” 在3月31日正式公布了首个完整、无间隙的人类基因组序列。补全先前相关研究缺失部分,有助科学家进一步解开人类生命密码。人类基因组含有约30亿个DNA(脱氧核糖核酸)碱基对,完成这些碱基对的完整、无间隙测序对于了解人类基因组变异全谱、掌握基因对某些疾病的影响至关重要。
2001年,由包括中国在内的6国科学家共同参与的国际“人类基因组计划”,在英国《自然》杂志上发布了人类基因组草图及初步分析。由于当时的测序技术所限,这份人类基因组草图中留有许多空白。之后在2003年,发布人类基因组图谱。然而,这份图谱只完成人类92%的基因组测序,剩下8%因为含有重复DNA片段,难以测序。10年来,随着基因测序技术提高,研究人员得以对最后8%测序,绘制出人类基因组完整图谱。
为补全人类基因组图谱缺失的8%,研究人员为人体染色体和基因基本化学结构约2亿碱基对测序。最后的完整图谱包括逾30亿碱基对序列和近2万个蛋白质编码基因。这些基因中,有约2000个基因为这次研究新发现。研究人员还新发现了200万个基因变异,其中622处存在于与医学相关的基因中。
当时使用的测序方法是“短读长测序”技术,一次只能读取很短的一段基因序列。打个比方,如果把基因组的一部分想象成段落中的一句话,比如“今天早上小明吃了个包子”,通过短读长测序,研究者能得到很多简短的小部件,比如“今天”、“小明”、“明吃”、“包子”;再经过“拼图”式的分析,他们就可以拼凑出这句完整的话,但却不知道这句话在整个段落里是否重复出现、重复了多少次。正因缺少这些信息,在过去的20年里,重复序列一直是基因组学研究的一大难题。
直到两种属于“长读长测序”的新技术诞生,人类基因组学的研究才迎来了转折点。这两种技术一种是牛津纳米孔测序,它可以一次读取多达100万个DNA碱基,准确度中等;另一种是PacBio HiFi测序,一次只能读取2万个碱基,但准确度近乎完美。通过这两种技术,研究者可以直接看到一整个句子甚至段落,也就能知道某个序列连续重复了多少次。
从2019年初开始,科学家们将这两种新技术结合起来,致力于攻克这些重复序列,填补缺失的空白。2020年底,他们公布了阶段性成果——X染色体和8号染色体的完整组装。现在,他们终于揭开了真正完整的人类基因组序列,从端粒到端粒,包含了每一条染色体。
参与此次研究的一位科学家大卫·豪斯勒说:“现在我们可以站在山顶,俯瞰下面的所有景色,看到我们人类全部的基因遗产。”
美国国家人类基因组研究所所长埃里克·格林表示,完成完整的人类基因组测序是一项重要科学成就,为了解人类DNA提供了首个全面视角。这些最基本的信息将增进对人类基因组所有细微功能差别的了解,促进对人类疾病的基因研究。(澎湃新闻)(果壳 @微博)(新华社)