生物科学门户网站
BIO1000.COM

研究人员对野生甘蔗的基因组进行序列分析

来自16个机构的100多名科学家组成的国际团队对野生甘蔗(Saccharum spontaneum)的基因组进行了测序。该结果显示在该杂志自然遗传学。

野甘蔗(Saccharum spontaneum)。 图片来源:Joydeep / CC BY-SA 3.0。

野甘蔗(Saccharum spontaneum)。

大约一万年前在新几内亚被驯化,“没有蜜蜂生产蜂蜜的芦苇”被认为是公元前六至四世纪的奢侈品和昂贵的香料。在大约八世纪将甘蔗引入旧世界之后,它蔓延到加勒比海,南美洲,印度洋和太平洋岛国,推动了大规模的人类迁徙,包括奴隶劳动。现在是世界上收获量最大的作物和第五大有价值作物,甘蔗在90多个国家的2600万公顷土地上种植,每年收获18.3亿公吨,总产值接近570亿美元,提供80%世界上的糖和40%的乙醇作为主要的糖和生物燃料原料作物。

大多数农民种植的甘蔗是两种物种的混合物:甘蔗(Saccharum officinarum),其生长具有高糖含量的大型植物;以及甘蔗自发体,其较小的尺寸和甜度被增加的抗病性和对环境胁迫的耐受性抵消。由于缺乏完整的基因组序列,植物育种者通过几代杂交和选择产生了高产,强壮的菌株,但这是一个依赖时间和运气的艰巨过程。

“甘蔗是第五大最有价值的作物,缺乏参考基因组阻碍了甘蔗改良的基因组研究和分子育种,”伊利诺伊大学的主要作者Ray Ming教授说。“测序技术还没有准备好处理大型同源多倍体基因组,直到2015年第三代测序技术的吞吐量,读取长度和成本变得足够具有竞争力。”

为什么对甘蔗基因组进行测序如此困难?

在甘蔗的进化历史中的某个时期,它的基因组被重复了两次,导致每对染色体的四个略有不同的版本都挤在同一个核心中。这些事件不仅使基因组的大小翻了两番,而且还使得来自全基因组重复的高度相似的序列更难以组装成不同的染色体。

基因组DNA通常以小的重叠片段进行测序或读取,并且来自那些片段的序列数据变成巨大的线性拼图的重叠片段。随着甘蔗基因组大小翻倍,再次翻倍,这个难题不仅变得更大;它采用了重复但不完全相同的元素,许多小块很难正确地装入其中。

为了克服这一挑战,Ming教授和共同作者使用了一种称为高通量染色质构象捕获或Hi-C的技术。这种方法使科学家们能够发现染色体DNA长而缠结的部分哪些部分在细胞内相互接触。

当使用由团队开发的称为ALLHIC的定制算法进行分析时,得到的数据用于拼图拼图盒盖上的图片的目的,提供粗略地图,其中序列的哪些部分最可能属于哪个染色体。“最大的惊喜是,通过结合长序列读数和Hi-C物理图谱,我们将同源四倍体[四倍]基因组组装成32条染色体,并实现了我们在同源染色体中进行等位基因特异性注释的目标,”Ming教授说。

换句话说,研究人员现在知道哪些基因序列属于原始的重复前基因组中的四种变异中的每一种 - 比他们预期的更高水平的细节。通过与相关物种的基因组进行比较,科学家们知道,在某些时候,独特染色体的数量从10个减少到8个。令团队惊讶的是,新数据显示两条不同的染色体已经分开,然后所有四个半部融合到不同的现有染色体上,这是一组比它们假设的更复杂的事件。理解这些物理变化有何帮助?随着基因组内的这些大的物理重排,受影响区域中的基因发生变化。

例如,研究小组发现,移动到新位置的大块染色体含有更多的基因,这些基因可帮助植物抵抗疾病,而不是其他地方。

“它解决了一个谜,为什么甘蔗自发是抗病和抗逆基因的优良来源,”明教授说。“染色体重排可能是原因,而不是这种富集的结果,尽管这种浓缩的强调机制仍有待研究。”“这一发现将加速挖掘有效基因的有效等位基因,这些基因已纳入优良的现代甘蔗杂交品种,随后实施甘蔗的分子育种。”

野生甘蔗基因组还使该团队能够确定现代甘蔗令人难以置信的甜味的可能起源:即使在甜度较低的甘蔗自发中,也会产生多个糖基转运蛋白基因的突变。他们还能够观察到,在Saccharum officinarum和Saccharum spontaneum之间的杂交中,来自S. spontaneum的衍生DNA序列在整个杂交基因组中随机分散。

“ALLHIC方法已被证明对构建同源多倍体甘蔗基因组有效,”Ming教授说。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。