来自ITMO大学和美国乔治华盛顿大学的国际科学家团队创建了一种算法,用于研究具有全基因组重复的物种(主要是酵母和植物)的进化历史。

该程序可用于分析有关这些物种的遗传信息,并得出有关全基因组复制是如何发生的以及为什么它在进化过程中占据立足点的结论。该文章发表在《生物信息学》上。

根据遗传科学家的研究,某些植物甚至哺乳动物都具有全基因组重复,即它们的某些基因存在多个拷贝,彼此之间或多或少相似。祖先基因组没有这样的重复,但是重复发生在其进化历史的某个时刻,并在种群中立足。

为了了解基因组复制的过程,研究人员必须创建具有这种进化事件的物种的所谓进化史。这段历史使他们能够追踪过去人口发生的情况,并确定重复发生的确切时间以及立足点。

尝试创建具有全基因组重复的进化史时,科学家必须面对一系列任务,这些任务的目标相似,但数学结构却完全不同。为了有效地解决它们,您需要优化。为此,由ITMO大学和美国乔治华盛顿大学的专家组成的团队提出了整数线性规划方法,该方法最初是由苏联数学家,经济学家和诺贝尔经济学奖获得者Leonid Kantorovich提出的。

ITMO大学的研究合著者Nikita Alekseev解释说:“从数学的角度来看,有一类任务本质上是相似的,但有所不同。” “因此,我们已经开发出一种通用的方法,可以归结为整数线性规划。这是一种优化方法,可以将复杂的程序简化为一组线性约束,并为其选择有效的求解器。”

结果,科学家们开发了一个程序,该程序可以分析重复的基因组,并对物种的进化路径,当时发生的基因组重复次数以及重复产生的基因拷贝如何变化进行推测。有时会在其中发生突变,在特定区域发生变化,因此它们不再相同。

该方法也可以用于研究动物中重复的基因组区域。Nikita Alekseev总结说:“基因组重复存在于许多物种中,不仅会影响整个基因组,而且会影响其片段,我们的工具也可以适用于解决此类问题。”