高速计算法让科学家重构动物细胞发展过程成为可能

28.07.2014  12:39
  换种方法为细胞“女儿”找“妈妈
  ——高速计算让科学家重构动物细胞发展过程成为可能
  
  图 这是数字化的果蝇胚胎,每个彩色的小圆圈显示了胚胎的单个细胞,前后两幅图片是受精三个小时内发生的变化。
  本报记者 房琳琳 综合外电
  成像技术的最新进展正在转向科学家见到了怎样的细胞世界,它可以向人们展示模糊结构和奇妙细节,以及细胞的存在形式和运动状态。但是,提取图像中的信息流,经常超过了现有计算机数据处理技术的能力极限,这让科学家们感到很不爽。
  现在,来自珍妮莉亚研究院霍华德·休斯医学研究所的研究人员,围绕这个问题找到了一种解决方案。他们创造了新的计算方法,能够快速跟踪细胞运动所产生的丰富的三维图像数据。使用这一技术,科学家们可以将耗时的重构动物细胞发展过程的工作,基本上实现计算机自动化处理。
  据物理学家组织网近日报道,组长菲利普·凯勒领导的研究小组开发出新的计算程序,并重建了果蝇神经系统早期演化过程中的细胞谱系。这一方法可以用来追踪多种生物的细胞谱系,并在高倍荧光显微镜中高效地处理数据。该成果于近日发布在《自然·方法》杂志在线版上。
  观察不难,重构个体细胞发展过程,难!
  2012年,凯勒发明了一种多重视角光片显微镜,可以用前所未有的速度和精度在几个小时或几天的时间里三维成像。这种显微镜能展示在胚芽发育初期作为生物学结构显现的个体细胞分裂和染色体重组。从那时起,凯勒开始用它追踪生物神经系统的早期进化过程。
  “我们想要重现动物演化发展的过程,而追踪细胞从初期到一定阶段的发展历史,有利于我们知晓在细胞运动和分裂中发生的一切。”凯勒说,“尤其是,我们想知道神经系统的形态,最终我们可能搜集每个神经系统中的细胞发展历史,并将细胞的最终功能与那些历史信息联系起来。为了这个目的,我们需要在一个相当大的尺度和足够长的时间里追踪个体细胞。
  在小鼠胚芽中,神经系统需要一个多星期的时间才能具有功能。即使是在果蝇中,这个过程也需要一天时间。追踪这么长时间的细胞演进,意味着凯勒的小组必须在数以千计的时间点上,为上万张细胞成像,这会产生数以兆计的字节数据。“我们能够采集很好的成像数据集,但是如果我们想重构它们,不借助计算机的帮助是绝不可能完成的。”凯勒说。
  凯勒课题组的生物信息学家艾迈特和同事用新型计算手段解决了这个问题。这个新方法能以高速显微镜捕获图像的速度识别和追踪细胞分裂。这一过程基本上是全自动完成的。
  成像不难,分析巨量数据和关联信息,难!
  凯勒课题组从2010年就在研究如何介入图像数据了。这个问题很有挑战,不仅因为他的光片显微镜产生的完整数据容量,还因为数据的复杂性。胚胎初期的细胞有着不同的形状和行为且密集地扭结在一起,让计算机识别和追踪个体细胞难上加难。难以避免的图像质量的千差万别也大大加剧了分析难度。
  艾迈特领导攻关并找到了有效的解决方案。他首先削减了数据的复杂程度。他的策略是先压缩三维像素,让每张图片变成一个大的数据单位,被命名为超级三维像素。用超级三维像素作为一个分析单位,可以将一张图像的复杂程度缩小一千倍。
  然后,程序在很多组相关联的超级三维像素组中寻找椭圆形,并将其识别为细胞核。一旦一个压缩的超级三维像素被认定为细胞核,计算机将用这个信息在其后的图像中继续寻找该细胞核。高速显微镜捕获图像非常迅速,以至于一个单独的细胞在前后两帧图片中很难发现移动的迹象。“我们将这个情况充分利用起来,并从一个时间点开始到下一个时间点结束之前,使用这种处理方法。”凯勒说,“一旦你知道了细胞分裂的路径,你就知道哪里是明确的时间点。一旦你知道了在哪个时间点开始分裂,你就知道了哪些是细胞‘女儿’,以及知道她们的细胞‘妈妈’是谁。
  “用这个足够快的简单方法,我们可以轻松高效解决一般案例。”凯勒说。这些一般案例占总数据量的95%,“在较难的且可能导致错误分析的案例中,我们使用更厉害的机器进行分析。
  分裂不难,从细胞谱系探知未来功能,难!
  凯勒解释说,在实际中细胞的分裂和发育更难追踪,因为有可能成像质量糟糕透顶或者细胞挤作一团,以至于计算机产生海量冗余信息。
  “我们想看看所有被观察的细胞在此前和此后的时间里都在干什么。”凯勒解释道,从上下关联的信息中能找出有效的信息呈现模式,这个策略需要非常强大的计算机处理能力。凯勒说:“我们想搜集更多信息搞定这一难题,并就此作出有见识的决策。
  所有这些步骤都能快速实现,结果是每个细胞的谱系信息都被明了的呈现。最后,人们该去检验计算机的工作并修正错误之处。计算机为每个时间点的每个细胞产生的“信度”,会引导使用者注意到那些小比例数据的存在,而不需要人们用眼睛人工手动检查每个细胞,这大大提高了分析结果的精确度。
  为了检测项目的效果,凯勒的课题组搜集了一只果蝇在发展初期的神经系统的成像。他们用自己的方法追踪295个神经母细胞的谱系关系,并且发现,基于大多数细胞早期的动力行为,很可能预测出这些细胞未来的功能。除了果蝇,他们还成功将这个程序应用于斑马鱼和小鼠的细胞成像数据分析,这些数据来自于一台商用光片显微镜和一台商用共焦显微镜。
  凯勒希望应用这一手段探索生命初期发展的绝大多数课题,也希望其他人可以用这个方法解决各自的问题。课题组还承诺绝大多数的数据形式都可以使用这个程序进行解析。