张学勇移民公司
微信扫一扫 分享朋友圈

已有 143 人浏览分享

开启左侧

“慧眼”卫星在轨交付与未来产出成果离不开Ta

[复制链接]
143 0

  来源:科学大院

  编者按:

  2017年6月15日,硬X射线调制望远镜卫星(HXMT)成功发射;2018年1月30日,卫星成功在轨交付。

  What?我还以为发射成功就万事大吉了呢!

  其实,发射成功只是第一步。为了顺利在轨交付,需要对硬件和科学载荷分别进行测试,其中重要的工作就是结合在轨实验数据完善数据校准流程。这就要说到在天文学研究中举足轻重的数据科学。

  今天大院er要为大家介绍的正是这位“幕后英雄”。

  纵观天文学研究的各种前沿问题,尽管层次和名目繁多,看起来关系错综复杂,但是主干工作仍然是围绕着各种奇怪的人名地名命名的天文台、各种有着长还要更长名字的望远镜开展的。

  望远镜的论证、设计和建造

  要建造一台望远镜,一般来说,流程是这样:


  图1 天文学家提议建造望远镜,天文学家和工程师共同设计望远镜,工程师建造望远镜并交付天文学家,望远镜开光(与寺庙无关)后投入使用。(绘图:付宇盈)

  从17世纪至今,望远镜越造越庞大,所需资源不断上涨,论证、设计、建造和使用过程也日益复杂。

  一方面是因为天文学本身就是观测驱动的,另一方面则是得益于人类社会也在不断发展。教育不断发展,培养了更多的科学家、工程师;产业不断发展,提高了生产效率;社会管理和动员能力不断发展,成千上万的科技工作者围绕同一个项目工作也能实现。

  以2017年6月15日发射的硬X射线调制望远镜卫星为例,在20世纪90年代提出设想之后,便是研发和论证两条腿走路。


图2 硬X射线调制望远镜(HXMT)卫星

  1、研发方面,不是首席科学家一个人在办公室、实验室或者小作坊就把工作全都完成了,而是需要不同单位的合作者一起研究。


图3 三家单位在卫星研制过程中承担的工作

  其中,卫星平台负责科学载荷的供配电,负责实现导航制导与控制(由于科学载荷本身不能转动,所以需要依靠卫星将望远镜对准需要观测的目标进行定点观测,或者围绕目标进行扫描观测)。

  不同单位承担不同的工作,而卫星总体又要与运载、发射场、测控等其他系统协同工作。

  2、论证方面,通俗的说,就是与经费支持单位、工程技术单位和科学共同体一起探讨和迭代出具备足够的科学价值、技术可行性和经费可承受性的方案。

  在数百年前的科学草创阶段,经费支持单位一般是贵族阶级,工程技术单位是各种工匠,或者科学家兼职工匠,科学共同体的圈子很小。而现在,上述各方的职能日益分化,因此相互之间的接口也更为复杂。因此,往往一个望远镜项目的首席科学家除了具备学界响当当的声望,广泛的工程技术敏感性,还具备项目管理和运作能力。

  获取科学产出

  望远镜建成并投入使用后,天文学家将利用它进行天文观测,并基于观测数据,进行科学研究。

  这个过程中,最为核心的问题就是观测时间的分配。


图4 望远镜观测时间的调配是核心问题(绘图:付宇盈)

  有限的望远镜、探测器总是无法满足同时在所有波段观察所有目标的需求,因此,观察什么/不观察什么、什么时候观察、用何种模式观察,等等,都与望远镜有限资源有限寿命能取得的科学产出有关。

  瞧,这又是一个管理问题。

  因此,现代望远镜、天文台成立科学委员会,来针对上述问题进行决策。观测时间分配同样兼顾效率和公平。笔者认为,所谓效率,就是有限资源科学产出最大化;所谓公平,就是论证、设计、研发阶段不能白出力。

  所以,深度参与望远镜前期工作的科学家代表可以进入科学委员会,获得望远镜的观测时间,开展与望远镜主要科学目标相关的观测;其他天文学家也可以向科学委员会提交观测建议书,针对自己感兴趣的目标申请观测时间。

  望远镜的使用中,除了观测时间分配,另一个问题是观测数据的获取。

  观测的建议者无疑能够最先获得观测数据。一般来说,观测数据只给观测建议者,供建议者慢慢研究,或许最符合建议者的利益(不过考虑到拖延症,或许还是有个截止时间更好);而对于科学委员会来说,把所有观测数据都公开,让所有感兴趣的人来挖掘里面的科学价值,显然最符合提升望远镜科学产出的需求;对于目前以各国政府机构为主体的经费资助单位,将不同阶段的科学产出释放出来,也符合社会需求。

  在X射线天文学中,望远镜的观测时间分配和观测数据获取都具有显著的开放性,这或许与X射线天文学足够年轻有关吧。

  天文学与数据科学

  在笔者看来,天文观测堪比建造通天塔(巴别塔)。每一砖、每一瓦都从观测数据中取得;望远镜则好比建造者使用的工具,从徒手进化到瓦刀,又从瓦刀进化到起重机、搅拌机;一代又一代先驱、学者不断向塔顶攀登,又努力把塔修建得更高,然后向更多的人讲述塔顶的风景。

  观测数据本身并不带来知识,但它是知识的基础。观测数据除了包含来自天体的信息,更与观测过程和探测器有关。探测器能力越来越强,观测过程也越来越复杂,积累的观测数据堪称海量。天文数据分析的模式也在悄然发生改变。过去,一人一镜走天下,观测设施是分散化、去中心化的;现如今,观测设施越来越集中化,借助虚拟天文台等技术,身处世界各地的研究者都能获取观测资源和观测数据。


图5 中国虚拟天文台的主页面(http://astrocloud.china-vo.org/)

  因此,现代天文学的数据分析需求日益强烈,且与统计学、计算科学等不断交叉。

  过去,射电天文学使用的干涉阵采用离线数据处理,分别在各个台站取得时间序列形式的观测数据后,放到一起进行交叉相关。而预计将于2020年出光的平方公里射电望远镜阵(SKA),则必须采取必要的在线数据分析了,因为SKA需要用上千台射电天线,合成相当于一平方公里有效面积的望远镜,数据产生速率实在太快(估计每天能产生的原始数据,与目前全球互联网日均流量的数量级相当)。数据分析领域面临如此挑战,以至于引起了高性能计算领域的持续关注。再比如,犹如大海捞针一般的天体引力波信号探测项目高新激光干涉仪引力波天文台(aLIGO)动用了分布式计算、超算等设施,还进行了大量的机器学习方面的研究,才能排除地面设施受到的各种干扰,并准确检验出收集到的引力波信号。

  也许有人会问,相比之下,传统的光学波段应该不会面临如此大的数据分析挑战吧?

  也不尽然。例如,上世纪的哈勃空间望远镜(HST)曾一度“罹患眼疾”:因为装调失误,导致成像模糊。在航天员修复哈勃的硬件之前,要想从哈勃的观测数据中重建清晰图像,也只能通过软件方法了。

  当时重建哈勃观测数据需要解决的数学问题其实和我们现在分析硬X射线调制望远镜的扫描观测数据颇有相似之处,都可以抽象为多维的退卷积问题,只不过卷积核不具备必要的对称性,因而计算复杂度颇具挑战。当时的科学家想了一个办法,利用二维阵列化的CPU,来构造价格相对低廉的向量处理器,从而在硬件架构层面优化图像重建问题的计算。


图6 预计在2022年投入使用的LSST

  将要建成的大口径全天巡视望远镜(LSST)是一台地面大口径、宽视场望远镜,它的探测器是美国斯坦福直线加速器中心(SLAC)在美国能源部资助下研发的相机,是名副其实的史上最大天文相机。

  这台相机的尺寸和一辆SUV相当,重达2.8吨,32亿像素,使用时要制冷到零下100摄氏度以下。这么大的相机,每个观测夜将要生成15TB的数据,也就不足为奇了。这个数据量确实不会给存储方面带来很大压力,但在数据分析中,例如进行两点相关甚至是多点相关分析时,确实带来真正的“大数据”问题。

  所以,天文学中的数据分析也越来越专业化,并且和具体项目的具体科学问题以及具体仪器强关联。因此,当前大型项目的工作方式,并不是将数据分析外包给面向通用任务的商业化机构,而是在项目内部通过专家交流、自主研究等方式解决。

  文章开篇提到,望远镜卫星要想产出成果,发射成功只是第一步,相信读到这里,您一定明白了,在轨交付也不是最后一步。未来要想获取科学成果,依然离不开Ta――数据科学。

举报 使用道具

回复
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

9

关注

15

粉丝

42462

主题
精彩推荐
热门资讯
网友晒图
图文推荐

维权声明:本站有大量内容由网友产生,如果有内容涉及您的版权或隐私,请点击右下角举报,我们会立即回应和处理。
版权声明:本站也有大量原创,本站欢迎转发原创,但转发前请与本站取得书面合作协议。

Powered by Discuz! X3.4 Copyright © 2003-2020, WinnipegChinese.COM
GMT-5, 2024-11-15 09:51 , Processed in 0.024006 second(s), 29 queries .