百度AI再落一子,发布全球首个航天大模型

2013年12月14日20时59分,一位地球来客划过月球的天空,以1.7千米每秒的速度向月球虹湾以东地区降落,随着7500牛变推力发动机关机,离月面4米时,嫦娥三号速度降为0,并以自由落体的方式稳稳落在其智能寻找的合适区域。

这是中国首次实现地外天体软着陆和巡视探测,这也是人类历史上第一次实现无人航天器地外天体软着陆自主避障,而帮助中国在航天领域做出这一突破的秘诀正是人工智能。

中国科学院院士、中国月球探测首任首席科学家欧阳自远,曾在2019年的一次公开活动中讲述了嫦娥三号如何利用人工智能自主避障,寻找月面合适的降落点:“它一直往下降,降到100米的位置我们要它停,拍照。它拍了3764张照片,它自个儿选了一个地点落下去。最后降落在我们指定的插红旗的地方。它刚好,真聪明,四条腿搭在平地上,里面有坑,外面有坑。”

欧阳院士最后强调:“我们用了最高的人工智能。”

航天领域的AI竞赛

自21世纪初,性能大增的人工神经网络——深度学习出现后,人工智能具备了执行更多、更复杂的任务的能力,从语音识别、图像识别,到语言文本翻译、人工贷款审核、消费者行为预测,各行各业都开始挖掘人工智能的巨大潜力。

航空领域也不例外,人工智能在航天领域的应用已成为公开的秘密,其实除了中国,美国近年来也在航天领域中加速应用人工智能技术。

火星表面有着密密麻麻的陨石坑,通过观测这些陨石坑,科学家就能以此来了解陨石撞击火星的大小,形状和频率。一般来说,天文学家每天会花上数个小时,来通过火星侦察轨道器拍摄的图像研究发现这些陨石坑,为了加快天文学家们的探索速度,美国宇航局的人工智能研究人员利用AI创建了一个可以自动甄别新撞击陨石坑分类器的工具,将人工平均需要40分钟发现一个陨石坑的速度节省至只需5秒,研究人员甚至用AI比对出2010年3月至2012年5月之间的某个时候,一个较小的陨石碎片坠入火星时,砸出的一个直径仅为13英尺(4米)的陨石坑,这是人眼很难从火星侦察轨道器传回的图像中观测到的。

图源:品玩版权图库

除了对火星表面环境的探测,人工智能在保障出舱宇航员的生命安全上也逐渐扮演起重要角色。2007年,美国“奋进”号航天飞机宇航员里克·马斯特拉基奥在出舱行走过程中,发现自己的两只手套均出现破损,左手大拇指的破口则尤为明显,地面控制人员命令马斯特拉基奥紧急返回空间站,提前结束此次有惊无险的出舱任务。

为何一直关注着出舱宇航员动态的NASA(美国国家航空航天局)没有提前发现这一安全风险,这是因为在环境复杂、距离遥远的太空中,地面和太空之间的数据传输速度较慢,NASA通过图片、视频传输的安全检测方式很难在地面及时发现手套上的破损。此后,NASA和微软、惠普合作,开发出一套AI系统,无需再将图片、视频传回地面,可利用该人工智能平台在太空环境中随时对宇航员的手套进行安全检测。

图源:品玩版权图库

随着人工智能的发展,越来越多上述优异的人工智能应用案例正在航天领域出现,从自主太空环境探测到智能图像分析,从维修检测到自主导航,从空间站、航天器的自主组装到月壤样本的自动采集,近地空间站、人造卫星、月球车、火星探测等航天领域的方方面面都已离不开人工智能技术。

人工智能技术在中美两国的航天领域广泛应用不是一个巧合,外太空的复杂环境决定了宇航员需要人工智能的帮助。在太空中,探测器与地面通讯困难,当遇到紧急情况时,地面常常无法及时处理,因此需要通过AI来处理一些应急情况。

中国科学院院士叶培建就曾表示道:“比方说我们现在火星探测,在围绕太阳公转的时候,会出现无法通讯的情况,在这样的情况下也要自主。即便是在通讯正常的状态下,由于距离很远,延时很长,天问一号绕着火星转,它的轨道5万多公里,加上到地球的距离延时17分钟多,这么长时间的延时发现任何问题想抢救也需要自主。”

此外,宇航员穿上了厚重的宇航服后在太空和地外星球活动有诸多不便,而宇航员往往有许多科考、探测和各类复杂的问题需要处理,地面沟通迟缓,空间站、飞船内的宇航员有限,宇航员的精力有限,那么数不清的任务如何执行,如何调度,这也需要有强大的人工智能系统来协助人类处理。

可以说AI已成为航天技术发展的核心技术之一,是提升中国航天在国际航天领域的竞争关键。

百度文心大模型助力中国航天

人工智能技术在飞速发展,我国的航天探索也向往飞去宇宙深处。叶培建曾表示,在航天工程中,人工智能的运用早已有之,但只是人工智能的初级部分,随着我们国家越飞越远,人工智能技术也需要不断进步。

《奇点临近》的作者雷·库兹韦尔曾在书中写道:“2045年左右,人工智能将会来到一个’奇点’,跨越这个临界点,人工智能将超越人类智慧,人类历史将会彻底改变。”因此,把AI领域的前沿突破尽快转换成我国航天领域的生产力成为了当务之急。

简单来说,决定一个人工智能模型是否“聪明”好用的关键一个在于算法本身,另一个则是算法背后用于训练算法的数据广度和深度。这就客观要求如今的AI模型有着更广的数据来进行训练,同时通过系列知识图谱来保证单纯追求参数量基础上模型的学习效率和质量。

AI过去在各行各业落地周期长的的一个原因就在于,传统AI模型泛化性差、依赖昂贵的人工标注数据、落地成本高等问题,如果想要扩大一个模型的应用范围,时常会出现如A模型往往专用于特定A领域,将A模型应用到领域B时效果并不好这样的问题,此外,传统模型训练需要海量的标注数据,如果一些应用场景的数据量不够大,那么模型精度就会大打折扣。

图源:pexels

AI在航天领域的落地应用同样存在模型分散、需要标注数量多、细分方向可训练数据较少、模型效果不理想等问题。如,互联网上的热门应用抖音、淘宝、微信、微博,其动辄就能在用户的浏览时长、点赞、收藏、转发、分享、加入购物车等操作中收集海量数据供AI筛选、分析,而在航天领域,可收集的有效数据则相对有限。

同时,航天是一项复杂的系统工程,是指进入、探索、开发和利用太空以及地球以外天体各种活动的总称,航天活动包括航天技术(又称空间技术),空间应用和空间科学三大部分,其每一部分又涉及成百上千个细分领域的知识,这意味着,传统模型训练方式放到航天领域会出现通用性差的问题,不同应用场景往往需要重新训练,但如果根据每个细分领域来做一个小模型又会使得成本高昂,随着航天技术的进步、模型的迭代更新,每次调整都需要花费研究人员无数的时间精力。

大模型的出现则提供了一种“预训练大模型+下游任务微调”的方式,来有效扩展模型的通用性,其泛化能力强,可以做到举一反三,相比于传统模型训练,它可以用更少的训练数据达到更好的模型效果,有效降低人工标注成本、降低模型使用门槛、提高模型利用效率,这也是为何大型模型近年来越来越受欢迎的原因。

因此,将大模型应用到航天领域,就显得刻不容缓。

2021年12月16日,嫦娥奔月航天科技(北京)有限责任公司与百度签署合作协议,双方将在包括月球探测、行星探测等在内的深空探测领域,开展航天技术与人工智能技术的合作。中国航天选择了百度作为“中国探月航天工程人工智能全球战略合作伙伴”,这背后正是百度储备深厚的AI技术能力,以及行业领先的百度自主自研深度学习平台飞桨和依托于飞桨的产业级知识增强大模型——文心大模型。从此,中国航天的发展有了大模型的助力。

自百度文心大模型诞生之初,文心ERNIE 2.0就以9个任务平均得分首次突破90大关的成绩登顶国际权威排行榜GLUE榜首。2021年7月,ERNIE 3.0英文模型在国际权威的复杂语言理解任务评测 SuperGLUE 上超越谷歌的 T5、OpenAI 的 GPT-3 等大模型,以超越人类水平0.8个百分点的成绩登顶榜首。2021年12月,百度与鹏城实验室联合发布全球首个知识增强千亿大模型鹏城-百度·文心,参数规模达到2600亿,在60多项NLP任务中取得最好效果。

图源:百度

虽然当今业内各类大模型不少,但与其他大模型相比,文心大模型具备“知识增强”的核心特色。百度知识增强大模型能够从大规模知识和海量无结构数据中融合学习,学习效率更高、效果更好,具有良好的可解释性。

此外,文心大模型具备通用性好、泛化性强的特点,使开发难度更小、标注数据可以更少,这对可用数据相对较少的航天领域尤为重要,这大大降低了航天领域AI开发和应用的门槛,那么基于百度飞桨文心大模型开发的航天-百度·文心大模型,可以满足航天行业真实场景中的应用需求,降低航天人们的使用门槛,以此推动航天产业的变革与科技创新。

其实自2019年3月文心ERNIE1.0发布以来,飞桨文心大模型已几乎应用到百度全系列产品,从百度搜索、信息流,到智能音箱等互联网产品,其内部日均调用已达万亿次,文心大模型的应用显著提升了百度的产品效果和用户体验。

从外部落地应用来看,飞桨文心大模型已通过飞桨开源开放平台、百度智能云等赋能到工业、能源、金融、通信、媒体、教育等各行各业,个人、企业开发者数量超6万。例如在保险领域应用中,文心大模型的智能解析能力,能使文本处理效率提升30倍;在人力资源领域应用中,文心大模型能实现候选人信息智能分类,模型识别准确率达到99%;在医疗领域应用中,文心大模型将每份病历的检查时间,从30分钟缩短到了秒级别。

大模型作为人工智能 “基础设施”的一部分,自然有着助推航天行业的潜力。依托于百度飞桨文心大模型,通过一个航天行业大模型底座,可应用到N个航天业务场景应用,如从航天故障部位信息抽取、航天工程文献情报分类,到航天技术文献检索等多方面。如,1971年3月,卫星曾在阴影期后出现遥测功率下降的问题,而且反复出现类似故障,故障是由于多工器断续接通造成的,大模型经过训练后可以实现航天故障部位信息抽取,直接输出故障部位多工器的结论。

大模型是AI领域的前沿方向,国内外各大公司和科研机构高度关注,百度联合中国航天率先发布自主可控的航天大模型,是大模型产业落地的先行者,当航天行业大模型成为航天领域的AI基础设施,航天体系各业务智能化升级也会成为趋势。

中国探月工程三期副总设计师、国家航天局探月与航天工程中心副主任裴照宇在与百度签署合作协议时曾致辞:“人工智能可实现航天器自主运行,为未来航天系统提供基础能力,特别是深空探测。我们希望在与百度的后续合作中,发挥好各自的优势,开展深度合作,共同研发可应用于深空探测的人工智能技术,推进深空技术的创新与发展。”

在未来,随着AI技术的发展,人工智能在航天领域将会有更为广泛的应用,如航天器的故障分析、任务设计与规划,自主决策、智能机器人、集群智能等方面,而百度的航天大模型将在其中扮演着AI基础设施的关键角色,为中国航天飞往宇宙深处贡献技术力量。