您当前的位置 :浙江在线 > 浙江新闻 > 原创 > 全媒体播报 正文

从赤潮预警到宇宙探索,浙江两项AI科学模型入选全球创新案例集

字体:
—2025—
07/11
17:19:57
2025-07-11 17:19:57 来源:浙江在线 通讯员 肖乐 记者 汪雨晨

  浙江在线7月11日讯(通讯员 肖乐 记者 汪雨晨)当地时间7月8日至11日,由国际电信联盟与53个联合国伙伴机构合作举办的2025年人工智能向善全球峰会在瑞士日内瓦召开。会上发布了《人工智能向善创新实践案例集》,之江实验室两项科学模型成果GeoGPT及OneAstronomy收录其中,展示了大模型等人工智能技术在地学科学研究、海洋生态监测与保护以及宇宙探索中的应用效果。

  值得一提的是,GeoGPT从全球200多个评选案例中脱颖而出,获评国际电信联盟颁发的优秀创新实践案例奖。这是之江实验室践行开放科学、积极参与全球科技治理的缩影,也是实验室持续推动“人工智能+科学”的探索实践。

中国工程院院士、之江实验室主任王坚在峰会现场领奖 图源之江实验室

  两项科学模型成果入选

  本次入选案例集的GeoGPT是一个开源、非营利的地学领域AI模型,受深时数字地球国际大科学计划(2019年由中国科学家倡议、13个国际组织与机构共同发起的国际大科学计划)使命愿景启发,初始于云栖工程院,由之江实验室主导打造。它融合了深时地球数据与智能算法,包含深度检索和分析理解、文献阅读和数据抽取、地质图问答和生成、知识图谱提取与构建等一系列科研工具,以及智能体开发平台。截至目前,GeoGPT已吸引来自135个国家的4万余名地球科学研究者注册使用,帮助众多该领域的科研人员提升了研究效率。

AI4G奖项 图源之江实验室

  如何将海量无脊椎动物古化石数据从《无脊椎动物专著》等纸质载体抽取出来,是古生物领域面临的一大挑战。GeoGPT团队与普渡大学James Ogg教授团队合作开发大模型数据智能抽取工具,相比人工提取及传统算法节省了75%的时间。目前已完成3卷专著、约2000页文本的自动化数据抽取与人工校验。这些结构化数据已成功汇入Treatise在线化石数据库并向全球开放,标志着该领域首批大规模化石数据成功实现线上化。

  除AI+地学外,之江实验室和中国科学院国家天文台共同打造的天文领域AI模型OneAstronomy及系列天文科学计算模型在处理分析复杂天文数据、推动理解宇宙起源上也展现出巨大的潜力。例如,天文科学计算模型之一恒星光谱模型SpecCLIP已经从郭守敬望远镜1000多万条中低分辨率光谱和盖亚空间天文台2亿多条超低分辨率光谱数据中,发现了8000多颗贫金属星候选体([Fe/H]小于-4.0),而此前人类发现的[Fe/H]小于-4.0的恒星一共仅有50多颗。通过研究这些贫金属星,天文学家能够去推断早期银河系的样貌。

之江实验室模型成果在人工智能向善全球峰会上展示亮相 图源之江实验室

  践行开放科学 参与全球科技治理

  为推动GeoGPT在国际科学界的透明合规和开放共享,将其打造成为全球性的地球科学科技公共产品,一个独立的、国际化的GeoGPT治理委员会于2024年底成立,以确保项目符合伦理、法律和运营标准,同时为用户和相关方提供透明性。在GeoGPT治理委员会的监督指导之下,GeoGPT已于今年4月27日面向全球开放使用,同时开源三个模型(Llama3.1-70B-GeoGPT、Qwen2.5-72B-GeoGPT、GeoGPT-R1-Preview)及训练数据源列表。

  “只有在国际上坚持开放以后,才可以真正介入科技治理的问题。GeoGPT和OneAstronomy非常好地践行了开放科学理念,同时通过GeoGPT的全球开放以及治理委员会的工作,我们也可以真正在实践上去体会如何参与国际科技治理。”中国工程院院士、之江实验室主任王坚说道。

王坚与GeoGPT治理委员会联席主席John Ludden,Richard J. Chuchla,委员Nancy House合影 图源之江实验室

  GeoGPT的全球开放使用为推动实现联合国可持续发展目标提供了有力支撑。例如,GeoGPT基于微藻物种分类算法,能够准确识别有害藻类,分析藻类分布规律,并对赤潮爆发的时间、位置和规模作出预警,其监测效率较人工提升1000倍。同时,GeoGPT能评估全球变暖对微藻分布的影响,揭示气候变化如何影响藻类行为、分布和相互作用,为水生态系统保护以及灾害预防提供关键科学支持。

  “我们进入了开放资源创新的时代,这里的开放资源不再局限于传统的以代码为核心的开源,而是涵盖数据、方法论等多方面内容。”王坚表示,我们需要面向全世界提供服务的科技公共产品,发挥AI所有的能力,让每个人的创造力在科学研究中充分地体现。

  打造科学基础模型 推动AI与科学深度融合

  “人工智能已经成为一个方法论、一种‘通用语言’,科学、技术、工程的创新都绕不开它。”王坚表示,“不要把人工智能当成一个简单的工具,它不仅改变科学研究的方法,甚至改变你提问题的方法。”

  为推动AI突破当前“描述世界”的浅层认知模式,向真正“理解科学”的深层认知范式演进,在打造GeoGPT、OneAstronomy等领域AI模型的同时,之江实验室正在科学基础模型领域发力——打造021 Large Science Model(021 LSM)。

  “基础模型是人工智能的皇冠,是人工智能发展的技术底座。”王坚认为,推动“人工智能+科学”,在基础模型上取得突破十分关键。之江实验室研发的021 LSM采用MoE混合训练框架,注重科学知识的丰富性和推理能力的提升,旨在实现深度科学推理与自主知识发现,为科学问题的解决提供全新的技术框架。当前,021 LSM使用了15T Tokens的训练数据,包含了STEM 174个专业领域,参数规模达到236B。

之江实验室科研人员向与会者介绍021 Large Science Model 图源之江实验室

  当前,“计算密集、数据驱动、基于模型”正加速各个领域的科技创新突破。之江实验室正聚焦智能计算,通过算力、数据、模型体系化的创新,为推动“人工智能+科学”提供核心动力,并期待与全球科学家携手,以人工智能延展人的创造力,解决人类社会面临的共性挑战。

版权和免责申明

凡注有"浙江在线"或电头为"浙江在线"的稿件,均为浙江在线独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"浙江在线",并保留"浙江在线"的电头。

标签:科学;研究责任编辑:吴珂珺
融媒产品
浙江宣传
群众工作室
90早新闻
精品专题
更多资讯

当地时间7月8日至11日,由国际电信联盟与53个联合国伙伴机构合作举办的2025年人工智能向善全球峰会在瑞士日内瓦召开。