秦超 2025-02-08 16:01:29
生态环境行业大模型(以下简称大模型)可对水质实时监测并分析相关数据,有效提高污水处理效率和资源回用率,而这只是大模型助力科学治污等业务应用场景中的一个。
当前,数据分析模型、AI应用蓬勃发展,为什么需要建设生态环境行业大模型?大模型是否能满足生态环境行业各类复杂、多元且专业的业务化需求?
打造大模型库,构建数字生态文明基座
“大模型的发展,将推动各类AI应用在更广泛领域创新应用。”生态环境部信息中心大数据发展部主任,国家重点研发项目“基于生态环境大模型的土壤地下水监测监管与风险预计体系”首席科学家黄明祥博士说,其深度学习的技术特点,使之具备了庞大的参数规模和复杂的神经网络结构,因而能够处理更加复杂的任务。
大模型的发展,是AI不断进步的缩影。随着AlexNet在图像识别上的成功,视觉技术在目标识别和目标检测等方面日趋成熟,而深度学习技术的进一步发展,特别是Transformer架构的提出,使得大语言模型(LLM)也取得了突破,BERT、GPT等模型在语言理解、翻译、文本生成等方面展现出了强大能力,并成为AI 发展的关键驱动器。当前,全球范围内已涌现出了诸如ChatGPT、Claude、通义千问、讯飞星火、ChatGLM等众多通用大模型,特别是DeepSeek国产自主大模型以其高性能、低成本、强推理优异表现,打破国外技术封锁,成为当前国内外关注的焦点。
“但通用大模型对行业专有知识的掌握存在局限。”黄明祥说。
通用大模型强调具备提供高效且共性化服务的能力,但面对行业专有知识,仍然面临不熟悉相关法律法规和标准、难以准确把握各种指标的具体含义等困境。
“不仅如此,各地生态环境系统的数字化发展水平不均衡,相互间的数据模型、AI应用也难以打通,这为全国数字生态文明建设带来阻碍。”黄明祥说,我们的办法是充分解耦,即把各类模型、数据库拆分成通用的基础单元提高其互通性,在经过深入优化调整和训练后,搭建起来大模型的基础设施和开放平台。
目前,大模型已搭建完成基础模型库,可涵盖通用大模型、代码大模型、向量模型、语音模型、OCR大模型等。2024年7月3日,由生态环境部信息中心与浙江省生态环境厅在浙江杭州宣布生态环境大数据创新应用研究示范基地成立,旨在进一步深化生态环境大数据应用。随后,生态环境部信息中心还陆续在广东省广州市、陕西省西安市不断深化生态环境信息化顶层设计,推动生态环境数字化治理应用场景创新。
在此基础上,各地已经开发应用的人工智能(AI)、智能模型和生态环境数据都可以无缝并入大模型,而各级生态环境主管部门也可在此基础上专注业务水平提高,开发符合各自业务需求的行业应用。
丰富的数据、实际的应用经验,是大模型发展迭代的关键。黄明祥说:“为实现能力共建、数据资源共用以及业务领域共赢,降低重复建设成本,我们邀请了科研院所及工程单位等组成研发专家团队,推动生态环境行业内相关企事业单位、科研院所之间互联互通。”
“大模型的‘基座’作用,将为生态环境全行业打造一个开放、互联、智能的生态环境数字化生态系统,加快全国数字生态文明建设。”生态环境大数据创新基地负责人王健说,目前大模型已经进入技术验证阶段并将于近期投入试运行。
数据分层、分类,实现生态环境全行业梯级利用
大模型旨在构建一个全面、高效的生态环境数据处理、溯源推理和智能协作平台,及周边生态应用和系统,“将形成知识驱动业务应用的生态环境领域典型模式”。黄明祥说。
目前,环评领域、执法领域、第三方服务监管、智能环保设备研究、绿色智慧产业发展、标准规范适用性审查、安全、运维等行业应用及端侧设备、绿色产业等,都已纳入了生态环境大模型的顶层规划,并形成了“1+5+N”整体架构。“后续,可根据不同行政层级,开发不同的业务场景应用。”黄明祥说。
“1+5+N”的规划布局中,“1”指以网络支撑和算力支撑为基础,构建一套生态环境基础设施平台;“5”指规划并逐步建设生态数据中心、能力研发平台、资源集成平台、服务集成平台、服务共享平台等五大核心平台,作为架构的基座;“N”则指在此基础上,打造案卷评查、数字环评、智能问答、精准问数、文书生成等众多基础应用及行业应用,以满足多样化的业务需求。
比如,执法案卷评查任务量庞大、质量不一,且存在人工抽查局限性、个人主观判断偏差、评审规则与法律标准变动频繁等问题。通过生态环境大模型的 AI智能识别案卷功能,包括结构化信息精确提取、长文本语义信息的深度解析与提取、手写字体及印章信息有效识别,与人工审查相结合,提升案卷质量评估工作的效率与成效,发挥事前预防、事中控制、事后监督的综合管理职能。
再如,通过开发特定领域的智能体,利用AI技术自动读取数据,调用相关领域的专业模型,并结合外部典型案例数据集与历史趋势演变分析,可提出最有可能的根因分析结果。在应用中加强专业模型微调、典型案例及历史经验的持续学习与优化,智能体将有望成为科学治污的智能决策核心。
“下一步,大模型将协调更多算力资源并规划利用智算平台,实现各类算力资源的有效整合与容器化部署管理。”黄明祥说。
“生态环境大模型的顺利运行,不仅有助于整合海量生态环境数据,为科学决策和精细化管理提供支撑,还将帮助更好地理解和应对气候变化条件下的生态环境变化,助力构建监管联动的调度体系,进而服务生态环境全行业业务需求。”王健说。
责编:肖静
一审:肖静
二审:张马良
三审:熊佳斌
我要问