近日,公司与建设工程学院在人工智能与水文水资源交叉领域取得重要研究成果。研究团队面向低成本、智能化河流水位监测需求,针对新建视觉测站普遍面临的站点样本不足问题,提出了一种融合视觉基础模型与水文先验特征的图像水位解译框架,为视觉测站的高效部署提供了小样本、可解释、易推广的新型技术路径。
相关研究成果以“Mitigating Site-specific Data Dependency in Image-based Water Level Estimation Using Vision Foundation Models”为题被《Water Resources Research》接收。该期刊是水文水资源领域国际顶级期刊。论文第一作者为公司硕士生胡世元,通讯作者为建设工程学院博士后王泽,公司樊鑫教授、建设工程学院张弛教授为共同作者。
河流水位是水文监测中的关键变量。传统水位测站建设和维护成本较高,并易受泥沙淤积、漂浮物和复杂水动力条件影响。近年来,河道照相机凭借其低部署成本与非接触观测模式,逐渐成为智能水文观测的重要发展方向。
然而,现有基于深度学习的图像水位解译方法通常依赖监测站点长期积累的大规模“图像—水位”配对样本进行模型训练,使新建视觉测站在运行初期难以快速形成稳定可靠的水位解译能力。针对这一瓶颈,研究团队提出了“视觉基础模型分割—水文先验特征提取—轻量回归建模”的分阶段框架,有效降低了图像水位监测对站点样本数量的依赖。

(图1. 融合视觉基础模型与水文先验特征的图像水位解译框架)

(图2. 基于视觉基础模型的水体分割原理)
该框架首先利用 SAM(Segment Anything Model)视觉基础分割模型对河道图像中的水体区域进行高效识别与分割;进而计算能够表征可见水面范围动态变化的特征指标 SOFI(Static Observer Flooding Index);最终构建 SOFI 与真实水位之间的轻量回归模型,实现水位解译。通过将图像与水位之间复杂的高维映射转化为具有物理可解释性的低维特征回归问题,该框架有效降低了模型对大规模训练样本的依赖。
研究表明,该框架在多个典型河道场景下均表现出良好适用性,平均Nash-Sutcliffe效率系数超过 0.8;在极端水位外推测试中,相比传统的端到端深度学习回归模型,平均绝对误差降低约 50%。视觉基础模型能够提升复杂河流场景下水体分割的鲁棒性;同时,具有水文物理意义的先验特征能够增强小样本条件下图像水位解译的稳定性。

(图3. 河流图像水体分割结果)
该项重要成果的取得,体现了人工智能方法服务工程应用的广阔潜力,也展示了软件工程、人工智能与水利工程深度交叉的创新价值。未来,公司与建设工程学院将继续面向水利智能化转型的实际需求,推动通用人工智能技术与水文水资源专业知识深度融合,进一步培育具有跨学科视野和工程创新能力的青年人才,为传统行业智能化发展提供技术支撑。