• 2.07 MB
  • 262页

专门水文学概论-宋松柏-西北农林科技大学出版社

  • 262页
  • 关注公众号即可免费下载文档
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档由网友投稿或网络整理,如有侵权请及时联系我们处理。
'专门水文学概论主编宋松柏蔡焕杰粟晓玲西北农林科技大学出版社 图书在版编目(CIP)数据专门水文学概论/宋松柏,蔡焕杰,粟晓玲编.—杨凌:西北农林科技大学出版社,2005ISBN7-81092-226-2Ⅰ.专⋯Ⅱ.①宋⋯②蔡⋯③粟⋯Ⅲ.水文学—研究Ⅳ.P33中国版本图书馆CIP数据核字(2005)第088137号专门水文学概论宋松柏蔡焕杰粟晓玲编出版发行西北农林科技大学出版社地址陕西杨凌杨武路3号邮编:712100电话总编室:029—87093105发行部:87093302电子邮箱press0809@163.com印刷杨凌三和科技印务有限公司版次2005年8月第1版印次2005年8月第1次开本787mm×1092mm1/16印张16.875字数389千字ISBN7-81092-226-2/P·3定价23.80元本书如有印装质量问题,请与本社联系 第1章水文学的体系1.1水文科学的分支1.1.1水文学的概念1.水文学的定义水是人类赖以生存、社会进步和经济发展最为重要的资源之一。水文学是人类长期与水旱灾害作斗争的生产活动中,通过观察和探索各种水文现象和变化规律,逐渐形成和发展起来的学科。水文学一词,英语表示为“Hydrology”、法语表示为“Hydrologie”、德语表示为“Hydroloìe”、西班牙语表示为“Hidrologia”、俄语表示为“ГИДРОАОГИЯ”,这些词是从希腊拉丁文中“Hydro”作词头演变而来,其意为“水的知识”(黄伟纶)。16~17世纪出现了英语“Hydrology”和法语“Hydrologie”词。18世纪末、19世纪初,“Hydrology”和以“Hydro”作为词头的词,如“Hydrography(水文地理学)”、“Hydrometry(水文测验学)”、“Hydrostatic(静水力学)”等词被广泛使用。1762年,Wallerius首次将“Hydrology”一词用于“精确研究土壤含水量”。1796年,Hutton对“Hydrology”进行了解释,即“用于实验和阐述普通水的自然现象与特性,为自然科学史的一部分”。1895年,WestmGaz认为“Hydrology”的全部科学是基于对降雨的研究。20世纪以后,“Hydrology”被解释为“用于研究地表水的特性、规律及其分布等的科学”,“还面临着侵蚀、干旱、污染等课题”。1922年,“国际科学水文协会—IASH”正式成立。1971年,“国际科学水文协会—IASH”改名为“国际水文科学协会—IAHS”,“Hydrology”正式被确定为“研究自然水体”的科学名词。水体是指自然界中以一定形态存在的水的总称。如江河、湖泊、冰川、沼泽、海洋、地下水和大气中的水汽。美国国家科学研究委员会通过回顾水文学的发展,提出水文学是研究地球上各种水体的发生、循环、分布,水的化学和物理性质以及水对环境的作用、水与生命体的关系等科学,研究范畴包含了水在地球上的整个生命过程。中国水利百科全书将水文学定义为:研究地球水圈的存在与运动的科学,主要研究地球上水的形成、循环、时空分布,化学和物理性质以及水与环境的相互关系,为人类战胜洪水与干旱、充分合理开发和利用水资源,不断改善生存和发展的环境条件提供科学依据。我国工程水文学教科书中则定义为:水文学研究各种水体的存在、循环和分布,物理与化学特性,以及水体对环境的影响和作用,包括对生物特别是对人类的影响。2.水文学的研究对象水文学是地球物理科学中一门独立的学科。地球是由岩石圈、水圈、大气圈和生物圈组成的。在各个自然圈层,各种水体均通过蒸发、水汽输送、降水、地面和地下径流等水文要素相互联系、相互转化和更新,形成一个巨大的水循环动态系统。由于太阳能和大气1 运动的驱动,水圈中的各种水体通过水面、陆面和植物茎叶面的蒸发或散发,形成水汽,进入大气圈,依靠气流运动进行水汽输送。在一定条件下,大气圈中的水汽凝结形成降水;降落到地球表面的雨水,一部分渗入地下,一部分形成地面径流,沿江河流动回归大海,一部分被蒸发和散发重新逸散到大气圈;渗入地下的水,或者成为土壤水,再经蒸发和散发逸散又回到大气圈;或者以地下水形式排入江河、湖泊,再汇入到海洋。因此,水文学是研究水循环各个环节以及与其有关的科学问题,其核心内容是水循环研究。由于大规模的人类活动干扰了自然界的水循环过程,因而,水资源的开发利用和人类活动对水环境的反馈效应研究,也已经成为现代水文学研究的重要内容。水文学研究的对象包括降水、蒸发、入渗、地下水、河川径流以及溶解物、悬浮物在水流中输送等问题。研究范围包括大气水、海洋水、陆地表面水和地下水;水圈同大气圈、岩石圈和生物圈等地球自然圈层的相互关系;水量和水质问题;水情的瞬息动态变化规律;全球水的生命史以及未来的变化趋势等。1.1.2水文学的主要分支学科水文学涉及气象学、地质学、地理学、植物生态学、数学、物理学、化学等学科。水文学最早主要研究河流、湖泊、沼泽、冰川和积雪,以后扩展到地下水、大气水和海洋水。目前,根据分类依据的不同,水文学有以下几种分类方法(芮孝芳)。1.按照地球圈层分类广义上,按照地球圈层(水体所处的空间位置),水文学可分为水文气象学、地表水文学和地下水文学。按照地球表面分布情况,又可分为海洋水文学和陆地水文学。(1)水文气象学研究水圈和大气圈的相互关系,包括大气中水文循环和水量平衡,以蒸发、凝结、降水为主要方式与下垫面的水分交换,暴雨和干旱发生和发展的规律等。(2)海洋水文学主要研究海水的物理性质和化学成分,海水运动和各种现象的发生、发展规律等。(3)地下水文学主要研究地下水的形成、分布和运动规律及其物理化学性质,地下水资源的评价和开发利用以及对环境的效应等。(4)陆地水文学研究大陆表面上的各种水体及其水文现象的形成过程与运动变化规律。按照研究水体的不同,又可分为河川水文学、湖泊水文学,沼泽水文学、冰川水文学和河口海岸水文学。1)河川水文学也称河流水文学,研究河流水文现象及河流资源利用。河流水文现象主要包括河流的补给、径流形成和变化规律、河流的水温和冰情、河流泥沙运动和河床演变、河水的化学成分、河流与环境的关系等。2)湖泊水文学主要研究湖泊(包括水库)中的水量变化和运动,湖水的物理特性和化学成分、湖泊沉积、湖泊富营养化和生态系统等湖泊水文现象以及湖泊资源的利用等问题。3)沼泽水文学研究沼泽水的物理化学性质、沼泽径流、沼泽对河流和湖泊的补给和沼泽改良等。4)冰川水文学主要研究冰川的分布、形成和运动,冰川融水径流的形成过程及其时空分布,冰川突发性洪水的形成机制和预测,冰川水资源的利用以及全球气候变化对冰2 川的影响等。5)河口海岸水文学研究入海河口和海岸带水文现象的基本规律、河口和海岸带的利用及其灾害防治。河口和海岸带的水文现象主要包括河口洪水波传播与扩散、潮波传播与变形、河口过滤器效应、泥沙运动等。2.按照研究对象分类按研究对象划分分支学科,主要有河流水文学、湖泊水文学、沼泽水文学、冰川水文学、雪水文学、水文气象学、地下水水文学、区域水文学和海洋水文学等。(1)雪水文学主要研究积雪的数量和分布、融雪过程、融雪水对河流和湖泊的补给、融雪洪水的形成和预报。有时把雪水文学和冰川水文学合称为雪冰水文学。(2)区域水文学主要研究某些特定地区的水文现象,如河口水文、坡地水文、平原水文、岩溶地区水文、干旱地区水文现象等。3.按照基础理论与应用分类按照基础理论与应用分类,水文学可以分为水文学原理和应用水文学。(1)水文学原理也称理论水文学。研究自然界水文循环、溶质运移机理,水圈与地球其他圈层的相互关系。主要研究内容包括:不同尺度下水文循环机理,土壤水分运动机理,蒸散发机理和流域蒸散发计算,地表水、地下水运动规律,流域产流、产沙、汇流机理,水质与生态系统环境问题以及水文循环中的溶质运移机理。(2)应用水文学运用水文学和有关学科的理论和方法,研究各种实际水文问题的解决途径和方法,为水利、农业、林业、国土整治规划、电力、交通、城市发展和环境保护等工程建设提供水文设计数据和水文预报服务。20世纪50年代后,应用水文学不断发展学科自身的理论和方法,紧密联系工程实际,开拓了水资源利用、人类活动的水文效应等新的研究领域,形成了工程水文学、农业水文学、森林水文学、都市水文学和医疗水文学等分支学科。4.按照研究方法分类按照研究方法分类,水文学可以分为土壤动力水文学、系统水文学、确定性水文学、水文统计学、随机水文学、灰色系统水文学、模糊水文学、地理水文学、实验水文学、同位素水文学、遥感水文学和数字水文学等。(1)土壤动力水文学土壤动力水文学是水文科学与土壤学相结合的一门学科,是理论水文学的一个重要分支,它是以物理学理论为依据,以土壤水能态为基础,研究土壤水发生、现象、性质、循环和分布,土壤水下渗、蒸散、植物吸收、运动和平衡等各种水文过程的机制与动力学特性,土壤水与人类活动和生态环境之间的相互关系。(2)系统水文学也称水文系统理论和方法(HydrologicalSystemTheory&Approach),是借助于系统理论及方法来研究流域、河段或区域水文过程的学科。将流域、河段或区域作为一个水文系统,用系统方法研究其输入、输出和系统运行间的关系,并建立相应的数学模型。(3)确定性水文学研究确定性水文过程的学科。(4)水文统计学也称统计水文学。研究纯随机水文过程的学科。(5)随机水文学是随机过程理论和时间序列分析技术引入水文学中逐渐形成的一门学科。3 (6)灰色系统水文学是我国最早由武汉大学(原武汉水利电力大学)夏军教授提出,基于灰色系统理论来研究水文过程模拟、预测和水文风险等问题的学科。其特色是针对水文信息资料不完全的特性,从水文原理和水文系统分析角度,研究水文现象的不确定性,具有独创性的水文灰色系统模拟、灰色预测、灰色统计和灰色规划等新方法。主要包括灰色系统水文学基础和灰色水文学的方法论及应用两个相互联系的部分。(7)模糊水文学是我国大连理工大学陈守煜教授提出的研究模糊随机系统理论分析体系与方法的新型水文学科,并在汛期的划分、设计年径流及其年内分配的确定、月径流随机模拟、多年径流过程的周期分析、水文计算的模糊优化适线等方面取得了大量的研究成果。(8)地理水文学水文学可以归纳为地理学、地球物理学与工程学三个研究方向。水文学早期研究主要为地理研究和工程研究。近代则出现了地球物理方向,主要偏重于数理范畴。现代水文学的研究中,三种方向并存发展。水文学的地理研究方向,称为“水文地理学”(Hydrography)。由于该词的涵义容易被人们误解为注重区域水文现象的描述,而忽视其学科的理论基础研究,难以有效地利用地理学原理指导水文学的研究工作。后来,经中国地理学会水文专业委员会多次讨论,建议改用“地理水文学”(GeographicalHydrology)一词。地理水文学同时隶属于地理学和水文学的分支科学。1981年,苏联学者A.安基波夫首次提出了“地理水文学”。他在“水文研究的地理学观点”一文中,以景观学(地理系统学说)为核心,详细地阐述了水文研究的地理学途径。我国著名的地理水文学家郭敬辉等认为,水文地理学主要以自然地理学原理与现代自然地理学的新思想(包括水热平衡、景观地球化学、生物地理群落研究的新成就,以及地理系统分析的新概念)为基础,同时吸取地学相邻学科(包括地质学、气象学、地貌学、土壤学、地植物学及人文地理学等)的基本知识和技术方法,对各种水文现象和水文过程开展研究。地理水文研究具有宏观性、综合性及区域性三大特点。相对于工程水文研究来说,地理水文研究更侧重于研究水体运动变化规律和总体演化趋势以及与其他自然地理因素之间相互影响的综合研究。地理水文学的研究内容包括:水、环境与人类社会发展的相互关系;水循环系统与水量平衡、区域水文、特殊水体的水文(岩溶、冰川、河口、干旱区等)、环境水文、水资源水文、比较水文,以及新技术的应用。(9)实验水文学实验水文学是研究和使用实验途径对水文现象和水文过程进行探索、寻求解答的水文学分支学科(顾慰祖,陆家驹,唐海行等,2003)。其方法和目标是通过水文现象观测和控制试验、实验,包括模拟或重演水文现象从定性、定量到定解,分析水文现象和水文过程的状态、成因,阐明其变化规律和内在联系,并将结果外延到应用水文学之中。实验水文学领域处在自然界圈层的界面上,涉及水圈、大气圈、岩石(土壤)圈、生物圈之间的各种关系,因而需要借助于各种近代科学技术手段。(10)同位素水文学同位素水文学是20世纪50年代发展起来的一门学科,它主要利用同位素技术解决水文学中一些关键问题。在水文实验、地下水运动研究中,应用核技术,逐渐形成同位素水文学。通过研究天然水中C、H、O等同位素,探讨天然水循环过程中遇到的各种水文学问题的学科。同时,同位素测定精度高,通过测定同位素组成,可研究和追踪水的运动和循4 环。同位素水文学研究有助于水文过程研究的定量化和微观化,如水质点运移,追踪降水时土壤中水分运动,研究降水入渗机理及降水入渗率。同位素方法必须与常规的水文学、水化学方法配合使用,才能获得最佳效果。(11)遥感水文学在水文调查和水文预报中,研究遥感技术的应用,逐渐形成遥感水文学。(12)数字水文学数字化是信息革命时代最具代表性的特征。数字化技术正在对人类的生产和生活产生极其深刻的影响,它对水文学来说,不仅使水文信息的采集、传输、储存、处理和显示方法发生了根本性的改变,而且也使揭示和探索水文规律的手段发生了巨大变化,从而导致了数字水文学的创立。数字水文学定义为:基于数字化技术描述水文现象时空变化,探索、揭示水文规律的水文学分支学科。5.按照水文学主要采用的实验研究方法分类按照水文学主要采用的实验研究方法分类,水文学可以分为水文测验学、水文调查、水文实验三个分支学科。(1)水文测验学研究如何正确、经济、迅速地测定各种水文要素的数量及其在时间和空间上的变化,主要包括站网布设、测验方法和资料整编方法的研究,测量仪器的研制和资料存储、检索、传送系统的研究。(2)水文调查是水文科学的野外勘测和考察部分,旨在对水体形态和数量、集水面积内的自然地理条件等作出科学的分析和评价。在中国,历史大暴雨、历史大洪水和枯水的调查是水文调查的重要内容。(3)水文实验旨在通过野外和室内实验,揭示水文循环过程各环节中水的运动、变化规律,如水向土中下渗的规律,土壤水的运动规律、径流形成规律、土壤和水面蒸发的规律,以及人类活动的水文效应等。6.按照应用范围分类按照应用范围分类,水文学可以分为工程水文学、农业水文学、森林水文学、城市水文学、环境水文学、生态水文学等分支学科,其中以工程水文学发展最为迅速。(1)工程水文学研究水文学原理应用于工程实践,为水利工程或其他有关工程等的规划、设计、施工和运行提供水文依据。研究内容包括水文计算、水利计算、水文预报等。(2)农业水文学研究土壤—植物—大气连续体系统中水文现象的基本规律,为农业合理用水、节水和灌溉提供科学依据,涉及的水文现象包括降水—地表水—土壤水—地下水的相互转化、溶质运移等。(3)森林水文学研究森林水文效应、保水作用以及水土流失的防治。森林水文效应主要包括森林对降水、蒸发和径流形成的影响。(4)城市水文学研究城市化水文效应,为城市给排水和防洪工程建设以及生态环境质量改善提供水文依据。城市化水文效应主要包括“雨岛效应”和“热岛效应”、城市化对径流形成的影响等问题。(5)生态水文学研究区域生态系统和区域水文科学的交叉领域,其核心内容是揭示不同环境条件下植物与水的相互作用机理,探索各种植被的生态水文作用。研究一定时空尺度上生态过程与水文过程耦合演进规律及其成因,探求协调的生态水文模式,应用可5 持续水资源管理的实践科学。(6)环境水文学研究水环境本底特征、水体自净机理及其与水文要素关系,水环境影响评价和保护,以及受损生态水文系统的重建与修复技术等。1.2水文学简史水文学经历了一个由萌芽到成熟、由定性到定量、由经验到理论的发展过程。同自然科学的许多学科相似,人们还难以找出公认的里程碑,把水文科学的历史进程划分成若干明确的阶段。根据水文学发展的足迹,大体划分为以下4个阶段。1.2.1萌芽时期(远古至约公元1400年)这一时期的基本特点是:人们已经认识到水文观测对治水工程的重要性,开始进行原始的水文观测和原始的水文知识积累,为人们生活和生产提供重要的水文资料。尼罗河、幼发拉底河、恒河和黄河在这一时期都曾进行过原始的水文观测。中国和埃及是世界上进行水位观测最早的国家。约公元前22世纪,中国传说中的大禹治水,以“随山刊木”(立木于河中),观测河水涨落。此后,战国时李冰设于都江堰的“石人”,隋代的石刻水则,宋代的水则碑等,都表明了水位观测的不断进步。公元前400年,印度开始了最早的雨量观测。公元前221~公元前207年,中国秦代已开始有呈报雨量的制度。公元1247年,出现了较科学的雨量器和雨深计算方法,并开始用“竹笼验雪”来计算平地降雪深度。明代刘天和在治理黄河过程中,已采用手制“乘沙量水器”测定河水中泥沙的数量。公元前239年的《吕氏春秋》中写道:“云气西行云云然,冬夏不辍;水泉东流,日夜不休,上不竭,下不满,小为大,重为轻,国道也。”提出了朴素的水文循环概念。公元约6世纪初的《水经注》记述了当时中国境内1252条河流的概况,成为水文地理考察的先驱。1.2.2奠基时期(约1400~1900年)这一时期的基本特点是:水文仪器出现,并有了显著的发展,为水文科学发展成为独立的学科奠定了基础,使水文观测进入定量观测阶段。观测项目主要包括流量、流速、蒸发、降水等。水文现象由定性发展到定量描述,标志着水文学基本理论初步形成。这些科学理论的创立,为水文科学在河道水流、蒸发、地下水运动、径流形成和水文循环等领域的发展奠定了理论基础,表明人类对水文现象的认识已由萌芽时期那种肤浅零星的知识,发展到了比较深刻系统的知识。同时也表明,人类对地球上水的运动、变化规律的探索,已发展到以大量观测事实为基础,进行假说、演绎和推理,进而建立各种理论体系。1663年雷恩和胡克创制了翻斗式自记雨量计,1687年哈雷创制了测量水面蒸发量的蒸发器,1870年埃利斯发明旋桨式流速仪,1885年普赖斯发明旋杯式流速仪。这些近代水文仪器使流量、流速、蒸发、降水的观测达到了相当的精度,各种水文站也开始陆续出现。1746年,中国在黄河老坝口设立了全国第一个正规水位站,开始观测水位和报汛。1674年佩罗提出了水量平衡的概念,成为水文科学最基本的原理之一。1738年伯努利提出水流能量方程,1775年谢才提出明渠均匀流公式,1802年道尔顿建立了研究水面蒸发的道尔6 顿公式,1856年达西提出了描述孔隙介质中地下水运动的达西定律,1851年摩尔凡尼提出了汇流、径流系数概念和计算最大流量的著名推理公式。19世纪末,专门水文研究机构开始出现,一些国家开始出版水文年鉴。弗里西著的《河流水文测验方法》、福雷尔著的《日内瓦湖湖泊志》、马略特著的《水的运动》等水文学专著陆续出版。这些著作总结了当时水文观测和理论研究的成就,为水文科学作为一门近代科学奠定了基础。1.2.3应用水文学兴起时期(约1900~1950年)进入20世纪以来,特别是第一次世界大战以后,防洪、灌溉、交通工程和农业、林业及城市建设等向水文科学提出了许多新的研究课题,促使了水文科学体系的理论化和系统化发展,水文科学的应用特色逐渐表现出来。其特点是水文观测理论体系进一步成熟,应用水文学进一步发展,水文学理论体系逐步形成。最重要的进展表现在应用水文学的兴起。1914~1924年,黑曾、福斯特等人把概率论、数理统计的理论和方法系统地引入了水文科学,使水文变量(如洪峰和洪量)和它出现的几率联系起来,为预估工程未来水文情势提供了途径。1932~1938年,谢尔曼、霍顿、麦卡锡、斯奈德等人在产流和汇流计算方面取得开拓性进展,为根据降雨推算洪水开辟了道路。随后,克拉克、林斯雷等人丰富和发展了单位线、多个水文变量联合分析和径流调节的理论。在此期间,形成了世界范围内的国家水文站网系统,这些成就为应用水文学的兴起,在理论上、方法上和资料条件方面奠定了基础,并率先形成了工程水文学。接着,农业水文学、森林水文学、都市水文学也相继兴起。1949年,林斯雷和柯勒、保罗赫斯合著《应用水文学》,同年,姜斯敦和克乐斯合著的《应用水文学原理》、美国土木工程师学会编著的《水文学手册》等应用水文学专著陆续问世,总结了这一时期的成就,标志着应用水文学的诞生。应用水文学成为近代水文科学体系中最富有生气的分支学科。1.2.4现代水文学(20世纪50年代以来)20世纪50年代以来,人类改造自然的能力迅速增强,随着社会经济和科学技术的迅速发展,人与水的关系发展到了兴利除害的新阶段。这个新阶段赋予水文科学新的特色:引进计算机技术和遥感遥测技术,一些新理论、新方法和边缘学科不断交叉、渗透,产生了许多新的分支学科,研究方法趋于综合,重点开展水资源及人类活动水文效应的研究。1.3水文现象的基本特点与研究方法1.3.1水文现象的基本特点1.周期性由于地球的自转和公转,昼夜、四季,海陆分布以及一定的大气环境,季风区域等,使水文现象在时程变化上具有一定的周期性。例如,河流存在汛期和枯季,而且每年交替出现和变化。潮汐随着月球周期的变化而表现出明显的日变化过程,气温和受控制于气温的水文情势(如冰雪水源河流)也具有日周期变化。7 2.随机性随机性是指水文现象在时程变化上的不重复性,即水文现象本身确定(如流量3500m/s),而表现在现象出现与否上的不确定性。如河流不同年份的流量过程不会完全一致。同一地区的河流,由于大气环境的差异,汛期和枯季出现的时间和水量在各年份都不可能完全重复。3.模糊性模糊性是指水文现象概念本身没有明确的外延,由于概念外延的模糊而造成划分上的非确定性,即水文现象概念本身的不确定性。事实上,汛期与非汛期是不能以其某一个时刻来划分的,如年径流的“丰”、“枯”,水体质量的“清洁”与“污染”,洪水、大洪水与特大洪水,流域自然地理条件的“相似”与“相异”,湿润地区、半干旱地区与干旱地区,水汽供应充分与不充分等,都找不到明确的界线。4.灰色性灰色系统理论是我国邓聚龙教授提出,20世纪80年代后期新兴发展起来的一门学科。灰色系统是指部分信息已知、部分信息未知或非确定的系统,即信息不完全的系统。根据这一理论,水文现象由于信息量不充分而出现的不确定性,称为灰色性,如有限年代的降水量、径流量、洪水、灌水量记录等,未知信息部分,如未来年代的降水量、径流量、灌水量,丰枯、洪水、干旱的出现时间以及水环境的前景变化等。5.复杂性水文系统是一个复杂的非线性系统。研究表明,具有对初始条件的敏感性和内在随机性,即产生混沌的基本条件。在同一水文系统(流域),不同的初始条件会产生完全不同的水文过程。因此,预测(报)与实际之间总是存在一定差距或误差,造成这种现象的原因是:除预测(报)技术与方法本身存在不足外,还可能与受水文系统内在随机性和对初始条件的敏感性的影响有关。另外,水文系统又是一个远离平衡态的开放系统,遵循混沌→有序→新的混沌→新的有序⋯⋯的自然演化基本规律。根据耗散结构理论、协同学等非平衡系统的理论,远离平衡态的开放水文系统的平衡和有序是有条件的、相对的,而非平衡和无序则是无条件的、绝对的。水文系统正是在平衡和非平衡、稳定和不稳定、有序和无序等的对立统一中进行演化。6.相似性由于流域所处的地理位置、气候和地理条件的相似,使水文现象在一定程度上具有一定的相似性,也称具有地带性。如湿润地区河流,其水量充沛,年内分配较为均匀;干旱地区大多数河流水量不足,年内分配不均匀。7.特殊性不同流域虽然地理位置、气候和地理条件相似,但是,由于下垫面条件差异,使得这些流域产生不同的水文规律。如,在同一地区,山区河流与平原河流,其洪水运动规律有较大的差异;岩溶地区与非岩溶地区、地下水源丰富河流与地下水源贫乏河流,其水文动态规律有很大差异。1.3.2水文现象的研究方法水文学研究是通过水文定位观测、实验研究和水文调查等手段,获取大量的实测资料,8 根据水文现象的基本特性进行综合分析,最后,获得水文现象的变化规律。其特点是:通过已经获得的短暂实测水文资料(通常最多仅有100余年的实测系列),把各种水文现象作为一个整体,并把它们同大气圈、岩石圈、生物圈及人类活动对它的影响结合起来,进行水文过程和水文规律的研究,并进一步预测或预估水文情势的未来状况,从而直接为人类生活和生产服务。水文研究方向可分为物理方向和地理方向。物理方向研究水文现象的物理机制规律,而地理方向研究水文现象的地理分布规律。具体的方法如下。1.传统的水文学研究方法主要有成因分析法、数理统计法和地理综合法三种。三种方法分别针对水文现象基本特点的一个侧面,因此,实际研究中,三种方法同时使用,相辅相成,互为补充。(1)成因分析法以物理学原理为基础,根据水文站网,获取实验资料,研究水文现象的形成、演变过程,通过建立水文现象要素与其影响因素间的定性和定量关系,揭示水文现象成因及其各因素之间的内在联系。确定性水文模型研究属于此类方法。(2)数理统计法以概率理论为基础,根据实测资料,运用数理统计方法,获得水文现象特征值的统计规律,或对主要水文现象与其影响因素之间进行相关分析,求出其经验关系。随机水文模型研究属于此类方法。(3)地理综合法根据气候要素和地理景观要素的地区分布特点,求出各测站水文要素的分类地区特征值,建立地区经验公式,绘制各种特征值等值线图等,分析水文现象的地区特征,揭示水文现象的地区分布规律。2.新技术、新理论与方法的应用吸收其他学科的最新研究成果,利用新技术、新理论与方法研究水文现象。如遥感技术、核技术、随机分析方法、模糊分析、灰色分析、非线性科学理论等,促进了水文学的发展。1.4现代水文学的特点现代水文学处在一个正在发展的阶段,目前,它还没有形成一个公认的体系。根据近年水文学的发展和部分学者的总结成果,与传统水文学相比,现代水文学具有以下特点(左其亭,叶守泽,夏军)。1.4.1水文信息获取与处理技术研究高新技术来获取区域、大尺度范围的水文信息。包括:计算机技术、“3S”技术、水文示踪技术和研究常规水文仪器观测的自动化等。1.4.2水文尺度问题研究不同尺度的水文规律和它们之间的转换问题。1.4.3水资源管理的水文基础研究大气—土壤—植被之间的水循环关系,全球气候变化对陆地水文过程的影响,水文水环境的相互作用与转化关系,水资源开发的效应问题,生态需水规律,水形态转化过程中9 污染形成与水质转化机理,水文极值(洪水和干旱)以及预测、减灾,冰盖河流水文学。1.4.4水文复杂性和不确定性研究研究水文现象的不确定性(随机性、模糊性、灰色性)。采用系统论、非线性理论探索和解释水文现象复杂性的机制和原因。1.4.5可持续水资源的规划与管理可持续水资源管理有3个基本目标,它们是环境的完整性(Environmentalintegrity)、经济效率(Economicefficiency)和衡平(Equity)。这里所说的可持续的水资源系统管理,除了考虑水量的变化分配管理外还要求考虑水质水环境问题,亦即水量,水质并重,具有环境的完整性;要求水资源的利用从长远的观点看具有最佳经济效率;为了处理好追求经济效益与环境保护之间的矛盾,要求水资源可持续发展,衡平便成为一个重要的目标。1.5随机水文学随机水文学是从随机性角度研究水文现象随机变化规律的科学。以下引用丁晶、刘权授主编的《随机水文学》,概括介绍其基本方法。1.5.1随机水文学的概念与基本方法由于水文现象受众多因素的影响,水文过程呈现出随机性,称为随机水文过程。即出现结果不止一个,事先无法确定出现何种结果。随机水文序列则是与随机水文过程对应的离散过程。1.随机水文学的主要任务(1)在全面随机分析的基础上,对随机水文序列建立反映水文现象主要变化特性的随机模型。主要有自回归模型、滑动平均模型和自回归滑动平均模型。(2)根据建立的模型,可模拟大量水文序列和统计预测,以满足水利工程规划、设计、运行及各种研究的需要。2.随机水文学的基本方法(1)应用实测水文序列建立具体反映时间(年、月、洪水)过程与空间(一个或多个工程地点)过程的水文随机模型。(2)应用所建立的随机模型模拟一个或多个工程地点未来可能出现的各种水文序列(模拟序列)。(3)应用大量的模拟序列,可适应工程需要进行径流调节或洪水调节,得到水利指标的频率分布曲线或特征值,供设计之用。3.随机水文学的特点随机水文学方法与现行水文计算法相比,具有以下特点。(1)以时间模型、空间模型和时空模型表征水文现象的统计变化体系。(2)随机水文学提供建立随机模型,能够模拟大量的洪水序列,根据工程体系,进行径流调节或洪水调节,得到相应的大量水利指标序列、水利指标的频率分布曲线或特征值供设计之用。10 (3)大量的模拟序列表征着未来水文现象可能出现的各种情况。4.随机水文学的应用随机水文模型和随机模拟的应用主要包括水文水利计算、水文预报和水文测验等。1.5.2随机过程的基本知识随机过程理论与方法是随机水文学的基本理论和方法。1.随机过程概念在相同的试验条件下,独立地重复多次随机试验,每一次试验结果是某种函数,其函数形式各次不同,且事先无法确定,称这族时间的函数为随机函数。在上述试验中,族中的每一个函数称为随机函数的样本函数或一个现实。随机函数就是所有现实或样本函数的集合。当随机函数时间连续地取有限区间内的值时,称为随机过程。当随机函数随时间取离散值时,称为随机序列。2.随机过程的分布函数随机过程在任意一时刻的状态是随机变量,因此,可以利用随机变量的统计描述方法来描述随机过程的统计特性。设X(t)为随机过程,其n维分布函数和n维概率密度为Fn(x1,x2,L,xn;t1,t2,L,tn)=P[X(t1)≤x1,X(t2)≤x2,L,X(tn)≤xn](1-1)∂Fn(x1,x2,L,xn;t1,t2,L,tn)fn(x1,x2,L,xn;t1,t2,L,tn)=(1-2)∂x1∂x2L∂xn3.随机过程的数字特征随机过程的主要数字特征有数学期望函数、方差函数和相关函数等。(1)数学期望函数mx(t)(均值函数)表示随机过程的所有样本函数在时刻t的平均值。∞mx(t)=E[X(t)]=∫xf(x,t)dt(1-3)−∞(2)方差函数DX(t)描述了随机过程对于数学期望mx(t)的偏离程度。∞22DX(t)=E[X(t)−mx(t)]=∫[x(t)−mx(t)]f(x)dx(1-4)−∞方差函数的平方根DX(t)称为随机过程的标准差函数,即σx(t)=DX(t)。(3)自协方差函数COV(t1,t2)(协方差函数)刻画了随机过程在时刻t1与t2的统计关系。COV(t1,t2)=E{[X(t1)−mx(t1)][X(t2)−mx(t2)]}∞∞=∫∫[x1−m(t1)][x2−m(t2)]f2(x1,x2;t1,t2)dx1x2(1-5)−∞−∞(4)自相关函数ρ(t1,t2)也称标准化协方差函数,简称相关函数。自相关函数刻画11 了随机过程在时刻t1与t2的统计关系。COV(t1,t2)ρ(t1,t2)=(1-6)σ(t1)σ(t2)4.平稳随机过程一个随机过程X(t),对于任意n和k,其n维分布函数满足:Fn(x1,x2,L,xn;t1,t2,L,tn)=Fn(x1,x2,L,xn;tk,tk+1,L,tk+n),则称X(t)为平稳随机过程,否则称为非平稳随机过程。(1)平稳随机过程的数字特征1)数学期望∞∞E[X(t)]=∫x1f(x1,,t1)dx1=∫x2f(x2,,t2)dx2=mx(常数)(1-7)−∞−∞表明平稳随机过程的所有样本函数都在水平直线mx(t)=mx周围波动。2)方差∞2D[X(t)]=∫(x1−mx)f(x1,)dx1=σx(常数)(1-8)−∞表明平稳随机过程的所有样本函数在水平直线mx(t)=mx周围波动的偏离程度。3)协方差函数和自相关函数协方差函数∞∞COV[t1,t2]=∫∫(x1−mx)(x2−mx)f2(x1,x2,τ)dx1dx2=COV(τ)(1-9)−∞−∞自相关函数ρ(t1,t2)=ρ(τ)(1-10)表明平稳随机过程的协方差函数和自相关函数只与时间间隔τ=t2−t1有关。(2)平稳随机过程的分类若随机过程X(t)满足Fn(x1,x2,L,xn;t1,t2,L,tn)=Fn(x1,x2,L,xn;tk,tk+1,L,tk+n)则称X(t)为严平稳过程或狭义平稳过程、强平稳过程、高阶平稳过程。若均值和协方差平稳,则X(t)称为广义平稳过程或弱平稳过程、二阶平稳过程。平稳随机过程的统计特性与所选取的时间起点无关,即统计特性不随时间的推移而变化。这种现象的解释是:若产生随机过程的主要物理条件在时间进程中没有变化,则该随机过程的统计特性也不会随时间而变化。5.平稳随机过程的各态历经性平稳随机过程的一个相当长的样本资料可以用来分析计算随机过程的统计特性,这样的随机过程称为具备各态历经性(遍历性)或各态历经过程。可以理解为随机过程的各样本函数都同样经历了随机过程的各种可能状态,因此,任何一个样本函数都可以估计随机过程的统计特性。实际过程中,论证平稳过程的各态历经性是先假设具体的平稳过程具有各态历经性,12 然后检验这个假设是否成立。1.5.3水文序列分析和随机模拟技术1.水文序列及其组成一般认为水文序列:X(t)=趋势项A(t)+周期项P(t)+突变项B(t)+随机项R(t)。(1)趋势项表示水文现象因水文或气象因素而引起的季节性趋势或多年变化趋势。如年内的降水量、流量的季节性变化趋势。年平均气温的逐年递增或递减趋势。常用的趋势成分检验方法有Kendall的秩次相关检验、线性趋势的回归检验。(2)周期项水文序列分离趋势项A(t)后,可将剩余序列X(t)-A(t)进行周期项分析。常用的方法有傅立叶级数法和方差分析法。(3)突变项是表示水文现象受到外部突变影响而形成的。如河流跨坝对洪水的影响。对于水文序列,只有在个别年份才能碰到明显的突变项。常采用水文学和水力学原理来估算。但在降雨序列中,一般不含有突变项。(4)随机项水文序列分离趋势、周期和突变项后,剩下的便是随机项成分。即X(t)-A(t)-P(t)-B(t)为随机成分。随机项R(t)可分为相依成分S(t)和纯随机项N(t)。即:R(t)=S(t)+N(t)。对于相依成分可用自回归模型、滑动平均模型和自回归滑动平均模型来模拟。纯随机项可用概率模型来模拟,它是水文序列模拟的基础。2.自相关分析和互相关分析自相关分析主要计算序列自相关系数γk,用来研究水文序列自身的线性相依性和随时移增加而变化的特性,同时用来检验水文序列的独立性。n−k∑(Xt−X)(Xk+t−X)t=1γk=(1-11)n2∑(Xt−X)t=1互相关分析以互相关系数γk(X,Y)来研究两个水文序列Xt、Yt的关系,不仅表示两变量同时刻的关系,而且表示向前或向后时移k个时间单位的相互关系。n−k∑(Xt−X)(Yk+t−Y)t=1γk(X,Y)=(1-12)1/2⎡nn⎤22⎢∑(Xt−X)∑(Yt−Y)⎥⎢⎣t=1t=1⎥⎦3.纯随机序列的随机模拟纯随机序列的随机模拟常采用统计试验法(蒙特卡洛法)。首先模拟[0,1]区间上均匀分布的纯随机序列(均匀随机数),然后将之转换为其他指定分布的纯随机数。纯随机序列模拟是随机序列模拟的一个很重要的部分。随机水文序列,需要首先模拟纯随机序列,再依时序将其迭加在其他成分之上,即得模拟水文序列。(1)均匀随机数的模拟由于[0,1]区间上的均匀分布是最简单、最基本的连续分布,所以,通常使用[0,1]13 区间上的均匀分布随机数生成其他指定分布的随机数。其生成方法有:1)利用随机数表查询目前已经制成的随机数表来获得均匀分布随机数。2)利用物理随机数发生器在数字计算机上安装一台物理随机数发生器,把具有随机性质的物理过程变换为随机数。这种方法由于存在较多缺陷,目前,在计算机上一般不使用。3)数学方法是用一定的数学方法,通过计算机模拟均匀随机数,因为它与真正的均匀随机数还存在一定距离,所以称它为伪随机数。目前应用最广的方法有混合同余法和乘同余法。混合同余法生成随机数的递推同余式为xn+1=λxn+c(modM),n=0,1,2,L(1-13)式中x0是初值,λ为增量,M为模,而且这些数均为非负整数,c、λ都小于M。上式递推同余式表示xn+1是λxn+c被M整除后的余数,叫作xn+1与λxn+c对模M同余,则xnun=为区间[0,1]上的数列。通常取c=0,则:xn+1=λxn(modM),n=0,1,2,L。称M为乘同余法,这是常用的生成随机数的公式。λ、M的选取与数字计算机的性能有关。上述产生的随机数须进行独立性和均匀性检验。3[例]取x0=1,λ=7,M=10。则有:λx0=7×1=7;x1=7;u1=7/1000=0.007;λx1=7×7=49;x1=49;u1=49/1000=0.049;λx2=7×49=343;x2=343;u2=343/1000=0.343;λx3=7×343=2401;x3=401;u3=401/1000=0.401;λx4=7×401=2807;x4=807;u4=807/1000=0.401。按上述算法依次继续下去。(2)服从正态分布的纯随机数模拟服从正态分布的纯随机数模拟目前常用的方法有变换法和随机数之和法。1)变换法标准正态分布纯随机数的生成公式为ξ1=−2lnu1cos2πu2;ξ2=−2lnu1sin2πu2(1-14)式中,ξ1、ξ2为相互独立的标准正态分布N(0,1)变量;u1、u2为均匀分布随机数。有了ξt,可生成正态分布纯随机数Xt。Xt=X+σξt(1-15)式中,X和σ分别为Xt序列的均值和方差。2)随机数之和法标准正态分布纯随机数ξ的生成公式为t14 12⎛nn⎞ξt=⎜⎜∑utk−⎟⎟;t=1,2,L(1-16)n2⎝k=1⎠一般取n=12。(3)服从对数正态分布的纯随机序列的模拟假定随机变量X为对数正态分布,则随机变量Y=ln(X−a)为正态分布。其模拟步骤为:首先模拟Y序列,通过X=exp(Y)+a转换,即可得到X序列。在对数正态分布的三个参数X,Cv和Cs已知情况下,其生成公式如下:1313⎡C2+4+C⎤⎡C2+4−C⎤η=⎢ss⎥−⎢ss⎥(1-17)⎢2⎥⎢2⎥⎣⎦⎣⎦⎛Cv⎞a=X⎜1−⎟(1-18)⎜⎟⎝η⎠2σY=ln(1+η)(1-19)12Y=ln(X−a)−ln(1+η)(1-20)2(4)服从P-III分布的纯随机数模拟通常采用W-H变换法,这一方法认为标准正态分布纯随机数ξt和标准皮尔逊Ⅲ型分布Φt之间的关系为2⎛CsξC2⎞2Φ=⎜1+t−s⎟−(1-21)tCs⎜636⎟Cs⎝⎠可根据Cs得到Φt,在由已知的X和Cv利用Xt=X+σΦt=X(1+CvΦt)模拟皮尔逊Ⅲ型分布的纯随机序列Xt。1.5.4线性平稳随机模型1.模型形式(1)自回归模型AR(p)Xt=µ+ϕ1(Xt−1−µ)+ϕ2(Xt−2−µ)+L+ϕp(Xt−p−µ)+εt(1-22)上式模型表明,任何一个时刻t的数值Xt可以表示为过去p个时刻数值Xt−1,Xt−2,⋯,Xt−p的线性组合加上t时刻的随机项εt。对于εt2Eεk=0;Dεk=σa;E(εkεj)=0,(k≠j)(1-23)15 式中,p为模型阶数,取正整数;ϕ1,ϕ2,⋯,ϕp为模型参数。(2)滑动平均模型MA(q)Xt=µ+at−θ1εt−1−θ2εt−2−L−θqεt−q(1-24)式中,q为模型阶数,取正整数;θ1,θ2,⋯,θq为模型参数。上式模型表明,任何一个时刻t的数值X可以表示为白噪声在t和t以前q+1个时刻t数值εt,εt−1,εt−2,⋯,εt−q的加权值。(3)自回归滑动平均模型ARMA(p,q)Xt=µ+ϕ1(Xt−1−µ)+ϕ2(Xt−2−µ)+L+ϕp(Xt−p−µ)+εt−θ1εt−1−θ2εt−2−L−θqεt−q(1-25)式中,p、q为模型阶数,取正整数。2.模型性质(1)自回归模型AR(p)的自相关函数ρk拖尾,偏自相关函数φkk截尾。−δkρk拖尾是指随着k无限增大,ρk以负指数速度趋于零。即k相当大时,有ρk0、δ>0,此时limρk=0,它的图像像拖着一条尾巴。k→∞φkk截尾指当k>p时,φkk=0;当k=p时,φkk≠0。(2)滑动平均模型MA(q)的自相关函数ρk截尾,偏自相关函数φkk拖尾。(3)自回归滑动平均模型ARMA(p,q)的自相关函数ρk拖尾,偏自相关函数φkk拖尾。3.建立线性平稳模型步骤(1)模型类型选择和阶数确定由自相关函数ρk、偏自相关函数φkk的拖尾和截尾性来确定模型类型和阶数。但是,实际中,由样本推算出的ρk和φkk抽样误差较大,难以直观判断,所以,一般采用统计判断。(2)参数估计根据上述确定模型,计算均值、方差、变差系数、偏态系数、模型参数以及独立随机变量的方差。(3)模型形式的进一步识别上述模型初步识别的方法太粗糙。日本学者赤池(Akaike)提出了ARMA(p,q)模型p和q的AIC准则。AIC准则定量化公式为2AIC(p,q)=nln(σε)+2(p+q)(1-26)2式中,n为实测序列长度;σε为参差的方差。对于AR(p)模型,p=0。MA(q)模型,16 q=0。使AIC达到最小值的模型便认为是可以接受的好模型。(4)模型检验模型检验主要是对模型的随机项ε(a)相互独立项检验。根据上述ttm2建立模型和样本序列Xt反推εt。构造统计量Q=n∑γk(ε),n为实测序列长度,γk(ε)为k=12随机项εt的k阶自相关函数。给定置信度α,根据自由度(K−p−q)查相应的xa,若Q≤2xa,则εt相互独立。(5)模型的实用性检验检验上述所建立的模型是否能够反映随机序列的真实特性,称为模型的实用性检验。其基本方法是通过上述所建立的模型模拟长序列或短序列,通过模拟序列计算出来的统计参数(均值,方差,变差系数,偏态系数和一阶自相关函数)与实测序列计算出来的参数作比较,看是否保持一致或接近。1.5.5季节性随机模型上述介绍了平稳模型,适用于年径流的模拟,这是因为影响以年为间隔的水文变量的气候因素在一定长的时期内可假定为基本稳定。但一年中影响各月、旬和日径流的气候因素差别较大,所以一年中不同月、旬和日径流呈现出不同的统计特性,因此这类序列为非平稳序列,不能应用上述介绍的平稳模型。在随机水文学中,把月、旬和日这类非平稳序列模型称作季节性随机模型。季节性水文序列主要指季径流、月径流、旬径流和日径流序列。下面主要以一阶季节性自回归模型为例。一阶季节性自回归模型的基本原理是:首先根据样本序列计算各月(或季)径流参数的估计值,然后根据选定的分布函数,最后生成相应的序列。1.模型形式平稳一阶自回归模型形式为Xt,τ=ϕ0,τ+ϕ1,τXt,τ−1+εt,τ;τ=1,2,L,12(1-27)式中,t为年份;Xt,τ为第t年第τ月的月径流量;ϕ0,τ、ϕ1,τ分别为第t年第τ月的参数;εt,τ为第t年第τ月的独立随机项。2.参数估计(1)均值n1Xτ=∑Xt,τ;τ=1,2,L,12(1-28)nt=12(2)方差στ17 n21στ=∑(Xt,τ−Xτ);τ=1,2,L,12(1-29)n−1t=1n1στ=∑(Xt,τ−Xτ);τ=1,2,L,12(1-30)n−1t=1(3)变差系数CvτστCvτ=;τ=1,2,L,12(1-31)Xτ(4)偏态系数Csτn3∑(Xt,τ−Xτ)t=1Csτ=;τ=1,2,L,12(1-32)2(n−3)στ(5)第τ月的一阶相关系数γ1,τn∑(Xt,τ−Xτ)(Xt,τ−1−Xτ−1)t=1γ1,τ=(1-33)(n−1)στστ−1(6)模型系数ϕ0,τ=γ1,τσt−1σt⎫⎪⎬(1-34)ϕ1,τ=Xτ−ϕ1,τXτ−1⎪⎭3.偏态特性考虑与一阶自回归模型AR(1)的独立项变换法类似。4.模型的实用性检验进行模拟序列的统计参数与实测序列的统计参数进行对比,若两类参数无显著性差异,则表明通过了实用性检验。1.5.6多站随机模型多站模型又称多元模型、多维模型、多变量模型。单站模型又称一元模型、一维模型、单变量模型。多站模型主要包括多站平稳模型和多站非平稳(季节性)模型两类。多站平稳模型,主要用于模拟多站以年为单位的径流序列,如多站年径流序列。多站非平稳(季节性)模型,主要用于模拟一年中多站旬、月径流和日径流序列及多站洪水序列。常用的多站模型有多站自回归模型、多站典型解集模型和相关解集模型、多站水文序列模拟的主站模型(主站法)。下面以多站年径流序列为例,说明一阶多站平稳自回归模型的形式和参数估计。18 ⒈模型形式一阶m站的自回归模型为:⎡Xt,1⎤⎡a1,1a1,2La1,m⎤⎡Xt−1,1⎤⎡b1,1b1,2Lb1,m⎤⎡εt,1⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢Xt,2⎥⎢a2,1a2,2La2,m⎥⎢Xt−1,2⎥⎢b2,1b2,2Lb2,m⎥⎢εt,2⎥⎢L⎥=⎢LLLL⎥⎢L⎥+⎢LLLL⎥⎢L⎥(1-35)⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢Xt,j⎥⎢aj,1aj,2Kaj,m⎥⎢Xt−1,j⎥⎢bj,1bj,2Kbj,m⎥⎢εt,j⎥⎢⎣Xt,m⎥⎦⎢⎣an,1an,2Lan,m⎥⎦⎢⎣Xt−1,m⎥⎦⎢⎣bn,1bn,2Lbn,m⎥⎦⎢⎣εt,m⎥⎦式中,t为年份;j为站序(j=1,2,L,m);εt,j为第j站均值为0、方差为1的标准独立Xt′,j−Xj随机变量;Xt,j表示第j站第t年的标准化变量,即:Xt,j=;式中,Xt′,j为第jσj站第t年的径流;Xj、σj分别为第j站的均值与方差。模型的矩阵形式为:Xt=A+Bεt,A、B分别为待定的参数矩阵。⒉参数估计−1T−1T经证明有:A=M1M0;BB=M0−M1M0M1,B为一个下三角阵。−1式中,M0为各站间滞时为0(同期)径流的互相关系数矩阵;M0为M0的逆矩阵;M1TT为各站间滞时为1(相邻时段)径流的互相关系数矩阵;M1为M1的转置矩阵;B为B的转置矩阵。计算公式为⎡1n1n1n⎤⎢∑Xt,1Xt,1∑Xt,1Xt,2L∑Xt,1Xt,m⎥⎢nt=1nt=1nt=1⎥⎢1n1n1n⎥M=⎢∑Xt,2Xt,1∑Xt,2Xt,2L∑Xt,2Xt,m⎥(1-36)0⎢nt=1nt=1nt=1⎥⎢LLLL⎥⎢1n1n1n⎥⎢∑Xt,mXt,1∑Xt,mXt,2L∑Xt,mXt,m⎥⎢⎣nt=1nt=1nt=1⎥⎦⎡1n1n1n⎤⎢∑Xt,1Xt−1,1∑Xt,1Xt−1,2L∑Xt,1Xt−1,m⎥⎢nt=1nt=1nt=1⎥⎢1n1n1n⎥M=⎢∑Xt,2Xt−1,1∑Xt,2Xt−1,2L∑Xt,2Xt−1,m⎥(1-37)1⎢nt=1nt=1nt=1⎥⎢LLLL⎥⎢1n1n1n⎥⎢∑Xt,mXt−1,1∑Xt,mXt−1,2L∑Xt,mXt−1,m⎥⎢⎣nt=1nt=1nt=1⎥⎦19 ⎡b1,1⎤⎡b1,1b2,1Lbn,1⎤⎢⎥⎢⎥设B=⎢b2,1b2,2⎥,则BT=⎢b2,2Lbn,2⎥⎢LLL⎥⎢LL⎥⎢⎥⎢⎥⎢⎣bn,1bn,2Lbn,m⎥⎦⎢⎣bn,m⎥⎦通过上述关系式,可求出参数阵A、B。1.6模糊水文学水文变量的统计特征和变量间的关系,往往是模糊的,而不是清晰的,因此按模糊性反映系统之间的关系,以模糊集为其表达形式。为了完整地分析、描述水文现象这种不确定性,1987年大连理工大学的陈守煜教授,提出了模糊水文学这一新的水文分支学科,并在汛期的划分、设计年径流及其年内分配的确定、月径流随机模拟、多年径流过程的周期分析、水文计算的模糊优化适线等方面取得了大量的成果。模糊水文学是集成因分析、概率分析、模糊集分析为一体的新体系,是研究模糊随机系统理论分析体系与方法的新型水文学科。它使用数学方法去处理和描述不易精确加以定量的模糊现象与事件,通过构造隶属函数,将人的知识与经验比较科学的定量化,从而使含有不少经验处理的水文分析计算与计算机为工具的现代计算技术相结合成为可能。模糊水文学区别于其他水文学科的基本特征在于它不仅考虑水文现象、水文事件的系统成因、随机特性,而且还涉及水文现象、事件在中介过渡阶段划分中的模糊性。以下应用模糊水文原理的模糊划分理论模型(陈守煜),进行设计枯水年径流过程的模糊推求。1.6.1最优模糊划分的理论与模型设有n个样本组成样本集合X={}x1,x2,L,xn,每个样本有m个指标特征值,rTxj=(x1j,x2j,L,xmj),则样本集可用矩阵X=(xij)m×n,i=1,2,L,m,j=1,2,L,n。将样本集经过(1-38)式规格化处理后,变换为[0,1]区间的模糊指标特征矩阵R=(rij)c×n。rij=(xij−ximin)(ximax−ximin)(1-38)设将样本集划分为c类,代表每一类的m个指标特征值称为分类中心,可用模糊分类中心矩阵表示c个分类的指标特征,即S=(Sih)m×c,i=1,2,L,m,h=1,2,L,c。Sih表示分类中心h第i个指标的特征值。第h类分类中心m个指标的特征值用向量表示为rTSh=(S1h,S2h,L,Smh)。设将样本集依据m个指标特征值划分为c类,模糊划分矩阵为U=(Uhj)c×n,h=1,2,L,c,j=1,2,L,n。Uhj为j样本隶属于第h类的隶属度,满足条件约束20 cn0≤Uhj≤1,∑Uhj=1,∑Uhj>0(1-39)h=1j=11rr⎛m⎞2r设第j个样本与第h类的差异用欧氏距离表示为r−S=⎜(r−S)2⎟,其中rjh⎜∑ijih⎟j⎝i=1⎠为第j个样本向量,h=1,2,L,c,i=1,2,L,m,j=1,2,L,n。根据模糊划分矩阵U=(Uhj)c×n,第j个样本以隶属度Uhj隶属于第h类,将隶属度定义为权重,表示第j个样本与第h类的差异程度,用权距离表示为:1rr⎛m⎞2d(r,S)=U⎜(r−S)2⎟(1-40)jhhj⎜∑ijih⎟⎝i=1⎠以全体样本集对全体分类中心之间的权距离平方和最小为目标,则目标函数为:⎧ncm12ncm⎫⎡⎤⎪2222⎪min⎨F=∑∑⎢Uhj(∑(rij−Sih))⎥=∑∑Uhj(∑(rij−Sih))⎬(1-41)⎪j==11h⎢⎣i=1⎥⎦j==11hi=1⎪⎩⎭(1-41)式中未知数为模糊分类中心矩阵(Sih)m×c与模糊划分矩阵(Uhj)c×n,其求解推导如下:⎧⎪ncm⎫⎪22由(1-41)式可得min{}F=min⎨∑∑Uhj(∑(rij−Sih))⎬。⎪⎩j==11hi=1⎪⎭mc⎧⎪n⎫⎪22(1)假定Uhj已知,求Sih,则min{}F=∑∑min⎨Uhj(∑(rij−Sih))⎬,令i==11h⎪⎩j=1⎪⎭n22F(Sih)=∑Uhj(rij−Sih)),则有:j=1nnndF222=2∑Uhj(rij−Sih)(−1)=2∑UhjSih−2∑Uhjrij=0,所以,dSihj=1j=1j=1nn22Sih=∑Uhjrij∑Uhj(1-42)j=1j=1mc⎧⎪n⎫⎪22(2)假定Sih已知,求Uhj,则min{}F=∑∑min⎨Uhj(∑(rij−Sih))⎬,令i==11h⎪⎩j=1⎪⎭21 nn2222F(Uhj)=∑Uhj(rij−Sih)),根据F(Uhj)=∑Uhj(rij−Sih))和约束条件(1-39)构造j=1j=1拉格朗日函数,即:mc22L(Uhj,λ)=Uhj∑(rij−Sih)−λ(∑Uhj−1),然后分别对Uhj和λ求偏导数,并令其等于0,i=1h=1则有∂L(Uhj,λ)m2=2Uhj∑(rij−Sih)−λ=0(1-43)∂Uhji=1∂L(Uhj,λ)c=∑Uhj−1=0(1-44)∂λh=1由(1-43)式得m2Uhj=λ2∑(rij−Sih)(1-45)i=1把(1-45)式代入(1-44)式得2λ=(1-46)⎡⎤⎢⎥c⎢1⎥∑⎢m⎥h=1⎢(r−S)2⎥∑ijih⎢⎥⎣i=1⎦把(1-46)式代入(1-45)式得1Uhj=(1-47)⎡⎤⎢⎥c1⎡m⎤⎢⎥2⎢∑m⎥⎢∑(rij−Sih)⎥⎢h=1(r−S)2⎥⎢⎣i=1⎥⎦∑ijih⎢⎥⎣i=1⎦mcc21将(1-47)式中∑(rij−Sih)移入“∑”内,把∑m中求和下标hi=1h=1h=12∑(rij−Sih)i=1变换为k,则得22 1Uhj=(1-48)⎡m⎤2c⎢∑(rij−Sih)⎥⎢i=1⎥∑⎢m⎥k=1⎢(r−S)2⎥∑ijih⎢⎥⎣i=1⎦1.6.2最优模糊划分的理论模型求解最优模糊划分的理论求解的步骤如下:(1)选择划分分类数c和计算控制精度ε;(0)(2)给定一个满足(1-39)式的初始模糊划分矩阵U;hj(0)(1)(3)把U代入(1-42)式得聚类中心S;hjih(1)(1)(4)把S代入(1-48)式得模糊划分矩阵U;ihhj(1)(0)(5)逐个比较U与U的对应元素,若对应元素最大差值的绝对值满足计算控制hjhj(1)(0)(1)精度,即maxU−U≤ε,则迭代结束,U可作为满足计算控制精度要求的最优模hjhjhj∗(0)(1)糊划分矩阵Uhj。否则,使Uhj=Uhj,重复(3)、(4)、(5)步骤,直至满足计算控制精度要求为止;∗∗(6)将所求得Uhj代入(1-42)式得最优模糊分类中心Sih。1.6.3模型应用选用陕西省渭河临潼站26年(1972~1997)的月平均资料,经对资料的可靠性、一3致性和代表性进行审查后,通过频率适线计算,得P=95%的年平均流量Q=106.0m/s。设−4划分类别取“特枯”、“枯水”、“中水”、“丰水”、“特丰”5类,m=12,计算控制精度ε=1×10,根据上述计算步骤,编制了相应的计算程序,通过迭代求解的枯水类分类中心如表1-1所3示,枯水类典型样本的年平均值Q=115.0m/s。枯3表1-1枯水类的最优模糊分类中心m/s一月二月三月四月五月六月七月八月九月十月十一月十二月月平均62.649.264.588.4137.496.4155.2219.3171.7146.1105.483.2115.023 则αp=Q设Q枯=106.0115.0=0.92,将αp=0.92乘以表1-1枯水类的最优模糊分类中心,得到P=95%枯水年的径流过程(如表1-2所示)。3表1-2P=95%枯水年的径流过程m/s一月二月三月四月五月六月七月八月九月十月十一月十二月57.645.359.381.3126.488.7142.8201.8158.0134.497.076.51.7生态水文学生态水文学是一门年轻的学科,它的理论体系仍在探索研究之中。本节是在参考和应用我国学者夏军、严登华、王根绪、赵文智、武强等的研究成果基础上,介绍这门学科的体系框架。1.7.1生态水文学产生的背景生态水文学最早是从水陆缓冲带开始提出的。由于社会经济的发展,世界上许多地区的淡水生态系统受到了各种负面影响,其程度和范围正在不断扩大,水资源问题受到生态过程和水文过程的综合影响,自然和人类的非理性活动导致生态破坏,使得区(流)域水文过程发生紊乱。从水资源发展的本身来看,提高淡水生态系统抵御外界干扰的能力并维护其本身的结构和功能是实现淡水资源持续管理的基础(夏军、严登华、何岩等)。在这种背景下,生态水文学作为一门水资源综合研究和管理的科学于1992年在Dublin水与环境国际会议上正式提出,1995年被列为联合国教科文组织国际水文计划第Ⅴ阶段UNESCO/IHPⅤ(1996~2001)的研究项目之中,研究解决环境问题的新途径。1.7.2生态水文学概念目前,生态水文学或水文生态学还没有一个统一的概念。以下引用国内外几种有代表性的定义。1.国外学者对生态水文学的定义生态水文学的概念首先由Zalewski等人提出,它指对地表环境中水文学和生态学相互关系的研究。在他后来的文章中认为生态水文学是在流域的尺度上,研究水文和生物相互功能关系的科学,是实现水资源可持续管理的一种新方法。Zalewski构想了生态水文学的内涵,包括:①采用生态水文学方法提高河道的抗干扰和缓冲能力,实现水资源持续利用;②河流、水库和河口的脆弱性决定于水文和生物过程的时间演化,这些演化会在人类的干预下发生变化;③营养物质进入到水体环境的方式和强度决定于人为因素对流城内的水文和生态特征的干扰;④洪水的强度及持续时间受到河道系统生物过程的改变,即水文变化受到生态格局的24 影响;⑤河流中营养物质富集状况受到地表水和河道生物结构的影响;⑥污染物的转移和变化受到水力—水文格局和河流廊道生态特征的影响;⑦基于GIS的生态水文学方法,应用于由交错带和基本斑块组成的流域,获得在微观尺度上的水文和生态信息,在高一级尺度上汇合,这种对水文信息的增加将会对流域水文格局作出更深刻的解释;⑧对生态水文过程的深刻理解和预测能力的提高是实现水资源和景观高效管理的基础;⑨交错带如河岸缓冲区、湿地和洪泛平原结构的理想化,是降低污染物从流域进入河流和下游水体的一个主要工具。Wassenetal.将生态水文学定义为:旨在帮助更好地理解湿地生态系统自然发育,以及帮助评价湿地生态系统价值、保护和恢复湿地生态系统的一门应用学科。强调生态水文学的研究对象仅限于湿地生态系统。Bairdetal.认为,生态水文学是生态学的水文方面,它是研究植物如何影响水文过程及水文过程如何影响植物分布和生长的水文学和生态学之间的交叉学科。所研究的对象不仅包括湿地生态系统,而且包括干旱地区的生态系统、森林和疏林生态系统、江河生态系统、湖泊生态系统和水生生态系统等其他生态系统。Rodriguez认为,生态水文学是描述生态格局和生态过程水文学机制的学科。IHP—Ⅴ认为,生态水文学的实用性含义(workingdefinitlon)是研究在不同时空尺度上水文过程与生物动力过程相综合的科学。Nuttle认为,生态水文学是生态学和水文学的亚学科,它所关心的是水文过程对生态系统配置、结构和动态的影响,以及生物过程对水循环要素的影响。这一定义聚焦于水文过程在生态系统中所起的作用上,这与Rodriguez所提到的在生态模式和生态过程上研究水文机制的概念相一致。Hatton认为,生态水文学需要在质量守恒和能量守恒定律的基础上,在周围环境不同的情况下,研究环境过程的机制。Acreman关于应用水文生态学的定义:是指运用水文学、水力学、地形学和生物学(生态学)的综合知识,来预测不同时空尺度范围内,淡水生物和生态系统对非生物环境变化的响应。另外,水文生态学侧重研究河流及洪泛平原区的水文与生态过程,以及建立模拟这两个过程相互作用的模型。2.国内学者对生态水文学的定义夏军认为,在概念上不必区分生态水文学或水文生态学侧重于哪一个学科,二者应理解为生态学和水文学交叉领域的内容,即水文过程对生态系统结构、分布、格局、生长状况的影响,同时研究生态系统(生态系统中植被类型、格局、配置等)变化对水文循环的影响,是一个相互影响的过程。在实际研究中,可根据问题的需要,来决定生态水文学研究的侧重点。如果侧重点在生态学方面,则主要研究不同的水文循环形式,如降水、径流等对生态系统结构和功能的影响。即植被类型、格局、生长状况和物质循环、能量流动等对水分循环响应机制方面的研究。据此,可根据当地的水资源量来决定生态建设的规模。如果侧重点在水文学方面:25 ①主要指在生态系统中的植被类型、格局、配置等发生变化,非生命物质相对稳定的情况下,水文循环变化规律的研究。其中,植被变化起主导作用,一般是在同一气候、坡度、土壤类型等物理因素相同的情况下,研究不同植被类型、格局、配置的产汇流机制。②或者是在植被类型、格局和配置等不变,而非生命物质(降雨、气温、风速,土壤)变化的情况下,水文循环方面的响应机制研究,这主要是在不同气候带,同一植被类型下的水循环机制研究。③或生命物质和非生命物质同时发生变化时,水文循环的变化规律等。王根绪等认为,生态水文学是研究水文学和生态学两方面都涉及的科学。有关生态圈与水文圈之间的相互关系以及由此产生的相关问题,就是生态水文学的内涵。严登华认为,生态水文学是研究一定时空尺度上生态过程与水文过程的耦合演进规律及成因,探求协调的生态水文模式,应用于水资源持续管理实践的科学。武强认为,生态水文学是一个集地表水文学、地下水文学、植物生理学、生态学、土壤学、气象学和自然地理学等于一体,彼此间相互影响、渗透而形成的一门新型边缘交叉学科。它们的主要研究对象就是由水圈、生物圈、岩石圈和大气圈共同组成的复合系统,其研究的主要问题就是因人类社会经济活动引起水圈条件改变而导致生物圈、岩石圈和大气圈所出现的所有异常现象,它并不简单是指因水圈条件改变而导致生物圈的环境所出现的问题。在地下水浅埋区,地表水系(S)、地下水含水层(G)、土壤(S)、植物(P)、大气(A)五者构成了一个关系十分复杂的生态与土壤水分循环系统(SGSPA),在这个系统中,植物与大气水、地表水、地下水仅仅存在着间接的水力联系与转化,而直接影响植物生态发育的水分是土壤水,因此,土壤水是连接生态学与水文学的枢纽,自然界中不同形式的水分只有通过转化为土壤水才能够被植物吸收利用,SGSPA系统是生态水文学研究的核心。1.7.3生态水文学发展过程1.生态水文学的孕育阶段(20世纪中叶至90年代初期)这一时期的基本特点是:侧重人类活动对河道的干扰研究,已经认识到区域的淡水资源的持续利用不是一个自发的过程,需要建立在对水文学、生物机制和区域(流域)经济机制的深刻理解上,但没有具体的实施措施。通过河道研究,提出了生物演替概念、基于鱼类种群分布的生物发生带概念、河流连续体概念(RiverContinumConcept,简称RCC)、序列不连续体概念(SerialDiscontinuityConcept,简称SDC)、洪水脉动概念(FloodPluseConcept,简称FPL)、河流生产力模型(RiverineProductivityModel,简称RPM)等。RCC认为,在天然河流系统中,生物种群形成一个从河源到河口的逐渐变化时空连续体;SDC认为林木残留物对河水产生一定的影响;FPL则考虑了河岸森林的生产力,完善了早期用RCC理论预测的生态系统过程;RPM认为河流中有机碳的来源是综合的,受到局地作用、河岸带的直接排入和河流第一生产力等因素的制约。2.生态水文学的产生及初期研究(20世纪90年代中期)这一时期,生态水文学主要以湿地为研究对象,开始研究构建生态水文学框架。主要研究湿地水文生态效应、小流域生态水文过程及相关问题,包括模拟土气相互作用、地表径流的产生和水流路径以及小流域尺度上的水质和水文生物地球化学行为。26 3.理论探寻阶段(20世纪90年中期以后)以UNESCO/IHPⅤ2.3、2.4(1995~2001)对生态水文学的专项研究最具代表性。主要研究包括:生态水文学尺度的进一步探索、水文过程的生态环境效应、水文格局的生态效应、模型与制图研究。1.7.4生态水文学的主要研究内容1999年,英国AndrewBaird、Derby、美国RobertWilby共同主编出版了《生态水文学》(Ecohydrology)。该书首次综合论述了有关陆生环境和水生环境植物与水分关系问题,阐述和探讨了各种环境植物—水分的相互作用问题。全书共分10章,涉及以下10个主要问题,概括了生态水文学的主要研究内容。(1)生态水文学概念。(2)植物水分关系。包括植物利用水分的基本知识,水分在植物中的运动,渍水和干旱对植物生长和生存的影响。(3)生态水文关系相互作用的尺度问题。应用不同尺度探讨生态水文问题。(4)干旱区的植物与水分。旱地的生态水文过程。包括旱地大尺度土壤—植被—大气传输情况下的小尺度过程的相互作用问题,和气候变化影响地中海地区的植被演化问题。(5)淡水湿地植物与水分。包括湿地水位如何影响植物的生长和生存、植物在影响湿地水位中的作用问题。(6)森林和疏林中的植物与水分。包括树木如何影响水在地面的分配以及如何通过蒸散过程影响土壤水分状况,树冠截留雨水和蒸腾的观测方法和模型建立问题,热带雨林和温带森林的水文过程。(7)河流植物与水分。包括河流中的植物与水分关系,植物对河流的水力特性影响。(8)湖泊及其毗洼地区的植物与水分。(9)建立模型问题。(10)生态水文学展望。全球尺度生态水文学的前景问题,生态水文学实验途径的作用和生态水文过程的知识应用于人类所干扰的生态系统管理问题。1.8灰色系统水文学本节引用我国学者夏军教授的研究成果,介绍灰色系统水文学的体系框架。1.8.1灰色系统水文学产生的背景1.灰色系统水文学产生的客观背景灰色系统水文学产生的客观背景是我国的水文水资源问题。我国是一个水旱灾害频繁、水资源分配很不均匀,且面临水源短缺、水质恶化等许多水问题挑战的发展中国家。水文学的发展对我国的经济建设、人民的安居乐业和社会发展,发挥着十分重要的作用。同时,社会经济发展中的许多问题向水文学提出了一系列新的要求,如洪水与干旱灾害产生的机制、不同尺度能量与水循环关系,水资源未来可能的影响变化等问题。水文工作者27 需要研究跨越不同时空尺度水文情势(枯水、径流、洪水)的相似性与变异性,开展水资源情势的长期预测,研究气候变化对水资源的影响和水资源开发利用(包括大型水工程)对环境的影响。这些实际的水文水资源问题要求水文学不仅具备坚实的理论和先进的技术,而且能够处理当今水文学面临问题的复杂性以及学科交叉中的各种不确定性。这就是灰色系统水文学产生的客观现实环境。2.灰色系统水文学产生的学科背景灰色系统水文学产生的学科背景是国际水文学的发展方向。从水文学科学发展的趋势来看,具有以下特点。(1)随着水文学研究领域不断扩展,研究问题的复杂化,水文现象的不确定性和非确知问题的出现给水文学的发展提出了挑战。探索水文现象复杂性和不确定性,将是水文学的一项长期的任务和责任。(2)水文学的研究已愈来愈注重系统性和整体性。流域尺度水文学问题、未来趋势的变化及其对人类社会经济的影响等许多问题需要采用水文系统分析的观点和方法,为系统水文学的发展提出了最新的要求和动力。(3)水文学的研究与为人类服务、解决实际工作中各项水的问题的联系越来越紧密。如全球气候变化影响的研究,预测与减轻水旱灾害等。面对这样的环境与形势,夏军教授认为,中国的水文科学工作者也应抓住机遇,迎接这种挑战,开发和引用先进的科学技术与观测手段,获取更多的水文信息,根据国际水科学的前沿问题,从中国的实际出发,先行开展新的水文系统方法的研究与实践是十分必要的。灰色系统水文学正是在这样的历史背景和要求下产生的。1994年,灰色系统水文学理论与方法被正式列入全国首届水文水资源与水环境科学不确定性新理论、新方法学术讨论会的新方法之一,随后,1995年正式出版了会议论文集《现代水科学不确定性研究与进展》。1.8.2灰色系统水文学的体系1982年,我国学者邓聚龙首先提出了灰色系统的概念和思想,目前,已经应用于社会、经济、工程、军事和水利等领域。灰色系统理论的问世,为水文学研究提供了新的方法论和视野,促使一些水文工作者积极应用和探讨灰色系统水文学问题。针对水文学资料信息不完全的学科特征,灰色系统水文学基于水文学原理和水文系统分析原理,在探讨水文现象的复杂性和不确定性,认识水文循环和不同尺度水文的特征规律及其它们之间的联系方面,建立了一套学术思想新颖、有一定独创性的水文灰色系统模拟、灰色预测、灰色统计、灰色规划等新方法,以促进精确的物理水文学和统计水文学有机结合,更多地考虑来自社会经济、人类活动影响方面造成的种种不确定性,使水文学的理论向现实更逼近一步。依据目前的研究,夏军教授将灰色系统水文学的学科体系概括为以下相互联系的两个部分。1.灰色系统水文学基础(1)地球水循环的质量、力和能量的关系;(2)水文尺度问题研究;(3)宏观、中观与微观水文系统(开放与封闭系统)的信息与不确定性;(4)水文灰色系统的概念与分类;28 (5)水文系统信息及其度量;(6)研究“灰”概念、“灰”现象的学术理论与系统分析原理(含灰集合、灰数的定义、灰数四则运算、灰数的扩张与收敛分析、灰数的比较等);(7)水文现象的“灰”与“白”关系分析等。2.灰色系统水文学的方法论及应用(1)水文灰色系统关联分析方法及应用水文灰色系统关联分析方法主要用于研究水循环系统变量及其影响分析,灰序列关联分析是其基本方法之一。应用的方面主要有。1)复杂流域径流影响因子序化分析;2)流域水文—生态模拟影响因子分析;3)流域水质水环境模拟影响因子分析;4)人类活动对水文水资源管理影响分析;5)大气—土壤—植被的界面分析;6)气候变化对水文水资源影响分析等。(2)水文灰色系统模拟方法及应用这部分研究包括两个方面的内容。1)建立水文灰色系统模型的原理研究与现行灰色系统方法有所不同,这里侧重研究有物理原型但仅部分被观测的非本征性灰色系统。其目标是将确定性水文物理方法或概念性水文模型与灰色系统建模方法有机结合起来,提出既吸收了先验物理知识(第一原理)又可由实测资料辨识未知或不确定部分,且有较好弹性的灰结构/灰参数模型。这部分内容是灰色系统水文学的主要特点,它包括:①水文灰色系统结构与参数化;②水文系统广义不确定性描述;③水文灰色结构与参数识别;④水文灰色系统模拟与检验等。2)水文灰色系统模拟方法的应用,主要可应用的方面包括:①流域暴雨洪水模拟;②流域水文生态模拟;③宏观尺度大气环流模拟与局部尺度水文生态模拟及其耦合;④都市径流面流模拟:⑤区域水文水资源模拟与评价等。(3)灰色系统水文预测、预报方法及应用水文预测、预报是水文学应用最重要的方面之一。灰色系统水文预测、预报研究的内容包括进行预测、预报不确定性的量化分析,提出水文灰色预测及“灰靶”概念与理论方法。灰色系统水文预测、预报的应用涉及到三类时间尺度的水文预报。1)中长期水文时间序列灰色预测。它涉及到:①时间序列灰色预测方法研究;②降雨及气候因子中长期预测应用;③年(或月)径流中长期预测应用等。2)是短期水文灰色系统预报的应用。主要有:①流域暴雨洪水实时灰色预报;29 ②河道洪水实时联机的灰色系统预报;③河流湖泊或水库水质灰色系统预测:④都市雨洪面源负荷灰色预报;⑤预报的精度、不确定度与合格率评定。3)水文灾变事件灰色预测。主要有①洪水灾害灰色预测,它涉及洪灾评定准则与样本集、洪灾事件的灰信息预测、洪灾的GM类模型预测,以及实用实例分析;②干旱灾害灰色预测,它涉及干旱的定义与指标的评定、干旱灾害灰色预测方法、干旱周期性与灰概率分析和实际应用。(4)水文灰色统计、区划与聚类主要研究水文区划与站网规划的信息不完全及决策问题。涉及内容有:1)水文灰色统计与聚类问题;2)水文区划的灰色系统方法;3)站网规划的灰色分析方法;4)应用实例研究。(5)灰色系统水文学方法在水资源管理和水环境保护中的应用1)可持续水资源管理量化的系统长期变化预测;2)区域水资源系统分析应用的灰色系统方法;3)需水量灰色预测与供需平衡分析;4)区域水资源质量灰色系统评价;5)河流、湖泊和水库的水质模拟与预测;6)区域水污染控制的灰色规划与灰色系统控制;7)水环境保护及经济分析的灰色系统方法应用等。(6)灰色系统水文学目前在水文科学方面的应用包括气候变化对水文水资源影响分析、洪水与干旱预报、泥沙与径流量预测、水文区划、水质评价与模拟预测、区域水污染控制与规划等。20世纪90年代以后,灰色系统方法引入到国外,并应用到全球气候变化(IGBP)中的BAHC项目中的若干方面,如GCMs不确定性分析、水资源受气候变化影响的风险评价等。但是,从该分支学科整体发展来看,目前研究仍处在初期阶段,有许多问题需要进一步探索。主要的任务有:1)加强灰色系统水文学与物理水文学的联系与渗透,注意通过实验和实践环节促进对“灰”的学术问题的研究。例如,水文尺度问题,就是一个难度很大,但十分有意义的“灰”的研究课题。2)加强大尺度水文学的应用问题研究,如气候变化对水文水资源影响分析、预测与评价,平衡当代人与后代人利益与资源分配的可持续水资源管理的新概念、准则与量化方法等;在复杂性、不确定性问题和信息不完全的水文问题研究与处理中,发挥灰色系统水文学的优势与作用。3)加强灰色系统方法与水文新技术和其他新理论的结合与渗透。例如,与水文地理信息系统、水文遥感遥测等新技术的结合与渗透。4)加强国际水文学项目的合作,使灰色系统水文学理论得到广泛的检验,吸引更多30 的学者从事该理论的研究,促进理论与应用的发展。1.9数字水文学本节引用我国刘新仁、任立良等学者的研究成果和文献,介绍数字水文的体系框架。“数字水文”(DigitalHydrology)是地球空间多源水文信息的数字集成。它的核心是将传统的站点观测水文数据与数字地球中各种原数据,经过同化系统的加工处理,产生数字化的、覆盖整个流域或区域空间的、多重时间和空间尺度的、多种要素的、对水文分析有用的数据产品,为各种水文工作和有关的农业、林业、环境、交通等建设部门提供所需的数字化水文信息,为地球的其他系统(大气、地质、生态、环境等)的数据同化提供与水、能循环有关的数字化状态和通量变量,为进一步揭示地球水圈的基本规律的科学研究提供数字化信息平台。1.数字水文是对传统水文的大幅度拓宽主要表现在以下三方面(刘新仁)。(1)空间拓宽传统水文受到观测手段的限制,只能获取有限站点上的水文特性数据,主要关注的是河道断面的水位和流量。数字水文作为数字地球的组成,将面对整个地球空间,不再局限于有限的河道测站断面。(2)要素拓宽作为地球的水圈,其变量不再局限于河道的流量和水位,将包括水文循环各要素,即土壤水、地下水、河道、湖泊等参与水循环的各种水体的水、热及化学状态变量以及它们之间的水量、能量和化学物质及其他夹带物质的通量。(3)尺度拓宽传统水文是针对水文站的,其尺度是单一的,决定于水文站所控制的流域。而数字水文服务于各种需求对象,所涉及的尺度将是多重的和多构的。空间上将跨越从大陆尺度到山坡及土块尺度的若干尺度层次;时间上将跨越从多年平均的水文气候尺度到瞬时的洪水时间尺度;空间上将既要按照水文系统的自身特性以流域为单元来构成,又要满足社会经济的应用需求,以行政区域为单元构成。这种多重性和多构性在栅格结构的数字空间上很容易处理和得到满足。这是传统水文难以与之相比的数字水文的优点。2.数字水文系统涵盖的内容主要包括以下四方面。(1)利用卫星云图、雷达测雨和地面雨量站测雨的多源数据,产生多种空间和时间分辨率的雨量分布的动态数字信息。(2)利用卫星遥感信息、土壤湿度和温度站点观测数据和分布式流域水文模型,产生多种时空分辨率的土壤水分和热状态的动态数字信息。(3)利用卫星遥感信息(包括辐射、土地利用、植物状态等)、土壤水、热状态信息、气象站点观测信息和分布式水文模型,产生多种时空分辨率的蒸发能力、实际蒸发和散发的动态数字信息。(4)利用卫星遥感信息、水文站点观测信息和水文、水力学耦合模型,产生重点地区(河段、工程枢纽或城市)的高分辨率的水位、流量动态数字信息。数字水文是水文基础科学与应用技术的深层次结合。水圈与大气圈、岩石圈、生物圈31 处于不停的相互作用之中,对水文系统的信息采集和加工处理以及特性的认识和描述,必须置于各种有关系统的耦合之中,不能只局限于水文本身。陆面水文过程与大气过程、水文过程与地球化学过程、水文过程与生态过程的相互作用是一个十分复杂的巨系统。对这个系统的信息采集、处理、分析必须建立在地球科学基础之上。数字水文研究的方面在于分布式水文模型,其原理方法参见第6章。传统水文的服务主要局限在与河川水情有关的部门,而数字水文应该可以为一切与水圈情势有关的部门提供信息服务,包括为农业部门提供土壤墒情的预报预测,为供水部门提供地下水情的预报预测,配合气象部门进行天气与气候的预报预测,等等。数字水文是建立水灾害防治决策支持系统、水资源规划管理系统、水环境保护系统的基础。参考文献1黄伟纶.“水文学”词源初探.水文,1995.56~582张建云,李纪生,等译.水文学手册.北京:科学出版社,2002.3~43叶守泽,詹道江.工程水文学.北京:中国水利水电出版社,2000.1~24于维忠.水文学原理(一).北京:中国水利水电出版社,19905芮孝芳.水文学原理.北京:中国水利水电出版社,20046黄锡荃.水文学.北京:高等教育出版社,20047水利百科全书编写组.中国水利百科全书.北京:水利电力出版社,1987,Vol3:1857~18588陈守煜.模糊水文学的建立与前景.大自然探索,1992,11(1):24~289夏军.灰色系统水文学.武汉:华中理工大学出版社,2000:2,16~2310左其亭,王中根.现代水文学.郑州:黄河水利出版社,2002.3~411叶守泽,夏军.水文科学研究的世纪回眸与展望.水科学进展,2002,13(1):93~10412丁晶,刘权授.随机水文学.北京:中国水利水电出版社,1997.1~713顾慰祖,陆家驹,唐海行,等.水文实验求是传统水文概念-纪念中国水文流域研究50年、滁州水文实验20年.水科学进展,2003,14(3):368~37814余新晓.土壤水动力水文学问题研究及其在防护林体系建设中的应用.世界林业研究,1995,(3):27~3315夏军,丰华丽,谈戈,等.生态水文学─概念、框架和体系.灌溉排水学报,2003,22(1):4~1016严登华,何岩,邓伟,等.生态水文学研究进展.地理科学,2001,21(5):467~47317王根绪,钱鞠,程国栋.生态水文科学研究的现状与展望.地球科学进展,2001,16(3):314~32318赵文智,程国栋.生态水文学—揭示生态格局和生态过程水文学机制的科学.冰川冻土,2001,23(4):450~45519武强,董东林.试论生态水文学主要问题及研究方法.水文地质工程地质,2001(2):69~7220地球科学进展编辑部.生态水文学研究的奠基之作—《生态水文学》.地球科学进展,2001,16(5):734~73521刘新仁.数字水文系统建设—信息时代的水文技术变革.水文,2000,20(4):5~832 第2章河流水文学研究进展河流是地球上重要的生态系统,它与人类生存休戚相关。19世纪以前,人们对河流水文现象的认识是感性的、局部的、描述性的。19世纪,牛顿力学体系的建立与不断完善为河流水文学的发展奠定了理论基础。20世纪,由于生产力的推动和科学技术的全面进步,河流水文学得到了蓬勃发展,形成了自身的学科体系,成为水文学中最重要的、最先得到发展的分支学科之一。本章引用我国水文学者芮孝芳等的文献总结,介绍21世纪河流水文学几个主要研究领域所取得的成就及其发展前景展望,包括产汇流理论、流域定量地貌、河流洪水、河流泥沙、河流热状况与冰情、河流资源利用、河流水质与河流生态环境等问题。关于流域水文模型的研究进展,本章不再介绍,可参见第6章。2.1河流水文学研究的内容2.1.1河流水文学研究的主要内容河流水文学主要研究河流中所发生的各种水文现象的基本规律及过程、河流集水面积上的产流与汇流过程、河流资源的利用,以及人类活动与河流生态系统之间的关系等。河流水文现象和过程主要包括流域的地形地貌、河系的形态和河床演变、河流的形成与发育、河槽形势和河床演变、河流补给、河水运动、洪水与枯水、河水热动态、河流冰情、河流泥沙运动和河水水质等(芮孝芳,孔凡哲等,2001)。河流水文学的主要内容有水系特征和流域特征研究、河流补给、径流和河水运动、河流水文变化、河流泥沙的形成和运送、河水化学成分等。河流水文学的研究有助于人们掌握河川径流形成和水情的变化规律,是水资源评价和规划、河流水工建筑物设计、运行和河道整治等的重要依据,也是正确进行水文预报的基础。2.1.2河流水文学研究的方法河流水文学的研究方法有:布设水文站网,长期观测水文要素;水文调查,了解流域自然地理条件、历史洪水、枯水情况和人类活动;室内和野外实验,进行实验流域和代表性流域上的水文要素观测;成因分析;数理统计分析;地理综合法等方式、方法,并以此获取水文信息。2.1.3河流水文学涉及的主要学科河流水文学与气象学、流体力学、数理统计学、热力学、化学、地质学、地理学等学科有密切关系。应用气象学原理研究流域降水和蒸发的基本规律;应用水力学原理研究河水运动和河流泥沙运动的变化规律;应用数理统计学理论和方法研究河流径流的多年变化规律;应用热力学原理研究河水热动态和冰情规律;应用化学原理和方法评价河水水质;33 运用地质学和地理学原理和方法研究河流水文现象的地理分布规律。2.2产汇流理论产汇流理论是河流水文学的重要任务之一,以水—土—植系统水文循环和流域尺度的水文循环为研究对象,探讨不同气候和下垫面条件下降雨径流形成的物理机制、不同介质中水流汇集的基本规律以及产汇流计算方法的基本原理,是研制确定性水文模型、短期水文预报方法和解决许多水文、水资源实际问题的重要理论依据。其主要基础理论是土壤水动力学、气象学、自然地理学、明渠水力学、渗流力学、实验水文学、系统分析技术等(芮孝芳,1995)。流域内降雨形成出口断面的径流过程分为产流和汇流两个阶段。产流过程是指流域中各种径流成分的生成过程,也是流域下垫面对降雨的再分配过程。降雨落在流域上的降水质点,从流域各处向流域出口断面汇集的过程称为流域汇流。产汇流理论是研究流域产汇流的形成及其分析计算原理。2.2.1产汇流理论研究进展19世纪后,产汇流理论开始形成并得到进一步发展。1856年,达西(Darcy)提出了渗流力学基本定律(达西定律)。1871年,圣维南(St.Venant)推导出了明渠缓变非恒定流基本微分方程组(圣维南方程组)。达西定律和圣维南方程组为研究产汇流理论中的地面水流、河道水流、土壤中水流和地下水水流的运动规律奠定了理论基础。20世纪70年代以后,产汇流理论日趋成熟。这一阶段相继出现了动力水文学(DynamicHydrology)、水文系统线性理论(TheLinearTheoryofHydrologicSystems)、山坡水文学(HillslopeHydrology)、河川径流的数学模拟、流域水文模拟、水文系统的识别和动力水文学实验,以及非霍顿产流理论、计算河流水力学和地貌瞬时单位线等理论方法。1.产流理论研究进展20世纪30~60年代,产汇流理论取得了重大突破。1935年,霍顿(R.E.Horton)根据降水-入渗关系提出了著名的Horton产流理论,阐明了自然界超渗地面径流和地下径流产生的机制,是目前产流研究的基本原理。20世纪60年代初,我国在产流理论研究方面取得了重要的突破。中国水文学者赵人俊、华士乾等以姜湾径流实验站等大量小流域降雨径流实验为基础,把降雨径流关系和流域蓄水曲线联系起来,提出了湿润地区蓄满产流的概念,为中国湿润地区产流计算提供了依据。通过对中国北方的降雨径流关系研究,赵人俊、华士乾等发现雨强是影响降雨径流关系的主要因素,指出北方干旱地区超渗产流是径流形成的主要方式,并建立了实用的流域产流量计算方法,从而使霍顿产流理论在实际中得到了较为广泛的应用。这两种产流概念对指导中国降雨径流的研究发挥了重要的作用(刘昌明)。(1)20世纪,在流域产流理论及计算方法方面的主要进展1)揭示了超渗地面径流、饱和地面径流、壤中径流、地下径流等四种径流成分形成的物理条件;2)提出了蓄满产流和超渗产流两种基本产流模式及其与气候条件和下垫面条件的关34 系;3)发现了在流域产流过程中产流面积随时间变化的原因及处理蓄满产流和超渗产流情况下产流面积随时间变化的方法;4)建立了一些具有实用价值的流域产流量分析计算方法。(2)流域产流理论研究的主要方法1)重视水文实验研究广义的水文实验应包括现场观测、实验流域和室内实验等。水文实验研究推动了产汇流理论中一些重要的发现。如达西的沙柱渗流试验,取得了达西定律的发现。20世纪60年代,通过大量的水文观测,中国水文学者总结出蓄满、超渗产流模型。由于实验流域的兴起与发展,赫魏尔特(Hewlett)和邓尼(Dunne)等揭示了非饱和侧向流、壤中径流和饱和地面径流机制的存在。2)多学科的相互渗透与掺混水动力学与热力学的引进,导致了动力水文学的建立。系统论、控制论和最优化理论的渗透,出现了系统水文学。河系地貌随机结构理论与统计力学研究方法的结合,创立了地貌瞬时单位线理论。由于高速度、大容量电子计算机普及,促使了谢尔曼单位线、圣维南方程组在汇流研究中得到了广泛地应用,同时也出现了河段单位线、地下水单位线、坡地单位线等理论。3)确定性方法与随机性方法相结合产汇流理论探讨水分在不同介质中的垂直与水平运动。水的物质结构既不同于固体,也不同于气体。对于固体,分子与分子、质点与质点之间的相互作用十分强烈,排列有序,因此其运动规律完全由分析力学(即牛顿力学)定律所支配。气体与固体相反,分子与分子、质点与质点之间的相互作用十分微弱,可以认为是相互独立的。因此,对于气体分子或质点的这种纯随机性运动,统计力学方法获得了极大的成功。液体的分子与分子,质点与质点之间,既非严密有序,也非完全随机,而是一种松散的结构关系,分析力学不能精确支配它,统计力学也不能精确描述它。水在物质结构上这种特殊性,使得在探讨其运动规律时要求把确定性研究方法和随机性研究方法有机地结合起来,各得其所,相互补充。20世纪70年代末、80年代初,罗德里古兹·伊特布(Rodriguez—Iturbe)等人和古珀特(Guptan)等人,把统计力学的研究方法和霍顿地貌定律引进流域汇流计算,导出了地貌瞬时单位线,对促进确定性和随机性研究方法的结合进行了有益的开创性尝试。2.汇流理论研究进展流域汇流是一种比河道洪水波运动更复杂的水流运动,它的研究成果主要有罗斯(Ross,1921)提出的面积—时间曲线,谢尔曼(Sherman,1932)创建的汇流方法经典理论—单位线推求流域汇流方法;佐贺(Zoch,1934)建立的线性水库和瞬时单位线概念;麦卡锡(G.T.Macarthy,1938)首次使用的马斯京根洪水演算法;克拉克(Clark,1945)将等流时线与线性水库两种概念相结合建立的瞬时单位线方法;加里宁一米留柯夫提出的特征河长原理(1957);纳西(Nash,1957)提出的具有Gamma函数分布形式的瞬时单位线以及串联线性水库汇流模型;杜格(Dooge,1960)明确将系统概念引入流域汇流,提出的一般性流域汇流单位线;根据流域汇流单位线,水文学者又相继提出时变水文系统概念和各种流域非线性汇流理论和计算方法;Rodriguez—Iturbe和Gupta等人(1979)基于流域河网定理把汇流单位线与地貌特征、气候因子结合模拟汇流过程,提出了地貌瞬时单位线,这是对瞬时单位线的发展。McCarthy(1939)从河段水量平衡方程出发推出的Muskingum35 河道洪水演算,是河道汇流的基本方法。60年代,中国水文学者对马斯京根法的理论解释和提出的长河段连续演算方法等,已成为现行实用汇流计算方法的基础(胡彩虹,2003)。20世纪,在流域汇流理论及计算方法方面的主要进展是(芮孝芳,2001):1)从水滴运动学、河网水力学、流域调蓄作用和流域汇流系统分析等不同角度阐述了流域汇流的机理或宏观表现;2)完善了线性情况下流域汇流的计算方法;3)发现了若干个可以描述推移和概化现象的概念性元件,并提出了由此构造概念性流域汇流模型的方法;4)创立了地貌瞬时单位线理论。2.2.2流域产汇流理论研究趋势展望由于自然界产汇流机制本身十分复杂,人类活动的影响又增加了这种复杂性,因此,在21世纪,进一步揭示不同气候和下垫面条件下的产汇流规律,尤其是探讨人类活动对产汇流的影响,仍然是十分重要的。发挥多学科交叉与相互渗透的作用,采用新的科学理论和技术,仍然是探求新的产汇流理论和计算方法的重要手段。在流域产流理论和计算方法方面,重点要研究下垫面结构各向异性、地形坡度等在产流中的作用,人类不同的土地利用方式对产流的影响,以及各种径流成分产流量的计算方法。在流域汇流理论和计算方法方面,重点要研究水系发展与流域汇流的关系,流域地形地貌与流域汇流的关系,以及在流域汇流计算中尺度对这些关系的影响。2.3河系结构与流域地貌2.3.1河系结构与流域地貌研究进展河系及流域地貌是决定径流过程线形状的重要地学背景。20世纪,地貌学经历了由定性研究向定量研究的初步发展过程,在河系拓扑及流域定量地貌方面已取得了一批重要研究成果,通过建立河系随机模型、分形理论,揭示了河系分叉规律,河系、坡度、集水面积的分布规律,发现并解释了面积与河长之间的定量关系,以及从不同比例尺地形图上获取的地貌参数之间的分形关系,基于数字高程模型(DEM)的数字流域已见端倪。流域地貌是流域内各种地貌形态要素的有机组合,它不是单一的地貌形态。流域地貌以分水岭为周界,由坡地和水系两大形态要素组成。水系是由多级水道组合而成的水文网,常构成各种图形,在遥感图像上十分引人注目,而一个地区的水系特征,是由该区域的岩性、构造和地貌形态所决定的。因此,遥感图像在流域地貌解译研究中有着无可比拟的优越性。19世纪末至20世纪初,戴维斯提出了侵蚀循环理论,把地貌形态归结为构造营力和时间的函数,将地貌发育划分为幼年、壮年和老年期三个阶段,从而把以往单纯从形态描述的地貌学上升为解释性地貌学。50年代美国地貌学家斯揣勒提出了面积—高程分析法,从而将戴维斯的侵蚀发育模式给以定量化,这是定量研究中的一次飞跃。艾南山等提出了地貌信息熵和超熵的概念,并且用来作为发育阶段的划分和稳定性判别的定量指标。流域地36 貌的演化,是地表物质遭受侵蚀搬运、堆积的传输过程,而任何物质的传输过程是一种非线性变化。由此看来,以线性方法和观点去研究流域地貌问题是无法取得突破性新进展的。分形理论的形成与发展,为流域地貌非线性研究开辟了一条新思路。这种现象绝不是偶然的,流域地貌的内在规律为这条思路提供了可靠的依据。在流域形态上,流域中的水文网、岩石表面的裂隙都表现出一定尺度的统计自相似性。尤其是霍顿(R.E.Horton)在解释他发现的河流数定律时,认为这可能是由于水系本身按自身结构有规则地循环发展的结果,这样形成的水系自然满足霍顿定律。水系是由地表水的侵蚀、搬运和堆积作用形成的地貌景观,也是所在地区内外营力作用的产物。水系的形成和发育与气候、地层岩性、地质构造等诸因素有关。水系是一条干流和多级支流的组合,其组合形式受地质构造和自然环境的控制,在平面上表现为有规律的排列组合,可以用分形理论来描述。目前分形理论被广泛应用于物理学、化学、生物学、经济学、情报学、地学等科学领域,但在应用中普遍存在一种不足,即利用一些分形公式计算出某分形体的维数之后,没有进一步去探究这些维数所包含的意义。为此,王协康利用分形理论对流域地貌系统的定量问题进行了研究(王协康,1998)。在研究水系分维的基础上,对水系的分维含义作出了诠释,水系的分维反映了水系发育的复杂程度,代表了水系所处流域的地貌侵蚀发育阶段。1.主河道的分维计算流域地貌的一个重要特征就是主河道(单一河道)与流域面积的关系。自从20世纪50年代,数理统计方法开始在地貌学广泛运用以来,霍顿定律就一直是流域地貌中的一个公认的经典定律。J.Fedter导出了一个用霍顿定律表示的主河道的分维公式Dt=2lnRl/LnRb(2-1)式中,Dt为主河道的分维数;Rl为河道长度比;Rb为河道分枝比。利用河道分枝比和长度比计算主河道分维数的方法,J.Fedter对美国14个流域,计算出的分维数见表2-1。表2-1主河道分维数计算表序号流域河道分枝比河道长度比分维数1巨穆狄溪3.292.081.232巨桑迪溪3.932.081.233科罗拉多河4.102.131.074卡斯卡斯加河4.062.131.085麦基诺河3.881.960.996梅里麦克河4.472.561.267内契斯河4.792.441.148罗阿诺克河4.312.081.009罗古河3.722.081.1110桑加蒙河3.741.850.9311斯昔恩河4.002.131.0912斯查汉纳河3.992.331.2213佛米利翁河3.971.890.9214怀特河4.512.331.12平均值4.052.171.1137 2.沟系的分维计算流域地貌源头发育的初期阶段,伴随着坡面上产流、产沙过程,坡面形态亦在经历一个迅速变化的过程。由此而产生了具有不规则,貌似杂乱的沟系地貌,显然不是欧氏几何学和普通微分几何学的研究内容,只能用分形理论来表达沟系地貌的定量标准。由于坡面沟系尺度较小,发育程度极不规则,一般不属于干流型水系,此外细沟水道级也难以用A.N.Strahler或R.E.Horton划分原则进行分析,因此主河道分维公式难以适应计算要求。为此,采用简单而实用的计盒方法来计算沟系的分维数,以方格边长为r的方格网覆盖在平面分形图上,数出包含图形的方格数N(r);对不同的ri(i=1,2,3,⋯,m),将得到m个不同的N(ri)值;在双对数轴上标绘N(ri)与ri数值之间经验关系,用最小二乘法拟合出一条直线,可用下式表示:lnN(r)=A−DLn(r)(2-2)式中,A为系数;D为所求分维数。利用计盒数方法计算坡面沟系室内实验资料的分维数,在坡面形态已趋于稳定状态的条件下,沟系统计平均分维数D=1.589(洪时中,1988)。3.水系的分维计算分形学者早就注意到了水系的分形特征。水系的分枝图形,主流有支流,支流又有各自的次级支流。大型水系是一种多重分形(Multi—Fractal),它的子流域又是分形,子流域有各自局部范围的分维。大型水系若只用一个分维来表示显然是不合适的,用诸多子流域的多个分维数来划分会更恰当。水系分维公式的计算,人们最早用主河道长度及水系总长度与流域面积的如下二公式表示:mL=αA(2-3)b∑L=CA式中,L为主河道长度,A为流域面积,主河道分维D=2m。D=2b为整个水系的分维。2.3.2分形理论在河网水系和流域地形地貌中的应用1.研究进展在形态(结构)、功能等方面具有自相似性的研究对象统称为分形,也称之为“广义分形”。它包括自然分形、时间分形、社会分形、思维分形。凡是自然界中客观存在的或经过理论抽象而得到的具有自相似性的几何客体,都称为自然分形。根据各种系统具有不同的具体特点,自然分形分为几何分形、功能分形或信息分形、能量分形。系统在形态和结构上存在着自相似性的几何对象,称为几何分形,如线状分形(科契曲线、高分子链等)、表面分形(二维谢尔宾斯基地毯、催化剂表面等)、体积分形(谢尔宾斯基海绵)、规则分形和随机分形;在功能或信息上存在着自相似性的几何对象,分别称为功能分形或信息分形。这两类分形所涉及的内容也十分宽广,从植物生长到人类发育、从城市边界线的变迁到气象预报都属于此范畴;在能量的传播上存在着自相似性的系统称为能量分形,这种分形主要表现在无线电通信中能量的传输和地震波的传播等能量传递过程中。Horton定律表明流域的河网是一个自相似的分形集(Rodriguez,1997)。因此,近几十年来,一大批水文学家运用分形理论对流域河网结构和流域地形地貌进行研究。38 20世纪60年代以来,水系的定量研究十分活跃,Leopold、Langbein、Shreve、Scheidegger等的工作,使水系性质的研究取得了长足的进展,新成果、新方法不断出现。1989年,Gupta对Shreve等提出的水系形成与发展的随机过程进行了分析,从数学上证明了在一定尺度上可能存在自相似性。罗文峰等研究了分枝结构的分形特征,讨论了在河网中的意义。Hjelmfet从Mcdeermott关于主河道长度与流域面积比的经验公式,推出了长度与面积之间的分形幂率关系。Robert对23个小流域的资料分析表明,地图扭曲影响和河道分形结构均对b值有贡献。Barbera等假设Horton长度比在所有尺度上保持不变,推出了一个理论上的河道分形公式。Rosso等从Mandelbrot模型推出主河道长度与流域面积的分形关系。Nikora认为Hack定律中幂指数b与气候条件、地质条件、流域形状、集水区宽度的非线性特征有关。李后强等给出了一个联系水系级别与分形维数的关系式。冯平等分析了海河水系的分形特征。傅军等研究了嘉陵江流域河网的分形特征。RodriguezIturbe等运用矩法研究了意2大利北部一个2200km的流域,计算了其多重分形谱。Marnani等研究了水系结构、地貌与流域响应之间的关系,把水系、流域面积和分维结合起来描述流域的几何特性,用一个基于Peano构造的严格自相似理想水系的水文响应给出了水系多重分形实例。Rodriguez-Iturbe、Rinaldo等根据能量最小原理,通过极小化流域系统整体和部分的能量消耗率得到的模拟水系称为最优河道网络(Optimalchannelnetwork,OCN),把OCN与天然流域的DEM进行了对比研究,通过模拟,形象地说明OCN将自动地从任意初始条件演化到具有分形特征的网络。这隐含着临界自组织(self-organizationCriticality,SOC)可能刻画了天然河网形成的动力学。水流侵蚀在河流形成过程中起着重要作用,可以用SOC的概念来描述流域地貌的形成与演化,因此水系河网结构和流域地貌表现出分形特征。由于流域地形的分形特征,流域的流量和能量也表现出分形特征,其分布形式为幂律形式的双曲型分布。Mandelbrot于1977年将分形原理引入地理水文学,作为分形现象的一个例子,通过河流的分形特征给出了河长与流域面积的关系。李华哗等(1998)论述了河流水系的分形特征,对于整个水系的分形模型D=limLnN(F)/Lnδ,N(F)为所有半径是δ的盒子内δδr→0的河流总数。刘德平(1988)采用分形理论中的分维数和引入的形状因子a,对水文过程线进行了研究。2.存在问题流域水系的分形与自组织研究成果较丰富,泥沙运动、输移及蜿蜒河流方面的分形研究成果较少。一般的研究工作是计算和比较不同河流的分形维数和标度指数,同一河流在不同时期的分形维数,即河道演化方面的研究工作尚未见到。在自组织临界性方面,研究模拟河流的较多,针对实际河流的较少;在研究方法上,运用动力学分析的多,运用热力学或非平衡统计物理方法的少,分形维数的物理意义尚未得到揭示。人们的研究重点集中在对单河道或水系平面形态的分形特征(即分维)上,而流域因素如流量、含沙量、输沙率等对河道与河网分形结构的调制作用也很少涉及。2.3.3数字流域数字流域是一个以流域空间信息为基础,融合流域内各种数字信息的系统平台,是对39 真实流域及其相关现象统一的数字化重现,它把流域搬进了实验室和计算机,成为真实流域的虚拟对照体。数字流域是数字地球的有机组成部分,是数字地球中有关流域的信息集合。具体地说,数字流域是把流域及与之相关的所有信息数字化,并用空间信息的形式组织成一个有机的整体,从而有效地从各个侧面反映整个流域的完整的、真实的情况,并提供对信息的各种调用要求。数字流域综合运用遥感、地理信息系统、全球定位系统、网络技术、多媒体及虚拟现实等现代高新技术对全流域的地理环境、自然资源、生态环境、人文景观、社会和经济状态等各种信息进行采集和数字化管理,构建全流域综合信息平台和三维影像模型,使各级部门能够有效管理整个流域的经济建设,做出宏观的资源利用与开发决策。数字流域由各种信息的数据库和数据采集、分析、交换、管理等子系统组成,可以根据不同的需要,对不同时间的数据进行比较分析,透视流域的变化规律。数字流域的基本框架包括流域信息的获取、处理和应用三个环节。1.流域信息获取要很好地管理一个流域,必须深入了解流域的自然和社会经济状况。基本的自然环境状况主要包括流域的地质、地貌、土壤、气候、水文、植被等。社会经济状况主要包括人口及其分布,流域各部分的经济发展水平,资源状况和对资源的需求状况,工农业发展的水平,有利条件和限制性因子,流域的水利、水保设施等。流域信息采集方法主要有传统的采集方法和基于数字地球技术体系的现代观测方法。传统的流域数据采集方法主要有各种统计年鉴、历史文献记录、野外观测、调查访问等,为探讨流域的动力学机理,室内实验也成为一个重要的数据来源。基于数字地球技术体系的现代观测技术,可通过全球定位系统(GPS)、对地观测系统(GMS)、遥感(RS)等高科技手段,更快、更完整地获取所需要的资料,极大地丰富了流域数据的来源。全球定位系统能全球、全天候并三维定速、定时高精度、快速省时高效率地提供多功能服务。对地观测系统利用多平台多种遥感器,通过遥感器之间互为修正、不同观测周期互补等特点来了解地球的各种情况、现象及相互作用,认识地球系统及其变化规律。遥感将采用三维数字成像系统,在获取地面目标多波段光谱反射、辐射能量信息的同时,同步地获取与对地定位(X、Y、Z)有关的各种参数,通过同步简单计算或事后准实时处理,使数字图像中由地面目标多波段光谱能量信息构成的每个象元都含有三维地理坐标值。这些高新技术将逐步成为数字流域的主要数据源。此外,还可通过互联网从其他相关部门获取资料,实现资源共享。2.流域信息处理流域信息的处理包括流域数据的存储、集成、分析和输出等几个环节。流域数据获取后,建立流域数据库对数据进行统一管理。由于数据量巨大,流域信息的存储必须依靠海量数据存储技术的发展和完善,数据库的建立也只能建立在总数据库管理下的分布式数据库。这样,信息的集成和共享就成了关键。建库时应遵循统一的元数据管理标准、统一管理及数据调用。统一管理要依靠无缝集成技术、互操作技术和分布式管理技术,才能达到理想的效果,数据远程调用的效率依赖于高速网络技术。信息的分析主要利用完善的GIS技术,包括变化规律分析、机理分析以及在分析的基础上建立流域模型。变化规律主要包括流域各种要素的时空变化过程、空间分布格局等,并能利用时间序列预测将来的变化趋40 势。机理分析主要是找出各种要素变化的原因,充分利用可能获取的多途径和高精度的资料,在处理大量高精度资料的基础上建立具有普遍意义的定量模型,引进物理学和数学的最新研究成果,探索流域演化的复杂性和内在机理,弄清地貌演化中侵蚀过程、输移过程、堆积过程和物理过程、化学过程、生物过程、人文过程等不同体系过程之间的联系方式和相互作用关系。在机理分析的基础上建立流域动力学模型,首先要建立流域的DEM模型,并利用GIS建立流域各个因子的多层数据,以各层数据为基础,分别建立适用于不同用途的模型,如流域生态模型、土壤侵蚀模型、洪水预报模型、水资源调度模型、社会发展模型等。模型建立后调用相应的数据来检验其精度,然后输出预报结果,供决策使用。信息的输出主要包括动态监测、实时三维模拟显示、分布式显示等,这必须依靠全球定位系统技术、虚拟现实技术等与数字地球相应的支撑技术。3.流域信息应用数字流域的应用主要包括决策和实施两个阶段。决策是建立在全面分析流域信息基础上,综合考虑各方面的因素,根据所建立的决策模型和决策支持系统作出决策,并制定相应的实施措施,如水保措施、防洪抗旱措施、水库联合调度措施、河道治理措施、水资源利用和协调措施等。这种决策应网络化、数字化、可视化。实施是对决策的执行,包括命令的下达、接收及采取相应的工程措施。从决策到实施的过程都要以数字地球的技术体系如高速网络技术、虚拟现实技术、分布式管理技术、互操作技术等为基础,才能发挥最佳效益。利用数字地球的技术体系建立数字流域,完善流域的信息采集和存储、利用体系,对流域数据进行分布式存储、管理和互操作,利用高速网络进行信息的传输,建立决策支持系统,对分析结果、决策和实施过程进行分布式、实时三维显示,有利于决策和实施,从而有效地实现流域的综合管理。2.3.4研究展望信息科学发展趋势表明,21世纪将是一个数字化世纪,因此,在21世纪,数字流域无论在理论上或实际应用上必将有巨大发展,人们将可以方便地利用数字流域的理论技术生成河系和流域形状,提取河系拓扑参数和流域地貌参数。数字流域与水文学的交叉和相互渗透将给传统的水文学增添生机,地貌水文学将可能最终形成。2.4河流洪水2.4.1河流洪水研究进展1.河流洪水运动及变化规律研究进展河流洪水是最主要的河流水文现象之一,也是导致洪涝灾害的自然因素。20世纪,在河流洪水运动及变化规律研究方面的主要进展是:(1)基于19世纪提出的描述明渠缓变非稳定流运动St.Venant方程组,证明驱使河道洪水波运动的各项作用力的对比决定了洪水波运动的特征。(2)对运动波、扩散波和动力波的特征从物理上作了深入的讨论,对惯性波的特征也作了初步的讨论。(3)提出了水文学和水力学两类主要的洪水演算途径,并发现了它们之间的相互联系。(4)所建立的众多水文学洪水演算方法和水力学洪水演算方法41 在实践中均行之有效。(5)认识到河流洪水的长期变化既有确定性一面,也有不确定性一面。(6)对引起河流洪水长期变化的气候因子、地球物理因子和宇宙物理因子作了一定的揭示。(7)对河流洪水长期变化所表现出的不确定性特征进行了探索,例如,应用概率论和数理统计探索河流洪水长期变化的随机性特点,应用模糊数学方法探索河流洪水长期变化的模糊性特点,以及应用混沌动力学理论探索河流洪水长期变化的混沌性特点等。2.现代洪水预报研究进展洪水预报是根据洪水形成和运动规律,利用水文、气象信息,预测洪水的发生与变化过程的应用科学技术。它是防汛抢险和防洪系统调度运用的决策依据,同时,也为水资源的合理利用和保护、水利工程的建设和管理运用及工农业的安全生产服务。主要预报项目为:洪峰水位、最大流量、洪峰出现时间和一次洪水总量等。通常,把预见期在2d以内的称短期预报;预见期在2~10d的称中期预报;预见期在10d以上、一年以内的称长期预报。由于大气环流、海洋潮汐、各种地球物理因子和下垫面产流、汇流条件等对洪水形成和演变都能产生影响,故短期洪水预报多采用基于物理成因的经验方法,而中、长期预报更与天气气候、气象预报紧密关联,且影响天气过程变化的因子尤为复杂,故其预报方法尚处于研究探索阶段。暴雨洪水预报常用基于一定理论基础的经验性预报法。近年来,实时联机降雨径流预报系统的建立和电子计算机的应用,以及暴雨洪水产流和汇流理论研究的进展,已使暴雨洪水预报能在几分钟之内发布,并获得最大预见期和准确度。融雪与冰凌洪水预报均选用气象、水文、动力等因子,建立经验公式或相关图预报融雪径流总量、融雪洪峰流量、冰流量、冰塞壅水高度、解冻最高水位及其出现时间等。风暴潮预报一般用调和分析法、最小二乘法和月龄法等,先计算天文潮正常水位,然后用经验统计法或动力数值计算法进行风暴潮的增水预报。系统理论向洪水预报技术的渗透是从20世纪50年代开始的。经历了一个从个别方法的借用逐步到理论体系的引入的过程。最初引起水文学者兴趣的是谢尔曼单位线与系统响应函数定义惊人的一致。于是用系统离线识别算法作为推求单位线的数值工具的研究首先兴起。1949年,Linsley等在《应用水文学》一书中提出单位线可以用最小二乘法去推求。1955年,斯奈德在“用最小二乘法作水文过程线分析”一文中,表述形式与线性系统最小二乘离线识别完全一致。1964年,Diskin在“流域降雨径流过程的线性的基本研究”中,把拉普拉斯变换算法应用到推求单位线上。同年,Levi和Valdes在“一种直接分析水文过程线的方法”一文中,把傅立叶变换法应用于单位线推求。1965年,Dooge在“使用拉盖尔函数方法于线性系统分析”文中,建议用拉盖尔系数代替调和系数推求单位线。1966年,Eagleson在“最佳可实现单位线的计算”中,报告了建立降雨—径流传递函数模型,使用维纳—霍夫方程的求解和反演(称为相关函数法)来推求单位线。2.4.2研究展望21世纪,人们应当对复杂条件下的洪水运动规律作深入的揭示,并提出精度较高的分析计算方法。对惯性波的特征及计算方法要更进一步探索和不断完善。这些复杂的条件主要指平原河网、河湖(库)系统、洪泛区行洪、河道水流与地下水之间的联系、河道冲淤变化,以及工程控制运用等;特大洪水的发生规律及预测,是人们特别关注的问题。但特大洪水的发生,与其他重大自然现象,如地震、海啸、台风等一样,应当是宇宙力量所致,42 尤其是太阳系对地球的作用和地球系统本身的变化。这些自然因素发生突变可能导致全球或局部地区气候异常和水文循环变异,从而可能形成特大洪水。因此,随着宇宙科学和地球科学的进展,人类揭示特大洪水发生规律的能力,在21世纪有可能得到较大的提高。此外,人类活动向大气大量排放温室气体可能引起的气候异常和相应的水文异常,也是21世纪必须进一步加强研究的课题。2.5河流泥沙及河床演变虽然人类对河流的研究已有悠久的历史,但河床演变学开始发展成为一门独立的学科是在20世纪60年代,研究在水流作用下河床的形态及其变化的学科时才得以成形。由于河流的复杂性,河床演变学仍处于发展时期,对许多问题的认识还不成熟,对一些问题的看法尚难于统一。水系的形成和发育、河型成因、河相关系、河床水力几何形态等是20世纪河床演变学研究中的若干个重要问题。2.5.1河流泥沙及河床演变研究进展1.水系的形成和发育对这个问题的研究有两个学派。1945年,R.E.Horton率先利用水文物理学的方法研究水系的形成和发育过程及其形态规律,使水系的研究有了定量的成果,这对带动该领域的研究起到了积极的作用。但由于他们对流域的自然地理因素对水系形成和演变的影响认识不足,导致了他们的模式与实际情况有相当的偏差。1966年,以Shreve-Smart为代表的学派以随机理论为手段,得出了服从统计规律的水系形态理论。这一理论将Horton-Strahler模式中的结论(如分枝比分布,河长比分布,干流河长和流域面积的0.6次方间的正比关系等),采用随机理论从理论上加以论证说明,而且利用这一理论取得了许多新成果,使得这一领域的研究进入了一个更高的阶段。我国在这一领域的研究尚处于分散状态,没有形成系统的理论。2.河型成因在河床演变学中,按平面形态和动态特征将河流划分为若干种基本河型。一般将河流分为3类:弯曲(分汊)、顺直、游荡。河型成因的研究一直是河流动力学研究中非常活跃的领域。它研究解决两个基本问题,其一是河流为什么具有某种平面形态的问题,它说明的是河流内部潜在的使河流朝某一河型发展的原因和可能性,即内因,对于这个问题的回答必须从水沙流本身的运动机理及能量特性入手。其二是什么条件下某种河型才能得以产生、存在并维持,这个问题研究的是某种河型得以产生和维持的外部条件和必要条件。迄今为止用来解释河型成因的理论已有许多,归纳起来,仍为研究者们重视并发展的理论主要有最小能耗率假设、地貌界限假设、稳定性理论、随机理论、相对负载假设、相对可动性假设等,无论是从动力学或运动学角度,还是从随机理论出发,各种理论都顺着一条基本线索研究河型成因,并相互补充,这一线索即为任一河流总是表现为一定的周期性和在一定时期内向着某一稳定状态(或极值方向)发展的趋向性。各种成因理论所力图解决的是能建立反映这一趋向性或稳定状态的数学表达式,就现有各理论的研究成果看,基于非平衡态热力学理论的最小能耗率理论最接近于这一目标的实现。对于流体最小能耗43 率原理的研究,最早始于赫姆霍尔兹(Helmholtz),他于1868年提出了适用于缓慢黏性流动的“最小能耗率原理”,20世纪50年代,维里坎诺夫将最小能耗率原理推展到河流动力学领域,并将其作为河床过程的原理之一。20世纪60年代,以里奥普(Leopold.l.B)为代表的一批学者引入非平衡态热力学理论的某些观点,强调河流系统能量分配规律的研究,到70年代,美籍华人学者杨志达、张海燕等人在最小能耗率理论应用于河流动力学方面取得了较大的进展并获得大量的研究成果。上述研究理论在揭示河型成因的内在原因方面均提出了一些具体的数学表达式。近年来陈绪坚、胡春宏及徐国宾、练继建等在这一领域又进行了许多有益的研究工作。3.河相关系河相关系是指河流的纵剖面及断面形态与流域因素之间的定量关系。为了更好地治理河流,工程师需要这种定量关系。1953年,Leopold和Maddock将均衡理论用于美国河流,得到了河流的水力几何形态关系(hydraulicgeometry),它包括断面水力几何形态(flowgeometry)和沿程水力几何形态(channelgeometry),属于经验方法。此后,人们开始从理论上探求解决河相关系的方法,先后提出了最小活动性假说、临界起动假说及最小能量原理。他们根据各自的假说都推导出了一套半理论、半经验的河相关系式。所有这些假说虽然都有一定的理论根据,但都还不能在理论上充分证明其正确性,同时,得出的关系式也还没有经过大量实测资料的验证。关于分形理论在河床表面形态方面的应用(张少文,2005),金德生等采用分形粗视化对黄河下游及长江中下游深泓纵剖面进行了研究,发现其具有分形特征,分维与河床纵坡降和能量有关,分维可刻画河流纵剖面发育的复杂程度。王协康等在分析非均匀沙河床颗粒随机分布基础上,对床面颗粒暴露度函数关系进行分析,通过简化颗粒的排列方式,研究了非均匀沙河床的分形特征。Nikora研究了地貌齐性河段(MHRS)平面形态的分形特征。Nikora和Sapozhikov提出了分析河道自相似性和自仿射性的新方法,并用这一方法来研究辫状河道的平面形态。同样地,针对河道表面形态的分形特征,自组织临界性思想被引入其演变过程来解释其分形特征。Murray从水流与泥沙输移的角度提出辫状河流元胞自动机模型,并对阿拉斯加的Aichilik河进行了研究,通过理论与实验对照,比较了河流泥沙输移时间序列的功率谱,两者十分相似且与自组织临界过程一致。姚令侃、方铎讨论了非均匀沙河床的自组织临界性,应用重正化群理论对形成河床抗冲粗化临界覆盖面积率进行了推导。4.河床水力几何形态广义的河床形态是指由河道水流侵蚀堆积而成的作为河道水流边界的那部分地貌形态。自1895年R.G.kennedy从河相的观点提出确定河床形态的经验方程以来,Lacey.G,Blench.T,Simons.D.B以及Albertson等先后对这一问题进行过研究,由于人们对河流成因的原理认识不同,各家河床形态方程结构形式差异较大。20世纪60年代,由统计经验建立的原生河相方程应用较多,但取值的随意性较大,使得由此构建的河床形态方程组仍缺乏指导实际工程规划设计的功能。20世纪70、80年代以来,河流动力学与其他学科的相互渗透,使人们对冲积河流形成的内营力和外营力有了进一步的认识,河床形态分析计算从断面形态向平面形态扩展。美藉华人张海燕从河流形成的两个基本假设出发,建立了以推移质造床为主的冲积河流断面和平面形态的分析计算模型,尽管该模型并未得到显式的河相44 关系式,但从实用角度看,已初步实现了有关河型成因从理论研究探索向指导实际工程规划设计的突破。特定河型的形成,是在内在规律的支配下由河段水沙条件、河谷条件、河床边界组成等因素相互制约而产生的,反映内营力作用的原生河相方程只有与特定河床边界组成相联系才能使得水沙条件和河谷条件(侵蚀基准因素)所界定的河型得以产生和存在。所以从河床边界组成的量化指标入手,研究基于非平衡态热力学理论下的显式原生河相方程,建立河流水力几何形态的分析计算方法,无论从理论上还是应用上都是十分必要的。5.河流泥沙流域产沙与产流密切相关。通过产流模型与产沙模型的耦合来处理流域产沙的定量计算,这在20世纪已经有了良好的开端,但以概念性产流、产沙模型为基础的流域产沙计算方法在揭示产流、产沙机理上粗浅,甚至不合理,因此,现有的流域产沙模型的计算精度是不尽如人意的,必须进一步探索。可以预见,随着处理降雨和下垫面特性空间分布不均匀的技术水平的不断提高,理论上更合理的、分布式的水流动力学与泥沙动力学相耦合的产沙计算方法将会得到实际应用。近代河流泥沙理论及河床演变理论始于19世纪末,并于20世纪得到蓬勃发展,其主要进展是:(1)在河流输沙机理方面,基于流体力学和水力学理论,通过物理模型试验和对天然河流的泥沙测验,揭示了泥沙颗粒在河水中沉降与悬浮的规律及影响因素,分析了河流泥沙颗粒的作用力及定量方法,提出了适用于不同水流、泥沙条件的泥沙沉降速度公式、泥沙起动流速公式、河流输沙率公式等。(2)在河床演变理论方面,揭示了天然河流的河相关系,提出了造床流量概念;(3)对河型进行了分类,并探讨了它们之间的相互转换条件。(4)泥沙运动理论与计算机技术相结合,促进了河流泥沙数学模型的大力发展,目前已在解决工程泥沙问题和河床演变预测中得到比较成功的应用。中国的许多河流都存在不同程度的泥沙问题,黄河的含沙量为世界之最。因此,20世纪,中国学者在河流泥沙研究中有着特殊的贡献,例如,提出了非平衡输沙理论,初步揭示了高含沙水流运动的特性,成功地解决了长江三峡工程和黄河小浪底工程的工程泥沙问题。2.5.2研究展望在河流泥沙和河床演变研究取得丰硕成果的基础上,21世纪将要着重研究的主要问题是:挟沙水流紊动结构及输沙机理;大水深条件下泥沙起动、扬动及泥沙与床面的交换规律;非均匀、非恒定输沙规律;黏性泥沙的物理化学特性及沉降规律;泥沙物理模型相似理论及试验技术;三维河流泥沙数学模型的完善与应用;不同类型河道的河床演变规律;平原河道崩岸机理及防治技术等。45 2.6河流热状态及冰情2.6.1河流热状态及冰情研究进展河流热状况、水温的时空变化,不仅是河流冰情发生与变化的根据,而且是河流水环境与生态系统发生变化的重要影响因素。20世纪,人们在探讨河流热量平衡和河水热力学的基础上,揭示了河冰形成的机理,对河流封冻、冰厚增消,冰坝和冰塞的形成、解冻和冰凌洪水等冰情进行了全面的研究。基于热力学和水力学理论的冰凌数学模型的研制也提上了议事日程。但由于河流热动态、河冰形成、河流冰情变化等都十分复杂,因此,在这方面的研究成果大都是初步的、经验性较强的。2.6.2研究展望21世纪应着重对河冰形成及河流冰情变化的热力学和水力学机理继续作深入的研究,以促使冰凌数学模型日臻完善。2.7河流水质及生态环境2.7.1河流水质及生态环境研究进展河流水流挟带污染物质的运动,既包含物理过程,也包含化学过程、物理化学过程、生物过程、生物化学过程等。这要比河流水流单纯挟带泥沙的运动复杂得多。自20世纪20年代世界上第一个水质模型诞生以来,由于环境问题日益受到人们的关注,人们对河流水流挟带污染物质的运动机理研究有了长足的进步,不仅揭示了水流中污染物对流、扩散、弥散、沉降、悬浮、吸附等机理,而且揭示了水流中污染物质的降解、转化等机理,并在此基础上建立了许多水质模型,尤其是有机污染的水质模型,在实际中达到较好的使用效果。21世纪,河流水流挟带污染物质的运动机理,将得到更深入、更精确的揭示,现有的水质模型也将不断完善,计算精度得到进一步提高。随着新的水污染问题的出现,新的水质模型必将不断涌现出来,例如:描述重金属污染、油污染、富营养化污染等的水质模型的研究可能会越来越受到重视。此外,面污染模型的结构和精度也将随着流域产汇流理论和监测技术的进步而得到改进。2.7.2研究展望21世纪,应当采用多学科综合的手段,更加深入地探讨人类活动对河流生态系统的影响,以及防止或减少负效应的对策。人类在开发利用河流时,应当使河流生态系统维持在对人类生存与发展有利的状态,或朝着更有利于人类生存与发展的方向改变,这就是建设生态河流的问题,这将成为21世纪河流水文学研究的一个重要课题。河流生态系统属于地球湿地生态系统。湿地生态系统、海洋生态系统和森林生态系统合称为地球上三大生态系统,许多河流都与人类文明发展有着密切的联系,例如,埃及的文明与尼罗河相联系,美索不达米亚(即两河地区)的文明与底格里斯河和幼发拉底河相联系,中华民族的文明与黄河、长江两条母亲河分不开。20世纪,由于人口激增,经济社46 会快速发展,人类以前所未有的速度加快了对河流的开发利用,以前所未有的规模加大了向自然的索取。但是,对河流不合理的开发利用将导致水质变坏、湿地减退,甚至发生断流或加剧洪水灾害,严重破坏了原有良好的河流生态平衡和生物多样性,恶化了人类自身的生存环境。20世纪中叶,人们开始注意到人类活动可能对河流生态系统产生负效应。20世纪70年代,人们提出了旨在保护生态环境、寻求人与自然和谐共存的经济社会可持续发展的发展模式。人们已经看到了21世纪科学技术飞速发展的曙光,这将是一个知识创新时代,它必将给古老而又年轻的河流水文学的发展带来新的机遇。参考文献1雒文生.河流水文学.北京:水利电力出版社,19922芮孝芳,孔凡哲,石朋.河流水文学若干研究领域的回顾与展望.水利水电科技进展,2001,21(2):8~113芮孝芳.产汇流理论.北京:水利电力出版社,19954胡彩虹,郭生练,熊立华,等.黄河流域水文模型研究现状与进展.西北水资源与水工程.2003,14(1):5~85袁作新.流域水文模型.北京:水利电力出版社,19936赵人俊,流域水文模拟——新安江模型与陕北模型.北京:水利电力出版社,19847KachrooRK.RiverFlowForcasting(Specialissue).JournalofHydrology,1992.1338吴险峰,刘昌明.流域水文模型研究的若干进展.地理科学进展.2002,21(4):341~3489郭生练,李兰,李订芳.分布式流域水文物理模型的研究现状与进展.刘昌明,陈效国主编.黄河流域水资源演化规律与可再生性维持机理研究和进展.郑州:黄河水利出版社,2001,51~5510FreezeRA,HarlanRL.Blueprintofaphysically-baseddigitally-simulatedhydrologicalresponsemodel.JournalofHydrology,1969,9:237~25811李兰,等.流域水文数学物理耦合模型.朱尔明编.中国水利学会优秀论文集.北京:中国三峡出版社,2000.322~32912李兰,等.流域水文分布动态参数反问题模型.朱尔明编.中国水利学会优秀论文集.北京:中国三峡出版社,2000.48~5413张建云,等.气候异常对我国水资源及水分循环影响的评估模型研究.国家“九五”重中之重科技攻关项目,200014郭生练,熊立华,杨井,等.基于DEM的分布式流域水文物理模型.武汉水利电力大学学报,2000,33(6):1~515郭生练,熊立华,杨井,等.分布式流域水文物理模型的应用和检验.武汉大学学报工学版,2001,34(1):1~516任立良,刘新仁.数字高程模型在流域水系拓扑结构计算中的应用.水科学进展,1999,10(2):129~13417任立良.流域数字水文模型研究.河海大学学报,2000,28(4):1~718芮孝芳,黄国如.分布式水文模型的现状与未来.水利水电科技进展,2004,24(2):55~5819芮孝芳,朱庆平.分布式流域水文模型研究中的几个问题.水利水电科技进展,2002,22(3):56~5847 20王协康,方铎.流域地貌系统定量研究的新指标.山地研究,1998,16(1):8~1221洪时中,洪时明,地学领域中的分维研究:水系、地震及其它.大自然探索,1988,24(2):33~4022Rodriguez-Iturbe,RinaldoA.Fractalriverbasins-Changeandself-organization.Cambridge:CambridgeUniversityPress,1997,99~19023GuptaVK.Statisticalself-similarityinrivernetworksparameterizedbyelevation.WaterResourcesBulletin,1989,25(3):72~7524罗文锋,李后强,丁晶,等.Horton定律及分枝网络结构的分形描述.水科学进展,1998,9(2):118~12325汪富泉.泥沙运动及河床演变的分形特征与自组织规律研究.四川大学博士学位论文,1999,9~1026RobertA,RoyAG.Onthefractalinterpretationofthemain-streamlength-drainagearearelationshipWaterResourcesResearch,1990,26(9):839~84227BarberaL,RossoR.Onfractalgeometryofrivernetworks.WaterResourcesResearch,1989,25(4):735~74128RossoR,BacchiB,BarberaPL.Fractalrelationofmainstreamlengthtocatchmentareainrivernetworks.WaterResourcesResearch,1991,27(3):381~38729Nikorav.Fractalstructuresofriverplanforms.WaterResourcesResearch,1991,27(6):1327~133330李后强,艾南山.分形地貌学及地貌发育的分形模型.自然杂志,1991,15(7):516~51931冯平,冯炎.河流形态特征的分维计算方法.地理学报,1993,52(4):324~33032傅军,丁晶,邓育仁.嘉陵江流域形态及流量过程分维研究.成都科技大学学报,1995,(1):74~7933Rodriguez-IturbeM,MaraniR,RigonARialdo.Self-organizedriverbasinlandscapes:Fractalandmultifractalcharacteristics.WaterResourcesResearch,1994,30(12):3531~353934MaraniA,RigonARialdo.Anodeonfractalchannelnetworks.WaterResourcesResearch,1991,27(12):3041~304935WhartonG,Tomlinson.Flooddischargeestimationfromriverchanneldimensions:resultofapplicationinJave,Burunda,GhanaandTanzania.HydrologicalSciences-Journal,1999,44(1):97~11036葛守西著.现代洪水预报技术,北京:中国水利水电出版社,199937陈绪坚,胡春宏.河流最小可用能耗率原理和统计熵理论研究.泥沙研究,2004,(6):10~1538陈立,张俊勇,谢葆玲.河流再造床过程中河型变化的实验研究.水利学报,2003,(7):42~5139齐璞,梁国亭.冲积河型形成条件的探讨.泥沙研究,2002(3):39~4340王明甫,陈立,周宜林.高含沙水流游荡型河道滩槽冲淤演变特点及机理分析,2000,(1):1~641夏军强,王光谦,张红武,等.河道横向展宽机理与模拟方法的研究综述.泥沙研究,2001,(6):71~7842王兆印,李昌志,王费新.潼关高程对渭河河床演变的影响.水利学报,2004,(9):1~843王兆印,林秉南.中国泥沙研究的几个问题.泥沙研究,2003,(4):73~8044张少文,王文圣,丁晶.分形理论在水文水资源的应用.水科学进展,2005,16(1):141~14645金德生,陈浩,郭庆伍.河道纵剖面分形—非线性形态特征.地理学报,1993,52(2):154~16146王协康,方铎,姚令侃.非均匀沙床面粗糙度德分形特征.水利学报,1999,(7):70~7447NikoraVI.Fractalstructuresofriverplanforms.WaterResourcesResearch,1991,17(6):1327~133348NikoraVI,SapozhnikovVB,NoverDA.Fractalgeometryofindividualriverchannelsanditscomputersimulation.WaterResourcesResearch,1993,29(10):3561~356848 第3章水文学的前沿科学问题水文系统由于受到天、地、气等多种复杂因素的影响和干扰,属复杂的巨系统。一般无法建立既完整又精确无误的机理过程模型,具有确定性与非确定性、线性与非线性、正态分布与非正态分布、静态与动态、定量与定性、平衡与非平衡等特征。本章主要引用我国丁晶、芮孝芳、夏军、左其亭等学者的总结和研究成果,介绍目前水文科学中的几个前沿的研究问题,包括水文的不确定问题、水文非线性问题、水文尺度与水文相似问题、人类活动对水文系统的干扰分析原理与应用、资料缺乏地区的水文计算问题和当前需要开展研究的重大水文科学技术问题。3.1水文的不确定问题3.1.1不确定性的涵义自然界存在着确定性和不确定性两类基本现象。确定性现象特点是已知初始状态,即可确知其未来状态;不确定性现象是已知初始状态,不能确知其未来状态。毫无疑问,水文现象具有不确定性。1996年,联合国教科文组织组织并召开了第3届国际水文计划和国际水文协会CeorgeKovacs研讨会。这次会议的主题是水资源系统的风险、可靠性、不确定性和稳健性。会议的中心问题是研讨风险、可靠性、不确定性等问题的新途径和未来应用的展望。1994年,我国在武汉召开了“全国首届水文水资源与水环境科学不确定性研究理论、新方法学术讨论会”。从目前研究来看,水文的不确定性主要包括随机性、模糊性、灰色性和未确知性。随机性、模糊性和灰色性的涵义如第一章所述。未确知性是指纯主观和认识上的不确定性。3.1.2不确定性研究的主要途径根据不确定性的类型,我国学者丁晶认为实际中研究不确定性问题有单一途径和耦合途径。单一途径是针对某一类不确定性问题进行的。由于往往是各种不确定性共存于水文系统,所以,必须结合各种方法,即耦合途径。以下将介绍丁晶教授对不确定性问题研究的总结。1.单一途径单一途径主要包括以下几种方法。(1)随机分析法处理研究对象发生与否的不确定性(随机性)。(2)模糊分析法处理研究对象概念的不确定性(模糊性)。(3)灰色分析法处理研究对象信息量不充分而出现的不确定性(灰色性)。(4)分形分析法处理研究对象形态和结构水文不确定但相似的特性。49 (5)混沌分析法处理研究对象运动变化中的混乱不定性(混沌性)。(6)粗集分析法处理研究对象不完整、不精确的信息所形成的不确定性。(7)人工神经网络分析法处理研究对象因极端复杂造成的不确定性。(8)子波分析法处理研究对象变化中的不确定性。2.耦合途径耦合途径主要包括以下几种方法。(1)随机和模糊分析的耦合。(2)随机和灰色分析的耦合。(3)模糊和灰色分析的耦合。(4)随机、灰色和模糊分析三者的耦合。(5)随机和混沌分析的耦合。(6)人工神经网络和混沌分析的耦合。(7)模糊和人工神经网络的耦合。(8)子波和人工神经网络的耦合。(9)子波和混沌分析的耦合。(10)子波和随机分析的耦合。3.2水文非线性问题水文现象的非线性问题研究是探索水文复杂性最为重要的理论问题,是水文科学研究的前沿课题之一。20世纪70年代后,水文系统理论方法得到了较快的发展。1973年,J.C.I.Dooge出版了专著《水文系统的线性理论》。1988年,V.P.Singh主编了《水文系统丛书》。长江水利委员会葛守西出版了《现代洪水预报技术》,较为系统地反映了我国在水文线性系统理论方法的研究。2002年,武汉大学夏军教授出版了《水文非线性系统理论与方法》,是我国第一部系统论述水文非线性系统理论与方法的学术专著,全书运用水文非线性系统识别理论与分布式水循环模拟等方法描述和处理水文过程与空间变化复杂性问题,建立了独具特色的水文系统非线性的理论体系,分别从水文循环非线性过程变化特征、水文非线性系统描述的泛函模型方法、集总式的水文非线性概念性模型途径,以及流域分布式水循环系统多个层面,阐述水文非线性系统模拟、水文预报、水量转换、水资源评价和水文-生态系统的特征与应用实例。本节引用夏军教授的专著《水文非线性系统理论与方法》以及马建华关于系统方法的论述来介绍水文非线性问题。3.2.1系统的涵义与系统方法1.系统的涵义据统计,系统(System)的涵义表达有30~40种。其中“一般系统论”的创始人L.vonBertalanffy关于系统的定义影响较大,他认为系统是处于相互联系中并与环境发生关系的各组成部分(要素)的总体(集)。我国著名科学家钱学森认为,系统是由相互作用和相互依赖的若干组成部分结合成的具有特定功能的有机整体。夏军教授认为系统是由若干个50 相互区别、相互联系和相互作用的元素组成,且处在一定的环境中为实现同一目标而存在的有机整体。从系统的定义可以看出,系统概念的理解必须对要素、环境、相互联系、结构和功能有一个全面的了解。(1)要素要素是系统的组成部分,是构成系统的基本单位。如生态系统是由各种植物、动物、微生物、无机环境等要素组成。水文循环涉及到降水、蒸发、散发、截留、下渗、存蓄和径流等复杂过程。一个系统的要素数目至少要有两个以上,一个要素是不能构成系统的。系统要素的范围是相对的,与系统的规模和复杂程度有关,即一个系统本身可以从属于另一个更大的系统,或者它可以由若干个小系统组成。(2)环境任何系统都具有明确的边界限制。系统外部具有的所有其他事物,称为该系统的环境。如水文系统,其周围的人类社会为它的环境。系统的边界有2种类型:①真实边界,如流域边界、水体的上下界等。②假想边界,其特点是根据研究需要而定义的抽象边界,如经济系统边界、文化系统边界等。(3)相互联系相互联系是指系统各要素之间以及系统与环境之间通过某种方式相互影响、相互制约、相互依存的关系。由于系统各要素间的相互联系,所以某一要素发生变化必然引起其他要素的改变,从而使系统表现为一个有机整体。如流域进行大规模的水土保持治理,其下垫面发生变化,则会影响径流的产生。(4)结构系统的结构是指系统内部各要素相对稳定的组织形式(秩序)或分布关系的总称。根据系统要素的组织或分布方式,系统结构可分为3种基本形式:①空间结构指系统各要素在空间的排列组合或分布。如水系结构。②时间结构指系统各要素随时间的进程所表现出的有规律变化或分布形式。如水文系统各要素的季节周期变化和多年平均周期变化。③时空结构即系统时间结构和空间结构的统一。系统的时空结构更具有普遍性。(5)功能功能是系统内部各要素之间的活动关系的总称,如图3-1所示。系统内部各要素活动关系的表现形式多种多样,但最终都体现在系统把接受的环境作用(输入)转换为系统对环境作用(输出)的能力,即系统对输入的相应能力。如水分—土壤—植物系统中的水文循环,降水进入这个系统后将在太阳能、地球引力和土壤、植物根系产生的力场等作用下,发生截留、填洼、下渗、蒸发、散发等,最后形成径流。u1系统y1u2(要素、相互联系、结构)y2……状态变量x1,x2,…,xnunyn图3-1系统功能示意图2.系统的数学描述多年来,人们一直致力于系统的普适性数学描述。以下介绍系统的两种数学描述方法。(1)贝塔朗菲微分方程式贝塔朗菲微分认为,系统是相互作用着的一系列要素pi(pi=p1,p2,L,pn)的集,各51 要素的性质可用一系列定量测定的量Qi(Qi=Q1,Q2,L,Qn)来表征。各要素之间的相互作用是指若干要素(p)处于若干关系(R)中,以致一个要素p在R中的行为不同于它在另一个关系R′中的行为。如果要素的行为在p和R中无差异,那么就不存在相互作用,要素的行为就不依赖于p和R。根据上述理解,贝塔朗菲用一组联立微分方程式来描述一般系统的概念。dQ1⎫=f1(Q1,Q2,LQn)⎪dt⎪dQ2⎪=f2(Q1,Q2,LQn)⎪dt⎬(3-1)LLLLLLLLLL⎪⎪dQn⎪=fn(Q1,Q2,LQn)⎪dt⎭上式说明,系统内任何要素性质Qi的变化均是Q1,Q2,LQn的函数,它的变化都会引起所有其他量以及整个系统的变化,任何要素的变化同样都会依赖所有其他要素的变化,系统是一个统一整体。式(3-1)也可简写为dQi=fi(Q1,Q2,LQn),i=1,2,L,n(3-2)dt(2)林福永方程式我国学者林福永认为,系统Z(n)是由n个存在关联的部分e(1),e(2),L,e(n)构成的整体,其数学表达式可以表示为{}*Z(n)=E(n),RZ(3-3)*式中,RZ表示部分e(1),e(2),L,e(n)间存在的关联集合,E(n)表示各部分或要素的集合,即E(n)={e(i)},i=1,2,L,n,n≤2(3-4)上式说明,系统是要素集合和要素关系的总体。系统的存在状态可记为SZ=ψS(S,R,Sin)(3-5)式中,SZ表示系统的状态,ψS表示与环境有关的函数,S为系统所处环境的状态,R为环境向系统的输入,Sin为系统原有的内部状态。上式说明,系统的状态是系统输入、系统内部状态和系统所处环境的函数。3.系统的性质系统性质就是系统质的规定性,也称系统的特性。系统之所以存在,是由于它们的对象之间具有特殊性或个性。作为一般系统,除系统个性外,还存在共同的性质。(1)整体性系统的整体性是指系统内部各要素之间相互联系、相互制约,共同构成一个有机整体,某要素的变化会引起其他要素变化乃至整个系统变化的性质。如黄土高原流域水文系统,大规模的植被破坏会引起生物的截留和蓄水能力下降,地表径流增加,土壤侵蚀增大,地力下降,生物衰退,大气湿度减小,气候干旱加剧,出现整个系统的逆向演化。52 (2)稳定性系统稳定性也称自稳性,是指系统性质在一定的干扰下不发生相应改变,或发生改变后可以自动恢复到原来状态的性能。干扰包括外部干扰和内部干扰。外部干扰指系统范围之外环境条件的随机干扰;内部干扰指系统内部某些要素的随机干扰。内外干扰可使系统状态和属性在其平均值附近发生波动性变化,这种变化称为涨落。一个系统产生涨落是必然的,但涨落的大小则具有随机性。涨落可分为内涨落和外涨落。由系统内部原因形成的涨落称为内涨落,系统外界环境原因形成的涨落称为外涨落。因此,系统的稳定性就是系统抵抗或抑制系统内外涨落的性能。(3)层次性系统内部每个要素在系统中的作用往往不是同等的,某些要素起主导作用,某些要素起次要作用。根据要素在系统中作用的大小,将系统划分为一系列不同等级或规模单元的性质称为系统的层次性。系统的层次性说明了系统是由要素构成的,要素就是该系统的子系统,而要素本身又是由更低一级的子系统构成的。(4)开放性系统的开放性是指系统与其环境发生物质、能量和信息交换的性能。这里交换包括两个方面。1)系统从其周围环境得到(输入)物质、能量和信息;2)系统向环境释放(输出)物质、能量和信息。如流域地表土壤系统与环境间的水分交换。环境向土壤系统输入的水分包括大气降水、灌溉水、地表径流渗入、气态水凝结,土壤内部的水分侧流渗入、地下水沿毛管上升到达土壤的水分等。土壤系统向环境输出的水分包括地面蒸发、植物蒸腾、地表径流流出、土壤内部的水分侧流流出及下渗等。从长时间尺度来看,土壤系统与环境间的水分交换是平衡的,即水分输出量和输入量是相等的,这就是土壤水量平衡规律。(5)动态性系统状态随时间不断变化的性质称为系统的动态性。系统变化是绝对的,不变化是相对的,其动态性有多种形式。1)周期性变化和随机性变化周期性变化是指系统状态和性质按照严格的时间间隔重复出现的变化,如水文系统中径流、水位的日变化、季节变化、年变化和多年周期变化。随机性变化是指系统状态和性质由于偶然因素引起的无固定时间间隔的变化,如水文系统中旱涝灾害的发生。2)线性变化和非线性变化线性变化是指系统各要素间以一次方关系一一对应的变化。如水文系统中,在一定的数值范围,降水量与土壤含水量之间的关系可看作是线性关系。实际上,系统中各要素之间的关系主要是非线性关系。非线性关系是指系统各要素间存在非一次方关系变化。如水文系统中,降雨与径流之间的非线性关系。3)渐进型变化和突变型变化系统演变遵循“量变到质变”规律。量变是在不影响系统本质特征的情况下,系统内部组成、性质数量上的变化表现为一种缓慢的、连续的和逐渐过渡的变化。质变是量变达到临界点时,系统所发生的本质特征变化表现为一种快速的、不连续的飞跃式变化。如气温的上升与下降为渐进型变化,河流洪水发生,其水位和流量的突然上涨和增加为突变型变化。(6)自组织性系统的自组织性是指无组织(完全无序)系统或低级组织(有序程度低)系统在没有外部力量强行驱动的情况下,仅由系统内部各要素之间的协同作用或联合行动,使系统在空间、时间和功能上出现低级组织系统或高级组织(有序程度高)系统的性质。这里的组织就是系统各要素在空间、时间和功能上出现的有序结构。如激光,当外53 界向气体激光器输送的能量没有达到某个特征值时,每个活性原子都独立地、无规则地发射光子,光子的频率和位相都是无序的,整个光场系统处于无序状态;输送的能量达到某个特征值时,激光器突然发射出单色的、方向一致的激光,它的频率和位相完全相同。激光是激光系统在空间和功能上的自组织特例。(7)目的性系统的目的性是指系统追求有序稳定结构的性质。它是系统自组织的必然结果,系统的自组织能力越强,系统的目的性越显著,反之,系统的目的性表现则不明显。系统追求有序稳定结构的性质是由系统的自身需要决定的,因为只有达到有序稳定的结构状态,系统的功能才能最大限度的发挥,否则系统将逐渐解体或崩溃。(8)同型性同型性也称同构性,指各种不同具体系统之间在存在方式或运动方式上的一致性或相似性。根据这一性质,我们可以用同一理论或数学模型描述不同性质的具体系统。如分形理论可以描述水系形态、海岸线形态等。前述关于系统的整体性、稳定性、层次性、动态性、开放性、自组织性和目的性都是系统同型性的有力证据。4.系统的分类系统目前尚无统一的分类,不同学者根据研究问题的侧重点和目的,形成了不同的分类。以下介绍我国学者马建华、管华对系统分类的总结。(1)按系统内容划分1)天然系统、半天然系统和人工系统天然系统是指很少受人类活动影响或影响非常轻微的系统,系统按照自身特有的规律运动变化着,几乎不受人类活动影响,如银河系、太阳系,人迹罕至的高山和沙漠等等。半天然系统是指在天然系统的基础上,叠加有相当程度的人类活动影响的系统,如放牧的草场、采育的林地、捕捞作业的渔场、受污染的河流与大气等等,系统的运动规律已受到人类活动的严重干扰,出现了有别于天然系统的发展变化规律。人工系统是在天然系统和半天然系统的基础上,由于人类活动强烈影响使自然面貌发生了重大改变的系统,或纯粹由人工制成的系统。例如,由人类活动彻底改变了原有自然面貌的农田、城市、水库等等;诸如机器设备等人工建造物;由一定组织、制度、程序等构成的各种管理系统和社会系统等;人类认识活动产生的科学体系和技术体系等等。人工系统的运动变化规律已与天然系统和半天然系统出现重大差别,出现了自身的发展变化规律。2)自然系统、社会系统和思维系统自然系统是由自然界的自然物构成的系统,其支配规律是自然规律。通常自然系统又分为物理系统和生物系统,前者是物理学、化学、天文学、地学的研究对象,后者是生物学的研究对象。社会系统是由人类社会及其活动构成的系统,它既可指整个人类社会,也可指社会系统中的各个子系统。社会系统包括政治系统、经济系统、军事系统、教育系统、行政系统等。社会系统是社会科学研究的对象。思维系统是由人的精神、心理、语言、文字、逻辑、思维方法以及其他思维工具构成的系统,思维系统是思维科学的研究对象。3)实体系统和概念系统实体系统也称硬系统,它是以物质(或能量)实体为要素构成的系统,如原子、分子、生物、大气、土壤、海洋、湖泊、沼泽、冰川、河流、山脉、丘陵、平原、岩石、机关、工厂、学校等都是实体系统。与实体系统相对应的是概念系统,它的构成要素不是实体而是概念,因此也有人称之为软系统。所谓概念系统是由各种思想、理论、定理、原理、方法、判据、制度、程序、规范、符号等在一定概念领域内有序组合54 构成的系统,如哲学系统、各种管理系统、信息系统、法律体系、道德规范体系等等就属于概念系统。实体系统和概念系统之间存在着某种对应关系。实体系统的要素是各种硬件,而这些硬件之所以能结合成一个系统,是因为有了相应的软件。也就是说,每一个实体系统都有与之相对应的概念系统,每一个概念系统也都有与之相对应的实体系统。以人工系统而言,要想使其有效地发挥作用,必须将实体系统和概念系统有效地结合在一起。例如,要想使一个水库高效运行,除有工程配套的基础设施(硬件系统)外,还必须有相应的水库调度规则和管理方法(软件系统)。(2)按系统与环境的关系划分根据系统与环境之间的关系,可将系统划分为孤立系统、封闭系统和开放系统。1)孤立系统孤立系统是指系统与环境之间既没有物质也没有能量交换的系统。这种系统在自然界是不存在的,类似的孤立系统只能在人工制造的仪器中出现,如一个密封很好的暖水瓶就可以近似地被看作是一个孤立系统。2)封闭系统封闭系统是指系统与环境之间只有能量交换而没有物质交换的系统。严格意义上的封闭系统在自然界也是不存在的,类似的封闭系统只能在实验室中存在。例如,一个密封完好的钢瓶或饮料瓶可以近似地看作是封闭系统。3)开放系统开放系统是指系统与环境之间既有物质又有能量交换的系统。开放系统在自然界和人类社会中是广泛存在的,大到地理系统、生态系统,小到一只昆虫、一个气体分子都是开放系统。(3)按系统的规模和复杂程度划分1)渺观系统、微观系统、宏观系统、宇观系统和胀观系统根据物质系统的空间尺度大小,可将系统分为渺观、微观、宏观、宇观和胀观系统五类。各类系统的空间尺度为:-34-152524渺观系统10cm;微观系统10cm;宏观系统10cm;宇观系统10ly;胀观系统10ly。12这里ly为光年,1ly=(9.46051±0.00009)×10km。2)小系统、大系统和巨系统按照组成系统的子系统多少,把系统分为小系统、大系统和巨系统三类。目前,关于这一分类还没有统一的标准,现以钱学森(1990)的观点作一简单介绍。组成系统的子系统数量较少,只有几个或十几个,并且子系统之间的关系比较单纯的系统叫小系统,例如,简单测量仪器、一个书桌、一支钢笔等非生命系统就是小系统。大系统是指子系统数量相对较多,一般为几十个到几百个,并且子系统之间的关系相对比较复杂的系统,例如,一个工厂、一个学校、一台计算机、公共服务系统、电力系统、卫生系统等就是大系统。巨系统是指子系统的数量非常巨大,一般是成千上万、上亿、上百亿甚至上千亿和万亿,并且子系统之间的关系也非常复杂的系统,例如,地理系统、人脑系统、自然经济社会可持续发展系统等等都属于巨系统。目前,精确表征和描述巨系统的方法还不成熟,存在很多人类未知的因素和关系,有待进一步研究。就当前人类的认知能力来说,“从定性到定量的综合集成法”是处理巨系统的最有效的方法。3)简单系统和复杂系统颜泽贤等(1993)在《复杂系统演化论》中对简单系统和复杂系统曾作过比较详细的论述,认为复杂系统主要具有如下一些特征。复杂系统层次结构多且不易明确区分,而简单系统为单一层次或层次结构简单且清晰易辨。如一块花岗岩由长石、石英和云母三大类矿物组成,它们同位于一个层次上,且颜55 色、光泽、化学组成和硬度都有明显区别,故它属于简单系统。而一只麻雀,虽然个体很小,但其结构层次多,如细胞、组织、器官、器官系统和个体层次等,且各层次之间的界限是模糊的,故它属于复杂系统。复杂系统各层次或同一层次的不同要素对系统的作用是不等同的,而简单系统同一层次的不同要素对系统的作用基本上是一致的,不同层次对系统的作用差别较小。如花岗岩的三大组成中任何一种矿物对花岗岩系统的构成都是一样的;而对麻雀个体系统来说,器官系统的重要性远大于单个器官或组织,如神经系统对消化系统、运动系统、呼吸系统等具有控制作用。复杂系统高层次要素的稳定性大于低层次要素的稳定性,而简单系统各层次要素的稳定性均较弱。复杂系统的层次结构呈金字塔状,低层次的要素数量众多,也易受到干扰,变化较大,而高层次的要素与其他低层次很多要素有错综复杂的联系,对干扰的抵抗力强,表现出稳定少变的性质。例如,麻雀身体某一部位的皮肤遭受伤害后,可以自动修复,不至于使其生命终止。简单系统本身的层次结构比较简单,易受干扰,稳定性相对较差。例如,暴露在空气中的花岗岩易受外界温度变化和生物活动的影响,发生风化作用使其破碎、变小。4)简单巨系统和复杂巨系统按照钱学森(1990)的观点,巨系统中子系统数目相对较少且关系相对简单的系统叫简单巨系统,如激光系统。相反,巨系统中子系统众多,层次结构复杂,彼此空间的关系十分复杂的系统叫复杂巨系统,如生物体系统、人脑系统、社会系统、地理系统和星系系统等等。对于简单巨系统,已经有了比较理想的处理办法,如建立在统计力学基础上的耗散结构理论和协同论等。对于复杂巨系统,目前,只能采用“从定性到定量的综合集成方法”。(4)按系统的运动状态划分1)静态系统和动态系统根据系统状态和行为与时间的关系,可将系统划分为静态系统和动态系统。静态系统也叫无记忆系统,它是指任一时刻的输出只与该时刻的输入有关,而与该时刻之前的输入无关的系统,例如,固定电阻的电流仅与该时刻的电压高低有关,而与系统以前的电压高低无关,这种系统就是静态系统。动态系统也叫有记忆系统,它是指任一时刻的输出不仅与该时刻的输入有关,而且还与该时刻之前的输入有关的系统,例如,由教师、学生、教材、实验设备等构成的教学系统,教学质量的高低除与现时教师的教学水平有关外,还与学生过去的知识积累有关。就现实系统来说,几乎全部是动态系统,静态系统只是现实动态系统的一种近似处理。所以,在现实系统中,动态系统是一般情形,静态系统只是动态系统的一种特例。2)稳态系统和非稳态系统根据系统稳定性大小,可将系统分为稳态系统和非稳态系统。稳态系统是指外界干扰较小,系统偏离正常(稳定)状态后可以自动恢复到原有正常(稳定)状态的系统。相反,非稳态系统是指外界干扰较大且到达临界点附近,系统较小的涨落即可驱使系统发生质变,永远不能恢复到原有状态的系统,例如,人类合理经营森林,采育结合,使砍伐量限制在植物生长量之内(弱干扰),这种干扰将不影响系统的整体功能,系统可以得到自动恢复,表现出稳态系统的特点;反之,人类持续大量砍伐森林(强干扰)到达一定程度时(临界点),林木将不能正常更新,森林景观将被草原景观或其他景观取代,表现出非稳态系统的特点。56 3)线性系统和非线性系统根据输入与输出之间的关系是否满足叠加原理,可将系统划分为线性系统和非线性系统两类。所谓线性系统是指把系统的输入线性叠加时,其输出也能线性叠加的系统,描述这类系统的数学模型的参数为一次方。所谓非线性系统是指系统的输入与输出之间不满足叠加原理的系统,描述这类系统的数学模型的参数中至少有一个不是一次方。在现实系统中,真正的线性系统是不存在的,一般都含有各种非线性因素,使系统成为非线性系统。因为非线性微分方程至今没有通用的解法,所以当其变量保持在一定数值范围时往往将其视为线性系统,从而求得精确解。但是,这种解不能真正代表非线性系统的规律,特别在处理大系统、巨系统和复杂系统时,必须考虑非线性因素的作用。4)连续系统和离散系统根据系统输入与输出是否连续变化,可将系统划分为连续系统和离散系统。连续系统是指系统输入的连续变化,其输出也呈连续变化的系统。反之,对于系统输入的连续或不连续变化,系统的输出呈现出不连续变化的系统叫离散系统。可见,连续系统的状态随时间呈连续性变化,离散系统的状态随时间呈不连续性变化。对于连续系统,因为系统的输入、输出和状态变化是时间的连续函数,因此可用微分方程来描述;对于离散系统,因为系统的输入、输出和状态变化是各离散时刻的函数,因此可用差分方程来描述。5)确定性系统和非确定性系统根据系统输入能否明确判断系统输出,可将系统划分为确定性系统和非确定性系统。某一时刻的状态和输入一经确定,下一个时刻的状态和输出就明确的、惟一决定的系统叫确定性系统。例如,太阳系中的行星围绕太阳的公转运动,只要知道某一时刻某一行星在其公转轨道上的位置,那么就可以明确地断定以后任一时刻,该行星在轨道上的位置。确定性系统的这种属性反映了事物的精确性、必然性和确定性的一面,表明了事物之间存在的肯定因果联系。显然,对于确定性系统来说,我们可以通过建立数学模型,准确地预测系统的未来状态,在人类认识自然和改造自然中具有重要理论和实践意义。某一时刻系统的状态和输入一经确定,下一个时刻的系统状态和输出不能明确的、惟一决定的系统叫非确定系统。如城市交通系统、生态系统、气象系统、经济系统等等都是非确定性系统。非确定性系统的这种属性反映了事物的复杂性、随机性、偶然性、模糊性和不确定性的一面,表明了某些事物具有不可准确预测的性质。但是,经过人们长期艰苦的探索,目前已经掌握了一些处理非确定性系统的方法,如系统方法、统计方法、模糊方法等等都是研究非确定性系统的有效方法。事物的不确定性至少包括两种情况,一是随机性;二是模糊性。所谓随机性是指系统的输入可能导致多种不同的输出,系统究竟选择哪种结果,事先是不确定的。模糊性是指系统所表述的事件在概念或命题的内涵和外延上的不确定性。例如,据天气预报,某地区明天出现降水的可能性为90%,降水量在30~50mm之间,降水时间在12~14h之间,在这里,降水事件的概率为90%,表明了事件的随机性;降水量在30~50mm之间,降水时间在12~14h之间,表明了降水量和降水时间的模糊性。所以,非确定性系统又可划分为随机系统和模糊系统。在非确定性系统中,根据系统某一时刻的状态与输入能够确定下一时刻系统状态和输出的概率分布的系统叫随机系统,否则称为非概率不确定性系统。模糊系统是在非概率不确定性系统中,系统的状态、输入和输出有一定模糊性的系统。随机系统可用概率和数理统计的方法进行处理,模糊系统可用模糊数学的方法进行处理。57 (5)按人类对系统的认知水平划分根据人类对系统内部结构和过程的了解程度,可将系统划分为黑色系统、白色系统和灰色系统。对系统完全不了解时称“黑色”,对系统完全了解时称“白色”,对系统半了解半不了解时称“灰色”。1)黑色系统黑色系统是指人们只知道输入和输出关系,而不知道内部组成、结构和过程的系统。这就好像一个不能被人们打开进行研究的箱子,人们对其内部组成、结构和过程一无所知,内部漆黑一团,故又称黑色系统为黑箱系统。例如,人们对地球内部组成和状态的认识,是通过地震波在地球内部的传播差异获得的,人们只能在地球表面进行观测,尚无法深入到地球内部开展直接观察,因此地球内部系统就是黑色系统。2)白色系统白色系统是指人们不仅知道输入和输出关系,而且还知道内部组成、结构和过程的系统。这就好像一个能够被人们打开进行研究的箱子,内部的组成、结构和过程大白于天下,故又称白色系统为白箱系统。例如,一台非常复杂的电子计算机,虽然外行人看起来神奇无比,但对专业人员来说,不仅知道其元件组成,而且还知道它的工作原理,因此它是一个白色系统。3)灰色系统灰色系统是指人们已经知道输入和输出关系,但对内部组成、结构和过程并不十分清楚的系统。因人们对它的了解介于黑箱和白箱之间,故也称之为灰箱系统。例如,对水文系统来说,人们不容易完全获得气候、水文、生物、地貌和土壤的信息,更不容易获得彼此之间的确切关系,因此可以将它看作灰色系统。随着科学技术的发展,特别是系统科学的发展,人类对各类系统的认识水平是不断提高的,所以黑色系统、白色系统和灰色系统是相对的,不是一成不变的。在一定条件下,黑色系统可以转变为灰色系统,灰色系统可以转变为白色系统。例如,在很早以前,人们对土壤能够生长植物感到不可思议,认为是一种超天然的神奇力量在起作用,用现在系统科学的语言来说,土壤就是一个黑色系统。随着土壤学的发展,现在我们已经明白了土壤之所以能够生长植物是由于土壤具有肥力,并且也已经明白土壤肥力是由水、肥、气、热四大土壤肥力因子构成的,这样,土壤对人类已不再是黑色系统了,而变成了灰色系统。就现在人类的认知水平而言,纯粹的白色和黑色系统是少见的,大量出现的是灰色系统。5.系统方法系统方法,就是把对象放在系统中加以考察,着眼于从整体与部分(要素)之间,整体与外部环境的相互联系、相互作用、相互制约的关系中综合地、精确地考察对象,以达到最佳处理问题的一种方法和途径。主要途径是应用运筹学、概率论、信息论以及控制论定量地描述对象的运动状态和规律。近些年来,系统理论本身也在不断地发展,一些研究大系统、复杂系统的新学说应运而生。如普里高津提出的旨在研究系统从有序到混沌和混沌到有序基本现象的耗散结构理论,哈肯的协同论,查德首创的模糊数学方法,以及我国学者邓聚龙提出的灰色系统理论等。他们基于不同角度提出的新观念、新方法,更加丰富了系统论的内容。3.2.2水文系统的概念及分类水文系统是地球大气圈环境内由相互作用和相互依赖的若干水文要素组成的具有水文循环(演变和转换)功能的整体。从系统观点出发,水文系统包括三个部分:输入(降58 雨)、输出(径流)和系统状况。根据系统的特性,水文系统可以分为线性与非线性、时变与非时变、集总参数与分散参数、确定性与不确定性等系统(夏军)。1.线性与非线性系统当一个系统的输入与输出之间关系满足齐次性和叠加性,这个系统就是线性的。反之为非线性系统。所谓系统的齐次性是指:若系统的输入为X(t)有输出Y(t),则当输入X(t)为标量a倍数时(即aX(t)为输入)输出是aY(t)。叠加性意味着:当输入X1(t)对应有输出是Y1(t),X2(t)对应有输出Y2(t),则把X1(t)+X2(t)作为输入,也有输出Y1(t)+Y2(t)。从数学观点看,线性系统就是服从线性方程的系统,例如,某流域的平均降雨X(t)与出口断面流量Q(t),假定满足下列线性微分方程:dQ+aQ=bX(3-6)dt式中,a、b为模型参数。假定有两个不同输入X1(t)和X2(t),其出口断面流量分别为Q1(t)和Q2(t),按照式(3-6)有dQ1+aQ1=bX1dtdQ2+aQ2=bX2dtd(Q1+Q2)以上两式相加,有:+a(Q1+Q2)=b(X1+X2)。所以,该流域的降雨径流dtdQ2为线性水文系统。如果X(t)~Q(t)满足下列非线性微分方程+aQ=bX,可证明不满dt足叠加性,即该流域的降雨径流为非线性水文系统。国内外大量的研究成果表明,水文过程的非线性是客观存在的,其变化机理比较复杂,它们在整体上表现为降雨—径流的关系不满足线性叠加原理这一特点。2.时变与非时变系统具有随时间而变化参数的系统叫做时变系统。这种系统通常用具有时变系数的系统方程来描述。相反,不随时间而变化的系统是非时变系统(亦称定常系统)。非时变系统通常用定常系数微分方程或积分方程来模拟。式(3-6)中模型参数a、b均为常数,则其描述了非时变系统。如果至少有一个参数具有时间的函数,这样的系统就是时变系统。3.分布系统与集总系统系统的输入和输出不仅随时间变化,而且随空间分布变化,这样的系统称为分布系统,这类系统模型多用偏微分方程描述。如沿程变化的明渠非恒定流,可用S.V方程组描述。反之,系统的输入、输出或参数不存在空间变化的称为集总系统,这类系统一般用常微分方程描述。中小流域的降雨—径流关系可以近似看作为集总系统。而大、中流域,由于存在明显的降水空间分布,一般需要概化为输入分布系统。4.确定性系统与不确定性系统系统的结构和参数以及与输入/输出的关系是确定的,系统的状态仅取决于系统的初始条件和边界条件,这样的系统称为确定性系统。如描述河流的非恒定水流运动系统。另59 一方面,在实际中,系统的过程可能很复杂,存在一些变量分布未知的或取值不确定的参数,如随机变量、模糊量或灰色数等。一个系统若有一个以上的不确定性变量或参数,就称为不确定性系统。对于一个真实的流域而言,由于径流过程的形成要受到气象(如降雨、蒸发)、下垫面地形地貌、土壤地质以及人类活动等多种因素的制约和影响,水文系统一般具有非线性、时变、分布和不确定性的特性。但在实际工作中,人们往往依据系统分析允许的范围,进行一些抽象和简化,如假定为线性、时不变、集总和确定性的,以便分析、计算和应用。3.2.3水文系统非线性的研究方法水文非线性系统分析理论包括水文非线性系统描述(SystemRepresentation)和非线性系统识别(SystemIdentification)两类基本的问题(夏军)。系统描述主要是根据水文现象的观察、观测以及具有的物理知识或认识,研究建立能够近似原型(结构概念化)和描述水文系统输入—输出关系的数学模型类。系统识别亦称系统辨识,它是利用系统的观测试验数据和先验知识,研究建立系统的数学模型和估计参数的理论和方法的总称。水文系统识别就是从一类模型中选择一个特定的模型,使所选模型的描述在数学上与相应的原型系统相“等价”。在水文科学研究和解决水的问题实际需求中,所涉及的水文模拟、水文预报、水资源评价、防洪决策、可持续水资源管理等,都与这两类基本的水文系统问题有直接的联系。1.水文非线性系统描述水文非线性系统的描述采用水文数学模型。针对不同的目的,水文非线性系统描述可以有不同的途径与方法。从微观过程科学研究探索的目的出发,一般采用数学物理方程描述。另一方面,从水文模拟预报的实时性、有效性目标出发,往往需要把握系统的整体关系,主要有基于非线性系统理论的数学描述方法。根据不同的研究方法和途径,水文非线性模型可以分为数学物理模型、非线性系统理论数学模型、简单的概念性水文模型和分布式流域水循环模型。(1)非线性水动力数学模型微观尺度水文问题多采用非线性水动力学的数学物理方法描述。这类模型一般为偏微分或一组偏微分非线性数学物理模型,它的求解问题通常是不解析的。由于水文现象的复杂性和随着水文尺度扩展,因此,原来的“理论”模型需大量简化和再参数化。再参数化就是将原系统某部分变量进行空间或时间积分,用某个均化的特征参数代表。如流体力学中著名的Navier-Stokes方程(N—S方程),其分量形式为⎛∂u∂u⎞∂p∂2uρ⎜i+ui⎟=F−−µi(3-7)⎜∂tj∂X⎟i∂X∂X∂X⎝ij⎠iij式中,ui、uj分别为Xi、Xj方向流速;Fi为水体质量力在Xi方向的分力;ρ为水体密度;µ为黏性系数;p为动水压强。在土壤水运动研究中,对雷诺数Re小于1的多孔介质水流,N—S方程可简化为60 2∂ui∂pµ=Fi−(3-8)∂Xi∂Xj∂Xi实际工作中,“理论”模型参数化往往带有经验性和非惟一性以及线性与非线性的转化问题。(2)非线性系统理论数学模型流域可视为一个水文系统,降雨可看作系统输入X(t),出口断面的径流可看作系统输出Y(t)。如果主要关心的是降雨径流的因果关系,二者的转换过程可视为系统的运用或响应。相互联系可写为Y(t)=H[X(t)],H为系统的运用算子(如图3-2所示)。(流域)X(t)Y(t)H系统运用输入输出(环境)图3-2输入、输出与系统算子关系图在线性系统理论中,确定性、非时变、整体的模型可由卷积方程来表达t(3-9)Y(t)=∫h(τ)X(t−τ)dτ0式中,h(τ)为瞬时单位线,亦称线性核函数。非线性系统理论模型主要涉及到建立系统(或子系统)输入—输出非线性关系的数学模型。它通常以水文过程论述的非线性泛函或算子方程来表示。目前,大体上有两类途径。1)变动核函数方法变动核函数方法描述系统方程为ty(t)=∫h[]x(t−τ),τx(t−τ)dτ(3-10)0由于核函数不满足比例性,系统输出相对输入是非线性的,不满足叠加性。J.D.Ding等人曾对该途径进行过研究。我国水文界一直延用的单位线非线性校正也属于此范畴。2)Volterra泛函级数方法h1h2Y(t)┇U(t)Y(t)X(t)∑输出流域系统降雨径流输入hn┇(a)(b)图3-3非线性系统泛函数级数分解图Volterra泛函级数方法,亦称响应函数法。对于一个非线性的流域系统(如图3-3(a)所61 示),一般的非线性系统方程为ttty(t)=∫h1(τ)u(t−τ)dτ+∫∫h(τ1,τ2)u(t−τ1)u(t−τ2)dτ1dτ2+L000nmtt=∑∫L∫hn(τ1,L,τm)Cu(t−τj)dτ1dτ2Ldτm(3-11)00m=1j=1式中,h1,h2,⋯,hn称为一阶,二阶等核函数,其阶数表示系统的非线性响应程度。显然,非线性系统(3—10)是它的一个子类,输出Y(t)相对输入X(t)是完全的非线性关系。该类模型给出了降雨径流的直接关系。各子系统一目了然的输出过程,为直观分析流域系统的线性与非线性提供了可能。同理,若采用微分算子描述系统的动态关系,就有下列微分方程模型:ndydya0(y,u)n+L+an−1(y,u)+an(y,u)ydtdtmdudu=b0(y,u)m+L+bm−1(y,u)+bm(y,u)(3-12)dtdt式中,ai(⋅)、bi(⋅)为非线性参数。系统理论模型的特点是直接描述系统输入(或状态)—输出之间的因果关系。系统的特征及动态行为主要由系统的功能函数如hn(⋅)或F(⋅)、H(⋅)等表达。这类模型的结构和参数不是验前就假定好了的,而是依据原型的观测信息通过系统识别来确定的。它不受验前假定的限制,可避开许多复杂中间环节构想,具有适应环境变化,便于使用等优点。因而在流域洪水特性分析、实时洪水预报等方面应用较多。就方法而论,系统理论模型属“黑箱”分析范畴。它最适用于一些复杂系统,即内部结构不便直接观测,水文中间环节信息较贫乏(物理机制不太清楚),但可以从外部行为数据去认识的系统。(3)概念性水文模型在降雨径流描述中,将流域内的结构设想为有水文逻辑关系的元素排列,其中各元素有一定的物理概念(或经验关系),这种模型称为概念性水文模型。20世纪70年代以后,按照土壤水分运动和坡面河槽汇流概念而构想或假定的集总或分散的流域水文模型(如国外斯坦福模型、萨克模型和国内新安江模型等)即属此类。基于系统分析观点,若将流域构想为一简单元素的排列,其中各元素具有简单的物理或水文学概念,这样的描述称为简单的概念性水文模型。有关水文模型介绍参见第6章。在研究方法上,概念性水文模型属于“灰箱”的分析范畴,它利用一定的验前知识将流域划分为两个部分:确定的概念和假定的结构,以及有待确定的参数。概念性模型可以对系统内部机制作出部分描述或解释,因而易被水文工作者接受。但是,若子结构划分得愈细,模型就愈复杂,其可用性就降低。另外,由于验前知识不完备,概念性水文模型仍需用观测或试验资料识别参数(也称估计)。(4)分布式水循环模型研究自然变化和人类活动影响下的流域水文循环过程,需要借助具有物理机理的流域分布式水文模型(见第6章)。流域分布式水文模型在我国才刚刚起步,而且国外现有的62 几个模型也存在很大的局限性,有些并不适合我们国家现有的数据条件,因此,有必要在借鉴国外先进模型的基础上,利用水文非线性理论和现代科学技术(尤其是计算机和“3S”技术),研制适合我国国情的基于DEM的流域分布式水文模型。这是水文非线性系统理论一个新的发展方向。3.3水文相似与水文尺度问题本节引用我国丁晶,任立良,左其亭,王文圣,刘建梅,刘贤赵等学者的总结和研究成果,介绍水文相似与水文尺度问题。3.3.1水文相似水文现象中普遍存在的三种水文相似——统计相似、自相似和动态相似。1.统计相似研究表明,水文现象所遵循的统计规律在绝大多数情况下,呈P-Ⅲ型分布。换言之,各种尺度下的水文变量能以一种P-Ⅲ型的统计分布模式概括性表示。例如,大小流域的洪水都可以P-Ⅲ型频率分布曲线表示,又如长短历时的降水均可以这种曲线表示。水文变量的空间和时间尺度尽管差异很大,但统计分布却显示出惊人的相似。一般将这样的相似性称为统计相似性。水文统计相似性的确切含义是指水文变量虽然受尺度的影响,变化不一样,但是统计分布类型却是一样的。然而,由于统计分布曲线参数的差异,不同的水文变量显示出不同的分布曲线。这就是说,水文变量的时空尺度一般不影响分布类型,而尺度通过影响分布参数等而造成分布曲线有所不同。例如,大、小流域洪水的统计变化均服从统计规律P-Ⅲ型分布类型,但是大流域的洪水分布曲线和小流域的洪水分布曲线却是不同的。短历时和长历时的降水分布的统计变化均可以P-Ⅲ型曲线表征,但二者的分布曲线完全不一样。分布曲线的差异一方面取决于水文变量的类型(洪水、降水等),另一方面取决于水文变量的尺度(空间尺度和时间尺度)。就同一种水文变量而言,分布曲线的差异主要是尺度所引起。因此,水文变量的统计相似性为尺度分析提供了基础。在此基础上作尺度分析的关键在于设法消除因尺度引起的统计分布曲线之间的差异,从而建立起一种与尺度无关可转换的分布曲线。2.自相似自相似性源于分形。分形中的自相似性是指研究对象,其局部和整体之间存在着相似性。按照分形理论在一定尺度范围内,具有自相似性的对象,其某种统计量在不同尺度下的相互关系决定于一种简单变换——标度变换。3.动态相似自相似性多涉及空间尺度,而且是静态的。当探求的重点转移到研究水文现象随时间而变的特性上时,就要从静态转移到动态,即要在动态相似性的基础上,研究尺度分析的问题。水文动态相似性的概念可以定性地叙述为:假设一个水文对象,具有分形性,而且当该对象随时间演变时,在所有的时刻均具有分形特性。在这样的假设条件下研究对象空间上的自相似性(分形性)意味是:将该对象较小局部(尺寸为L1×L1)的图像和较大局部(尺寸为L2×L2)的图像投影到一样大小的两个银幕上,这两个投影图像存在着自相似63 性。这是就静态情况而言的。若是考虑动态,对研究对象的这两部分随时间演变的情况进行录像,然后在屏幕上放出,其图像并不相似。二者的演变率有所差异,大尺度显示出较S慢。然而,就所研究的对象而言,可能存在一个动态指数S,使T2T1=()L2L1成立。换言之,改变时间T的量度,以不同的速度放录像,二者的演变率就变成相同了。一般说来,一个物理系统,若以这样的定律所支配,则称该系统可以表征为动态意义下的尺度不变性,即具有动态相似性。3.3.2尺度问题所谓尺度(Scale)是指某一自然过程本身及其观测或模拟的特征时间或特征长度(任立良)。通常把利用某一尺度下获取的信息来推求大尺度或小尺度下的理论称之为尺度转换(Scaling)或聚集(Aggregation)/解集(Disaggregation),与此有关联的问题称为尺度问题(Scaleissues)。水文尺度问题则是指水文系统在不同尺度之间进行尺度转换时所遇到的问题。水文学的研究对象包括了地球水圈范围内的所有尺度水文现象及过程。尺度问题是国际上关于水文学研究的前沿性课题。原因是水文学研究范围广泛,小到水质点,大到全球气候变化与水循环模拟。水文条件(如流域的地形地貌、土壤类型、植被条件、土地利用状况和流域前期储水特征)的空间异质性和水文通量的时空非恒定性(如降水、蒸发散在流域空间的不均匀性与分散性)导致大多数水文过程具有显著的空间异质性。水文学的物理方法,主要应用在微观尺度,随着向流域和全球的中观或宏观尺度扩展,原来的“理论”模型需均化和再参数化,并产生新的机理,这导致相邻尺度间的水文联系太复杂,关系很不清楚。为了寻求水文学规律,似乎首先要认识不同尺度的水文规律或特征,然后设法找出它们之间的联系或某种新的过渡规律,只有达到后一种阶段,水文科学理论或许能真正建立在普适性基础上(左其亭)。水文学的理论研究与实践表明,不同时间和空间尺度的水文系统规律通常有很大的差异,其水文学的理论和模型具有高度的尺度特性,在某一尺度上建立的模型一般不能移植到高一级或低一级时空问题中求解。一个典型的例子是微观尺度水文实验获得的“物理”参数,如土壤饱和含水率往往不能直接应用到流域尺度的水文模拟。反过来,宏观尺度的水文气象背景值变化也不能直接套用到时空变异性十分突出的微观水文模拟预报。因此,上述问题向人们提出了许多问题:①如何认识不同尺度的水文规律?②如何发现全球气候变化、区域水文特性变化、小单元水文模拟等不同水文尺度之间的联系?③在漫长的演变过程中,研究对象的时间尺度选择问题;④大尺度与小尺度研究思路、方法如何协调?等等,这些都是人们十分关注的尺度问题。1.尺度分类及研究目标尺度的划分目前还没有统一的标准。以下引用我国学者左其亭、王中根在总结水文学不同研究目的对尺度大小需求的基础上,对尺度的分类。从水文学研究范围上划分,可把尺度划分为六个类型或量级,即超微观尺度、微观尺度、中微观尺度、中观尺度、宏观尺度、超宏观尺度。本节将此分类列出(见表3-1),供参考。64 表3-1水文尺度类型及研究目标空间尺度时间尺度分类研究目标特征量极特征量极724超宏观尺度全球10km地质时期10年地质时期全球气候变化及水文过程522宏观尺度大区域10km历史时期10年区域水文过程百年变化过程22中观尺度流域10km年际变化1年流域水文特性年际变化过程2中微观尺度小单元1km年内变化1月单元内水文特性年内变化分析与建模-62微观尺度实验点10km实验过程1s实验过程变化-202-10超微观尺度分子10km实验过程10s水文机理实验与理论研究(1)空间尺度721)超宏观尺度是以全球变化为主要研究对象,尺度量级在10km以上,适应于全球气候变化和全球水文循环模拟研究等。522)宏观尺度是以较大区域为主要研究对象,尺度量级在10km,适应于研究区域水文特性变化过程模拟,如国家范围、板块范围、中国西部干旱半干旱区、中国东部环太平洋区域等等。这种空间尺度是站在区域的高度来研究水文学问题,也是目前常常使用的空间尺度。223)中观尺度是以一般流域为主要研究对象,尺度量级在10km。这种尺度的基本思路是,把流域视为一个系统,研究流域水文现象及过程变化,并进行流域统一规划与管理。4)中微观尺度是以较小的研究单元(如地貌单元、人类活动单元、水文循环研究2单元等)为对象,尺度量级在1km。对于水文学研究来说,这是尺度比较小的研究单元,常用作实验研究或用作中观尺度研究划分的计算单元。如,基于遥感(RS)和地理信息系统(GIS)条件下的流域分布式水文模型研究,可以把流域分成间隔lkm或400m,甚至更小的栅格,进行模拟研究。-625)微观尺度是专门针对实验点,尺度量级在10km。主要是在实验阶段,研究水文变化过程、建模、计算参数,为较大尺度研究提供实验基础。-2026)超微观尺度是专门针对分子及以下水平,尺度量级在10km,或更小。主要是在水文学机理实验与理论研究阶段,从更深层次上,研究水文变化机理、过程、建模、计算参数。为较大尺度研究提供理论基础。(2)时间尺度-101)超微观尺度是针对水文学机理实验与理论研究阶段,以10s为时间尺度进行的机理研究。包括建立模型、获得参数、认识基本规律等,为更大尺度研究奠定理论基础。2)微观尺度是针对实验过程,以秒为时间尺度,研究实验过程变化及实验阶段基础理论。3)中微观尺度是针对年内变化,以1月为时间尺度,进行研究。比如,研究年内气候周期变化、水文特性年内变化等。4)中观尺度是针对年际变化,以1年为时间尺度,进行研究。如研究年际或丰、平、65 枯水年水文特性周期变化等。5)宏观尺度是针对人类历史时期,特别是人类活动的影响带来的水文特性变化问题。6)超宏观尺度是站在地质变化时期这种更长的时间尺度上来研究问题。它不仅要考虑有历史记载的水文现象变化过程,而且要通过地质事件记录下的各种迹象来反演水文现象变化过程,从而在更大的尺度上来研究问题。这是研究水文现象变化过程常采用的方法。2.不同尺度转换问题关于尺度转换问题,左其亭、王中根将目前国际上针对这一问题的处理思路概括总结如下。通常把大尺度向小尺度的转化称为顺尺度转化(downscaling),相应的算法称为顺尺度算法。而小尺度向大尺度转化称为逆尺度转化(upscaling),相应的算法称为逆尺度算法。对于顺尺度问题有三种观点:①随着计算机硬件技术的发展,在大尺度模型中,可以通过减小网格尺度来满足小尺度模型的衔接需要;②按照研究区问题的重要性或特殊性,设置不同尺度大小的网格,对于重要或特殊要求的研究区域或时段采用尺度较小的网格;而对其他区域或时段仍采用较大尺度的网格;③将问题重要性或特殊性的区域或时段所建立的小尺度模型嵌套到较大尺度的模型中,实现不同尺度模型的混合计算。对于逆尺度问题,根据一定的物理意义,采用将较小尺度建立的模型进行均化和再参数化,将原系统部分变量进行空间或时间积分,再用某个均化的特征参数代表。3.尺度转换问题的研究进展(1)不同尺度上的水文循环研究1)小尺度(<200km)的水循环研究主要集中在水、热通量从大气进入植物、土壤和不同水体后的迁移机理,如以水动力学方程和连续方程描述的实验尺度的水循环。随后从植被的小块发展成大气环流模式(GCMs)网格单元时空尺度上的土壤—植物—大气连续体中的能量和水的通用模式(SVAT),具有代表性的研究成果是农业水循环模拟模型(ACRU)。2)中尺度的(200~2000km)的水循环研究主要研究土壤—植被—大气之间的相互作用,利用大气环流模式研究水循环对下垫面变化的响应,修正大气环流模式,预测区域环境变化、区域开发对水循环的影响。3)大尺度的研究包括“国际地圈生物圈计划”(IGBP)核心项目之一“水文循环的生物圈方面”(BHAC)中的第四个重点研究内容以及“全球能量与水循环实验”计划,都进行不同尺度上的水文循环进行了研究。(2)水文尺度的研究方法目前,常见的尺度转换方法有(吕一河,刘贤赵,丁晶,刘建梅等):图示法、回归分析、半变异函数、自相关分析、谱分析、分形和小波变换及RS和GIS技术在尺度中的应用。1)在尺度研究方法方面,传统水文学一般是基于统计分析,从水文现象本身寻找规律,用野外收集的难以精确反映空间属性变化特征的点数据来代表面上信息,但对物理成因与尺度影响考虑较少。主要方法有图示法、回归分析、半变异函数、自相关分析、谱分析等。图示法是将研究问题涉及的变量或属性值以图形方式表示;回归分析则是采用回归66 模型建立变量或属性值与时间、空间分布的关系模型;半变异函数通过比较特定滞时后距离分隔的同一随机变量的不同值,在多个尺度上进行区域化随机变量的变异性度量;自相关分析是指在一定滞后距离或时间上研究变量在空间或时间上的自相关特征;谱分析通过对原始数据进行转换,将序列分解为不同频率的正弦、余弦,常用于时间序列的尺度转换。2)近年来,水文过程的尺度转换理论和方法主要有外推、缩微、分形、混沌分析、随机解集模型、小波变换和3S技术的应用。①外推技术基本假定为,中等或小尺度上的原理和等式可用于描述大尺度的过程,这样,大尺度上的响应过程可能被系统误差或无关联局部所掩盖。尽管如此,大多数外推法仍认为中尺度参数与大尺度参数是相同的,结果使外推理论的应用受到限制。②“缩微”可以简单地理解为将低空间分辨率图像用高分辨率表示的重采样。小波变换适用于多尺度的时空数据转换与优化。③RS和GIS技术则是利用RS提供数据源,以GIS进行数据分析处理、维护和管理,通过建立分布式水文模型进行尺度问题的研究。④分形认为多尺度上的结构变化具有分形特征,常用于空间格局的复杂性,按照分形理论在一定尺度范围内具有自相似性的对象,其某种统计量在不同尺度下的相互关系决定于一种简单变换——标度变换。分形技术为解决在一定时空尺度范围呈现相似格局的表面上具复杂形式的问题提供了途径(丁晶,王文圣)。设水文变量为x,影响该变量变化的主要尺度为a,则x(a)表示x随a而变。若尺度a变为λa(λ为一比例数),那么x(λa)和x(a)之间是什么样的关系呢?只要x(λa)和x(a)的变化具有自相似性,则下列关系成立:a{}x(λa)dis{}λθx(a)(3-13)式中,dis表示概率分布相同,θ为标度指数。据式(3-13),对一定概率(频率)p有θx(λa)=λx(a)(3-14)式(3-14)表明:对尺度a的水文变量,当尺度由a转换到另一个尺度λa时,其相应水文变量的分位值(一定频率的变量值)可由原尺度水文变量的分位值,通过非常简单的关系式转换而得,转换的关键在于确定标度指数θ。这样,式(3-14)为水文尺度分析提供了方便。但必须解决两个重要问题,一是如何评判水文现象(变量)的自相似性;二是如何获得标度指数θ的可靠估值。实际上,这两个问题已获得比较满意的解决。以年最大洪峰的尺度分析为例。在这个特定对象的分析式(3-14)中的x为年最大洪峰流量Q,a为流域面积F,由式(3-14)得θQ(λF)=λQ(F)(3-15)式(3-15)显示某一频率的年最大洪峰流量和尺度流域面积F之间的定量关系。据此,由一个尺度的年最大洪峰流量可以获得另一个尺度下的年最大洪峰流量,为无资料流域的洪水计算提供依据。67 ⑤以混沌理论为基础的尺度分析统计方法是最早的顺尺度方法,例如回归方法便是其中之一(丁晶,王文圣)。类似于前面的分析,x(a)和x(λa)为尺度a和尺度λa的两个水文变量。现讨论x(a)和x(λa)之间的关系,若λ>1,则x(a)转化到x(λa)称为由小尺度转换到大尺度;反之若λ<1,则x(a)转化到x(λa)称为由大尺度转换到小尺度,简称为顺尺度。水文中的很多问题常常涉及到顺尺度,所以水W1x1(12)文顺尺度分析成为研究重点。当前顺尺度分析的一种新x(24)途径是探讨分配权重的变化规律,并通过分配权重由大尺度转换到小尺度。例如,时间尺度为24h的降水量W2x2(12)x(24)降为时间尺度为12h的降水量x(24),可以表达为图3-4权重分配示意图图3-4所示。W1和W2称为分配权重,支配着大尺度量如何分配为小尺度量。一般而言,分配权重是变化的(例如W1和W2随x(24)的不同而变化)。若掌握了分配权重W的变化规律,那么就可以将一种尺度的水文变量转换到另一尺度的水文变量,达到了顺尺度的目的。显然不同的水文变量,W有不同的变化特性;在某些情况下即使同一水文变量,基本尺度不同,W的变化特性亦有所差异。降水量的顺尺度分析结果表明:权重W的变化具有混沌性。分配权重W具有混沌性,意味着可以通过W所建立的混沌模型概括地表征及其变化特性,同时由模型可以模拟W,最终获得顺尺度的水文变量。当前,以混沌理论为基础的水文尺度分析处在探索阶段,有不少问题尚需进一步研究。但这是具有新意的思路,值得重视。⑥以随机解集原理为基础的尺度分析(丁晶,王文圣)如图3-4所示,研究表明,分配权重W也具有随机性。当W呈现出随机性的情况下,通常采用以随机解集原理(见第1章)为基础的顺尺度分析法。应用随机解集顺尺度的关键在于寻求分配权重W的随机分布(分布类型和参数估计)。若具有实测资料,由已知的总量和相应的分量反算出分配权重W,例如将x(24)解集为x1(12)和x2(12),反算出W1和W2,然后就W1和W2样本序列作统计分析,寻求相应的随机分布。当W1和W2有一定关系时,则需寻求联合随机分布。只要获得权重分布,便可依据这种分布随机模拟出权重,最终由总量转换成分量。随机解集顺尺度的结果不是惟一的,即结果具有多种可能性。这是随机解集尺度分析的一个显著特点。当实测资料较短,难以可靠地推估权重分布时,可以考虑采用典型解集方法。例如由年水量解集成月水量,可以随机地在实测资料中选取一年作为典型,并反算出权重。然后由此权重作为顺尺度计算的依据。这一方法既简便又适用,是值得推广的一种顺尺度方法。⑦基于小波理论的尺度分析(丁晶,王文圣)逆尺度分析,即将小尺度转换大尺度。例如,一个流域的年径流序列显示出的是以年为尺度的径流量变化特性。若要了解以10年为尺度的径流量长期波动特性,则必须由1年尺度转换到10年尺度。水文气象等领域常用的滑动平均技术就是用来作逆尺度分析的一种传统方法。对年径流量作10年的滑动平均,所得结果便能显示尺度为10年的径流量变动特性,达到了逆尺度的目的,这一方法简单直观,但不便作综合分析。小波分析的基本思路在于以一簇函数去表示水文序列,并刻划其特性,这一簇函数叫做小波函数,是通过一种基本小波函数(母函数)的不同尺度的平移和伸缩构成。小波分析的关键是小波变换,由此可以得到一群变换系数。基于这些系数,最终能显示研究对象在各种尺度上的特性。小波分析是一种多分辨分析,对水文序列可以作粗和细的综合分析,既显示变化的全貌,又剖析局部变化的特性,即这种分析68 既使人看到概貌(大尺度),又看到细节(小尺度),所以小波分析非常适合于尺度分析,在这个领域的研究已成为当前的热点之一。关于小波分析原理参见第11章。3)在模型尺度研究方面,在单一的降雨—径流模型基础上,考虑了水文循环与气候环境变化、生态系统和人类活动影响等综合因素。主要突出的进展表现在两个方面:①利用“3S”技术获取传统水文方法观测不到的数值地形(如TOPMODEL和TOPOG地形模型)、土壤、植被、气象观测信息(加大范围的降水量)以及土壤含水量信息,建立了描述时空变异性、多变量或参数化的耦合流域水文模型。②加深了对水文机理以及与生态系统和人类活动影响的认识,探索了水文过程的复杂性。尽管陆面过程参数化和中尺度水文模型的研究已取得了可喜进展,但由于水文变量时空分布的不均匀性和水文过程转换的复杂性,建立能够模拟变化尺度的水文物理模型以及能与气候模型时空尺度相匹配的大尺度水文模型,仍没有取得令人满意的结果。3.4水文序列变异点的分析原理与应用3.4.1水文序列变异点的概念变异点是指水文观测序列在某个时刻突然变化,这个发生变化的时刻称为变异点(变点)。人们通过修建水库、引水灌溉、水利等措施对水资源进行调控,以解决供需矛盾,这种大规模的水事活动,对河川径流形成了一定程度的调控能力,改变了河川径流的天然状态。同时,土地开发、水土保持等一系列大规模生产活动,也不同程度地改变了流域下垫面条件,引起了河川径流情势的改变。因此可以说,人类水事活动可以在一个不太长的时期内改变了一些水文要素的形成条件。在实施了人类水事活动的流域,水文要素过程在人类水事活动前后将不能认为是来自同一总体(芮孝芳,1999),这样就产生了两个需要解决的问题(芮孝芳,1999),其一是如何对该水文要素系列进行还原,以便使整个系列属于同一总体;其二是如何确定不同类型和不同程度人类活动影响下的水文要素概率分布函数。目前,现行的水文计算是假定水文要素具有随机性,应用数理统计方法来寻求其概率分布函数,要求水文要素必须在同一条件下获得,服从统一总体分布。因此,如何确定不同类型、不同程度人类水事活动影响下的水文要素概率分布函数就成为目前迫切需要解决的课题之一,要解决这一问题,首先必须正确推断水文要素过程的显著变异点。目前,人类水事活动对水文过程的影响极其复杂,水文过程的变异点研究是目前水文学中的热点课题,变异点存在判定、变异点数目确定的理论和方法还不够成熟。研究水文过程的变异分析,可为流域规划方案决策、水利工程效应评价、现行水利工程管理、水文分析计算提供可靠的依据。从理论和方法上,对于流域内人类水事活动对水文生态系统的影响评价、水资源的可持续利用和生态安全,具有重要的理论意义和生产实用价值。3.4.2水文序列变异点的研究方法水文过程的变异点研究的方法主要有水量平衡法、对比分析法、流域水文模拟法、统计检验法、熵值法、R/S分析法和变点分析法等(曹云玲,顾大辛,王国庆,李香云,ZbigniewW.Kundzewicz,PerreaultL,熊立华,王孝礼等)。69 水量平衡法是利用水量平衡方程,分析水文要素过程受人类水事活动影响后的差异及其变化。对比分析法主要有两类方法:一类是根据实验流域和代表流域已有的资料,通过建立各类活动与水文要素过程变化之间关系,分析不同人类水事活动的水文效应,最后将这些分析成果应用于类似流域或地区同类人类水事活动对水文要素过程的影响;另一类是以研究区受人类水事活动影响前后的资料,应用趋势法和相关分析法进行对比分析。流域水文模拟法是基于水文现象成因和各要素之间的关系,建立流域水文模型来模拟流域水文过程,一种途径是应用人类水事活动影响前或影响较小的资料,率定模型中的参数,通过率定参数检验,应用率定参数后的模型推求自然状况下的径流过程,进行推求径流过程和实测径流对比分析,分析人类水事活动对径流的影响。一种途径是改变水文模型中反映下垫面条件变化较敏感的参数,逐年拟合受人类水事活动影响后的资料,分析该参数的变化规律和预测未来的水文情势。统计检验法是应用斯波曼秩次相关检验法判定水文过程是否具有一致性,在受人类水事活动显著影响的条件下,应用有序聚类分析法寻求水文过程显著影响变异点。熵值法主要是以灰色差异信息理论为基础,通过建立差异信息相对测度体系和最优信息二分割模型,来判定水文过程的变异点存在、位置和变异度R/S分析法(RescaledRangeAnalysis,重新标度极差分析)认为人类水事活动能使流域水文过程序列的分形特征值、赫斯特指数、分形维数发生明显变化,使水文过程成为非平稳过程。因此,可通过流域分形特征值、赫斯特指数、分形维数来判断水文过程的变异点。变点分析(Changepointanalysis)是对序列变点的判断和检验,它是统计学中一门新兴的研究课题。在水文中常用的方法有Mann-Kendall方法、有序聚类分割法、最小方差法、极大似然法和贝叶斯推断法等。其中,贝叶斯推断法和其他方法相比,其优点是能够给出变点可能发生位置的概率分布。3.4.3水文时间序列变点分析的贝叶斯方法以下介绍(熊立华,周芬,肖义等,2003)应用贝叶斯方法进行水文时间序列变点分析。给定水文时间序列(y1,y2,L,yn),假设变点发生的任何可能位置为k(1≤k<n)。变点将整个时间序列分割为两部分,这两部分的某些统计特征如均值,会有明显的不同,我们将在变点之前(包括变点)的时间序列称为前部分,而变点之后(不包括变点)的时间序列称为后部分。采用如下符号表示整个序列的前后两部分:⎧Y={}y1,y2,L,yn⎪⎨Yk={}y1,y2,L,yk(3-16)⎪⎩Yk+1={}yk+1,yk+2,L,yn变点分析的任务就是检验变点最有可能发生的时间位置和所研究的统计特征值的变化幅度。1.贝叶斯变点分析模型对某一固定时刻,假设水文序列的观测值发生服从某一概率分布(本节假定这个分布为正态分布),对于原时间序列不符合正态分布的规律,可通过某种数学变换(比如取对数)产生一个符合正态分布的新系列。如果产生水文序列的物理机制在某一时刻发生了70 突变,那么在该时刻(即变点)的前后,观测入值所服从的正态分布的统计参数将会不再相同。在变点时刻k以前和以后,观测值yi所服从的分布密度函数分别记为2yi~;N(µa,σa)(i=1,2,L,k)(3-17)2yi~;N(µb,σb)(i=k+1,k+2,L,n)(3-18)222若只研究水文序列的均值是否发生变化,可以假设方差不变,即σa=σb=σ,并且2σ的值可由实测的水文序列来估计。对于µa和µb,则假设它们服从一定的概率分布。在获得任何实测的水文序列之前,由于对µa和µb的分布函数(先验分布)并不了解,故只能假设。一般可以假定µa和µb的先验分布为相同的正态分布,即⎧µ~N(µ,σ2)⎪a00⎨(3-19)2⎪⎩µb~N(µ0,σ0)2注意,当σ0趋近于无穷大时,正态分布就趋近于非正常均匀分布。在无信息条件下,假设µa和µb的先验分布为方差很大的正态分布,或者是从−∞到+∞的均匀分布是合理2的。在实际应用中,µ0可取为整个实测水文序列的均值,而σ0取值应大于或等于σ的4σ22倍,即0≥σ。根据贝叶斯定理,在获得观测信息Y={Yk,Yk+1}后,就可以推导出分布参数µa和µb的后验分布。由观测信息Yk推导出µa的后验分布为••2µaYk~N(µa,σa)(3-20)⎧⎛k⎞⎪µ•=⎜n•µ+y⎟()n•+ka⎜0∑i⎟⎪⎝i=1⎠⎪•22()•⎨σa=σn+k(3-21)⎪•22⎪n=σσ0⎪⎩由观测信息Yk+1,推导出µb的后验分布为••2µbYk+1~N(µb,σb)(3-22)⎧⎛n⎞⎪µ•=⎜n•µ+y⎟[]n•+()n−kb⎜0∑i⎟⎪⎝i=k+1⎠⎪•22[]•()⎨σb=σn+n−k(3-23)⎪•22⎪n=σσ0⎪⎩变点发生位置k的后验分布密度函数的推导,分为两步(这是贝叶斯变点分析模型的核心)。71 第一步,导出在给定µa和µb的情况下观测资料Y={Yk,Yk+1}发生的联合分布函数:k1⎡()y−µ2⎤n1⎡(y−µ)2⎤()iaibpYk,µa,µb=∏exp⎢2⎥⋅∏exp⎢2⎥(3-24)i=12πσ⎢⎣2σ⎥⎦i=k+12πσ⎢⎣2σ⎥⎦第二步,根据贝叶斯法则,推导变点发生位置k的后验分布密度函数:p()Yk,µa,µbp(k)p()kY,µa,µb=n(3-25)∑p()Yj,µa,µbp(j)j=1式中,p(j)代表变点发生位置k的先验分布,一般假定为均匀分布,即p(j)=1n,j=1,2,L,n。在此假定下,变点发生位置k的后验分布密度函数最终可以简化为p(Yk,µa,µb)p()kY,µa,µb=n(3-26)∑p()Yj,µa,µbj=1变点发生位置k的后验发生概率的期望值为p(kY)=∫∫p()Yk,µa,µbdµaµb(3-27)式(3-27)可由蒙特卡洛马尔科夫链随机抽样法来估计。2.模型应用采用上面所建立的贝叶斯变点分析模型来研究长江宜昌站120年(1882~2001)的年径流资料系列和关于年最小流量系列。经变点发生位置k的先验和后验概率分布计算,当k=1934年时,所对应的后验概率最大,为0.11,即长江宜昌站的年最小流量序列最有可能3在1934年发生变化。从1882年到1934年,其年最小流量序列的均值为3707m/s;而3从1935年到2001年,年最小流量序列的均值为3408m/s。因此以1934年为变点,长3江宜昌站的年最小流量序列的均值下降了近300m/s,降幅为8%。3.4.4R/S分析法在水文序列变异点分析中的应用1.R/S分析法的基本原理R/S分析法是赫斯特在大量实证的基础上提出的一种时间序列统计方法,它在分形理论中有着重要的作用。基本原理和方法如下(王孝礼,胡宝清,2002):考虑一个时间序列{ξ(t)},t=1,2,⋯,n。对于任意正整数τ≥1,定义均值序列τ1ξ=∑ξ()t,τ=1,2,⋯,n(3-28)ττt=111即ξ=∑ξ()t=ξ()111t=172 211ξ=∑ξ()t=[]ξ()1+ξ()2222t=1311ξ=∑ξ()t=[]ξ()1+ξ()2+ξ()3333t=1⋯⋯n11ξ=∑ξ()t=[]ξ()1+ξ()2+ξ()3+L+ξ()nnnnt=1定义累积离差为tX()t,τ=∑[]ξ()u−ξ(3-29)τu=1即当τ=1时,1≤t≤11X()1,1=∑[ξ()u−ξ]=ξ()1−ξ11u=1当τ=2时,1≤t≤21X()1,2=∑[]ξ()u−ξ=ξ()1−ξ22u=12X()1,2=∑[]ξ()u−ξ=[]ξ()1−ξ+[]ξ()2−ξ222u=1当τ=3时,1≤t≤31X()1,3=∑[]ξ()u−ξ=ξ()1−ξ33u=12X()2,3=∑[]ξ()u−ξ=[]ξ()1−ξ+[]ξ()2−ξ333u=13X()3,3=∑[]ξ()u−ξ=[]ξ()1−ξ+[]ξ()2−ξ+[]ξ()3−ξ3333u=1⋯⋯定义标准差为73 11τ22S()τ=∑[]ξ()t−ξ;τ=1,2Ln(3-30)ττt=11122即S()1=∑[]ξ()t−ξ=[]ξ()1−ξ111t=1212122S()2=∑[]ξ()t−ξ={}[]ξ()1−ξ+[]ξ()2−ξ22222t=13211222S()3=∑[]ξ()t−ξ={}[]ξ()1−ξ+[]ξ()2−ξ+[]ξ()3−ξ333333t=1⋯⋯定义极差为R()τ=maxX(t,τ)(−minXt,τ);τ=1,2,L,n(3-31)1≤t≤τ1≤t≤τ即R()1=maxX(1,1)−minX(1,1)=max{X(1,1)}−min{X(1,1)}=X(1,1)()−X1,11≤t≤11≤t≤1R()2=maxX(t,τ)(−minXt,τ)=max{X(1,2),X(2,2)}−min{X(1,2)(),X2,2}1≤t≤21≤t≤2R()3=maxX()t,τ−minX()t,τ=max{}X()1,3,X(2,3),X(3,3)−min{X(1,3)()(),X2,3,X3,3}1≤t≤31≤t≤3⋯⋯对于{ξ(t)},t=1,2,⋯,n,是相互独立、方差有限的随机序列,即布朗运动,赫斯特和费勒证明了如下结果:()()HRτSτ=(πτ/2)(3-32)其中H=1/2。对于{ξ(t)},t=1,2,⋯,n,不是相互独立的分数布朗运动,可以证明:()()()HRτSτ=Cτ(c为某常数)(3-33)式中,H为赫斯特指数。由于一维布朗运动样本函数的赫斯特指数H与其分维数D0之间有如下关系:D0=2-H(3-34)我们求任意的一维布朗运动样本函数的分维D0时,可以先对其数据用上述方法进行R/S分析,用线性回归方法从下式中算出H:R()τln=Hlnc+Hlnτ(3-35)S()τ进而由D0=2-H求出D0。分维D0表示运动轨迹的不平滑和运动的激烈程度。所以对于一维布朗运动样本函数,随着H的减小,D0的增大,其运动轨迹的平滑程度越差,变化越激烈。可见,赫斯特指数H与分布式布朗运动的分维密切相关,它表示分布式布朗运74 动的持久性(或反持久性),这从一个侧面阐明了赫斯特指数的意义。具体计算H的方法如下:R(τ)H由以上计算可知R(τ)和S(τ)的关系为=()cτS()ττR()τS(τ)1R()1S(1)2R()2S(2)3R()3S(3)MMMnR()nS(n)R()τH对=()cτ两边取对数,H-赫斯特指数S()τR()τln=Hlnc+HlnτS()τ作线性回归分析计算:R(τ)R(τ)τR(τ)S(τ)lnln()τS()τS()τR(1)R(1)1R(1)S(1)lnln()1S()1S()1R(2)R(2)2R(2)S(2)lnln()2S()2S()2R(3)R(3)3R(3)S(3)lnln()3S()3S()3MMMMMMR(n)R(n)nR(n)S(n)lnln()nS()nS()nR()τ令ln=Y,ln(τ)=X,则S()τY=Hlnc+HX(3-36)以X和Y线性回归分析,可得H和Hlnc的值。2.模型应用利用甘肃省石羊河流域杂木河的1950~2000年的年径流时间序列,经计算得:()()0.8602Rτ/Sτ=0.3958τ于是得到H=0.8602,由于H>1/2,因此年径流时间序列作为分布运动的轨迹表现出持久性,用平均的观点来看,来水量过去的一个增长趋势意味着将来的一个增长趋势,过去的一个减少趋势意味着将来的一个减少趋势。同时也暗示着来水量统计数据表现出了一75 定的非随机性。分形研究的是具有特定特征的无序序列,当分形的制约因素发生变化、分形发生变化,分维值也随之发生变化,由于H与D0的直线变化,H的变化反映D0的变化,故H变化较大处,即为制约系统的因素发生变异,此处即为变异点。为此,我们分别以ξ(t)(t=10,11,⋯n-10)为分界点将原始数据分为两部分(即以此点位前一部分的结束点和后一部分的起始点),对这两部分进行R/S分析,相应的H指数记为H1和H2,然后,求出H1与H2之差的绝对值△H=|H1-H2|,逐个比较,找出△H最大的那一点,则视这一点为变异最大点,便可诊断出相应变异年份。这一变异最大点是与所分析的其他样本点相比较而言的,因而是相对的,分段分析计算结果见表3-2。表3-2石羊河流域杂木河年径流分段分析表序号H1H2|H1-H2|序号H1H2|H1-H2|10.65410.62110.033170.81960.63740.182220.6210.64120.0202180.82610.67130.154830.60060.71560.115190.83190.65480.177140.59750.63740.0399200.83740.66450.172950.6210.54570.0753210.84230.67060.171760.63960.63070.0089220.8470.63860.208470.66680.60990.0569230.85070.68690.163880.69920.57630.1229240.8540.67420.179890.72690.66690.06250.85650.71590.1406100.7420.69420.0478260.85920.67490.1843110.75730.66400.0933270.86190.66450.1974120.76970.72000.0497280.86430.68470.1796140.79270.66100.1317300.87040.53730.3331150.80220.65860.1436310.87480.52540.3494160.81160.61900.1926320.87810.67210.206从表3-2可得,在序号31对应的点处(对应于1989年),|H1-H2|最大,因此,杂木河年径流序列变异年份诊断为1989年。以诊断变异年份1989年所对应的数据作为分段点,分别对1950~1989年数据和1990~2000年的数据进行R/S分析并进行分段拟合,得1950~1989年的标准差和极差计算表与1990~2000年的标准差和极差计算表,见表3-3。由表3-3可知,样本(1950~1989)的H指数为0.8748,其回归方程为()()0.8748RτSτ=0.3868τ样本(1990~2000)的H指数为0.5254,回归方程为()()0.5254RτSτ=0.5472τ76 表3-3杂木河年径流序列极差和标准差计算表1950~1989年极差和标准差12345678910R(t)00.150.4480.450.7550.7811.2131.5331.7581.829S(t)00.150.340.2940.4060.3720.4510.4720.7640.72511121314151617181920R(t)1.9842.0292.5233.2113.2744.034.7034.9094.7124.978S(t)0.7340.7060.7880.8210.7930.8490.8660.8510.8380.82521222324252627282930R(t)5.045.2075.4415.5095.7475.8325.875.9676.0986.206S(t)0.8060.7910.7810.7650.7590.7450.7320.720.710.731323334353637383940R(t)6.3396.3566.4456.4566.6726.8266.8987.0477.5067.855S(t)0.6910.6810.6720.6620.6610.6570.6490.6440.6450.6431990~2000年极差和标准差1234567891011R(t)00.4230.4810.7980.7310.7230.7480.7920.8050.9050.87S(t)00.4230.3550.4850.4390.410.3850.3650.3450.3550.34为了验证以上计算成果物理成因的准确性,分别求出前后两个序列的均值进行比较,3杂木河1950~1989年年径流序列的均值为2.5426亿m,1990~2000年年径流序列的均值3为2.1093亿m,均值具有明显的差异;再将杂木河前后两个年径流序列分别与时间进行回归分析,得直线回归方程,杂木河1950~1989年年径流序列的回归方程为y=-0.0185t+2.9226(y为年径流序列,t为时间序列),1990~2000年年径流序列的回归方程为y=-0.0229t+2.246。从杂木河前后两个序列的均值和回归方程的比较来看,前后两个序列已经明显不符合一致性的要求,就以分析1989年为杂木河1950~2000年年径流序列的变异点是准确的。3.5无资料地区的水文预报问题无资料地区的水文预报(PredictioninUngagedBasins)是目前国际水文协会(IAHS)最为重要的水文科学研究前沿课题之一。本节引用我国学者谈戈、夏军对这一科学问题的总结,介绍无资料地区的水文预报的研究思路。目前,许多国家和地区的许多流域缺乏水文站网或观测的水文数据,或水文台站的分布密度和它们所掌握的数据信息不足以满足建立足够精度的水文模型的要求,或是由于各种自然条件与人为因素的限制,一些基础性的水文数据无法取得,在水文学的研究意义上,这些地区成为“无资料地区(UngagedBasins)”。由于无法充分掌握该流域的水资源状况,77 所以,给水资源的科学管理造成很大困难。全球的水文、气象台站大多分布于欧洲、北美和日本的少数几个发达国家和经济发达地区,更多的发展中国家的广大面积上只设布了零星的水文、气象台站。据WMO的数据22显示,全球每个水文站点的控制面积约从150km到10000km,而且最新数据显示,最近的20年,世界上的水文站点数量正在迅速萎缩,前苏联和一些发展中国家减少了约25%~40%。面对这样的事实,水文学家不得不开展无资料地区的水文模型研究,以获得能够满足水资源管理需求的相关数据,实现对广大区域水资源的科学调度管理。目前,国际人文计划(IHDP),世界气候研究计划(WCRP),国际水文计划(IHP),以及国际地圈生物圈计划(IGBP/BAHC)等几个重要的国际研究组织和计划都开始重视无资料地区的气象和水文研究工作。无资料地区水文预报的主要内容是该地区的水文预报方法和水文预报的不确定性问题。传统的水文学多侧重采用水文观测、实验等手段,运用传统的数学、物理方法来研究。现代水文学则要采用现代的新理论、新方法来解决传统水文学所遇到的困难。这些新理论包括灰色系统理论、人工神经网络、分形几何、小波分析等;新的科学手段则包括计算机技术和遥感遥测“3S”技术等。遥感信息已经是现代地球科学研究的主要信息来源。现代水文学对无资料地区的水文预报研究的出路在于将充分利用计算机技术和遥感手段所得到的流域信息,运用到系统论、信息论和控制论等现代科学方法中,综合空间技术和计算技术,揭示地表信息流的动力学机制与时空分布特性,最终做到对流域水文性状的数值模拟。3.5.1基本思路目前,各种流域水文数值模型很多,从早期的新安江模型、陕北模型到现在的SHE模型,SWAT模型,以及最新的各类分布式模型等。应用的关键在于对这些数学模型的优选。要判断哪个数值模型更适合于广域的无资料地区,我们的做法应当是根据有充分资料的流域开始研究验证,被选定的流域要求资料充分,有足够多的空间站点分布,而且站点布局合理,能够精确反映流域水文要素的空间变化,同时站点资料有足够长的时间序列,能反映出水文过程对流域下垫面历史变化的响应。研究开始时,人为先隐藏大部分站点的实测数据(隐藏站点的空间分布可以随机,也可以按照一定的空间拓扑规律),用多个数学模型依靠仅剩的少数几个站点的资料来计算隐藏站点的数值,最终选择计算值与实测值误差最小的那个模型,作为能推广到与模拟流域性质相似的无资料地区的模型。有了实测资料的检验,模型的优劣自然非常清楚。3.5.2分布式水文模型流域分布式水文模型研究是现代流域水文学的一个亮点。它可以和现有覆盖整个地球各个流域(包括无水文站点资料的地区)的遥感数据紧密结合,精确模拟各单元格上的水文过程,通过单元格之间的水力联系做到对全流域的数值模拟。因此,它的发展是开展无资料地区水文研究的一条可行之路。流域分布式水文模型是指以流域面上分散的水文参数和变量来描述水文时空变化特性的数学模型。它构建在GIS/RS基础之上,先由GIS/DTM建78 立数字高程流域水系模型,再与产流模型和汇流模型进行有机结合。分布式水文模型具有物理机理,不是统计模型或经验模型,能描述流域内水文循环的时空变化过程,这保证了它的精度;同时它建立在DEM基础之上,这对无水文站点资料的地区而言是一个最好的补偿。3.5.3空间插值对无资料地区的研究,空间插值是必不可少的工具。空间内插对于观测台站十分稀少,且台站分布又很不合理的地区有十分重要的现实意义。空间插值方法可以分为几何方法、统计方法、空间统计方法、函数方法、随机生成等多种。目前还没有绝对最优的空间内插方法,因此,必须依据数据的内在特征,依据对数据的空间探索分析,经过反复实验,通过比较,选择一个合用的、适于数据空间分布特点的内插方法。应对内插的结果做严格的检验。空间插值方法的研究要注意保证其有良好的数据库接口,要能做到与GIS平台的兼容。3.5.4四维同化四维数据同化系统(fourdimensionaldataassimilationsystem),简称数据同化系统,是指在考虑数据时空分布的基础上,在数值模型的动态运行过程中融合新的观测数据的方法。其理论、概念和方法来源于大气和海洋科学,在数学上主要借助于估计理论、控制论、优化方法和误差估计理论。在过去20a间,数据同化系统日趋成熟。相对于大气和海洋科学中的数据同化研究而言,陆面和水文数据同化系统的研究开始较晚。20世纪90年代后期,陆面数据同化系统的研究才日益活跃起来,使用“离线”的陆面过程模型同化微波遥感观测数据也逐渐成为陆面数据同化系统的明显特征。最具代表性的事件是:美国国家航空与宇航管理局哥达德空间飞行中心(NASAGSFC)水文科学部和数据同化办公室(DAO)联合支持了陆面数据同化项目,目前已开始准实时地提供北美1/8°和全球1/4°陆面同化数据集;美国国家大气海洋局(NOAA)也支持了美国大陆尺度、基于水文学的陆面数据同化系统研究。陆面数据同化系统真正体现了模型和观测(常规与遥感观测)的集成。因此,开展陆面数据同化系统研究,对于观测数据稀少且自然地域单元多样而复杂的西部地区的生态环境科学研究和水文科学研究是非常重要的。研建陆面数据同化系统,在理论上,可以探讨与陆面过程模型、水文模型、土壤水分和积雪的微波遥感观测、模型和观测误差估计等有关的环境和生态科学研究的一系列基本科学问题;在实践上,可以为大尺度和流域尺度的水循环研究提供高分辨率的、具有物理一致性和时空一致性的土壤水分、土壤温度、积雪和冻土数据集。3.6当前我国需要开展研究的重大水文科学技术问题本节引用我国学者芮孝芳的总结成果,介绍当前我国需要开展研究的重大水文科学技术问题。79 3.6.1当前需要关注的对水文发展有重大影响的问题1.防洪减灾包括实时洪水预报调度模型,防洪减灾决策支持系统,国家防汛指挥系统。2.水资源开发保护与合理配置包括水资源评价及供需平衡评价,水资源保护与水生态环境的修复,水资源时空合理配置及其与经济社会可持续发展的关系。3.开发西部和振兴东北包括西部和东北的水灾害问题,西部和东北的生态环境问题,西部和东北的水资源问题;西部水电开发问题。4.南水北调包括长距离调水的输水渠道的防洪问题,长距离调水的供水保障问题,长距离调水的水质保障问题,长距离调水系统的运行管理问题。5.长江的合理开发利用与保护包括长江的洪水灾害及防洪问题,长江的水资源问题,长江的水污染和水环境问题,长江航道问题;长江河口拦门沙和盐水上溯问题,长江水电开发问题,大规模水利、交通工程对长江的影响。6.黄河的合理开发利用与保护包括黄河水患与防洪、防凌问题,黄河水沙关系问题,黄河水资源开发利用程度与断流问题,黄河流域水土保持和生态环境问题,气候变化与黄河水资源时空演变的关系,黄河水电梯级开发问题,大规模水利、水保工程对黄河的影响。7.城市水利包括城市防洪问题,城市水资源及水环境问题,水景观与生态城市的关系,城市水务管理系统。8.人类活动对水文水资源水环境的影响包括人类活动对洪水的影响,人类活动对水资源的影响,人类活动对水质和生态环境的影响,人类活动对河流、湖泊等水体“寿命”的影响,人类活动对湿地和生物多样性的影响。3.6.2当前需要开展的主要的水文基础研究1.气候变化对水文循环时空分布的影响。2.水文时间序列演变机理及影响因子分析。3.产汇流理论和分布式水文模型。4.水文尺度问题及水文相似性问题。5.数字水文学。6.同位素水文学。7.生态水文学。3.6.3当前需要着重抓的对水文有重大影响的新技术的应用研究1.地理信息系统(GIS)技术。80 2.雷达测雨技术。3.遥感技术。4.同位素技术。5.实时测报和调度系统。参考文献1左其亭,王中根.现代水文学.郑州:黄河水利出版社,20022芮孝芳.中国的主要水问题及水文学的机遇.水利水电科技进展,1999,19(3):18~213丁晶,邓育仁.水文水资源中不确定性分析与计算的耦合途径.水文,1996,1:19~214夏军.水文非线性系统理论与方法.武汉:武汉大学出版社,20025马建华,管华.系统科学及其在地理学中的应用.北京:科学出版社,20036叶守泽,詹道江.工程水文学.北京:中国水利水电出版社,20007丁晶,王文圣.水文相似和尺度分析.水电能源科学,2004,22(1):1~48任立良.流域水文物理过程的数字模型研究.河海大学博士学位论文,1999.10:6~169吕一河,傅伯杰.生态学中的尺度及尺度转换方法.生态学报,2001,21(12):2096~210510刘贤赵.论水文尺度问题.干旱区地理,2004,27(1):61~6511刘贤赵.论水文尺度问题.西北林学院学报,2004,19(3):84~8812丁晶,王文圣,金菊良.论水文中的尺度问题.四川大学学报(工程科学版),2003,35(3):9~1313刘建梅,裴铁璠.水文尺度转换研究进展.应用生态学报,2003,14(2):2305~231014芮孝芳.中国的主要水问题及水文学的机遇.水利水电科技进展,1999,(6):18~2115曹云玲.水利工程的水文效应.治淮,1999,(5):32~3316顾大辛,谭炳卿.人类活动的水文效应及研究方法.水文,1989,(5):61~6417王国庆,贾西安,陈江南,等.人类活动对水文序列的显著影响干扰点分析.西北水资源与水工程,2001,12(3):13~1518李香云,罗岩,王立新.近50a人类活动对西北干旱区水文过程干扰研究.郑州大学学报(工学版),2003,24(4):93~9819ZbigniewW.Kundzewicz.Searchingforchangeinhydrologicaldata.HydrologicalSciencesJournal.2004,49(1):3~620ZbigniewW.Kundzewicz.Changedetectioninhydrologicalrecords-areviewofthemethodology.HydrologicalSciencesJournal,2004,49(1):7~1921ShengYue.Acomparisionofthepowerofthettest,Mann-Kendallandbootstraptestsfortrenddetection.HydrologicalSciencesJournal,2004,49(1):21~3722MaciejRadziejewski,ZbigniewW.Kundzewicz.Detectabilityofchangesinhydrologicalrecords.HydrologicalSciencesJournal,2004,49(1):39~5123Stephens,D.A.Bayesianretrospectivemultiple-changepointidentification.Application.Statistics,1994.43:159~17881 24PerreaultL,BernierJ,BobbeB,etal.Bayesianchange-pointanalysisinhydrometeorologicaltimeseries.Part1.Thenormalmodelrevisited.JournalofHydrology,2000,(235):221~24125PerreaultL,BernierJ,BobbeB,etal.Bayesianchange-pointanalysisinhydrometeorologicaltimeseries.Part2.Comparisionofchange-pointmodelsandforecasting.JournalofHydrology,2000,(235):242~26326熊立华,周芬,肖义等.水文时间序列变点分析的贝叶斯方法[J].水电能源科学,2003,21(4):39~4127王孝礼,胡宝清,夏军.水文时序趋势与变异点的R/S分析法.武汉大学学报(工学版),2002,35(2):10~1228谈戈,夏军,李新.无资料地区水文预报研究的方法与出路.冰川冻土,2004,26(2):192~19682 第4章水文系统识别原理与应用目前,自然界中许多水文规律还不能被人们完全认识,实际中,人们获得的水文知识还存在一些未知部分(包括水文结构或参数)。这些未知部分需要通过系统观测的数据信息加以判明或予以估计,其处理方法适当与否不仅直接影响到所建模型的质量,而且涉及到水文特征的正确分析、水文模型的实际应用及其评价等(左其亭,王中根,2002)。因而,定量描述水文过程的数学模型往往十分复杂。为了解决这一问题,近几十年发展了水文系统识别理论,它是运用系统分析的原理和方法,建立可以定量描述水文过程的数学模型,研究和处理缺乏或部分缺乏水文信息,以及受各种随机性、模糊性等不确定性因素干扰的水文系统。本章引用我国夏军、左其亭等学者的研究成果,介绍水文系统识别的概念、原理、研究方法和应用。4.1水文系统识别的概念4.1.1水文系统识别的概念与数学描述系统识别(系统辨识)是指利用系统的观测实验数据和先验知识,建立系统的数学模型和估计参数的理论和方法,它是水文系统模拟及其应用中最基本的问题之一。水文系统识别的概念和应用,开始于30年代L.K.谢尔曼(Shetman)提出的单位线。由于数学模型的发展和应用,今天的水文系统识别在运用系统理论建立模型方面,已经具有深刻的涵义和内容。人们在认识事物过程中,通过测量和计算来判明其内在的结构和参数,称为识别问题。系统识别是通过观测一个系统或一个过程的输入—输出关系,确定该系统或过程的数学模型。水文系统识别是从水文过程的观测中,确定一个能在一定逼近意义下与水文原型过程T相匹配的数学模型。具体地说,水文系统识别是依据水文系统的输入—输出{}u,Y和其他t=1∗水文信息{}IN,在指定的水文模型集ϕ={MN}中确定出一个具体的模型MN,它在数学上与原型的实际观察数据和概念相符合,即:条件:D={}()u,yT;I,ϕ={}M⎫nt=1NN⎪∗⎪目标:E=ε→MN⎬(4-1)∗⎪要求:E=min,且MN∈D0⎪⎭式中,ε为水文模型与原型间的误差向量;E为水文过程模拟的目标函数;⋅为量度83 误差“距离”的某种范数;D0为水文模型的可行域。由上可以看出:(1)水文系统识别有三个基本成分,即水文模型类ϕ={⋅}、观测资料信息D0={}⋅和⎧∗⎫系统识别准则J=⎨E=min,且MN∈D0⎬。它们是描述识别问题的重要部分。只有当三⎩⎭者被确定之后,在数学上才进一步归结为模型或参数的最优化、最优估计等问题。(2)水文模型类ϕ={⋅}是由结构、参数或函数组成的,故识别内容可分为模型的结构识别与参数识别两部分。只有当结构在验前完全设定的情况下,问题才简化为参数识别。(3)识别过程有三个环节,即确定基本成分(ϕ,D0,J)、完成数学求解和检验及应用。4.1.2水文系统识别的一般程序水文系统识别方法是水文系统建模的基本问题之一。在实际应用上,应该遵循水文系统识别方法的一般程序,有步骤地进行分析、计算。(1)首先,依据研究的问题(水文分析、预报或水库调度、水资源评价等),由水文学原理和系统方法确定模型类。(2)然后,选择适当的系统识别准则,利用可以观测到的原型信息(即水文资料)去估计模型中未知部分,并作出必要模型的检验。(3)最后,应用于实际或反馈后作再次改进。4.1.3水文系统识别的分类针对水文系统的模拟或识别的方法取决于研究问题的性质、要求和实际条件以及人们对原型基本特性的认识程度等。从建立一个具体水文系统模型来看,它又必然涉及到数学模型的表达形式。常用的水文系统识别有以下分类。(1)完全识别和部分识别按系统识别的程度,可以分为完全识别和部分识别。若水文系统建模既有结构识别又有参数估计,称为完全识别,例如,系统理论模型的确定等。若系统结构验前作了设定,仅有参数估计,即为部分识别,例如,概念性降雨径流模型的确定等。(2)确定性识别和不确定性识别按识别系统的性质,可分为确定性识别和不确定性识别。确定性识别,就是系统输入和输出关系完全对应,系统的动态变化过程仅取决于初始条件、边界条件和系统输入,即系统输入、输出以及系统结构和变化过程都是确定的。反之,则为不确定性识别。在一定范围内,具有较强因果规律的水文过程可以近似定为确定性关系,现行大多数的概念性水文模型属于确定性关系。这种系统识别在数学上往往归结为最优化问题。当然,水文系统中的不确定性干扰是普遍存在的。如果某些水文变量、参数或系统结构是由不确定性描述的,其相应的系统识别应该是不确定性识别。假如可以通过系统假定、近似等处理措施,把不确定性因素变成确定性因素,相应的识别问题就变成确定性识别问题。若系统含有随机性干扰,可归结为随机识别问题;若基本要素在概念外延上是模糊的,可归结为模糊识别问题;若系统信息具有不完善特性(也称灰色性),可归结为灰色系统识别。84 另外,随着不确定性理论研究的不断深入,也会派生出其他类型的识别问题。(3)显式模型识别和隐式模型识别按照系统识别所建模型的数学结构形式,可以区分为显式模型识别和隐式模型识别。显式是显结构的简称。23例如,某一类非线性过程uk~yk可用方程yk=θ1uk−2+θ2uk−1+θ3uk+εk来描述。模型输出y(k)相对于待定参数{θ1,θ2,θ3}是线性的,称为显式关系。而非线性方程y=θu2+θe−θ3k,则称为隐式关系。k1k2水文系统识别问题的分类见表4-1。表4-1水文系统识别分类及数学问题分类识别的问题定义要点模型特征数学问题按完全识别问题既有结构识别又有参数识别的建模泛函算子模型程非线性规划或度线性与非线性估计分部分识别问题结构验前设定只有参数识别的建模概念性模型类按确定性识别问题不含随机量的水文系统建模确定性模型非线性规划性质分随机性识别问题水文系统含有随机量及概率分布的建模随机模型线性、非线性估计类按模型对参数识别是非线性的数隐式识别问题隐结构模型y=ϕ{u;θ}+ε学非线性规划或线形性与非线性估计式模型对参数识别是线性的显式识别问题显结构模型分y=ϕ{u}+ε类4.2水文系统识别的原理与方法4.2.1水文系统识别的误差准则原型观测值Y和模型计算值YM之间的误差通常用泛函数或范数表示:E=E()Y,YM(4-2)水文系统识别的误差准则通常是使误差泛函数(或范数)E取最小值。比如,最小二乘准则是:TTE=E()Y,YM=∫ε(t)⋅ε(t)dt=min(4-3)0式中,ε(t)=Y(t)−YM(t),Y、YM是定义在区间[0,T]上的函数。85 4.2.2水文系统识别的基本原则1.建模的目的要明确,并且是可以识别的水文模型的建立应有明确的目的性,这将决定模型类的结构和形式的选择。因为针对同一个对象,因系统识别目的和结构设计方法的不同,可以得到复杂程度和使用效果完全不同的模型。在概念性水文模型类中,内部层次划分得愈细,水文系统机理提供的假设和描述就愈多,模型类的结构也将变得愈复杂,这对于最终建模所必需的系统识别和计算处理的困难性就愈大。相反,当采用简单结构或“过程描述”方式,识别技术往往很有效,实用性也较强,但它不一定能够提供足够的有关系统内部机理信息。在具体应用时,要针对具体问题和目的建模。另外,选择的水文系统模型类应该是可识别的,这是一个基本前提。目前,几乎任一种用于实际问题的水文模型都需要借助于识别技术来确定。但是,并非任何水文模型类都可以通过水文资料加以识别。因此,需要对水文模型类的可识别性进行判断。2.识别的技术方法应有效可行当建模问题确定之后,接着就是如何选择系统识别方法。这一阶段涉及数学问题较多,必须针对水文系统特性,经过分析判断,采用合理可行的计算方法。描述水文问题的系统理论模型,多半是显式系统方程。对于非线性结构模型的求解,应注意数值计算不稳定的“病态”现象。对于隐式水文模型,一般无法直接求解。当前能够使用的主要是迭代搜寻的数值方法,应注意搜寻的“失效”问题。3.识别的结果需要分析和检验利用数学方法求得最优模型的解并不等于系统识别的完成,还需要做最后的分析与检验。主要有三方面内容:1)水文概念合理性的检查;2)水文过程模拟的复核检验;3)水文事件预测的检验。前两项检验是结果分析的基础,即,建立的水文模型只有概念合理、模拟可靠时,才可能被采用。当然,第三项的“预测”检验也是必要的。在对识别结果检验时,要发现问题并及时分析原因,作反馈修正,直到获得可用的模型。4.水文系统识别最优估计方法水文系统识别大多涉及到数学上的模型最优化问题。关于求解模型最优化的方法有多种,其中水文中常用的有最小二乘法、最速下降法等。下面将介绍水文系统识别中常用的最小二乘估计方法。把一般的线性方程组记为下列形式:a11x1+a12x2+L+a1nxn=b1⎫⎪a21x1+a22x2+L+a2nxn=b2⎪⎪LLLLLLLLLLLLL⎬(4-4)⎪aj1xj+aj2xj+L+ajnxj=bj⎪am1x1+am2x2+L+amnxn=bm⎪⎭式中,xj为待定量(未知),j=1,2,L,m;aij为m×n个方程系数(已知);bj为m个方程右端项(已知),j=1,2,L,m。86 线性方程组式(4-4)可用矩阵表达为AX=B(4-5)⎡a11a12La1n⎤⎡x1⎤⎡b1⎤⎢⎥⎢⎥⎢⎥式中,A=⎢a21a22La2n⎥;X=⎢x2⎥;B=⎢b2⎥⎢MM⎥⎢M⎥⎢M⎥⎢⎥⎢⎥⎢⎥⎣am1am2Lamn⎦⎣xn⎦⎣bm⎦水文系统识别问题常归结为已知A与B求X。假设线性方程组(4-4)是一个矛盾方程组(有m>n),它不符合由n个方程求n个未知数的定解条件。从m个已知量bi决定n个未知量xj来看,只要已知值的个数m大于惟一决定未知量所必需的方程数目,得到的均是一个矛盾方程组。如方程式(4-5),对任何n维向量X,总有AX-B≠0,当m≠n(4-6)令其差为残差ε(X),即TAX-B=)ε(X;ε(X)=(ε1,ε2,L,εm)(4-7)T式中,ε(X)=(ε1,ε2,L,εm)。一般说,ε有无穷多种取法都可以找到相应的X,使上式成为严格的等式。当然,我们总希望找到使ε在某种意义下达到最小的那个解X,这实际是处理矛盾方程组的最优化*问题。如果我们寻找的解X,使残差ε1,ε2,L,εm的平方和为最小,这类问题就是线性最小二乘问题。*设E(X)为目标函数,当寻求某一向量X,使下式成立22E(X)=AX−B=min;或ε=min(4-8)*则称X为矛盾方程组(4-4)的最小二乘解。可以证明,矛盾线性方程组AX=B存在最小二乘解X的充分必要条件是X满足下列方程组TT2TT()AAX=(AB),即AX−B=min⇔(AA)X=(AB)(4-9)TT方程式(4-9)的系数()AA是对称正定的。如果(AA)矩阵非奇异(矩阵行列式不∗−1T为零),由正规方程式(4-9)可求得惟一的最小二乘解X=(AA)()AB。87 4.3水文系统识别应用以下介绍左其亭应用系统识别方法,针对新疆的伊犁河流域、额尔齐斯河流域、塔里木河源流区以及博斯腾湖流域干旱区灌溉特点,建立的干旱区水量模型,计算灌溉蒸发量的方法步骤和技术路线。4.3.1概念性模型首先,根据实际情况,界定研究区—灌区范围,即水文系统计算单元。一般应考虑以下几个方面。(1)把水力联系密切且交换水量大小计算难于控制的地区放在一起,作为一个系统。(2)尽可能利用地貌单元、水文单元来划分计算单元。(3)有一定的水文循环概念性模型框架,且对出入单元的水量易于定量表达。其次,建立计算单元的概念性水文模型,并绘制成图。一般情况下,如图4-1所示。总蒸发E大气降水P灌溉引水QI植物截留坡面流地表调节地表径流RS地表水体蒸发回归水地表蒸散发ES包气带蒸散发土壤调节壤中流河川径流R河道渗漏QS潜水蒸发EG地下水调节河川基流RG地下潜流UG图4-1灌区概念性水文模型4.3.2建立水量平衡方程根据概念性水文模型,确定计算单元的输入、输出项,绘制水量平衡示意图,如图4-2。依据水量平衡原理,建立水量平衡方程。一般通式如下:QIPERSIRSORGIRGO灌区△VUGIUGO图4-2灌区计算单元水量平衡示意图88 P+QI+RSI+RGI+UGI=E+RSO+RGO+UGO+∆V(4-10)式中,P为大气降水量;E为总蒸发量,包括大气降水引起的降水蒸发EP、灌溉引起的水量蒸发EQ、潜层引起的水量蒸发EG、地表水体直接蒸发ER。即E=EP+EQ+EG+ER;QI为灌溉引水量;RSI为地表径流流入量;RGI为地下径流流入量;RSO为地表径流流出量;RGO为地下径流流出量;UGI为地下潜流流入量;UGO为地下潜流流出量;∆V为系统蓄水量的改变量,增加为正,减少为负,在多年平均情况下可以忽略。4.3.3简化模型结构,确定已知项和未知项的函数关系在水量平衡方程中,有些项是已知的(如灌溉引水量QI、地表径流量RS);有些量可以通过一定的转换关系计算得到(如大气降水量);有些量是未知的,并且未知项居多,这对计算很不利。为了简化计算和识别参数,可以根据已知项和未知项的经验关系(或理论关系),用已知量来近似表达未知量。再代入水量平衡方程中,识别出未知参数。以下将针对新疆伊犁河流域、额尔齐斯河流域、塔里木河源流区以及博斯腾湖流域等干旱区的具体特点,以灌溉蒸发量EQ计算为例,介绍这种近似表达方法。灌溉引水量QI中到底有多少水量被蒸发了,有多少水量又回归到河道,这是干旱区计算水量一直关注的问题。因为,它直接关系到灌溉实际消耗量的计算、天然径流量的还原计算以及水资源合理配置和灌溉面积规划等。灌溉引水产生的蒸发量记为EQ(即灌溉蒸发量)。EQ是总蒸发量E中的一部分。以往在计算EQ时,常采用经验系数法,准确性难以定论。本节将根据以下原理来近似表达EQ,再据系统识别方法来识别有关参数。EQ的计算可以根据实际情况分成两部分,即引水口到进入灌区田间之间的渠道总蒸发量EQ1和农田内灌溉蒸发量EQ2,EQ=EQ1+EQ2。(1)关于EQ1的计算先计算引水口到田间的总损失量是(1−η)×QI,其中,η为渠系水利用系数,QI为引水量。那么,近似计算EQ1的公式为:EQ1=a3×(1−η)×QI(4-11)式中,a3为模型参数。(2)关于EQ2的计算先计算进入田间的总水量为η×QI(符号含义同上),再引用陆面蒸发的计算方法来近似计算EQ2。陆面蒸发是指土壤和水体蒸发以及植被蒸散发的总和。直接观测陆面蒸发很困难,可以用陆面蒸发能力来表达。陆面蒸发能力Ep是指在一定的气象条件下,充分湿润的陆地表面的可能最大蒸发量。它是估计陆面蒸发、进行地区湿润条件和灌溉模数分析以及用间接途径估算径流的主要参数。由于其测量很困难,一般多用公式计算,如,用E-601型蒸发皿观测值E601进行估算:Ep=K×E601(4-12)式中,K为折算系数,我国目前暂取0.9。用Ep表达E的公式如下:89 ⎧Ep;当W≥W0⎪E=⎨W(4-13)⎪Ep;当Wx0}、d={xix0,xi-1>x0),类似地可知后三个转移概率的表达式。(3)状态的二阶转移概率,P(S/SS)、P(d/SS)、P(S/Sd)、P(d/Sd),P(S/dS)、P(d/dS)、P(S/dd)、P(d/dd)、其中P(S/SS)=P(xi>x0/xi-1>x0,xi-2>x0),P(d/SS)=P(xix0,xi-2>x0)类似地可知其他各二阶转移概率的表达式。根据以上参数,用枚举法可分别写出对于样本容量为1、2和3时对应不同极限干旱历时的概率,即极限干旱历时的概率密度,显然对于样本容量为1时极限干旱历时可能取值为0或1,而对样本容量为2时,极限干旱历时可能取值为0、1、2,即取小于或等于样本容量的正整数和0。150 依此,对于样本容量为n,有Pn(L=0/SS)=Pn−1(L=0/SS)P(S/SS)Pn(L=1/dS)=Pn−1(L=0/SS)P(d/SS)+Pn−1(L=1/Sd)P(d/Sd)Pn(L=1/SS)=Pn−1(L=1/SS)P(S/SS)+Pn−1(L=1/Sd)P(S/Sd)Pn(L=1/Sd)=Pn−1(L=1/Sd)P(S/Sd)Pn(L=j/dd)=Pn−1(L=j−1/dS)P(d/dS)+Pn−1(L=j/dS)P(d/dS)(7—13)Pn(L=j/dS)=Pn−1(L=j/SS)P(d/SS)+Pn−1(L=j/Sd)P(d/Sd)Pn(L=j/SS)=Pn−1(L=j/SS)P(S/SS)+Pn−1(L=j/Sd)P(S/Sd)Pn(L=j/Sd)=Pn−1(L=j/dS)P(d/dS)+Pn−1(L=j/SS)P(S/SS)其中2X0)与重现期T的关系可表示为T=1/P。Lloyd(1970)把重现期概念的应用扩展到研究非独立的年洪峰流量序列,而Fernandez(1995)用来研究独立的和非独立枯水流量事件。Vogel(1987)评价重现期的概念,并研究与供水系统可靠性的矢事风险概念有关的统计特性。Fernandez和Salas(1998)把重现期概念应用于不同类型的水文事件,如独立和非独立的洪水、枯水流量及干旱序列。对于这些复杂事件,Fernandez提出,其重现期可以通过计算预测的时间或期望的时刻来估计,直到事件首次发生:∞T=∑n⋅fn(7-16)n=1上式中n=1,2,3,⋯,表示时期或游程,游程事件是指持续出现的同类事件,在它的前后是另一类事件,如降水的丰枯变化等。fn是计算游程发生的概率函数,是指事件在时段n第一次发生的概率。定义函数Sn为事件在时段n及其之前发生的概率,根据定义,可表示为Sn=Sn-1+fn(7-17)对每一个特殊事件,重现期与风险可通过计算fn和Sn得到。2.独立的周期性事件的风险许多水文事件由于受太阳系循环对气候及水文特征的影响,表现出周期性的发生。设x1,x2,⋯,xn,⋯,表示一组周期为ω的循环变量序列,系列R(R1,R2,⋯Rr)为包含r个满足给定条件的连续值的游程,其值呈现出两个不同的状态,即正常(N)或失事(F)。在水资源短缺的情况下,失事是指所有降雨无效或低于相应时段的需水。对于月降雨而言,r个连续月的游程,是代表干旱期为r月的一次气象干旱,如连续三个月缺水的事件可描述为R={F,F,F}。假设缺水状况下,xn是时段n的降雨量,D代表失事与正常条件间的极限值,若xn<D,则有一次失事,那么,在时段n变量x的l个值失事的概率函数qn(l)为qn(l)=P(xn-l+1=F,xn-l+2=F,⋯,xn-1=F,xn=F)(7-18)即:qn(l)=P(xn-l+1r时,Sn=Sn-1+fn在时段n发生缺水的概率fn满足以下条件:①在时段n发生r游程的缺水事件,有一个给定概率qn(r);②在时段n-r-1没有连续发生缺水事件,有一个给定概率(1-Sn-r-1);③从时段n-r到n-1没有发生缺水事件,即在时段n-r没有失事,有一个给定概率(1-PF,n)。以上三个条件彼此独立,因此fn=qn(r)(1-Sn-r-1)(1-PF,n)(7-23)必须要指出的是,fn和Sn与时段的起始时段和周期有关。7.3.2陕西黄土高原区月降雨缺水风险分析分析陕西黄土高原区6个雨量站(其中陕北有绥德、神木、赵石窑3站,关中有3站,马渡王、咸阳、林家村)的降雨资料(表7-5),对于月无效降雨(F)与有效降雨(N)的界值为D,考虑蒸发、作物需水量等情况,全年1~6月和10~12月取D=10mm,7~9月取D=25mm,各月降雨小于D为无效降雨即缺水。计算游程的起始时段是1月,也可用其他月份作为计算起始时段。图7-2为各站各月降雨缺水发生的概率。陕北无效降雨从11月至次年5月易发生;关中从11月至次年4月易发生;6至10月无效降雨概率陕北高于关中,马渡王高于林家村,反映出关中西部较东部干旱频率低。1.00.9绥徳0.8赵石窑0.70.6神木0.5概率0.4马渡王0.3林家村0.20.1咸阳0.0123456789101112月图7-2各站各月降雨缺水的概率表7-5雨量站统计特性表降雨深月均降雨11、12月及1、2月7~9月站名系列(mm)(mm)降雨占全年的%降雨占全年的%绥德1963~1989457.538.14.660.8神木1952~1989435.036.23.866.0赵石窑1951~1989380.931.73.662.1马渡王1956~1995634.052.89.046.0咸阳1956~1995529.544.18.047.0林家村1956~1995703.658.67.051.0153 计算各站连续6个月(游程长为6月)降雨缺水的概率矩阵PF,n及函数qn(l),表7-6是以绥德站为例的计算结果。表7-6绥德站概率矩阵PF,n及概率函数qn(l)计算值月123456789101112PF,n0.9630.9260.5930.3330.2220.1480.1110.0370.1480.0740.3330.630l=10.9630.9260.5930.3330.2220.1480.1110.0370.1480.0740.3330.630l=20.6070.8920.5490.1970.0740.0330.0160.0040.0050.0110.0250.210l=30.2020.5620.5290.1830.0440.0110.0040.0010.0010.0000.0040.016l=40.0150.1870.3330.1760.0410.0060.0010.0000.0000.0000.0000.002l=50.0020.0140.1110.1110.0390.0060.0010.0000.0000.0000.0000.000l=60.0000.0020.0080.0370.0250.0060.0010.0000.0000.0000.0000.000概率fn和累积概率Sn值可以通过将PF,n及qn(l)值代入公式(7-18)、(7-20)、(7-21)计算。图7-3是绥德站7年内发生游程长为3月(无效降雨)的周期函数fn和Sn。当Sn达1.0时,发生相应游程事件的风险是100%。从图7-3中可看出,二函数有着明显的周期性。当n=75月时,累积概率函数Sn达到1,亦即在75月内发生连续3月缺水的风险是100%。当n=60月(5年)时,累积概率函数Sn为0.9991,亦即在5年内发生连续3月缺水的风险是99.99%。1.00.90.8绥德0.70.60.5概率ffnn0.40.3sSnn0.20.10.0月06121824303642485460667278841.00.90.8马渡王0.70.6ffnn概率0.50.4sSnn0.30.20.10.0月060120180240300360420480图7-3连续3月降雨缺水的周期函数fn及累积函数Sn同理,其他各站5年内发生各种游程长(1~6月)的降雨缺水的风险概率见表7-7。由表7-7可知,陕西黄土高原区在5年内,各站发生连续1个月缺水的风险概率是100%,发生连续2个月缺水的风险概率,陕北各站是100%,关中各站98%~99%;发生连续3个月缺水的风险概率,陕北赵石窑站是100%,关中马渡王站最低为74%;发生连续4个月缺水的风险概率,陕北赵石窑为99.9%,关中马渡王最低为29.9%;发生连续5个月缺154 水的风险概率,陕北赵石窑为97.5%,关中马渡王最低为5.7%;连续6个月缺水的风险概率,陕北赵石窑为80.7%,关中马渡王最低为0.5%,说明5年内赵石窑站发生连续半年的降雨缺水的风险很大,而马渡王没有风险。表7-75年内发生连续r月降雨缺水的风险概率游程长r站名1月2月3月4月5月6月绥德1.00001.00000.99910.93920.61730.2299神木1.00001.00000.99990.99050.87870.5402赵石窑1.00001.00001.00000.99930.97510.8075马渡王1.00000.98720.74360.29940.05720.0051咸阳1.00000.99980.96540.67900.23050.0369林家村1.00000.99650.86830.47330.12660.0162将n及fn代入公式(7-16)可估算出各种游程长的重现期(表7-8、图7-4)。在重现期内,出现对应的游程长降雨缺水的风险概率是100%。发生连续1~2个月降雨缺水的重现期各站都小于1年,说明年年发生连续2个月降雨缺水;发生连续3个月缺水的重现期陕北各站都小于1年,说明陕北每年都可能发生连续3个月降雨缺水;关中1~3年发生一次连续3个月的干旱;发生连续4个月缺水的重现期陕北赵石窑站1年一次,其他2站1~2年一次,关中为4~13年一次;发生连续6个月降雨缺水的重现期陕北各站为3~16年一次,关中各站为54~245年一次。可以看出,赵石窑站每3年就要发生连续6月降雨缺水。计算结果应验了黄土高原“年年有旱、三年一小旱、十年一大旱”之说。表7-8发生连续r月降雨缺水的重现期T(年)游程长r(月)站名123456绥德0.0870.2370.7941.9634.96415.833神木0.0880.2170.5421.1752.5126.088赵石窑0.0860.1810.4090.8111.5973.210马渡王0.1710.9753.47113.06458.849245.374咸阳0.1080.4521.3854.22916.30554.021林家村0.1420.7352.3207.32229.604108.386250绥德200神木150赵石窑100马渡王重现期(年)50咸阳0123456月林家村图7-4不同游程长降雨缺水的重现期155 参考文献1中央气象局气象科学研究院.中国近五百年旱涝分布图集.北京:地图出版社,19812中央气象局气象台.1950~1971年我国灾害性天气概况及其对农业生产的影响.北京:农业出版社,19723陈菊英.中国旱涝的分析和长期预报研究.北京:农业出版社,19914刘昌明,魏忠义.华北平原农业水文及水资源.北京:科学出版社,19895冯平,李绍飞,王仲珏.干旱识别与分析指标综述.中国农村水利水电,2002,(7):13~156黄嘉佑.大气科学研究与应用.北京:气象出版社,19927宋连春.1951~1990我国夏季旱涝灾害及其影响的研究.南京大学学报,1991(2)8鞠笑生.气候旱涝指标方法及其分析.自然灾害学报,1988(3)9BahlmeHN,Mooley.LargeScaledrought/floodandmonsooncirculation.MonWeatherReview,1980,10810BogardH,MatgasovszkyI.Ahydrolimatologicalmodelofaerialdrought.JournalofHydrology,1994,154(1~4):245~26411董振国.对土壤水分指标的研究.气象,1985(1)12戴荣法.河北省的旱情与旱灾.水科学进展,1994(增刊)13钱云平,张美丽.应用干旱指标法研究黄河流域干旱特征.水科学进展,1994(增刊)14PalmerWC.MeteorologicalDrought.WeatherBureau,U.S.1965.Researchpaper4515王谦.黄淮海平原极限干旱历时概率特征研究.气象,1995,21(06):9~1216冯国章.极限水文干旱历时概率分布的解析与模拟研究.地理学报,1994,49(5):457~46417冯国章.非相依水文序列极限干旱历时频率分析.干旱地区农业研究,1993,11(3)18WilhiteDA.Droughtplanning:Aprocessforstategovernment.WaterResourcesBulletin,1991,27(1):29~3819HerbstPH,BredenkarcpDB,BarkerHMC.Atechniquefortheevaluationofdroughtfromrainfalldata.JournalofHydrology,1966,4(4):264~27220MohanS,RangacharyaNCV.AmodifiedmethodfordroughtidentificationHydrologicalSciencesJournal,1991,36(1):11~2221冯平,朱元甡,杨鹏.径流调节下的水文干旱识别.自然科学进展,1999,9(9):848~85322李克让,郭其蕴,张家诚.中国干旱灾害研究及减灾对策.郑州:河南科学技术出版社,1999,1~2823王维第.水文干旱研究的进展和展望.水文,1993(5):61~6524李佩成.试论干旱.见:中国干旱半干旱区自然资源研究.北京:科学出版社,1988,49~5525冯平,朱元甡.供水系统水文干旱的识别.水利学报,1997,(11):71~7626Linsley,RK.HydrologyforEngineering.3ndedn.MC.Graw-Hill,NewYork,374~37527刘庚山,郭安红,安顺清,等.帕默尔干旱指标及其应用研究进展.自然灾害学报,2004,13(4):21~27156 28孙荣强.干旱定义及其指标评述.灾害学,1994,9(1):17~2129任尚义.干旱概念研究.中国干旱半干旱地区气候、环境与区域开发研究.北京:气象出版社,1990,54~5530ShenHW,GupllermoQ,Tabios.Droughtanalysiswithreservoirsusingtreeringreconstructedflow.JournalofHydraulicEngineering,1995(5)31冯平,王仲珏,杨鹏.海河流域区域干旱特征的分析与研究.水利水电技术,2003,34(3):33~3532Yevjevich,V.Anobjectiveapproachtodefinitionsandinvestigationsofcontinentialhydrologicdroughts..ColorradoStateUniversity,FortCollins,Colo.1967,HydrologyPaper2333Dracup,JA,Lee,KS,andPaulson,EG.Onthestatisticalcharacteristicsofdroughtevents.WaterResourcesResearch,1980,16(2):289~296.34Dracup,JA,Lee,KS,Paulson,EG.Onthedefinitionofdroughts.WaterResourcesResearch,198016(2):297~302.35Wilhite,DA,andGlantz,MH.Understandingthedroughtphenomenon:theroleofdefinitions.WaterInternation,1985,10(3):111~120.36粟晓玲.陕西黄土高原降雨缺水风险分析.水文,2002.22(3):18~21157 第8章人工神经网络在水文科学中的应用人工神经网络是源于人脑神经系统的一类模型,是模拟人类智能的一条重要途径,具有模拟人的部分形象思维能力,表现出容错性、非局域性、非凸性等特点。人工神经网络主要用于解决水文科学中复杂、模糊和高度非线性的问题,特别是对水文非线性问题的识别与模拟。本章介绍人工神经网络的基本原理及其在水文科学应用中的几个问题。8.1人工神经网络的基本原理本节引用徐丽娜,苑希民,李鸿雁,刘树坤等学者的文献,介绍人工神经网络的基本原理。8.1.1人工神经网络概述神经生理学和神经解剖学证明了人的思维是由脑完成的。神经元是组成人脑的最基本单元,能够接受并处理信息。人脑约由1011~1012个神经元组成,其中,每个神经元约与104~105个神经元通过突触联接。因此,人脑是一个复杂的信息并行加工处理巨系统。人脑的功能,一方面受先天因素的制约,即由遗传信息先天确定了其结构与特性,另一方面,后天因素也起重要的作用,即大脑可通过其自组织、自学习,不断适应外界环境的变化。大脑的自组织(Self-Organization)、自学习(Self-Learning)性,来源于神经网络结构的可塑性(Plasticity),它主要反映在神经元之间联接强度的可变性上。1.人工神经网络的基本含义人工神经网络(ANN-ArtificialNeuralNetwork)或称联接机制,它是对人脑若干基本特性通过数学方法进行概化、抽象,由简单信息处理单元(人工神经元,简称神经元)互连组成的网络,能接受并处理信息,网络的信息处理由处理单元之间的相互作用来实现,通过把问题表达成处理单元之间的联接权进行处理,具有模拟人的部分形象思维能力的非线性信息处理系统。2.人工神经网络的特点(1)大规模的并行计算分布式存贮能力传统计算机的计算和存贮是互相独立的,而在ANN中,无论是单个神经元还是整个神经网络都兼有信息的处理和存贮的双重功能,这两种功能自然融合在同一网络中。ANN计算过程的并行性决定了其对信息的高速处理能力。(2)非线性映射能力ANN各神经元的映射特征是非线性的,有些网络的单元间采用复杂的非线性连接。因此,ANN是一个大规模的非线性动力系统,具有很强的非线性处理能力。(3)较强的鲁棒性和容错性由于信息的分布存储和集体协作计算,每个信息处理158 单元既包含对集体的贡献又无法决定网络的整体状态,因此,局部神经网络的故障并不影响整体神经网络输出的正确性。(4)自适应、自组织、自学习的能力神经网络最突出的特点就是具有自适应、自组织、自学习的能力,它可以处理各种变化的信息,而且在处理信息的同时,非线性动力系统本身也在不断变化,即可以通过对信息的有监督和无监督学习,实现对任意复杂函数的映射,从而适应环境的变化。(5)非局域性一个神经网络通常由多个神经元广泛连接而成。一个系统的整体行为不仅取决于单个神经元的特征,而且可能由神经元之间的相互作用、相互连接所决定,通过神经元之间的连接模拟大脑的非局域性,联想记忆是非局域性的典型例子。(6)非凸性一个系统的演化方向,在一定条件下将取决于某个特定的状态函数,例如能量函数,它的极值对应系统具有某个比较稳定的状态。非凸性是指某系统的能量函数有多个极值,故系统具有多个较稳定的平衡状态,这将导致系统演化结果的多样性。3.人工神经网络的分类(1)按性能分:连续型与离散型;确定型与随机型;静态与动态网络。(2)按联接方式分:前馈(或称前向)型与反馈型。(3)按逼近特性分:全局逼近型与局部逼近型。(4)按学习方式分:有导师的学习(也称监督学习)、无导师的学习(也称无监督学习,或称自组织)和再励学习(也称强化学习)三种,它们都是模拟人适应环境的学习过程的一种机器学习模型,因此,具有学习能力的系统称为学习系统,或称学习机。①有导师的学习:见图8-1(a)。在学习过程中,网络根据实际输出与期望输出比较,进行联接权系的调整,将期望输出称为导师信号,它是评价学习的标准。②无导师的学习:见图8-1(b)。无导师信号提供给网络,网络能根据其特有的结构和学习规则,进行联接权系的调整,此时,网络的学习评价标准隐含于其内部。③再励学习:见图8-1(c)。它把学习看作为试探评价(奖或惩)过程,学习机选择一个动作(输出)作用于环境之后,使环境的状态改变,并产生一个再励信号(奖或惩)反馈至学习机,学习机依据再励信号与环境当前的状态,再选择下一动作作用于环境,选择的原则,是使受到奖励的可能性增大。4.人工神经网络的应用随着计算机技术的普及与发展,人工神经网络的研究与应用涉及自然科学、社会科学、应用科学及综合性交叉科学等各个方面,主要的应用有以下几个方面。(1)模式识别在模式识别方面的主要应用有非线性系统识别、动态系统识别、图形和文字识别、卫星遥感图像识别、声音识别、模糊系统识别、化学过程的仿真与识别、医疗疾病的诊断等。(2)预测和预报在预测和预报方面的主要应用有经济发展预测、银行汇率预测、股市行情预测、市场需求预测、天气预报、降雨径流预报、洪水预报、电力负荷预测、交通状况预测等。(3)优化问题电力输送的优化、大型混合问题的解决、能源的优化利用、水资源优化配置、水库优化调度、大型拱坝体型优化等。(4)神经控制基于神经网络的智能控制有:①工业过程控制,包括蒸汽机的模糊159 控制、退火炉燃烧过程控制、冶炼炉的模糊控制、造纸过程控制、仿人智能温度控制、电力系统控制;②运载工具控制,包括飞机机翼的倾斜和力矩控制、列车自动驾驶系统的模糊智能控制、汽车喷油系统的神经网络控制;③机器人的智能控制;④冰箱温度智能控制系统;⑤机械振动系统的智能减振控制;⑥大型结构的智能减振控制等。(5)智能决策和专家系统美国BehavHeuristics公司应用自适应神经网络研制出一整套航空管理与决策专家系统,实现航空收入的管理、航空市场的分析和预测、人力物力的优化分配与调度;智能数据库系统;专家系统中智能学习和判断分析系统等。期望输出比较自我比较输入输入NNNN实际输出实际输出学习机学习机(a)(b)rcNN1输入动作(输出)输出NN2环境学习机状态(c)图8-1三种学习方式(a)有导师(b)无导师(c)再励8.1.2人工神经元模型如前所述,神经元是组成人脑的最基本单元。生物神经元由细胞体、树突和轴突构成,每个细胞只有一个细胞核、一根轴突,数以千万计的树突及其突触。轴突粗细均匀,表面光滑,其功能为传输细胞体发出的神经信息,是该神经元的输出通道。树突粗而短,数量非常多,其作用为收集其他神经元传出的信息,是神经元的输入通道。突触是两个神经元连接之处,各神经元间通过突触完成信息的传递,而且信息是单向的。如果通过某个突触传来的信号起到使该神经元兴奋的作用,则称其为兴奋型突触;反之,称抑制型突触。另外,突触的连接强度代表了两个神经元间信号传递时耦合的紧密程度,不同的紧密程度相当于作用信号不同的“权重”,而且,正权重表示兴奋作用,负权160 重表示抑制作用。所有输入信号加权后的综合效果作为神经元的输入。若输入值大于或等于该神经元的阈值,该神经元被激活;否则,未被激活。神经信号沿着轴突传出,激励突触连接,接着产生下一个激励,沿着树突传入另一个神经元。上述这些生物神经元具有如下基本特性:(1)神经元具有多输入、单输出的特性。(2)神经元具有非线性输入、输出的特性。(3)各神经元间传递信号的强度是可变的,输入的信号有兴奋与抑制作用之分。(4)神经元输出的响应取决于所有输入信号的加权效果,当等效的输入超过某一阈值时,该神经元被激活;否则,处于抑制状态。1.生物神经元的模拟研究表明,生物神经元的信息处理包括两个阶段,第一阶段是神经元接收信息流的加权过程,称作聚合过程;第二阶段是对聚合后信息流的线性、半线性、非线性函数的处理过程,称作活化过程。单个生物神经元处理信息的模拟过程可以简化成图8-2的形式。不同的信息处理函数反映了神经元处理复杂信息能力的差异。输入x1权重w1输入x2w2叠加转移函数输入xw33∑F┇输出wn输入xn图8-2神经元信息处理过程简化示意图将输入信息和响应输出用一个传输方程表示为⎛n⎞Y=F⎜⎜∑XkWk⎟⎟(8-1)⎝k=1⎠式中,Y为神经元的输出;F为神经元对输入信息的响应特性;Xk为第k个突触所对应的输入信息;Wk为第k个突触的权值。2.人工神经元的数学模型将图8-2神经元的信息处理过程采用数学方式进行描述,则得到图8-3所示的人工神经元数学模型。图8-3中,人工神经元的数学模型描述了一个典型的生物神经元,其过程可以分解为三个数学计算步骤:161 +1x1wj1θjx2wj2wj3yjxf(Sj)3wjn┇jxn图8-3人工神经元的数学模型加权——全部输入信号进行加权计算;求和——进行全部输入信号的组合效果求和计算;映射——通过转移函数f(•)计算输出结果。以下用数学公式描述该神经元进行信息的处理过程。列向量X表示输入向量:⎡x1⎤⎢⎥M⎢⎥TX=⎢xi⎥=[]x1LxiLxn(8-2)⎢⎥⎢M⎥⎢x⎥⎣n⎦行向量Wj表示神经元j的连接权重向量:W=[wLwLw](8-3)jj1jijn神经元j的净输入S为jnSj=∑wjixi+θj=WjX+θj(8-4)i=1式中,θ为阈值。j净输入经过转移函数的作用后,得到神经元的输出y为jn⎛⎞yj=f()Sj=f⎜∑wjixi+θj⎟(8-5)⎝i=1⎠162 转移函数f(•)又称激活函数(ActivationFunction),其作用是模拟生物神经元所具有的非线性转移特性。常用的转移函数有:(1)对称阶跃函数⎧+1,x≥0f(x)=⎨⎩−1,x<0(2)对称Sigmoid函数−xβx−βx1−ee−ef(x)=,f(x)=−xβx−βx1+ee+e(3)非对称Sigmoid函数11f(x)=,f(x)=−x−βx1+e1+e8.1.3人工神经网络模型的拓扑结构上述介绍单个人工神经元模型,这种模型处理信息的能力是非常有限的。多个神经元相互连接组合构成一个神经网络体系,可对复杂的信息进行有效的识别处理。这种神经元的连接方式,称作人工神经网络模型的拓扑结构。按照神经网络的拓扑结构和信息流在网络中传递的方式,人工神经网络可以分为前馈网络、反馈网络和混合网络3种形式。1.前馈网络前馈网络(FeedforwardNetwork)的信息流由输入层逐级向下层传递,没有反馈信息流,经网络处理后由输出层输出。图8-4、图8-5分别给出了单层前馈网络和多层前馈网络的结构。对于多层前馈网络,输入、输出神经元直接感受外部环境的刺激,并于外界发生关系,中间层与外界无直接联系,称为隐含层。输入层x1输出层y1x2┇┇ylxl┇┇ymxnmn图8-4单层前馈网络163 输入层隐含层隐含层输出层x1y1x2┇┇┇┇ylxl┇┇┇ym┇mxnpqn图8-5多层前馈网络拓扑结构2.反馈网络反馈网络又称递归网络(RecurrentNetwork),如图8-6所示,与前馈网络相比,网络中某一层的输出通过连接权重新作为输入反馈到同一层或前一层,输出不仅与当前的输入有关,还与以前的输出有关,因而具有“短期的记忆能力”。而前馈网络输出只与输入和网络的权重有关,与以前的输出无关,通过权重的前馈联想反映人脑的长期记忆能力。输出输出输入输入(a)(b)图8-6反馈网络拓扑结构示意图(a)部分反馈(b)完全反馈人工神经网络的功能不仅与其拓扑结构有关,还与该网络的学习算法有关,不同的学习算法决定了网络的不同功能。关于混合式网络,这里不再详述。8.1.4人工神经网络模型的工作方式人工神经网络的数理模型虽有多种,但基本运算归结为四种,积与和、权值学习、阈值处理和非线性函数处理。人工神经网络的工作方式,由学习期(或称之为训练)和工作期(或称之网络的联想)两个阶段组成。164 1.学习期网络的学习期就是通过不断地向网络输入一些样本模式,遵循一定的学习规则(算法),不断地调整网络的各层权重,使网络的输入和输出以一定精度向给定的样本模式逼近。学习期的实质就是网络通过输入和输出信息识别存在信息之间的内在规律。学习方法可以分为两种方式,一种为有监督学习(SupervisedLearning)或称有教师学习;另一种为无监督学习(Unsupervisedlearning)或称无教师学习。(1)有监督学习有监督学习是给定一组输入、输出作为样本模式,网络根据学习规则不断地调整网络的权重,使网络的实际输出与样本期望输出之间的误差降低到允许的精度。有监督学习常常用来进行系统规律的映射。(2)无监督学习无监督学习的样本模式中不包含期望输出,网络完全按照样本所提供的某些统计规律来调整网络自身,以获得输入信息的某些固有特征,如聚类和统计上的分布规律。这正如小孩子在观察了各种各样的狗后,形成了对“狗”属性的认知,这就是一个学习过程。这类网络常用于信息的分类。不同拓扑结构的神经网络,甚至相同结构的神经网络,因其学习规则的不同,神经网络的功能各异。网络中的每一个神经元都是一个自适应单元,它的权重是可以调整的。权重调整方法的不同,便产生了各种各样的学习规则。以下从神经元权重调整量的角度来介绍各种学习规则。图8-7描述了网络中神经元节点j权重Wj的调整情况。学习信号r定义为x1wj1┇wjiyxjji┇wjnxn∆Wjr=r(∆Wj,X,tj)tj图8-7神经元节点权重的调整情况r=r(Wj,X,tj)(8-6)式中,tj为示教信号。∆Wj表示第j个神经元节点的权重增量,可定义为输入向量X、学习信号r以及学习率η三者之积的形式:T∆Wj=ηr()Wj,X,tjX(8-7)第j个神经元节点在下一迭代中对应的权重可表示为:Wj(t+1)=Wj(t)+∆Wj(t)(8-8)常用的学习规则有Hebb学习规则、感知器学习规则、Delta学习规则、Widrow-Hoff学165 习规则、相关学习规则等等,为了便于分析与比较,这里用统一列表的形式给出各种常见的学习规则及其表达式,见表8-1。有关各种学习规则的推导、性质及用途在很多书籍中都有非常详细的介绍,这里不再赘述。表8-1常用学习规则学习转移学习规则向量式分量式方式函数∆W=ηfWXXT()Hebbj()j∆wji=ηfWjXxi无监督任意∆W=ηt−signWXXT[()]感知器j[j(j)]∆wji=ηtj−signWjXxi有监督二进制∆W=ηt−yf′sXT()()Deltaj(jj)(j)∆wji=ηtj−yjf′sjxj有监督连续∆W=ηt−WXXT()Windrow-Hoffj(jj)∆wji=ηtj−WjXxi有监督任意相关∆Wj=ηXT∆w=ηxi有监督任意tjjitj胜者为王∆W=η(XT−W)()mm∆wmi=ηxi−wmi无监督连续外星∆Wj=η(T−Wj)∆wji=η(tj−wji)无监督连续2.网络的工作期神经网络训练结束后,已经将学习样本的信息存贮于网络之中,此时,网络已经具有映射功能。我们把通过某种方式,使已经存贮在网络中的有关信息从输出层复现出来的过程,称为联想或回忆。不同网络的联想方式也不同。对于前馈联想,输入的激励模式只需一次性通过权重矩阵,就可以产生所需的响应,即输出模式。对于反馈联想,输入的激励模式通过网络产生的响应,作为下一次激励再输入网络(初始激励撤消),这样依次循环,直到输入、输出均不再变化为止,则网络的输出便是网络的联想结果。网络的运行过程可以用图8-8表示。激励W响应激励W响应(a)(b)图8-8联想方式(a)前馈联想(b)反馈联想166 从生物神经元的结构和基本特征入手,通过模拟生物神经元的结构和它对信息的处理过程,建立了人工神经元模型。神经元作为一个处理元件,其功能是极为有限的,不足以完成对复杂系统的辨识与映射,只有将多个神经元联合起来,构成神经网络体系,才能形成具有某种功能的系统,人工神经网络模型即为这种网络体系。对于人工神经网络而言,只从结构上确定的网络不能满足应用需要。一方面,同一结构的网络由于不同的学习规则,会导致不同的网络功能;另一方面,只有通过样本训练,才能最终实现网络的映射功能。总之,拓扑结构、学习规则、训练样本这三方面的有机结合,才能最终确定网络的具体功能。本章将重点介绍BP网络的应用。8.2人工神经网络在水文科学的应用现状8.2.1应用现状从现有的研究来看,人工神经网络在水文科学的应用主要包括预测预报、分类识别计算、优化计算和模拟计算。1.预测预报预测预报是人工神经网络在水文科学中应用最为广泛而且最为成功的方面。水文的许多过程如降雨径流、河川径流、地下水管理、水质模拟、降水等均为非线性过程。人工神经网络是非线性模型建立的有效工具,是一种更为系统的预测方法。其优点是建模需要较少的数据,相对其他模型,模型建立需要的时间较短。预测的主要模型有BP模型和Adaline模型。其基本方法是用聚类方法对训练样本进行聚类,经过合适的人工神经网络网络训练后,获得权值和阈值,利用训练后的网络进行预测。目前,预测预报主要包括降水预报、河川径流预报、河流水位预测、河流含沙量的预测、洪水预报、河流水质预测、地下水位预测、灌溉面积预测、环境污染物浓度预测、旱涝灾害预测、土壤盐渍化的预测、非饱和土的特征参数预测、土壤渗透率预测、土壤湿度的预测等。2.分类识别计算应用这类问题的模型有BP模型、Kohonern模型、Hopfield模型、Harmming网模型、CPN模型和ART模型,其中以BP模型最为常用。分类识别的基本方法是:首先分析分类和识别问题的影响因子,将其作为BP网的输入,每一个影响因子对应BP网输入层的一个节点,将分类识别问题的结果作为BP网的输出,通过样本训练,从而识别出模式或类别与影响因子之间的复杂关系。目前,分类识别的研究主要包括水库纵剖面形态分类、水库水温分层模式判别、流域聚类分析、环境质量评价、水质污染综合评价、湖泊富营养化评价、气候变化对流域水资源环境的影响、管理机构的有效性评价。3.优化计算人工神经网络是一种由大量简单非线性单元连接而成,可以进行高速并行处理的系统,具有快速收敛于状态空间中稳定平衡点的特点,因而被应用到许多问题的求解中,为优化理论与算法的研究提供了一条新的途径。其基本方法是:以优化问题的决策变量人工167 神经网络为输入,优化问题目标函数值为输出,结合线性规划、非线性规划、动态规划等优化模型,通过人工神经网络对样本优化策略的自学习来实现优化问题求解。目前优化计算主要应用在水资源的优化配置,单水库、水库群的优化调度,测站优化设计等方面。4.模拟计算模拟计算是以研究问题归结为自变量与因变量之间的非线性映射关系。以自变量为人工神经网络输入,因变量为网络输出,通过人工神经网络自学习来识别因变量与自变量之间的复杂非线性映射关系。目前主要研究方法包括如下。(1)参数计算如地下水水流模型中复杂含水层的几何形状、含水层参数计算等。(2)曲线率定如时域反射仪(Time-domainreflectometry—TDR)的曲线率定。由于土壤中复杂的电介质,TDR测量的电介质常数—土壤含水量、溶质浓度—容积土壤电导率关系是很难确定的。因而,实际中大多采用经验公式率定。根据TDR测得电介质常数、容积土壤电导率,人工神经网络用来计算含水量和容积土壤电导率,则较其他模型具有较高的精度。(3)模拟计算如岩溶水模拟,水库调洪演算,工程造价估算,地下水水量模拟,区域排水量、排水水位模拟计算,河流特性模拟,泥沙运移模拟计算,地下水污染物运移模拟等。8.2.2存在的主要问题与发展趋势1.存在的主要问题(1)人工神经网络模型的种类很多,但对于某一人工神经网络需要解决的问题,选用哪种网络,目前尚无理论指导。网络的结构(如隐含层数、节点数)虽有一些方法,但是,在实际应用中,一般是先从简单到复杂,由计算机通过反复设计和仿真试验确定,而且与研究者的先验知识有关。(2)人工神经网络学习的准则(目标)函数是L2范数。虽然已经证明BP网络、RBF网络、B样条网络能够逼近L2上的非线性函数,但是目前的理论只是解决了存在性问题,对于提高网络的逼近精度和收敛速度的学习算法研究不够深入。(3)目前,ANN应用较多是BP网络,通过大量的实际应用,证实了BP网络相对其他模型具有较高的拟合精度和预测精度。许多学者研究了BP网络的结构、训练和预报精度等问题,研究结果表明,BP网络模型中的输入层节点数、隐含层数、节点转换函数的类型、模型的训练方式以及原始数据的处理方式均对预报精度产生一定的影响,但是,这些研究成果尚无公认的理论。从数学上看,BP网络模型实质上为非线性梯度优化问题,因此不可避免地存在有局部极小值问题。学习算法的收敛速度比较慢,通常需要上千次或更多次迭代。(4)人工神经网络理论涉及了生物学、神经生物学、脑科学、人工智能、数学等众多学科的研究成果,因此,它的发展有赖于上述学科的发展,特别是有待于人类对自身大脑结构及智能机理的不断深入研究。2.发展趋势(1)ANN模型算法完善与深入研究。包括网络的结构确定、提高网络的逼近精度和收敛速度等问题。168 (2)目前水文中所应用的ANN模型仅是众多人工神经网络模型中的极少数模型,因此,根据农业水土工程的具体特征,研究一些适合于水文问题的神经网络模型与其相适应的学习算法,具有重要的意义。(3)人工神经网络与其他学科的有机结合。如与模糊数学结合来研究模糊神经网络,与混沌学结合研究混沌神经网络,与灰色系统理论结合来研究灰色神经网络,与遗传算法结合进行优化计算。这将是今后研究的热点。8.3人工神经网络在水文中的应用实例以下以BP网络计算为例,说明其基本原理及其在水文中的应用。8.3.1BP网络计算原理本节采用4层BP神经网络。设有NU组样本,其编号为1,2,⋯,p,⋯,NU,输入层节点数为N,第一、二隐含层节点数分别为N1和N2,输出层节点数为M。输入层至第一隐含层的权重为wji,第一隐含层至第二隐含层的权重为wkj,第二隐含层至输出层的权重为wlk。第一隐含层节点的阈值为θj,第二隐含层节点的阈值为θk,输出层节点的阈值为θl。网络模型的计算步骤如下。1.网络初始化取学习步长α、冲量因子β和最大学习误差ε,迭代次数t=1。wji、wkj、wlk、θj、θk、θl随机赋给一个小于(0,1)之间的随机数。(i=1,2,L,N;j=1,2,L,N1;ppk=1,2,L,N2)。随机选取一个样本P,设Xi为样本P输入层节点输入值,yl为样本P输出层实际输出值。由步骤2开始样本训练。2.计算各层输入与输出第一隐含层节点的输入值(输入层节点的输出值)为Np1pXj=−S;Sj=(∑wji∗Xi)−θj(8-9)1+eji=1第二隐含层节点的输入值为(第一隐含层节点的输出值)为N1p1pXk=−S;Sk=(∑wkj∗Xj)−θk(8-10)1+ekj=1输出层节点的输出值为N2p1pXl=−S;Sl=(∑wlk∗Xk)−θl(8-11)1+elk=1169 3.输入下一个样本P=P+1,转向步骤2,直至所有样本训练结束。4.计算样本总误差NUMpp2E=(y−X)(8-12)∑∑llP==11l如果E≤ε,则样本学习结束;否则转向步骤5。5.计算各层误差信号pppppB=(y−X)∗X∗(1−X)(8-13)lkllllMppppB=B∗w∗X∗(1−X)(8-14)kj∑lklkkkl=1N2ppppBji=∑Bkj∗wkj∗Xj∗(1−Xj)(8-15)k=1(i=1,2,L,N;j=1,2,L,N1;k=1,2,L,N2;p=1,2,L,NU)6.修改各层权重⎛NU⎞w(t+1)=w(t)+β∗⎜Bp∗Xp⎟+α∗∆w(t−1)(8-16)lklk⎜∑lkk⎟lk⎝p=1⎠⎛NU⎞w(t+1)=w(t)+β∗⎜Bp∗Xp⎟+α∗∆w(t−1)(8-17)kjkj⎜∑kjj⎟kj⎝p=1⎠⎛NU⎞w(t+1)=w(t)+β∗⎜Bp∗Xp⎟+α∗∆w(t−1)(8-18)jiji⎜∑jii⎟ji⎝p=1⎠式中,wlk(t+1)、wkj(t+1)、wji(t+1)、wlk(t)、wkj(t)、wji(t)分别为t+1、t次迭代权重;∆wlk(t−1)、∆wkj(t−1)、∆wji(t−1)为t-1次权重改变量,其值分别为:⎛NU⎞∆w=β∗⎜Bp∗Xp⎟(8-19)lk⎜∑lkk⎟⎝p=1⎠⎛NU⎞∆w=β∗⎜Bp∗Xp⎟(8-20)kj⎜∑kjj⎟⎝p=1⎠170 ⎛NU⎞∆w=β∗⎜Bp∗Xp⎟(8-21)ji⎜∑jii⎟⎝p=1⎠7.修改各层阈值NUpθl(t+1)=θl(t)−β∗∑Blk+α∗θl(t−1)(8-22)p=1NUpθk(t+1)=θk(t)−β∗∑Bkj+α∗θk(t−1)(8-23)p=1NUpθj(t+1)=θj(t)−β∗∑Bji+α∗θj(t−1)(8-24)p=1式中,θl(t+1)、θk(t+1)、θj(t+1)、θl(t−1)、θk(t−1)、θj(t−1)分别为t+1、t次迭代阈值;∆θl(t−1)、∆θk(t−1)、∆θj(t−1)为t-1次权重改变量,其值分别为:NUp∆θ=−β∗B(8-25)l∑lkp=1NUp∆θ=−β∗B(8-26)k∑kjp=1NUp∆θj=−β∗∑Bji(8-27)p=18.置迭代次数t=t+1;转向步骤2。8.3.2BP网络的设计从目前的研究来看,人工神经网络的设计还没有一套完善的、可以遵循的理论和方法。实际应用中,常规的做法仍侧重于实验,探索多种模型方案,在不断试算中加以改进,直到获得满意的结果为止。人工神经网络设计概括起来主要包括以下三个方面的内容(苑希民,李鸿雁,刘树坤等,2002)。(1)网络拓扑结构的设计。隐含层数、隐含层神经元节点数和神经元节点转移函数的选择。(2)网络主要参数的确定。动量项系数、学习率、学习次数的确定。171 (3)训练样本的组织。训练样本的选择与处理。1.隐层及隐层神经元节点数的确定1988年,Cybenko指出,当各神经元节点均采用S型函数时,一个隐含层就足以实现任意判别分类问题,两个隐层则足以表示输入图形的任意输出函数。这个结论对神经网络的结构设计具有重要的指导作用。实践表明,对于任何复杂的函数,人工神经网络几乎都可以映射到很高的精度,但对于实际问题,要想达到较高的精度,需要做技巧处理。因为任何看似简单的实际问题,实际上涉及了非常多且复杂的影响因素,有时,一些影响因素或许还没意识到。因此,我们常常无法估计出它真实的复杂程度,为了保险,建议在实际应用中,首先考虑神经元节点采用S型转移函数的双隐含层网络设计的方案,有时,尽管单隐层能够解决的问题,也会由于采用双隐含层而大大降低网络训练的难度。隐含层神经元节点数的选择是人工神经网络设计中最为关键的步骤,它直接影响网络对复杂问题的映射能力。目前,许多学者都提出了各自的方法,常见的有如下几种:(1)1987年,Hecht-Nielsen提出的“2N+l”法,其中N为输入的神经元节点数。(2)1987年,根据R.P.Lippmann等人的实验结果,人们经过归纳总结,提出了一个近似公式H=log2T,其中H为隐含层单元数,T为训练样本数。(3)1988年,Kuarycki根据实验发现,第一隐含层与第二隐含层最佳神经元节点数的比例为3∶1。各种各样的方法还有很多,但它们都缺乏令人信服的理论根据,况且有时常常是无效的。所以,试算方法更具可靠性。由于应用对象的不同,隐含层神经元数难以用统一模式确定。苑希民,李鸿雁,刘树坤等(2002)建议采取以下步骤来建立神经网络模型并试算隐含层神经元数。(1)开始使用很少的隐含层神经元数。(2)进行网络训练和测试。(3)不断增加隐含层神经元数。(4)比较不同方案的训练和测试结果,选取合适的隐含层神经元数。2.训练次数的确定在实际训练次数中,常常会出现过度训练(Overtrained)或过度吻合(Overfit-ness)。造成这种现象的原因是网络训练次数过多,而导致网络更多地存贮了各个训练样本的“个性”,以至于掩盖了全体样本所表现出的“共性”。产生过度训练的主要原因是训练样本不够充足,在保证样本足够多的前提下,对于确定性函数的映射不会出现过度训练的现象。因为对于函数来讲,反映函数的映射规律只有对已知全部样本的精确映射,才能保证对函数关系的精确映射。但对于实际问题,发生过度训练的可能性也会存在。在实际问题中,常采用以下的方法来避免过度训练,即保留一部分样本数据作为测试样本,而不参加训练,在训练过程中,每经过一定的训练次数就停下来,以测试样本,检验此时网络对测试样本的测试误差,当发现测试误差开始上升时,就有可能发生过度训练。但一般情况下,并不马上停止训练,仍希望继续训练下去,同时不断地用测试样本对网络进行检验。经过多次比较,才能最终确定最佳训练次数。172 3.训练样本的基本要求网络所需样本的数量主要由两个因素决定,一是映射关系的复杂程度,二是数据中的噪音。映射关系越复杂,所需的训练样本就越多。样本的数目将随着噪音的增大而增加。通常选择样本遵循如下的原则。(1)样本足够多。(2)样本具有代表性。(3)样本分布均匀。4.样本数据的预处理网络训练前,一般需要对原始数据进行一定预处理。(1)有些网络存在输出范围的限制。例如,对于输出层的转移函数为单极性Sigmoid函数的网络,它的输出范围为[0,1],如果训练样本的期望值超出范围时,就必须对训练样本的期望值进行缩放处理。(2)如果网络的隐含层采用的是Sigmoid函数,这种函数的特点是中间部分对输入的变化比较敏感,而两端对输入的变化反应迟钝,这就意味着转移函数对取值范围在两端的数据不如中间部分映射得精确。为了解决这个问题,常常需要将网络的输入样本进行压缩处理。(3)如果网络的多维输入样本属于不同的量纲,它们的取值量级有时会相差较大,可以将各输入的数值都转换到0~1之间,即进行归一化处理,避免由量级上的差别影响网络的识别精度。数据的预处理方法主要有标准化法、重新定标法、变换法和比例放缩法等等。本节介绍一种最为常用的标准化法。(1)因子数据处理设样本因子为xij(i=1,2,L,NU;j=1,2,L,N),其标准化过程为NUNU12122Xj=∑xij;δj=∑(xij−Xj);xij=(xij−Xj)δj(8-28)NUNU−1i=1i=1(2)样本输出数据处理设样本输出数据为yl(l=1,2,L,M),其标准化过程为ylyl=(8-29)ylmax式中,ylmax为yl序列的最大值。8.3.3BP网络样本训练计算举例1.样本数据以下列举Y=f(x1,x2,x3,x4,x5,x6,x7,x8)非线性识别问题,其样本数据如下:No.X1X2X3X4X5X6X7X8Y118.5972.904100.6204.000138.47.851.639220.0454.109202.2474.100162.037.361.951318.2434.455302.5014.100190.063.071.600417.9444.806401.6834.210229.2194.281.945173 517.8905.400500.4944.210270.0351.292.400618.1596.918601.5064.371310.0536.2102.845717.5857.331803.3484.584360.61269.4153.206816.3277.190623.4064.785416.11775.8203.791917.0207.260802.6734.800680.02590.3254.4621016.5097.368854.9504.9001480.03592.2304.6662.数据的标准化处理利用式(8-28)、(8-29),得如下所示标准化数据。No.X1X2X3X4X5X6X7X8Y10.7080-1.7462-1.5837-1.2684-1.2151-0.7071-0.8296-0.97610.23422.0480-1.0131-1.2039-0.0705-0.9158-0.6486-0.8059-0.86130.27930.3804-0.8026-0.82410.1165-0.9158-0.5792-0.7853-0.74640.22940.1037-0.5890-0.4443-0.4858-0.5866-0.4820-0.6800-0.63160.27850.0538-0.2276-0.0646-1.3612-0.5866-0.3809-0.5541-0.51680.34360.30270.69600.3152-0.6161-0.1048-0.2817-0.4056-0.40190.4067-0.22850.94721.07480.74010.5327-0.15630.18270.17230.4588-1.39260.86150.39120.78281.1343-0.01870.58900.74640.5429-0.75130.90411.07480.24311.17920.63561.24251.32060.63710-1.22420.96981.26461.91951.47852.61882.04641.89480.6673.参数设置样本容量为NU=10,输入层节点数为N=8,第一、二隐含层节点数分别为N1=8、N2=8,输出层节点数为M=1。输入层至第一隐含层的权重为wji,第一隐含层至第二隐含层的权重为wkj,第二隐含层至输出层的权重为wlk。第一隐含层节点的阈值为θj,第二隐含层节点的阈值为θk,输出层节点的阈值为θl。取学习步长α=0.6、冲量因子β=0.6和最大学习误差ε=0.00001。4.初始化权重和阈值利用rand()产生[0,1]之间的随机数,得到如下结果。输入层至第一隐含层的权重wji;j=1,2,⋯,8;i=1,2,⋯,8。0.7060.5330.5800.2900.3020.7750.0140.7610.8140.7090.0450.4140.8630.7900.3740.9620.8710.0560.9500.3640.5250.7670.0540.5920.4690.2980.6230.6480.2640.2790.8300.8250.5890.9860.9110.2270.6950.9800.2440.5340.1060.9990.6760.0160.5750.1000.1030.7990.2840.0460.2960.3820.3010.9490.9800.4010.2780.1600.1630.6470.4100.4130.7130.326输入层至第一隐含层的权重改变量∆wji(0),j=1,2,⋯,8;i=1,2,⋯,8;设定为0。0.0000.0000.0000.0000.0000.0000.0000.000174 0.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.000wkj第一隐含层至第二隐含层的权重为,k=1,2,⋯,8;j=1,2,⋯,8。0.6330.2080.1860.5830.0810.4580.9060.2610.7850.3790.2900.9190.6320.6280.4280.0980.5610.6940.9140.8350.0230.5430.9160.4300.6780.5020.5140.4630.3530.4050.2700.0560.2440.9790.0610.3900.3650.4900.1560.4740.2570.6290.5420.1560.9390.6540.5060.3900.1070.7840.4600.7540.5960.8330.0190.2100.0740.1050.3320.1280.0000.5370.6570.544∆wkj(0)第一隐含层至第二隐含层的权重改变量为,k=1,2,⋯,8;j=1,2,⋯,8。设定为0。0.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.000第二隐含层至输出层的权重为wlk,l=1,k=1,2,⋯,8。0.8270.0820.1920.6790.4540.3570.1500.704第二隐含层至输出层的权重改变量为∆wlk(0),l=1,k=1,2,⋯,8。设定为0。0.0000.0000.0000.0000.0000.0000.0000.000第一隐含层节点的阈值θj,j=1,2,⋯,8。0.0950.5900.1700.9280.0980.4440.2730.873∆θj(0)第一隐含层节点的阈值改变量,j=1,2,⋯,8。设定为0。0.0000.0000.0000.0000.0000.0000.0000.000第二隐含层节点的阈值θk,k=1,2,⋯,8。0.5300.0900.7580.4020.4620.4920.2080.330第二隐含层节点的阈值改变量∆θk(0),k=1,2,⋯,8。设定为0。0.0000.0000.0000.0000.0000.0000.0000.000175 输出层节点的阈值θl,l=1。0.929输出层节点的阈值改变量∆θl(0),l=1。设定为0。0.0005.训练样本置训练序次t=1。(1)计算各层输出值fori=1to样本容量(NU=10)①应用式(8-9)计算第一隐含层节点的输入值(输入层节点的输出值)。②应用式(8-10)计算第二隐含层节点的输入值(第一隐含层节点的输出值)。③应用式(8-11)计算输出层节点的输出值。next例如,当i=1时,即选取第1个样本,X1=0.7080,X2=-1.7462,X3=-1.5837,X4=-1.2684,X5=-1.2151,X6=-0.7071,X7=-0.8296,X8=-0.9761。其计算结果如下。1)第一隐含层节点的输入值(输入层节点的输出值)1X=[0.7080-1.7462-1.5837-1.2684-1.2151-0.7071-0.8296-0.9761]Wji=0.7060.5330.5800.2900.3020.7750.0140.7610.8140.7090.0450.4140.8630.7900.3740.9620.8710.0560.9500.3640.5250.7670.0540.5920.4690.2980.6230.6480.2640.2790.8300.8250.5890.9860.9110.2270.6950.9800.2440.5340.1060.9990.6760.0160.5750.1000.1030.7990.2840.0460.2960.3820.3010.9490.9800.4010.2780.1600.1630.6470.4100.4130.7130.326θj=[0.0950.5900.1700.9280.0980.4440.2730.873]1TNETj=X*[Wji]-θj=[-3.4813-4.7042-3.4195-4.9356-5.3942-4.8394-3.3453-3.7335]1Xj=[0.02980.00900.03170.00710.00450.00780.03400.0234]2)第二隐含层节点的输入值为(第一隐含层节点的输出值)1Xj=[0.02980.00900.03170.00710.00450.00780.03400.0234]Wkj=0.6330.2080.1860.5830.0810.4580.9060.2610.7850.3790.2900.9190.6320.6280.4280.0980.5610.6940.9140.8350.0230.5430.9160.430176 0.6780.5020.5140.4630.3530.4050.2700.0560.2440.9790.0610.3900.3650.4900.1560.4740.2570.6290.5420.1560.9390.6540.5060.3900.1070.7840.4600.7540.5960.8330.0190.2100.0740.1050.3320.1280.0000.5370.6570.544θk=[0.5300.0900.7580.4020.4620.4920.2080.330]1TNETk=Xj*[Wkj]-θk=[-0.4585-0.0224-0.6542-0.3423-0.4192-0.4248-0.1627-0.2759]1Xk=[0.38730.49440.34200.41530.39670.39540.45940.4315]3)输出层节点的输出值1Xk=[0.38730.49440.34200.41530.39670.39540.45940.4315]Wlk=[0.8270.0820.1920.6790.4540.3570.1500.704]θl=0.9291TNETl=Xl*[Wlk]-θl=0.47391Xl=0.616同样,第2~10样本的最后输出值如下所示。2No.训练值实际值(训练值-实际值)10.6160.2340.14620.6740.2790.15630.6510.2290.17840.6630.2780.14950.6790.3430.11360.7980.4060.15370.8870.4580.18480.8880.5420.12090.9050.6370.071100.9090.6670.059(2)计算样本总误差利用式(8-12)计算样本总误差E=0.665;E>ε=0.0001,则进行各层误差信号传递和下一次迭代计算。(3)计算各层误差信号1)计算Blky=[0.2340.2790.2290.2780.3430.4060.4580.5420.6370.667]l177 X=[0.6160.6740.6510.6630.6790.7980.8870.8880.9050.909]l利用式(8-13)计算B,其结果如下。lkNo.ylXlyl−Xl1−XlBlk10.2340.616-0.3820.384-0.09020.2790.674-0.3950.326-0.08730.2290.651-0.4220.349-0.09640.2780.663-0.3850.337-0.08650.3430.679-0.3360.321-0.07360.4060.798-0.3920.202-0.06370.4580.887-0.4290.113-0.04380.5420.888-0.3460.112-0.03490.6370.905-0.2680.095-0.023100.6670.909-0.2420.091-0.020Blk=[-0.090-0.087-0.096-0.086-0.073-0.063-0.043-0.034-0.023-0.020]2)计算Bkj利用式(8-14)计算Bkj。Blk=[-0.090-0.087-0.096-0.086-0.073-0.063-0.043-0.034-0.023-0.020]Wlk=[0.8270.0820.1920.6790.4540.3570.1500.704]X=k0.38730.49440.34200.41530.39670.39540.45940.43150.45930.58340.46320.50080.45580.48140.53170.48090.43300.54870.40800.46060.43180.44580.50170.46480.44770.57090.42810.47840.44470.46920.52230.47530.46520.60190.44940.50210.46190.50170.55130.48680.63480.81330.69390.69890.64470.75240.76630.60330.86200.95550.93960.88630.86120.93130.93460.78880.86560.95240.93700.87520.87020.92920.93290.79830.92600.97800.97720.93200.92100.96470.96470.86120.94060.98270.98410.94360.93550.97220.97140.8834例如,对于第1个样本,B1j=-0.090*[0.8270.0820.1920.6790.4540.3570.1500.704]*[0.38730.49440.34200.41530.39670.39540.45940.4315].*[1-0.38731-0.49441-0.34201-0.41531-0.39671-0.39541-0.45941-0.4315]=[-0.018-0.002-0.004-0.015-0.010-0.008-0.003-0.016]178 例如,对于第2个样本,B2j=-0.087*[0.8270.0820.1920.6790.4540.3570.1500.704].*[0.45930.58340.46320.50080.45580.48140.53170.4809].*[1-0.45931-0.58341-0.46321-0.50081-0.45581-0.48141-0.53171-0.4809]=[-0.018-0.002-0.004-0.015-0.010-0.008-0.003-0.015].*表示矩阵点乘运算。同样,可算出其他样本的Bkj,结果如下:Bkj=-0.018-0.002-0.004-0.015-0.010-0.008-0.003-0.016-0.018-0.002-0.004-0.015-0.010-0.008-0.003-0.015-0.019-0.002-0.004-0.016-0.011-0.008-0.004-0.017-0.018-0.002-0.004-0.015-0.010-0.008-0.003-0.015-0.015-0.001-0.003-0.012-0.008-0.007-0.003-0.013-0.012-0.001-0.003-0.009-0.007-0.004-0.002-0.011-0.004-0.000-0.000-0.003-0.002-0.001-0.000-0.005-0.003-0.000-0.000-0.003-0.002-0.001-0.000-0.004-0.001-0.000-0.000-0.001-0.001-0.000-0.000-0.002-0.001-0.000-0.000-0.001-0.001-0.000-0.000-0.0013)计算BjiBkj=-0.018-0.002-0.004-0.015-0.010-0.008-0.003-0.016-0.018-0.002-0.004-0.015-0.010-0.008-0.003-0.015-0.019-0.002-0.004-0.016-0.011-0.008-0.004-0.017-0.018-0.002-0.004-0.015-0.010-0.008-0.003-0.015-0.015-0.001-0.003-0.012-0.008-0.007-0.003-0.013-0.012-0.001-0.003-0.009-0.007-0.004-0.002-0.011-0.004-0.000-0.000-0.003-0.002-0.001-0.000-0.005-0.003-0.000-0.000-0.003-0.002-0.001-0.000-0.004-0.001-0.000-0.000-0.001-0.001-0.000-0.000-0.002-0.001-0.000-0.000-0.001-0.001-0.000-0.000-0.001Wkj=0.6330.2080.1860.5830.0810.4580.9060.2610.7850.3790.2900.9190.6320.6280.4280.0980.5610.6940.9140.8350.0230.5430.9160.4300.6780.5020.5140.4630.3530.4050.2700.0560.2440.9790.0610.3900.3650.4900.1560.4740.2570.6290.5420.1560.9390.6540.5060.3900.1070.7840.4600.7540.5960.8330.0190.210179 0.0740.1050.3320.1280.0000.5370.6570.544Xj=0.02980.00900.03170.00710.00450.00780.03400.02340.20510.10380.24180.05380.05060.03180.10470.09930.11890.04320.11580.04320.03980.04640.09160.08530.14490.05250.14190.04650.07480.09200.10520.07910.18490.05810.16400.04570.13580.17140.10960.06030.48310.28050.42000.17430.56260.50900.23960.16750.77890.69440.77660.68720.90040.84080.63790.55220.67680.75590.59290.69540.85540.86450.72820.63850.91840.94490.90810.91870.97890.95410.93530.81120.99180.99720.99130.99450.99890.98400.99800.9845应用(8-15)计算B。例如,ji对于第1个样本,j=1,i=1;B=[-0.018-0.002-0.004-0.015-0.010-0.008-0.003-0.016][0.6330.78511T0.5610.6780.2440.2570.1070.074]*(0.0298)*(1-0.0298)=-0.001对于第2个样本,j=2,i=1;B=[-0.018-0.002-0.004-0.015-0.010-0.008-0.003-0.015][0.6330.78521T0.5610.6780.2440.2570.1070.074]*(0.2051)*(1-0.2051)=-0.005同样,可算出其他样本各节点BjiBji=-0.001-0.000-0.001-0.000-0.000-0.000-0.001-0.001-0.005-0.003-0.005-0.002-0.001-0.001-0.004-0.002-0.004-0.002-0.003-0.001-0.001-0.002-0.004-0.002-0.004-0.002-0.003-0.001-0.001-0.003-0.004-0.002-0.004-0.002-0.003-0.001-0.002-0.005-0.003-0.001-0.005-0.004-0.004-0.003-0.003-0.006-0.005-0.002-0.001-0.001-0.001-0.001-0.000-0.001-0.002-0.001-0.001-0.001-0.001-0.001-0.000-0.001-0.001-0.001-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000(4)修正权重值1)利用式(8-16)第二隐含层至输出层的权重为⎛NU⎞w(2)=w(1)+β∗⎜Bp∗Xp⎟+α∗∆w(0);lklk⎜∑lkk⎟lk⎝p=1⎠wlk(1)=[0.8270.0820.1920.6790.4540.3570.1500.704]Blk=[-0.090-0.087-0.096-0.086-0.073-0.063-0.043-0.034-0.023-0.020]180 Xk=0.38730.49440.34200.41530.39670.39540.45940.43150.45930.58340.46320.50080.45580.48140.53170.48090.43300.54870.40800.46060.43180.44580.50170.46480.44770.57090.42810.47840.44470.46920.52230.47530.46520.60190.44940.50210.46190.50170.55130.48680.63480.81330.69390.69890.64470.75240.76630.60330.86200.95550.93960.88630.86120.93130.93460.78880.86560.95240.93700.87520.87020.92920.93290.79830.92600.97800.97720.93200.92100.96470.96470.86120.94060.98270.98410.94360.93550.97220.97140.8834∆wlk(0)=[0.0000.0000.0000.0000.0000.0000.0000.000]例如,当l=1,k=1时w11(2)=0.827+0.6*[-0.090-0.087-0.096-0.086-0.073-0.063-0.043-0.034-0.023T-0.020]*[0.38730.45930.43300.44770.46520.63480.86200.86560.92600.9406]+0.6*0=0.626∆w11(1)=0.6*[-0.090-0.087-0.096-0.086-0.073-0.063-0.043-0.034-0.023T-0.020]*[0.38730.45930.43300.44770.46520.63480.86200.86560.92600.9406]=-0.202当l=1,k=2时w12(2)=0.082+0.6*[-0.090-0.087-0.096-0.086-0.073-0.063-0.043-0.034-0.023T-0.020]*[0.49440.58340.54870.57090.60190.81330.95550.95240.97800.9827]+0.6*0=-0.163∆w12(1)=0.6*[-0.090-0.087-0.096-0.086-0.073-0.063-0.043-0.034-0.023T-0.020]*[0.49440.58340.54870.57090.60190.81330.95550.95240.97800.9827]=-0.245同样,算出其他各权重,结果如下所示:wlk(2)=[0.626-0.163-0.0110.4650.2520.142-0.0800.501]∆wlk(1)=wlk(2)−wlk(1)=[-0.202-0.245-0.203-0.214-0.202-0.215-0.230-0.203]2)利用式(8-17)第一隐含层至第二隐含层的权重为wkj(2)⎛NU⎞w(2)=w(1)+β∗⎜Bp∗Xp⎟+α∗∆w(0)kjkj⎜∑kjj⎟kj⎝p=1⎠wkj(1)=0.6330.2080.1860.5830.0810.4580.9060.2610.7850.3790.2900.9190.6320.6280.4280.0980.5610.6940.9140.8350.0230.5430.9160.4300.6780.5020.5140.4630.3530.4050.2700.056181 0.2440.9790.0610.3900.3650.4900.1560.4740.2570.6290.5420.1560.9390.6540.5060.3900.1070.7840.4600.7540.5960.8330.0190.2100.0740.1050.3320.1280.0000.5370.6570.544∆wkj(0)=0.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.000Bkj=-0.018-0.002-0.004-0.015-0.010-0.008-0.003-0.016-0.018-0.002-0.004-0.015-0.010-0.008-0.003-0.015-0.019-0.002-0.004-0.016-0.011-0.008-0.004-0.017-0.018-0.002-0.004-0.015-0.010-0.008-0.003-0.015-0.015-0.001-0.003-0.012-0.008-0.007-0.003-0.013-0.012-0.001-0.003-0.009-0.007-0.004-0.002-0.011-0.004-0.000-0.000-0.003-0.002-0.001-0.000-0.005-0.003-0.000-0.000-0.003-0.002-0.001-0.000-0.004-0.001-0.000-0.000-0.001-0.001-0.000-0.000-0.002-0.001-0.000-0.000-0.001-0.001-0.000-0.000-0.001Xj=0.02980.00900.03170.00710.00450.00780.03400.02340.20510.10380.24180.05380.05060.03180.10470.09930.11890.04320.11580.04320.03980.04640.09160.08530.14490.05250.14190.04650.07480.09200.10520.07910.18490.05810.16400.04570.13580.17140.10960.06030.48310.28050.42000.17430.56260.50900.23960.16750.77890.69440.77660.68720.90040.84080.63790.55220.67680.75590.59290.69540.85540.86450.72820.63850.91840.94490.90810.91870.97890.95410.93530.81120.99180.99720.99130.99450.99890.98400.99800.9845例如,当k=1,j=1时w11(2)=0.633+0.6*[-0.018-0.018-0.019-0.018-0.015-0.012-0.004-0.003-0.001T-0.001]*[0.02980.20510.11890.14490.18490.48310.77890.67680.91840.9918]+0.6*0=0.618182 ∆w11(1)=0.6*[-0.018-0.018-0.019-0.018-0.015-0.012-0.004-0.003-0.001T-0.001]*[0.02980.20510.11890.14490.18490.48310.77890.67680.91840.9918]=-0.015当k=1,j=2时w12(2)=0.208+0.6*[-0.018-0.018-0.019-0.018-0.015-0.012-0.004-0.003-0.001T-0.001]*[0.00900.10380.04320.05250.05810.28050.69440.75590.94490.9972]+0.6*0=0.198∆w12(1)=0.6*[-0.018-0.018-0.019-0.018-0.015-0.012-0.004-0.003-0.001T-0.001]*[0.00900.10380.04320.05250.05810.28050.69440.75590.94490.9972]=-0.009同样,其他各点权重计算如下所示。wkj(2)=0.6180.1980.1710.5760.0680.4460.8950.2530.7840.3780.2890.9190.6310.6270.4280.0970.5580.6930.9110.8340.0210.5410.9140.4290.6660.4950.5020.4570.3440.3950.2610.0490.2350.9740.0530.3860.3580.4830.1500.4700.2520.6260.5370.1540.9350.6510.5020.3880.1050.7830.4570.7530.5940.8310.0170.2090.0590.0950.3170.120-0.0130.5240.6460.535∆wkj(1)=wkj(2)−wkj(1)=-0.015-0.009-0.015-0.008-0.012-0.012-0.011-0.009-0.001-0.001-0.001-0.000-0.001-0.001-0.001-0.001-0.003-0.002-0.003-0.001-0.002-0.002-0.002-0.001-0.012-0.007-0.012-0.006-0.010-0.009-0.008-0.007-0.008-0.005-0.008-0.004-0.007-0.007-0.006-0.005-0.005-0.003-0.005-0.002-0.004-0.004-0.004-0.003-0.002-0.001-0.002-0.001-0.002-0.002-0.002-0.001-0.015-0.010-0.015-0.009-0.013-0.013-0.011-0.0093)利用式(8-18)输入层至第一隐含层的权重wji(2)⎛NU⎞w(2)=w(1)+β∗⎜Bp∗Xp⎟+α∗∆w(0)jiji⎜∑jii⎟ji⎝p=1⎠输入层至第一隐含层的权重wji(1)0.7060.5330.5800.2900.3020.7750.0140.7610.8140.7090.0450.4140.8630.7900.3740.9620.8710.0560.9500.3640.5250.7670.0540.592183 0.4690.2980.6230.6480.2640.2790.8300.8250.5890.9860.9110.2270.6950.9800.2440.5340.1060.9990.6760.0160.5750.1000.1030.7990.2840.0460.2960.3820.3010.9490.9800.4010.2780.1600.1630.6470.4100.4130.7130.326∆wji(0)=0.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.0000.000Bji=-0.001-0.000-0.001-0.000-0.000-0.000-0.001-0.001-0.005-0.003-0.005-0.002-0.001-0.001-0.004-0.002-0.004-0.002-0.003-0.001-0.001-0.002-0.004-0.002-0.004-0.002-0.003-0.001-0.001-0.003-0.004-0.002-0.004-0.002-0.003-0.001-0.002-0.005-0.003-0.001-0.005-0.004-0.004-0.003-0.003-0.006-0.005-0.002-0.001-0.001-0.001-0.001-0.000-0.001-0.002-0.001-0.001-0.001-0.001-0.001-0.000-0.001-0.001-0.001-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000Xi=0.7080-1.7462-1.5837-1.2684-1.2151-0.7071-0.8296-0.97612.0480-1.0131-1.2039-0.0705-0.9158-0.6486-0.8059-0.86130.3804-0.8026-0.82410.1165-0.9158-0.5792-0.7853-0.74640.1037-0.5890-0.4443-0.4858-0.5866-0.4820-0.6800-0.63160.0538-0.2276-0.0646-1.3612-0.5866-0.3809-0.5541-0.51680.30270.69600.3152-0.6161-0.1048-0.2817-0.4056-0.4019-0.22850.94721.07480.74010.5327-0.15630.18270.1723-1.39260.86150.39120.78281.1343-0.01870.58900.7464-0.75130.90411.07480.24311.17920.63561.24251.3206-1.22420.96981.26461.91951.47852.61882.04641.8948例如,当j=1,i=1时w11(2)=0.706+0.6*[-0.001-0.005-0.004-0.004-0.004-0.005-0.001-0.001-0.000-0.000]*[0.70802.04800.38040.10370.05380.3027-0.2285-1.3926-0.7513184 T-1.2242]+0.6*0=0.698∆w11(1)=0.6*[-0.001-0.005-0.004-0.004-0.004-0.005-0.001-0.001-0.000-0.000]*[0.70802.04800.38040.10370.05380.3027-0.2285-1.3926-0.7513T-1.2242]=-0.007当j=1,i=2时w12(2)=0.533+0.6*[-0.001-0.005-0.004-0.004-0.004-0.005-0.001-0.001-0.000-0.000]*[-1.7462-1.0131-0.80260.10370.05380.3027-0.2285-1.3926T-0.7513-1.2242]+0.6*0=0.538∆w12(1)=0.6*[-0.001-0.005-0.004-0.004-0.004-0.005-0.001-0.001-0.000-0.000]*[-1.7462-1.0131-0.80260.10370.05380.3027-0.2285-1.3926T-0.7513-1.2242]=0.004同样,其他各点权重计算如下所示。wji(2)=0.6980.5380.5850.2950.3090.7810.0220.7690.8100.7100.0470.4160.8660.7940.3780.9660.8640.0600.9550.3690.5310.7730.0600.5990.4670.2980.6230.6490.2650.2820.8320.8270.5870.9860.9120.2300.6970.9820.2470.5360.1040.9990.6770.0220.5790.1040.1080.8040.2790.0490.3000.3870.3070.9550.9870.4080.2760.1620.1650.6480.4130.4160.7160.329∆wji(1)=-0.0070.0040.0050.0060.0070.0060.0080.008-0.0040.0010.0020.0020.0030.0030.0040.004-0.0070.0040.0050.0050.0060.0060.0070.007-0.002-0.0000.0010.0010.0020.0020.0030.002-0.0020.0000.0010.0030.0020.0020.0030.003-0.0030.0000.0010.0060.0040.0040.0050.005-0.0060.0030.0040.0050.0060.0060.0070.007-0.0030.0010.0020.0010.0020.0030.0030.003(5)修正权阈值1)利用式(8-22)计算θ(2),l=1。lNUpθl(2)=θl(1)−β∗∑Blk+α∗∆θl(0)p=1θl(1)=0.929,∆θl(0)=0Blk=[-0.090-0.087-0.096-0.086-0.073-0.063-0.043-0.034-0.023-0.020]185 θ1(2)=0.929-0.6*[(-0.090)+(-0.087)+(-0.096)+(-0.086)+(-0.073)+(-0.063)+(-0.043)+(-0.034)+(-0.023)+(-0.020)]+0.6*0=1.298∆θ1(1)=-0.6*[(-0.090)+(-0.087)+(-0.096)+(-0.086)+(-0.073)+(-0.063)+(-0.043)+(-0.034)+(-0.023)+(-0.020)]=0.3702)利用式(8-23)计算θk(2)NUpθk(2)=θk(1)−β∗∑Bkj+α∗∆θk(0)p=1θk(1)=[0.5300.0900.7580.4020.4620.4920.2080.330]∆θk(0)=[0.0000.0000.0000.0000.0000.0000.0000.000]Bkj=-0.018-0.002-0.004-0.015-0.010-0.008-0.003-0.016-0.018-0.002-0.004-0.015-0.010-0.008-0.003-0.015-0.019-0.002-0.004-0.016-0.011-0.008-0.004-0.017-0.018-0.002-0.004-0.015-0.010-0.008-0.003-0.015-0.015-0.001-0.003-0.012-0.008-0.007-0.003-0.013-0.012-0.001-0.003-0.009-0.007-0.004-0.002-0.011-0.004-0.000-0.000-0.003-0.002-0.001-0.000-0.005-0.003-0.000-0.000-0.003-0.002-0.001-0.000-0.004-0.001-0.000-0.000-0.001-0.001-0.000-0.000-0.002-0.001-0.000-0.000-0.001-0.001-0.000-0.000-0.001当k=1时θ1(2)=0.530-0.6*[(-0.018)+(-0.018)+(-0.019)+(-0.018)+(-0.015)+(-0.012)+(-0.004)+(-0.003)+(-0.001)+(-0.001)]+0.6*0=0.596∆θ1(1)=-0.6*[(-0.018)+(-0.018)+(-0.019)+(-0.018)+(-0.015)+(-0.012)+(-0.004)+(-0.003)+(-0.001)+(-0.001)]=0.066当k=2时θ2(2)=0.090-0.6*[(-0.018)+(-0.018)+(-0.019)+(-0.018)+(-0.015)+(-0.012)+(-0.004)+(-0.003)+(-0.001)+(-0.001)]+0.6*0=0.096∆θ2(1)=-0.6*[(-0.018)+(-0.018)+(-0.019)+(-0.018)+(-0.015)+(-0.012)+(-0.004)+(-0.003)+(-0.001)+(-0.001)]=0.006同样,各点θk(2)的其值为186 θk(2)=[0.5960.0960.7720.4550.4980.5190.2190.389]同样,各点∆θk(1)的其值为∆θk(1)=[0.0660.0060.0140.0530.0360.0270.0110.059]3)利用式(8-24)计算θj。NUpθj(2)=θj(1)−β∗∑Bji+α∗∆θj(0)p=1θj(1)=[0.0950.5900.1700.9280.0980.4440.2730.873]∆θj(0)=[0.0000.0000.0000.0000.0000.0000.0000.000]Bji=-0.001-0.000-0.001-0.000-0.000-0.000-0.001-0.001-0.005-0.003-0.005-0.002-0.001-0.001-0.004-0.002-0.004-0.002-0.003-0.001-0.001-0.002-0.004-0.002-0.004-0.002-0.003-0.001-0.001-0.003-0.004-0.002-0.004-0.002-0.003-0.001-0.002-0.005-0.003-0.001-0.005-0.004-0.004-0.003-0.003-0.006-0.005-0.002-0.001-0.001-0.001-0.001-0.000-0.001-0.002-0.001-0.001-0.001-0.001-0.001-0.000-0.001-0.001-0.001-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000-0.000当j=1;θ1(2)=0.095-0.6*[(-0.001)+(-0.005)+(-0.004)+(-0.004)+(-0.004)+(-0.005)+(-0.001)+(-0.001)+(-0.000)+(-0.000)]+0.6*0=0.110∆θ1(1)=-0.6*[(-0.001)+(-0.005)+(-0.004)+(-0.004)+(-0.004)+(-0.005)+(-0.001)+(-0.001)+(-0.000)+(-0.000)]=0.015当j=2;θ2(2)=0.590-0.6*[(-0.000)+(-0.003)+(-0.002)+(-0.002)+(-0.002)+(-0.004)+(-0.001)+(-0.001)+(-0.000)+(-0.000)]+0.6*0=0.599∆θ2(1)=-0.6*[(-0.000)+(-0.003)+(-0.002)+(-0.002)+(-0.002)+(-0.004)+(-0.001)+(-0.001)+(-0.000)+(-0.000)]=0.009187 同样,其他各点的θj(2)和∆θj(1)为θj(2)=[0.1100.5990.1820.9340.1030.4550.2880.880]∆θj(1)=[0.0150.0090.0130.0070.0050.0110.0150.008]8.3.4BP网络在洪水预报中的应用本节以陕西省石头河斜峪关水文站洪水预报为例,说明BP网络的应用。一般地,一个ANN若有m个隐含层,且每个隐含层均由p个单元组成,则可将其表示为ANN(n,m,p,q)。其中,n为输入层单元(神经元或节点)数,xi(i=1,2,⋯,n)表示其输入亦即该层的输出;p为隐含层单元数,q为输出层单元数,yk(k=1,2,⋯,q)表示ho其输出。用wij(i=1,2,⋯,n;j=1,2,⋯,p)表示从输入层到隐含层的连接权,用wjk(j=1,2,⋯,p;k=1,2,⋯,q)表示从隐含层到输出层的连接权。式(8-12)表示的样本总误差E是一个绝对量,不同序列其值不同(即使是标准化或规格化序列也如此),很难确定一个恰当的Eo来对其进行控制。因此,应采用与E有关的相对量作为判别网络训练效果及模型优劣的标准。考虑到水文预报中衡量模型或预报方案有效性的传统,采用确定性系数作为模型评定与预报检验的标准。确定性系数的算式为"N22∑(yi−yˆi)Si=12E2ED=1−=1−=1−=1−(8-30)2N"N"2σ(N′−1)σ22∑(yi−y)∑(yi−y)i=1i=122式中,S、σ分别表示预报序列yˆi的误差的方差和实测序列yi的方差;y表示实测序列的均值;D表示确定性系数,模型评定用Dc表示,预报检验用Dv表示;N"表示预报序列长,对于模型评定N"=N,对于预报检验,N"指用于预报检验的序列长。1.模型的基本形式采用次暴雨洪水径流量(净雨深Rc)及与之相应的暴雨量P和前期影响雨量Pa建立ANN模型,基本关系式为Rc=f(P,Pa)(8-31)即ANN模型的输入层有两个单元(P和Pa),输出层有一个单元(Rc)。建模时,对Rc、P和Pa用下式进行归一化处理:x−xminy=α+β(8-32)xmax−xmin式中,x和y分别表示“归一化”前、后的Rc等;xmax和xmin分别表示x的最大、最小值;α和β是“归一化”数据的上下限限定因子,此处取α=0.99,β=0.005,即把数据归一化在0.005~0.995之间。188 2.模型建立与评定建模采用2种方式,一是按时序选取61次洪水建模,另外10次洪水用于预报检验;二是考虑洪水在成因上属独立事件,建模采用的数据在时序上无关,因此,随机地将71次洪水在时序上完全打乱后选其中51次洪水建模,其余20次洪水用于预报检验。为便于区别,分别将两种方式建立的ANN模型表示为ANNT和ANNR。经对由式(8-31)确定的BP网络在不同隐层、不同隐层节点及节点转换函数下进行网络训练,最终认定以一个隐含层,7个隐含层节点的网络为佳。这样,两种建模方式的ANN结构均为ANN(2,1,7,1)。另外,最终采用的隐层节点转换函数为tansig函数,输出层节点转换函数为logsig函数。结果显示,对第一种方式,建模采用的61次洪水的Rc=f(P,Pa)关系的确定性系数Dc=0.941,第二种方式51次洪水的Dc=0.940。前者的合格率Hc=87%,后者的Hc=84%。两种模型评定与检验的详细计算结果见表8-2至表8-5。表8-2斜峪关水文站ANNT(2,1,7,1)模型评定表降雨量前期影实测预报相对误差洪号响雨量Pa评定结果备注P(mm)径流深径流深(%)(mm)59072228.865.026.622.913.8合格复峰59081235.655.021.421.71.3合格单峰60072241.340.013.312.47.0合格复峰60072535.561.022.825.310.9合格复峰60081476.440.043.843.21.4合格单峰60082140.160.032.627.615.3合格复峰60082635.564.024.727.611.9合格单峰63070659.662.048.837.124.0不合格单峰63081519.161.011.311.84.0合格单峰630831125.653.070.776.58.3合格复峰64052044.562.032.831.05.5合格复峰64052652.257.039.531.021.6不合格复峰64061852.664.021.836.065.2不合格单峰65051472.539.041.637.210.6合格单峰65060359.440.024.926.25.1合格单峰65072147.665.038.235.08.5合格复峰65090449.042.018.820.17.1合格单峰66070672.335.033.332.13.6合格复峰66090283.436.047.048.94.0合格复峰66091473.330.032.427.315.9合格复峰66092140.765.027.631.815.1合格复峰67051735.262.029.625.812.8合格复峰67070331.965.024.625.74.6合格单峰67071144.052.023.425.79.8合格复峰68091947.565.037.634.97.1合格复峰189 续表8-2实测预报前期影降雨量相对误差洪号响雨量Pa径流深径流深评定结果备注P(mm)(%)(mm)Rcm(mm)Rcf(mm)69042334.050.019.616.515.6合格单峰69092686.352.060.758.63.5合格复峰70043036.765.031.629.47.0合格单峰70052754.047.026.528.67.8合格复峰70061737.340.010.410.22.1合格单峰70072879.425.025.727.98.5合格单峰70083060.136.023.022.42.5合格单峰71050247.450.027.526.53.5合格复峰71070972.542.039.040.12.8合格单峰72052235.235.06.07.322.1不合格单峰72052948.445.029.022.920.9不合格单峰72062161.427.016.115.25.3合格复峰72070799.154.073.471.62.4合格复峰72082997.064.082.275.48.2合格复峰73043038.454.024.923.27.0合格单峰73050221.468.018.018.42.0合格单峰73070145.230.09.48.311.3合格单峰73080118.764.011.012.816.7合格单峰73083050.037.014.215.69.8合格单峰73090757.062.021.335.868.0不合格复峰73100557.865.047.440.215.2合格复峰73101335.955.019.421.912.9合格单峰74051876.350.049.445.57.9合格复峰74090459.737.017.623.231.7不合格复峰740910118.640.090.987.63.6合格复峰75070333.950.015.616.55.6合格复峰75070984.460.052.260.916.6合格单峰75080942.955.018.826.641.5不合格单峰75090580.140.045.848.76.3合格复峰75091339.562.030.028.64.7合格复峰77071064.861.037.939.33.7合格单峰78052959.851.030.532.97.8合格复峰780701116.258.076.274.52.2合格复峰78071565.967.052.152.00.3合格复峰78090259.945.030.331.12.6合格单峰78090767.267.054.653.61.8合格复峰190 表8-3斜峪关水文站ANNT(2,1,7,1)模型检验表实测预报前期影降雨量相对误差洪号响雨量Pa径流深径流深预报结果备注P(mm)(%)(mm)Rcm(mm)Rcf(mm)79060325.755.010.113.735.9不合格单峰79070454.250.035.030.213.8合格复峰79071119.965.012.814.412.6合格单峰79071547.340.012.516.632.8不合格单峰79092166.936.023.728.118.6合格复峰80052528.162.023.719.816.5合格单峰80070293.664.082.074.29.5合格复峰80080340.762.020.629.242.0不合格单峰80090473.436.039.134.611.6合格单峰80091572.946.044.242.34.3合格单峰表8-4斜峪关水文站ANNR(2,1,7,1)模型评定表降雨量前期影实测预报相对误差洪号响雨量Pa评定结果备注P(mm)径流深径流深(%)(mm)72052235.235.06.07.830.4不合格单峰79060325.755.010.114.947.2不合格单峰63081519.161.011.312.813.0合格复峰64051844.562.032.830.56.9合格复峰75070984.460.052.258.011.1合格单峰65051472.539.041.638.28.3合格单峰79070454.250.035.032.86.3合格复峰80090473.436.039.135.68.8合格单峰79092166.936.023.727.214.8合格复峰59072228.865.026.621.718.4合格复峰64061852.664.021.835.161.1不合格单峰60072535.561.022.824.99.2合格复峰72080118.764.011.013.421.8不合格单峰78071565.967.052.153.52.7合格复峰70061737.340.010.410.03.4合格单峰77071064.861.037.937.51.1合格单峰72082997.064.082.279.82.9合格复峰67051735.262.029.625.015.6合格复峰78090767.267.054.655.21.1合格复峰191 续表8-4实测预报前期影降雨量相对误差洪号响雨量Pa径流深径流深评定结果备注P(mm)(%)(mm)Rcm(mm)Rcf(mm)70083060.136.023.019.614.8合格单峰74090459.737.017.620.617.0合格复峰74051876.350.049.446.85.3合格复峰73050221.468.018.018.63.4合格单峰64052652.257.039.533.415.5合格复峰72070799.154.073.472.31.5合格复峰70072879.425.025.727.77.7合格单峰73070145.230.09.47.816.9合格单峰80091572.946.044.243.61.4合格单峰78052959.851.030.536.118.4合格复峰72062161.427.016.111.329.6不合格复峰70052754.047.026.529.611.6合格复峰73100557.865.047.439.516.7合格单峰65090449.042.018.818.04.4合格单峰63070659.662.048.835.926.5不合格单峰60081476.440.043.844.10.6合格复峰65072147.665.038.234.210.5合格单峰75091339.562.030.027.97.0合格复峰60082635.564.024.726.26.2合格复峰780701116.258.076.279.44.2合格复峰73043038.454.024.924.41.8合格单峰80080740.762.020.628.638.9不合格单峰80070293.664.082.077.65.3合格复峰79071119.965.012.814.614.4合格单峰73090757.062.021.334.963.7不合格单峰75090580.140.045.849.17.2合格复峰69042334.050.019.616.913.6合格单峰60082140.160.032.627.914.4合格复峰78090259.945.030.332.05.5合格单峰71050247.450.027.528.01.9合格复峰69092686.352.060.758.73.3合格复峰60072241.340.013.311.314.8合格复峰192 表8-5斜峪关水文站ANNR(2,1,7,1)模型检验表实测预报前期影降雨量相对误差洪号响雨量Pa径流深径流深预报结果备注P(mm)(%)(mm)Rcm(mm)Rcf(mm)66070672.335.033.332.81.6合格复峰75080942.955.018.828.752.7不合格单峰70043036.765.031.628.011.5合格单峰75070333.950.015.616.98.1合格复峰72052948.445.029.021.924.7不合格单峰59081235.655.021.422.76.1合格单峰66090283.436.047.050.57.4合格复峰630830125.653.070.780.313.5合格复峰66091473.330.032.426.618.0合格复峰68091947.565.037.634.19.2合格复峰67071144.052.023.427.417.2合格复峰67070331.965.024.624.31.3合格单峰73101335.955.019.423.018.4合格复峰66092440.765.027.630.610.7合格单峰71070972.542.039.041.05.2合格单峰73083050.037.014.212.99.1合格单峰740910118.640.090.985.36.1合格复峰79071547.340.012.514.314.5合格单峰80052528.162.023.719.318.4合格单峰65060359.440.024.924.71.0合格单峰3.预报与检验用上述模型对预留洪水进行预报,结果得ANNT(2,1,7,1)的确定性系数Dv=0.940,ANNR(2,1,7,1)的Dv=0.940,两者的合格率分别为70%和90%。4.模型的选择前面建立了由石头河流域面平均暴雨量P和前期影响雨量Pa预报次洪水径流量(净雨深)的人工神经网络模型的确定性系数和合格率汇总于表8-6。从表8-6两种ANN模型可以看出,两者差别并不大,其中确定性系数都在一个数量范围内,(这是专门按此要求训练模型的结果)。从合格率讲ANNT(2,1,7,1)的Hc略大于ANNR(2,1,7,1),但Hv和Ht(总合格率)则是后者比前者优。从误差变化看,虽然ANNR(2,1,7,1)的模型评定与总体平均误差均略大于ANNT(2,1,7,1)模型,但模型检验的平均相对误差则是后者远小于前者,而且从变幅看(最大、最小相对误差)亦可以认为ANNR(2,1,7,1)优于ANNT(2,1,7,1)。特别是ANNR(2,1,7,1)模型采用随机选样,且模型评定所用洪水次数是其他模型的2倍,比较能够反映实际情况。因此,最终选定ANN(R2,1,7,1)模型作为石头河水库的入库洪水预报模型。模型参数如表8-7。193 表8-6模型评定与模型结果表确定性合格率相对误差变化幅度(%)模型项目系数DH(%)平均最大最小评定0.9418711.268.00.3ANNt(2,1,7,1)检验0.9407019.842.04.3总体0.9408512.468.00.3评定0.9408413.563.70.6ANNr(2,1,7,1)检验0.9419012.752.71.0总体0.9408913.363.70.6表8-7ANNR(2,1,7,1)模型参数表wh1234567ij1-2.56380.9919-1.1038-4.88864.11953.17253.885921.85823.7525-3.7983-1.10912.0893-2.33031.9087θh-3.1359-3.34634.53243.8537-1.84610.4376-2.6169jwo1234567lk1-0.0082-1.8488-2.8950-1.92642.6240-0.7458-0.3867θo1k0.88465.模型的应用ANN模型建模时将数据做了“归一化”处理,因此,用表8-7所列参数作预报时,首先应将P和Pa按式(8-32)“归一化”为P′和Pa′,然后用ANNR(2,1,7,1)计算出“归一化”的R′,再用式(8-32)做逆变换,将R′换算成实际的净雨深R,最后再将R转换成水库坝址断面以上的洪水总量——入库次洪水总量。下面举一算例。设已预报出一次暴雨的总雨量P=80.0mm,并计算出相应的前期影响雨量Pa=50.0mm,试用ANNR(2,1,7,1)模型预报该次暴雨的洪水总量。计算过程如下:(1)从建模和模型检验所用数据中分别选出P、Pa和Rc的最大值、最小值:Pmax=125.6mmPmin=18.7mmPamax=68.0mmPamin=25.0mmRmax=90.9mmRmin=6.0mm(2)计算P′和Pa′⎛80.0−18.7⎞P"=⎜⎟×0.99+0.005=0.5727⎝125.6−18.7⎠194 ⎛50.0−25.0⎞Pa"=⎜⎟×0.99+0.005=0.5806⎝68.0−25.0⎠(3)计算R′R′的计算,可直接调用Matlab人工神经网络的函数Simuff(x,w1,b1,f1,w2,b2,f2)计算,TThhoo其中x=[]P",Pa"=[0.5727,0.5806];w1,b1,w2,b2分别为表8-7中的wij,θj,wlk和θk;f1和f2分别表示隐层和输出层节点转换函数,这里f1=tansig,f2=logsig。另外,可用其他语言编程计算,或用计算器计算。也可用Excel列表计算,其计算过程十分明了,就像在纸上计算一样。表8-8给出了详细的计算过程和数据,可供应用时参考。用各种方法均可得到R´=0.5302。(4)R的计算对式(8-32)作逆变换并计算得(R"−β)(Rmax−Rmin)R=+Rmin(8-33)α即(0.5302−0.005)(90.9−6.0)R=+6.0=51.0mm0.99(5)入库次洪水总量预报将R换算成坝址断面入库次洪水总量W,得3W=1000×R×F=1000×51×673=3435万m至此,完成了一次暴雨的净入库洪水的预报,再根据当前的入库径流过程估算出基流,即可预报出入库洪水总量。表8-8ANNR(2,1,7,1)预报参数计算表0c1j=c2j=sj=c1jZh=cjk=sk=Zj=j()jhh+c+θ()0hc+θlogsigskw1jx1w2jx22jjtansigcjwjkZj∑jkk=R′1-1.46831.0788-3.5253-0.99830.00820.12080.530220.56812.1786-0.5996-0.5368-0.99243-0.6321-2.20521.69500.9348-2.706240.7997-0.64390.41010.3885-0.748552.35921.21301.72610.93862.462961.8169-1.35290.90160.7171-0.534872.22551.10820.71670.6149-0.2378备注x1=P′,x2=Pa′,k=1195 参考文献1徐丽娜.神经网络控制.哈尔滨:哈尔滨工业大学出版社,19992苑希民,李鸿雁,刘树坤,等.神经网络和遗传算法在水科学领域的应用.北京:中国水利水电出版社,20023RaoSGovindaraju,chmn.ArtificialNeuralNetworksinHydrology.I:PreliminaryConcepts.JournalofHydrologicEngineering,2000,5(2):115~1234RaoSGovindaraju,chmn.ArtificialNeuralNetworksinHydrology.II:HydrologicApplicationsJournalofHydrologicEngineering,2000,5(2):124~1375ASezinTokarandMomciloMarkus.Precipitation-RunoffModelingUsingArtificialNeuralNetworksandConceptualModels.JournalofHydrologicEngineering,2000,5(2):156~1616Cho-ChungYang,Chang-ShianChen,andLiang-ChengChang.ModelingofWatershedFloodForecastingwithTimeSeriesArtificialNeuralNetworkAlgorithm.ConferenceProceeding.WaterResourcesEngineering"98:903~9087TawatchaiTingsanchali,MaheshRajGautam.Applicationoftank,NAM,ARMAandneuralnetworkmodelstofloodforecasting.HydrologyProcesses,2000,14(14):2473~24878KondaThirumalaiahandMakarandCDeo.HydrologicalForecastingUsingNeuralNetworks.JournalofHydrologicEngineering,2000,5(2):180~1899Hyun-SukShinandJoseDSalas.RegionalDroughtAnalysisBasedonNeuralNetworks.JournalofHydrologicEngineering,2000,5(2):145~15510胡铁松,袁鹏.人工神经网络在水文水资源中的应用.水科学进展,1995,6(1):76~8211赵辉,齐学斌.神经网络技术在地下水资源管理中的应用现状与发展趋势.地下水,1999,21(2):73~7512BSThandaveswaraandNSajikumar.ClassificationofRiverBasinsUsingArtificialNeuralNetwork.JournalofHydrologicEngineering,2000,5(3):290~29813SunilKSinhaandRobertAMcKim.ArtificialNeuralNetworkforMeasuringOrganizationalEffectiveness.JournalofComputinginCivilEngineering,2000,14(1):9~1414刘勇健,沈军.基于人工神经网络的水库纵剖面形态分类.武汉水利电力大学学报,1999,32(6):14~1715郭宗楼.人工神经网络在环境质量评价中的应用.武汉水利电力大学学报,1997,30(2):75~7816VChandramouli,andHRaman.MultireservoirModelingwithDynamicProgrammingandNeuralNetworks.JournalofWaterResourcesPlanningandManagement,2001,127(2):89~9817TRNeelakantanandNVPundarikanthan.NeuralNetwork-BasedSimulation-OptimizationModelforReservoirOperation.JournalofWaterResourcesPlanningandManagement,2000,126(2):57~6418胡铁松,万永华.水库群优化调度函数的人工神经网络方法研究.水科学进展,1995,6(1):53~5919SubhrenduGangopadhyay,TirthaRajGautamandAshimDasGupta.SubsurfaceCharacterizationUsingArtificialNeuralNetworkandGIS.JournalofComputinginCivilEngineering,1999,13(3):153~16120ThomasDKromandDanRosbjerg.AnArtificialNeuralNetworkBasedGroundwaterFlowandTransportSimulator.ConferenceProceeding.WaterResourcesandtheUrbanEnvironment-98:597~60221DavidCHoffmanandPanagiotisDScarlatos.ArtificialNeuralNetworkSimulationofAlluvialRiverCharacteristics.ConferenceProceeding.WaterResourcesEngineering:415~41922胡铁松,袁鹏,丁晶.人工神经网络在水文水资源中的应用,水科学进展,1995,6(1):76~82196 第9章遗传算法及其在水文科学中的应用遗传算法是模拟生物界的遗传和进化过程而建立起来的一种算法。20世纪60年代,美国密执根大学Holland教授提出了遗传算法的概念体系,这种方法仅需要利用适应度函数值进行优化问题的计算,不要求函数导数存在,具有鲁棒性和全局搜索能力,搜索不依赖于梯度和求解问题本身。因而,它得到了许多领域学者的高度关注,常常被应用优化和并行处理问题。本章介绍遗传算法的基本原理及其在水文科学应用中的几个问题。9.1遗传算法的基本原理本节引用徐丽娜,陆金桂,李谦,王浩,苑希民,李鸿雁,刘树坤,周明,孙树栋等学者的文献,介绍遗传算法的基本原理。9.1.1遗传算法概述1.遗传算法的基本含义遗传算法(GeneticAlgorithm—GA)是模拟生物界“生存竞争,优胜劣汰,适者生存”的机制,以位码的方式,基于有限合理解的条件下,以适当的评分标准来定出优胜劣汰的依据,适应值较好的个体将被复制、交配、突变,以使较符合目标函数的解能够有效地繁衍至下一代,持续这样的竞争性将使得较佳的解得以保留,反之,较差的解将被自然淘汰掉。经过数代后,即可得到最适应于搜寻空间的最佳解。因此,遗传算法是一个迭代过程,在每次迭代中都保留一组候选解,按其解的优劣进行排序,并按某种指标从中选出一些解,利用交配、突变等遗传算子对其进行运算,产生新一代的一组候选解,重复此过程,直到满足某种收敛指标为止。2.遗传算法的主要内容遗传算法主要包括如下内容(陆金桂,李谦,王浩等,1997):(1)构造适应度函数;(2)群体的初始化;(3)后代群体的繁殖;(4)群体进化收敛判别;(5)最优个体转化为优化解。3.遗传算法的主要特点(1)遗传算法模拟了生物界“生存竞争,优胜劣汰,适者生存”的机制,用逐次迭代法搜索寻优。(2)遗传算法对所求解的问题无连续性、可微性要求,只需知道目标函数的信息。(3)遗传算法在其寻优过程中,始终保持整个种群的进化,不是一点,而是在群体中搜索寻优。(4)遗传算法为许多求解困难的全局优化问题的解决开辟了一条新的途径。(5)最优个体转化为优化解。197 4.遗传算法的分类遗传算法有许多种形式,总体上可以分为两大类,即简单遗传算法(SimpleGeneticAlgorithm─SGA)和高级遗传算法(RefinedGeneticAlgorithm─RGA)。SGA和RGA的主要区别在于:⑴SGA的遗传算子只有交配和突变,而RGA中包括了一些新的算子,如逆算子等。⑵SGA中交配算子和突变算子发生的概率是恒定不变的,而RGA中的概率是可变的。5.遗传算法的应用目前,遗传算法广泛地应用在函数优化、组合优化、生产调度、自动控制、机器人学、图像控制、人工生命、遗传编码和机器学习等方面。9.1.2遗传算法中的几个概念1.个体个体(IndividualString)是遗传算法中用来模拟生物染色体的一定数目二进制位串,该二进制位串用来表示优化问题的设计点。由于个体是用来模拟生物群体进化的最基本单位,因而个体是遗传算法中的基本概念。在遗传算法中,个体又称为人工染色体(ArtificialChromosome)。例用六位二进制串来表示的个体。6显然,六位的二进制串最多可用来表示2个个体。下面是六位二进制串表示的64个个体。个体1111111个体2111110个体3111101个体4111011个体5110111⋯101111⋯011111⋯111100⋯⋯⋯⋯⋯⋯⋯个体61000011个体62000010个体63000001个体64000000遗传算法中个体与优化设计模型中的设计变量集存在着对应关系,一个个体可以用来描述优化设计问题中的一个解。例用个体来表示优化问题的设计点。优化问题为:minF(x)x=[x1,x2]198 假设每个设计变量都以4位二进制码来表示,则两个设计变量需用8位二进制码来表示,因此与设计变量解对应的个体将是一个8位二进制位串。个体110111100↓↓对应设计变量x1,对应设计变量x2个体211010011↓↓对应设计变量x1对应设计变量x2(1)(1)个体对应着优化问题的两个设计变量,个体1可表示设计解[x,x],个体2表示12(2)(2)设计解[x,x]。122.群体群体(Population)是由一定数量的个体组成的集合。生物进化过程是一代生物群体繁殖产生另一代生物群体的过程。因此,基于生物进化思想的遗传算法从本质上看是模拟生物的一代群体向另一代群体变化的历程,因而群体是遗传算法中体现算法特点的一个重要概念。遗传算法中的群体与优化模型中若干个设计解组成的集合相对应,因而群体与优化模型中设计解集合存在着一一对应的关系;群体规模是与群体有关的一个概念。群体规模是指群体中包含个体的数量。如在上例中,如果将个体l和个体2作为一个群体,那么群体规模数为2。初始化群体是一类特殊的群体,是指遗传算法中的第一代群体。初始化群体反映着优化问题的初解,因而初始化群体与优化模型的初始解相对应。初始化群体又称为原始群体;而初始化群体的过程,被称为群体的初始化。3.基因模式基因模式(Schemata)是指二进制位串表示的个体中,某一或某些位置上具有相似性的个体组成的集合。例基因模式下面给出如下六位二进制串中包含的6个基因模式。H1=*1****H2=*10***H3=*100**H4=1001**H5=*10110H6=100110在上述基因模式,符号*代表在该位置处二进制数值可以是0或1。基因模式H1代表在位置2二进制值为1的个体集合,基因模式H2代表在位置2、3二进制值为1、0的个体集合,基因模式H3代表在位置2、3、4二进制值为1、0、0的个体集合,基因模式H4代表在位置1、2、3、4二进制值为1、0、0、1的个体集合,基因模式H5代表在位置2、199 3、4、5、6二进制值为1、0、1、1、0的个体集合,基因模式H6代表在位置1、2、3、4、5、6二进制值为1、0、0、1、1、0的个体集合。4.模式阶次模式阶次(SchemaOrder)是指模式中包含相似位置的数目。用o(H)表示。在上例中,基因模式Hl的模式阶次为1,基因模式H2的模式阶次为2,基因模式H3的模式阶次为3,基因模式H4的模式阶次为4,基因模式H5的模式阶次为5,基因模式H6的模式阶次为6。5.模式定义长度模式定义长度(DefiningLengthofSchema)是基因模式中相似位间相距的最大距离。其单位是位串个数,常用符号一般用δ(H)表示。在上例中,基因模式H1的模式定义长度为0,基因模式H2的模式定义长度为1,基因模式H3的模式定义长度为2,基因模式H4的模式定义长度为3,基因模式H5的模式定义长度为4,基因模式H6的模式定义长度为5。6.适应度适应度(Fitness)是以数值方式来描述个体优劣程度的指标。在优化模型中,目标函数是对设计解优劣进行比较的指标,在遗传算法中适应度是用来评判个体优劣的重要指标,因此遗传算法的适应度在物理意义上对应着优化模型中的目标函数。7.平均适应度平均适应度(AverageFitness)是若干个个体的适应度值的算术平均值。他常用来评判群体中个体的优劣程度。8.繁殖繁殖(GeneratingNextPopulation)是由一代群体繁衍产生另一代群体的方式总称。在遗传算法中,由父代个体繁殖产生下代个体是最重要的内容。目前繁殖的方式主要包括选择、杂交、突变等繁殖算子。9.选择选择(Reproduction)算子是指在上一代群体中按照某些指标挑选,参与繁殖下一代群体的一定数量的个体。10.杂交杂交(Crossover)算子是指对优选后的父代个体进行基因模式的重组而产生后代个体的繁殖机制。在个体繁殖过程中,杂交能引起基因模式的重组,从而有可能产生包含优良性能的基因模式的个体。杂交方式一般有一点杂交、两点杂交、均匀杂交、基于顺序杂交等,其中一点杂交算子实现起来最简单。11.突变突变(Mutation)算子是指模拟生物在自然的遗传进化环境中由于各种偶然因素引起的基因模式突然改变的个体繁殖方式。在突变算子中,常以一定的概率在群体中选取个体,随机选择个体的二进制位串中的某一位进行由概率控制的变换(即由1改为0或由0改为1),从而产生新的个体。200 父代个体后代个体1111101111101011↑↑突变位突变位9.1.3遗传算法的计算在优化设计中,设计变量、目标函数、约束条件是优化模型的三个要素。一般可利用编码技术对设计变量进行编码,将设计变量转化为适合于群体进化的表达形式,对目标函数进行处理,使其蕴含于遗传算法的适应度函数。这样,在群体进化过程中适应度也就反映了优化模型的目标函构造适应度函数数。当群体进化结束时,适应度值最大的个体对应的目标函数值最小,该个体即对应优化模型的优化解。这样,建立变量个体的映射关系优化模型就可利用遗传算法来求解。遗传算法的流程图如图9-1所示。初始化群体1.编码问题标准遗传算法不能直接对问题空间进行操作,必须进行选择算子操作将问题空间的解变量转换成遗传空间,由基因按一定结构组成染色体,这一转换操作就叫做编码;相反,将染进行繁殖算子色体编码映射为问题空间的操作,称为解码。遗传算法在编码空间对染色体进行遗传运算,而在解空间对解进繁殖后代个体行评价和选择。常用的遗传算法编码技术如下。N(1)一维染色体编码。本代个体繁殖结束否?一维染色体编码是指问题空间的候选解转换到遗传YN空间后,其相应的染色体呈一维排列的基因链码。通常群代进化收敛否?采用的一维染色体编码技术有:Y1)二进制编码选择最优个体二进制编码是将问题空间的候选解转换为遗传空间的各位数值为“0”或“l”的字符串。输出最优解若变量x的取值区间为[a,b],要求的精度为小数点后n位,则染色体串v的长度m应为图9-1遗传算法流程图m−1nm2<(b−a)×10≤2−1(9-1)二进制v与对应的十进制编码x′的转换公式为m==⋅i=′v[vmvm−1vm−2Lv0]∑vi2x(9-2)i=0十进制编码x′与取值区间为[a,b]的实数变量x的转换公式为201 (b−a)x′x=a+(9-3)m2−1二进制编码方法是最为经典和常用的编码方法,它的优点有:①符合最小字符集的编码原则;②编码简单,便于进行交叉、变异等遗传操作,且物理概念清晰;③便于用模式定理进行分析与预测。因为模式定理就是以二进制编码为基础建立起来的,二进制提供了各个位信息最大的模式数。但是,对于多维、高精度问题,二进制编码就会显示出一些不足,主要有:①二进制编码不能直接反映出所求问题的本身结构特征;②二进制编码的染色体长度与问题空间的区域大小和精度要求直接相关,对于大区间、高精度的问题,染色体的长度会很长,搜索空间也会很大,这样的遗传搜索相当困难;③相邻的二进制编码可能会有较大的Hamming距离,从而降低了遗传算子的搜索效率。利用灰码编码方法可以在一定程度上克服上述缺点。2)灰码编码灰码编码是将二进制编码通过一个变换而得到的编码,其表现也为二进制的形式,所不同的是灰码编码技术保证了在遗传空间相互靠近的两个点也必须在问题空间里靠近,反之亦然。不难发现,灰码有这样的性质,即任何两个在问题空间彼此相邻的点在遗传空间的编码只有一位不同,也就是说,参数值增加一步相应的代码也改变一位。3)浮点编码浮点编码是灰码转换,只是保证了问题空间相邻的点在遗传空间有数值为1的Hamming距离,但遗传空间还不是问题空间。如果采用浮点表达的编码方法,即每个染色体向量被编码成一个与解向量相同长度的浮点数向量。浮点编码与二进制编码相比有以下优点:①精度依赖于所使用的机器,与编码本身无关,比二进制要灵活、方便;②浮点编码能够表达很大的区域,而二进制编码必须以牺牲精度来增加表达区域;③容易设计出封闭的、动态的遗传算子,容易处理非常规约束。一维编码的方法还有很多,如交叉编码、多参数编码、可变长编码等等。(2)二维染色体编码。在很多实际问题中,解本身就是以二维或多维的形式存在的,为了使问题的表达更直观,可直接采用多维染色体编码。在图像识别中,常常以二维矩阵的形式来记录一幅图像,如一幅黑白10×10个像素的二维图像的二进制染色体编码例子。如果某一点的像素为“黑”,则相应位的基因编码为“l”,如果像素点为“白”,则相应位的基因编码为“0”。2.适应度函数在遗传算法的进化过程中,对染色体的评价是由适应度函数来完成的,适应度函数的函数值作为选择运算的依据。由于进化的准则是“优胜劣汰”,即遗传算法向着适应值增加的方向进化,所以目标函数的寻优方向应该与适应度函数值增加的方向一致,这是适应度函数设计的先决条件。另外,为了理论分析的方便,最好保证适应度函数非负。有时适应值为负的情况,要进行适当的转换。将目标函数转换成适应度函数一般要遵循两个基本原则。一是优化过程中目标函数的优化方向(如寻求目标函数的最大值或最小值)与种群进化过程中适应度函数值增加的方向相一致。二是适应度函数值大于等于0。202 (1)适应度函数的设计在实际问题中,对于最小值优化问题,适应度函数为⎧Cmax−f(x)当f(x)Genmax,则终止。否则CurrentGen=CurrentGen+1,转向步骤2。9.2.2采用十进制编码求解优化问题⎧MinF(x)=(x−1)2+x2+100(x−1)2122⎪⎨x1∈[0,2]⎪⎩x2∈[0,2]则适应度值为:⎧Cmax−F(x)F(x)Genmax,则终止。否则CurrentGen=CurrentGen+1,转向步骤2。9.3有约束问题的优化问题求解目前,应用遗传算法处理有约束优化问题尚无一致适应的方法。常用的处理约束方法有修复不可行解法、改变遗传算子法和惩罚函数法。修复不可行解法的主要缺点是不同类的求解问题有不同的修复算法,修复算法依赖于所求问题;改变遗传算子法求解复杂的非线性优化问题,设计相应的遗传算子是非常困难的;惩罚函数法是对不可行解的个体,在计算个体适应度时,施加某种惩罚,降低该个体的适应度,使其被遗传到下一代群体的机会减少,经过若干次迭代计算,种群最后逐渐收敛于可行解。因此,实际中应用GA求解约束优化问题时,往往是根据具体优化模型中约束条件的特征,选择适合的遗传算子或设计相应的遗传算子,选用上述方法进行优化问题的求解。本节基于FernandoJiménez的研究,对一般非线性规划(NonlinearProgrammingProblem,NPP)和整数规划(IntegralProgrammingProblem,IPP)约束优化问题的GA求解进行探224 讨,以期为非线性规划和整数规划问题求解提供参考。9.3.1NPP和IPP问题求解的标准形式NPP和IPP问题求解的标准形式可以表示为:⎧目标函数minf(x1,L,xj,L,xn)⎪⎨约束条件gi(x1,L,xj,L,xn)≤0i=1,2,L,m(9-⎪⎩lj≤xj≤ujj=1,2,L,n13)式中,m,n分别为约束数和决策变量数;x1,L,xj,L,xn为决策变量,对于整数规划,取值为界于[lj,uj]之间的整数值,其中[lj,uj]为变量的取值范围;gi(x1,L,xj,L,xn)为不等式约束左边项,左边项可以是线性,也可以是非线性。式(9-13)模型求解采用如下方法转换为标准形式。(1)目标函数最大化对于目标函数最大化问题,可用其负值的最小化问题替代,求解后,将结果再反号,则为原目标函数的最大化值。即maxf(x1,L,xj,L,xn)=−{min−f(x1,L,xj,L,xn)}。(2)约束为“≥0”的形式若约束为gi(x1,L,xj,L,xn)≥0形式,两边同时乘以-1,则可转换为−gi(x1,L,xj,L,xn)≤0形式。(3)约束为“=0”的形式⎧⎪gi(x1,L,xj,L,xn)≤0若约束为gi(x1,L,xj,L,xn)=0形式,可用两个约束⎨替代,⎪⎩gi(x1,L,xj,L,xn)≥0对于gi(x1,L,xj,L,xn)≥0可用方法⑵转换为−gi(x1,L,xj,L,xn)≤0,因此,⎧⎪gi(x1,L,xj,L,xn)≤0gi(x1,L,xj,L,xn)=0最后被转换为⎨⎪⎩−gi(x1,L,xj,L,xn)≤09.3.2NPP和IPP问题的GA求解NPP和IPP问题的GA算法步骤如下所示。1.NPP问题的GA算法(1)初始化群体0在满足式(9-13)约束条件的解空间,选择一个初始解x=(x1,x2,L,xj,L,xn)作为初始群体个体Start_populaton(i),i=1,2,L,Popsize。初始群体为演化计算,提供初始225 的“良种”。(2)评价群体适应度将初始群体代入式(9-13)目标函数中,计算相应的适应度Start_populaton(i).Fitness,按照可行性判别条件,判别个体可行状态Start_populaton(i).Feasible,i=1,2,L,Popsize。以Feasible=1表示个体为可行解,Feasible=0表示个体为不可行解。(3)置当前遗传代数置Current_gen=1。(4)选择最优个体由于式(9-13)为目标函数最小化问题,因此,在群体大小为Popsize的初始群体Start_populaton(i),i=1,2,L,Popsize,选择适应度Start_populaton(i).Fitness最小,且满足Start_populaton(i).Feasible=1的个体作为最优个体Best_individual,并把该个体的适应度和解的可行状态赋给Best_individual.Fitness和Best_individual.Feasible。(5)最优个体遗传到新一代群体置当前个体序号s=1,把最优个体Best_individual赋给新一代群体的第1个个体New_population(1),s=s+1。(6)选择采用锦标赛选择(TournamentSelection),首先在[1,Popsize]内随机产生tourn个个体序号{}k1,k2,Lktourn,按照最优保存策略(ElitismStrategy)选取个体mate1和mate2。本节约定最优保存策略的原则为:①两个可行解个体,其评价适应度值小的个体优于评价适应度值大的个体;②不可行解个体在遗传过程中被淘汰。按照上述选择,使群体在遗传过程中,始终保持“良种”。因此,对于tourn个可行解个体,则适应度值最小的个体将被最后选择遗传到下一代群体。(7)交叉交叉算子采用算术交叉(ArithmeticCrossover),个体mate1和mate2算术交叉,产生两个个体child1和child2为:⎧child1=r⋅mate2+(1−r)⋅mate1⎨(9-14)⎩child2=r⋅mate1+(1−r)⋅mate2式中,r为界于[0,1]之间的随机数。(8)变异变异采用非均匀变异(NonuniformMutation),对于个体child1和child2分别进行非均匀变异,则变异后分别产生两个个体offspring1和offspring2。假定个体child1进行非均匀变异,则产生个体offspring1。设child1=x1x2LxkLxn,非均匀变异后产生的个体为offspring1=x1x2Lxk′Lxn,若变异点xk处的基因值取值范围为[lk,uk],则新的基因值x′k由下式确定:226 ⎧b⎛t⎞⎪xk+(uk−xk)⋅r⋅⎜1−⎟ifrandom(0,1)=0⎪⎝T⎠xk′=⎨b(9-15)⎪⎛t⎞⎪xk−(xk−lk)⋅r⋅⎜1−⎟ifrandom(0,1)=1⎩⎝T⎠式中,r为界于[0,1]之间的随机数;T为最大遗传代数;t为当前遗传代数;b为非均匀度参数;random(0,1)表示产生0或1的随机数。(9)将offspring1和offspring2分别赋给新一代群体的New_population(s)New_population(s)=offspring1,s=s+1,New_population(s)=offspring2,至此,步骤⑹~⑼完成产生两个新一代群体个体的过程。重复步骤⑹~⑼,直至产生Popsize个个体。(10)评价群体适应度将新一代群体的New_population(s)赋给Start_populaton(s),s=1,2,L,Popsize。适应度计算同步骤⑵。(11)当前遗传代Current_gen=Current_gen+1重复执行步骤⑷~⑾,直至终止代数Maxgen。输出最优个体Best_individual,停止遗传计算。2.IPP问题的GA求解IPP和NPP问题求解的差别在于某些遗传算子的选择。(1)选择选择算子同NPP问题,采用锦标赛选择。(2)交叉交叉算子采用均匀交叉(UniformCrossover)。均匀交叉是指两个配对个体的每一个基因座上的基因都以相同的交叉概率进行交换,从而形成两个新的个体。对于个体mate1和mate2进行均匀交叉,则交叉后产生两个个体child1和child2,其交叉的主要过程为:1)随机产生与个体编码长度等长的屏蔽字W=w1w2LwjLwn。2)个体mate1和mate2按下述规则产生两个新的个体child1和child2。若wj=0,则child1在j个基因座的基因值继承mate1上对应的基因值;child2在j个基因座的基因值继承mate2上对应的基因值。若wj=1,则child1在j个基因座的基因值继承mate2上对应的基因值;child2在j个基因座的基因值继承mate1上对应的基因值。(3)变异变异算子采用均匀变异(UniformMutation)。均匀变异是指分别用符合某一范围内均匀分布的随机数,用某一较小的概率来替换个体编码串中各个基因座上原有的基因值。假定个体child1=x1x2LxkLxn进行均匀变异,产生的个体为offspring1=x1x2Lxk′Lxn,227 若变异点xk处的基因值取值为[lk,uk],则新的基因值x′k由下式确定:xk=int(lk+r⋅(uk−lk))(9-16)式中,r为界于[0,1]之间的随机数;int为取整函数。9.3.3实例应用按前文所述的计算流程,以下就几个实例应用说明本文算法的适用性。1.NPP优化问题问题(1)⎧minf(x,x)=(x−10)3+(x−20)31212⎪22⎪(x1−5)+(x2−5)−100≥0⎪22⎨−(x1−6)−(x2−5)+82.81≥0⎪⎪13≤x1≤100⎪⎩0≤x2≤100问题(2)⎧minf(x1,x2)=−x1−x2⎪432⎪x2≤2x1−8x1+8x1+2⎪432⎨x2≤4x1−32x1+88x1−96x1+36⎪0≤x1≤3⎪⎪⎩0≤x2≤4问题(3)⎧3x1+x2−2x3+0.84x1−2x2+x3⎪maxf(x1,x2,x3)=+⎪2x1−2x2+x37x1+3x2−x3⎪x1+x2−x3≤1⎪⎪−x1+x2−x3≤−1⎨⎪12x1+5x2+12x3≤34.8⎪12x1+12x2+7x3≤29.1⎪⎪−6x1+x2+x3≤−4.1⎪⎩x1,x2,x3≥0228 问题(4)⎧4492⎪minf(x,y)=5∑xi−5∑xi−∑yi⎪i=1i=1i=1⎪2x1+2x2+y6+y7≤10⎪⎪2x1+2x3+y6+y8≤10⎪2x2+2x3+y7+y8≤10⎪⎪−8x1+y6≤10⎪⎪−8x2+y7≤0⎨⎪−8x3+y8≤0⎪−2x4−y1+y6≤0⎪⎪−2y2−y3+y7≤0⎪−2y4−y5+y8≤0⎪⎪0≤xi≤1i=1,2,3,4⎪0≤yi≤1i=1,2,3,4,5,9⎪⎪⎩yi≥0i=6,7,8选取群体大小Popsize=100,锦标赛选择个体数tourn=20,交叉概率pc=0.4、变异概率pm=0.2,遗传终止代数Maxgen=1000,ε=0.00001。上述优化问题(1)~(4)的求解结果如表9-2所示。表9-2NPP优化问题求解实例对比结果优化问题准确解GA求解结果问题1x1=14.1;x2=0.8;f=-6962.5x1=14.098;x2=0.801;f=-6962.498问题2x1=2.3295;x2=3.1783;f=-5.5079x1=2.3297;x2=3.1788;f=-5.5085问题3x1=1;x2=0;x3=0;f=-2.471428x1=0.9995;x2=0.0003;x3=0.0000;f=-2.4721x1=0;x2=1;x3=1;x3=4x1=0.0000;x2=1.0000;x3=1.0000;x3=4.0000y1=1;y2=1;y3=1;y4=1;y5=1y1=1.0000;y2=1.0000;y3=1.0000;y4=1.0000;问题4y6=3;y7=3;y8=3;y9=1;f=-15y5=1.0000;y6=3.0001;y7=3.0004;y8=3.0002;y9=1.0000;f=-15.00022.IPP优化问题实例应用问题(1)问题(2)⎧minf(x1,x2,x3)=3x1−2x2+5x3⎧maxf(x1,x2)=60x1+30x2⎪⎪⎪x1+2x2−x3≤2⎪35x1+8x2≤400⎪⎪x1+4x2+x3≤4⎪⎪1.5x1+3.5x2≤60⎨⎨⎪x1+x3≤3⎪4x1+5x2≤90⎪4x2+x3≤6⎪x1≥0,x2≥0⎪⎪⎪⎩x1,x2,x3={}0,1⎪⎩x1,x2取整数选取群体大小Popsize=100,锦标赛选择个体数tourn=20,交叉概率pc=0.3、变异概229 率pm=0.2,遗传终止代数Maxgen=1000,ε=0.001。上述优化问题(1)~(2)的求解结果如表9-3所示。表9-3IPP优化问题求解实例对比结果优化问题准确解GA求解结果问题1x1=1;x2=0;x3=1;f=8x1=1;x2=0;x3=1;f=8问题2x1=9;x2=10;f=840x1=9;x2=10;f=840从表9-2、表9-3可以对比看出,本文GA优化结果与准确解基本一致,其中NPP问题(3)的优化结果优于其准确解参考值,说明本节给出GA求解NPP、IPP问题的算法是稳定的。9.4遗传算法在水文中的应用现状水文系统由于受到天文、气候、气象、下垫面、人文活动等众多因素的影响,其优化问题通常表现出高维、多峰值、非线性、不连续、非凸性和带噪声等复杂特征。传统的确定性优化方法、随机性优化方法无法满足许多复杂问题的求解要求。基于生物进化原理的遗传算法能够快速有效地在复杂、高度非线性的多维空间中寻找最优点,因而,为传统优化方法无法处理的复杂优化问题提供了一条新的途径。目前,遗传算法主要用来研究解决水文学水文中的预报预测,参数估计,优化问题,模拟计算与评估分析等问题。其中以优化问题研究最多。9.4.1应用现状⒈预报预测各种统计预测方法要求水文要素序列具有严格的平稳性、均一性,以及正态分布条件。GA则不需要这些限制条件,对于给定形式的预测预报模型,其问题归结为参数优化,利用GA可建立参数优化准则函数和约束条件,通过遗传迭代计算,获得预测模型的最佳参数,最后根据预测模型进行预测。目前,主要研究包括河道洪水预报、地下水位预测、海温预测、入库含沙量预报、降水量预测。从方法上看,包括单一的遗传预报方法和遗传算法、人工神经网络等。⒉参数估计参数估计是针对已建模型进行参数的最优估计。传统的参数估计方法不仅计算工作量大,而且容易出现局部最优化问题,GA是复杂模型参数最优估计的通用方法。目前,主要研究包括地质统计学中变差函数参数估计,水文地质模型参数估计,地质分维数估计,环境模型参数估计,非线性数学模型参数估计,流量频率曲线参数估计,径流模型参数的修正,地下水管理模型的参数最优估计,降雨径流模型参数最优估计,马斯京根模型的参数,水电工程模型的参数优化。⒊优化问题优化问题是GA应用最为广泛的领域。GA进行优化问题求解最大的特点是不受模型230 结构、优化准则、参数数目、约束条件的限制,只要求优化问题是可计算的,能够直接在优化准则函数的引导下,在搜索空间中进行自适应全局并行搜索。目前,主要研究范围如下。(1)水库运行管理。包括供水水库优化调度,防洪水库优化调度。(2)环境保护。包括环境优化管理,水污染控制系统规划,地下水优化管理。(3)灌溉管理。包括建立沟灌优化模型,结合农田灌溉制度和GA进行灌溉用水决策,最优灌溉经济效益计算,估算作物产量,确定最优灌溉面积。(4)工程优化设计。包括管网优化设计,桁架结构的优化设计,配水系统网络优化设计。⒋灾情评估分析灾情是多种自然环境与社会经济多种因素综合作用的结果,其评估实际上是一种模式识别问题。目前广泛应用的灾度判别法、模糊综合评判法、物元分析法、神经网络等模型进行灾情评估均为离散、半定量化的灾情等级,这种灾级分辨率太粗。但实际灾情一般是连续的实数值。按照上述灾情等级模型,对于同一灾级的灾情,得出的灾情指标值常常相差显著。将GA、ANN和逻辑斯谛曲线(LOG)模型结合,可改变上述方法的缺陷。目前,主要研究洪水灾害承灾体易损性模型,进行洪水灾情评估。9.4.2存在的主要问题与发展趋势1.存在的主要问题GA在水文水资源系统优化中具有较大的潜力,但是它的计算收敛速度、非全周收敛、编码问题和基因参数的选取问题目前尚存在一些问题(孙艳丰)。大量的计算表明,遗传算法的求解时间随着问题的规模呈线性增加,特别是在最优解附近,求解时间更长。遗传算法的模式定理虽然证明了遗传算法是全局收敛的,但是,在实际计算中,遗传算法能发现全局最优解,但不能保证每次都收敛于全局最优解。造成这种一定概率不全局收敛的主要原因是:(1)随着遗传过程的进行,群体发生有效的基因缺失。(2)遗传算法采用二进制编码技术,这种编码有一定的局限性,不仅使收敛速度下降,计算精度与计算量之间出现矛盾,而且在求解过程中由于变量的编码和译码导致有效基因的丧失,造成算法的非全局收敛。⑶遗传算法计算中群体规模、染色体长度、复制概率、交叉概率和变异概率的选取目前大多数是通过试算或经验选取,没有理论基础,这在一定的程度上使遗传算法的应用受到限制。2.发展趋势(1)GA模型算法完善与深入研究。(2)针对水文系统的特征,寻求正确高效的遗传算法,改进编码技术,缩短编码长度,提高遗传算法性能。(3)研究适合水文问题自身特点的选择算子、交叉算子和变异算子,以改善遗传算法的全局收敛性能,提高遗传算法计算效率。(4)ANN、FS、GA各有特点,真正地实现复杂水文系统的智能模拟,仅用一种办法是很难实现的,因此,将ANN、FS、GA结合起来以及ANN、FS、GA与当代最新信息处理方法有机地结合起来研究,也就成为目前一种必然研究趋势。其结合方式主要有模231 糊联想记忆网络系统、灰色神经网络、模糊神经网络、混沌神经网络以及基于遗传算法的神经网络和基于子波变换的神经网络。灰色神经网络,模糊神经网络,混沌神经网络,基于遗传算法的神经网络和基于子波变换的神经网络的结构、神经网络的灰色与模糊输入、不确定信息在网络中的传播以及相应算法的改进将是今后深入研究的方向。参考文献1陆金桂,李谦,王浩,等.遗传算法原理及其工程应用.北京:中国矿业大学出版社,19972徐丽娜.神经网络控制.哈尔滨:哈尔滨工业大学出版社,19993苑希民,李鸿雁,刘树坤,等.神经网络和遗传算法在水科学领域的应用.北京:中国水利水电出版社,20024周明,孙树栋.遗传算法原理及应用.北京:国防工业出版社,1999.33~645孙艳丰,郑家齐,王德兴,等.基于遗传算法的约束优化方法评述.北方交通大学学报,2000,24(6):14~196MichalewiczZA.SurveyofConstraintHandlingTechniquesinEvolutionaryComputationMethodsthMcDonnellJR,ReynoldsRG,FogelDBProcessing4AnnualConferenceEvolutionaryProgramming.Cambridge,MA:MITPress,1995.135~1557MichalewiczZ,SchoenauerM.Evolutionaryalgorithmsforconstrainedpaprameteroptimizationproblems.EvolutionaryCompution,1996,4(1):1~328MichalewiczZ,DebK,SchmidtM,etal.EvolutionaryalgorithmsforengineeringApplication.MiettinenK,NeittaanmäkiP,MäkeläMM,etal.EvolutionaryAlgorithmsinEngineeringandComputerScience,JohnWileyandSons,Chichester,England,1999:73~949ZbigniewMichalewicz,MartinSchmidt.TCG-2:ATest-CaseGeneratorforNon-linearParameterOptimisationTechniques.IAshishGhosh,ShigeyoshiTsutsui.AdvancesinEvolutionaryComputing,TheoryandApplications,Springer,Heidelberg,Germany,2003.193~21210FernandoJiménez,JoséLVerdegay.Evolutionarytechniquesforconstrainedoptimizationproblem.InHans-JürgenZimmermann,editor.7thEuropeanCongressonIntelligentTechniquesandSoftComputing(EUFIT"99).Aachen,Germany,199911RobertJAbrahart,LindaSeeandPaulineEKneale.Usingpruningalgorithmsandgeneticalgorithmstooptimisenetworkarchitecturesandforecastinginputsinaneuralnetworkrainfall-runoffmodel.JournalofHydroinformatics,1999.1:103~11412ZekajŞen,AhmetÖztoral.Geneticalgorithmsfortheclassificationandpredictionofprecipitationoccurrence.HydrologicalSciencesJournalHydrologiques,2001,46(2):255~26813Liong,-Shie-Yui;Chan,-Weng-Tat;ShreeRam,-J.Peak-flowforecastingwithgeneticalgorithmandSWMM.JournalofHydraulicEngineering,1995,121(8):613~61714金菊良,杨晓华.遗传门限回归模型在河道洪水预报中的应用.水电能源科学,2000,18(1):1~415金菊良,丁晶.遗传算法及其在水科学中的应用.成都:四川大学出版社,2000.816Shie-YuiLiong,Soon-ThiamKhuandWeng-TatChan.DerivationofParetoFrontwithGeneticAlgorithmandNeuralNetwork.JournalofHydrologicEngineering,2001,6(1):52~61232 17KLakshmiPrasadandAKRastogi.EstimatingnetaquiferrechargeandzonalhydraulicconductivityvaluesforMahiRightBankCanalprojectarea,Indiabygeneticalgorithm.JournalofHydrology,2001,243(3~4):149~16118Balascio,CC,Palmeri,DJ,Gao,H.Useofageneticalgorithmandmulti-objectiveprogrammingforcalibrationofahydrologicmodel.TransactionsoftheASAE,1998,41(3):615~61919Franchini,M;Galeati,G.Comparingseveralgeneticalgorithmschemesforthecalibrationofconceptualrainfall-runoffmodels.HydrologicalSciencesJournal.1997,42(3):357~37820Mohan,S.ParameterestimationofnonlinearMuskingummodelsusinggeneticalgorithm.JournalofHydraulicEngineering,1997,123(2):137~14321Franchini,M.Useofageneticalgorithmcombinedwithalocalsearchmethodfortheautomaticcalibrationofconceptualrainfall-runoffmodels.HydrologicalSciences—Journal—desSciencesHydrologiques.1996,41(1):21~4022McKinney,DC,Lin,MD.Geneticalgorithmsolutionofgroundwatermanagementmodels.WaterResourcesResearch,1994,30(6):1897~190623金菊良,张国桃.加速遗传算法及其在环境模型参数估计中的应用.上海环境科学,1998,17(4):7~924JahangirMorshedandJagathJKaluarachchi.EnhancementstoGeneticAlgorithmforOptimalGround-WaterManagement.JournalofHydrologicEngineering,2000,5(1):67~7325JBNixon,GCDandy,ARSimpson.Ageneticalgorithmforoptimizingoff-farmirrigationscheduling.JournalofHydroinformatics,2001.3:11~2226JGuanandMMAral.Optimalremediationwithwelllocationsandpumpingratesselectedascontinuousdecisionvariables.JournalofHydrology,1999,221(1~2):20~4227PilarMontesinos,EmilioCamachoandSerafínAlvarez.Seasonalfurrowirrigationmodelwithgeneticalgorithms(OPTIMEC).AgriculturalWaterManagement,2001,52(1):1~1628Sheng-FengKuo,GaryP.MerkleyandChen-WuingLiu.Decisionsupportforirrigationprojectplanningusingageneticalgorithm.AgriculturalWaterManagement,Vol.45(3)(2000):243~26629LFRReis,RMPortoandFHChaudhry.OptimalLocationofControlValvesinPipeNetworksbyGeneticAlgorithm.JournalofWaterResourcesPlanningandManagement,1997,123(6):317~32630FranklinYChengandDanLi.MultiobjectiveOptimizationDesignwithParetoGeneticAlgorithm.JournalofStructuralEngineering,1997,123(9):1252~126131Chang,FJ,Chen,Li.Real-codedgeneticalgorithmforrule-basedfloodcontrolreservoirmanagement.WaterResourcesManagement,1998,12(3):185~19832Dandy,GC,Simpson,AR,Murphy,LJ.Animprovedgeneticalgorithmforpipenetworkoptimization.WaterResourcesResearch,1996,32(2):449~45833金菊良,储开凤.加速基因算法及其在水库计算中的应用.水电能源科学,1997,15(3):57~6034Morshed,J,Kaluarachchi,JJ.Applicationofartificialneuralnetworkandgeneticalgorithminflowandtransportsimulations.AdvancesinWaterResources,1998,22(2):145~15835刘首文,冯尚友.遗传算法及其在水污染控制系统规划中的应用.武汉水利电力大学学报,1996,29(4):95~9936金菊良,魏一鸣.基于遗传算法的神经网络及其在洪水灾害承灾体易损性建模中的应用.自然灾害学报,1998,7(2):53~6037金菊良,魏一鸣.基于遗传算法的洪水灾情评估神经网络模型探讨.灾害学,1998,13(2):6~7233 第10章混沌与分形理论及其在水文科学中的应用混沌现象是1963年美国气象学家洛伦兹首先发现的。分形是一类无特征尺度、具有自相似结构的几何体,是描述混沌现象的有力工具。1975年,美国数学家曼德尔布诺特正式创立了分形论。混沌与分形理论为非线性动力系统的研究提供了一条新途径。水文中的许多问题,其运动特征具有确定性的一面,又具有随机性的一面。应用混沌与分形理论,将能打破以往传统分析中单一的确定性分析或随机性分析,使水文研究有所突破。本章引用我国马建华,黄润生,张济忠,赵永龙,丁晶,邓育仁,吴伯贤,温权,张士军等学者的文献和研究成果,介绍混沌与分形的基本理论及其在水文科学中的应用。10.1混沌的基本理论10.1.1混沌的定义目前,混沌还没有一个公认的确切定义。以下列举几个代表性的定义。洛伦兹(1993)认为,混沌看起来是随机发生的,而实际上其行为是由精确法则规定的一类现象。哈肯(1979)指出,混沌是来源于决定性方程的无规则运动。刘秉正(1999)认为,混沌是服从确定性规律但具有随机性的运动,或是确定性系统中出现的具有随机性的运动。有的学者将混沌通俗地解释为宏观无序、微观有序的一种高级无序的系统状态等等。虽然,学者们对混沌的文字表述不同,但其基本涵义是一致的。本节采用马建华(2003)的提法,混沌是确定性动力系统所表现出的内在随机性或不确定性现象。根据动力学方程的初始条件和系统响应之间的关系,动力系统可分为确定性动力系统和非确定性动力系统两种。确定性动力系统是方程中所含的参数和初始条件都是确定性的,而系统的响应可以是确定的,也可以是不确定的动力系统。非确定性动力系统是方程中所含参数和初始条件中有不确定性成分,系统响应也是不确定性的动力系统。非确定性动力系统常用概率论和模糊数学等方法进行研究,而确定性动力系统常用解析方法、几何方法和数值计算等方法进行研究。以牛顿经典力学为代表的研究方法是确定性动力系统的重要研究方法。如果给定了方程的初始值,系统演化轨道就是惟一的、确定的。如果知道了轨道上的任何一点,我们就知道了系统演化的全貌(系统的过去和准确地预测其未来)。系统的随机不确定性行为既可以存在于非确定性动力系统之中,也可以来自确定性动力系统。非确定性动力系统的随机性可通过建立随机微分方程进行研究。由于随机微分方程中含有随机参数、随机初始条件或随机外界强迫,其随机性是在系统与环境相互作用中产生的,而不是系统内部动力学本质特征所决定的,因此,将非确定性动力系统的随机性称为234 外在随机性。确定性动力系统本身并不包含任何随机因素,但是,在一定参数范围内却可以得到看起来非常随机和混乱的结果。由于产生这种随机结果的原因不是来自系统外部,而是系统内部动力学特征的本质反映,所以将确定性动力系统中的随机性称为内在随机性,亦称动力随机性或内禀随机性。下面马建华(2003)列举的内在随机性例子,以帮助读者正确理解混沌现象。例:13世纪意大利数学家伦纳德(菲波那奇)在《算盘书》中提出了一个“兔子繁殖问题”。已知一对兔子,每个月可生一对小兔子,而一对小兔子被生下后的第二个月就开始生产下一代小兔子。问从刚出生的一对兔子算起,1~12月兔子的对数。按照兔子繁殖规律,我们很容易得到1~12月兔子的对数是:1,1,2,3,5,8,13,21,34,55,89,144这就构成了一个菲波那奇数列。不难看出,该数列的构成规则是,每个月的兔子对数都是相邻前两个月兔子对数之和。如果将这一构成规则稍加变形,每个月的兔子对数不是相邻前两个月兔子对数之和,而是按相邻前两项的数值向左移动相应的项数后的两项数值之和计算,即按下式计算:A(I)=A[I−A(I−2)−1]+A[I−A(I−2)](10-1)式中,A代表第I项的兔子对数。下面给出这个确定性方程解的前50项,从中我们可以看到该数列具有明显的不确定性和随机性。[1,1,2,3,3,3,5,6,5,5,6,8,8,6,8,10,11,11,11,11,10,11,16,16,11,10,18,22,11,11,22,21,11,16,32,22,6,18,32,21,11,21,43,27,2,22,29,21,22,23]10.1.2混沌的基本特征混沌的基本特征概括为以下几个方面。1.非线性无论是微分方程还是离散方程,只要它们是线性的,其解都具有确定的解析形式。也就是说,线性系统随时间的演化也是确定性的,它要么趋于稳定定态(当定态解稳定时),要么趋于无穷远(当定态解不稳定时),要么围绕定态做周期性运动(当定态是中心稳定时)。既然线性方程的解是确定性的,那么它不可能具有随机性的混沌运动。对于非线性方程来说,往往不止一个定态解。混沌运动必然发生在非线性动力系统之中。当然,系统的非线性只是混沌的必要条件,而不是说非线性系统一定会出现混沌,这要依非线性系统的内禀性而定。2.对初始值的敏感依赖性对初始值的敏感依赖性是混沌运动的共同特征。说明混沌系统的运动状况对初始值极为敏感,初始值的微小改变可导致其运动状况的重大变化,具有“差之毫厘,失之千里”的运动变化特点。通常我们把混沌运动的这一特征称作对初始值的敏感依赖性。3.长期行为的不可预测性由于混沌运动对初始值的稍微改变可引起面目全非的随机性结果,因此从道理上说这种系统的长期行为是不可能准确预测的。但是,简单地说混沌运动不可预测是错误的,这是因为描述混沌运动的演化方程是确定性方程,在短期内预测仍可以得到相当满意的结235 果,只是它的长期行为不能准确预测,而且其长期行为也不同于完全的随机运动,具有某种意义上的统计规律性。混沌运动既不同于简单的有序运动(短期行为和长期行为都可以预测的运动),也不同于完全的随机运动(短期行为和长期行为都无法预测的运动),属于另一类运动形式。研究和发现混沌运动的规律性,增强人类的预测能力是今后系统科学研究的重要任务之一。4.吸引子的奇特性奇怪吸引子是指那些迹线相互折叠,外观形状极不规则的吸引子。对于混沌运动来说,单独研究相空间中的某一条轨道是没有意义的,有意义的是研究奇怪吸引子上的轨道丛。奇怪吸引子对外部的轨道具有吸引力,进入奇怪吸引子的轨道就不可能再走出来,这是系统具有整体稳定性所决定的。但是,奇怪吸引子内部的各轨道却是相互排斥的,极不稳定,经常随机变化。形象地说,混沌运动具有“对外吸引,对内排斥;进得来,出不去;出不去,又安定不下来”的特点。奇怪吸引子的奇特性还表现在内部结构的奇特性。奇怪吸引子中的某些区域其相点或轨道密集呈带状,带与带之间有空隙。如果把轨道密集带放大,我们可以发现,带内还有被小空隙隔开的带,它们的结构形式与放大以前的带与空隙形式相似。若进一步放大相空间,我们还可以观察到相似的、更微小的结构形式。也就是说,奇怪吸引子具有无穷次的自相似(selfsimilar)结构。10.1.3混沌研究的方法20世纪80年代以前,混沌研究主要集中在计算机实验和物理实验模拟、观测、再现混沌行为。其借助分析的数学是分岔理论和突变理论。20世纪80年代以后。混沌研究主要集中在混沌结构,借助的数学方法是多标度分形理论和符号动力学。动力系统采用相空间进行研究。动力系统所出现的吸引子可分为平庸吸引子和奇怪吸引子两大类。平庸吸引子又可分为定常吸引子、周期吸引子和拟周期吸引子。10.1.4混沌研究的意义通过对混沌的研究,极大地扩展了人们的视野,活跃了人们的思维。过去被人们认为是确定论的和可逆的某些力学方程,却具有内在的随机性和不可逆性。确定论的方程可以得出不确定的结果,这就打破了确定论和随机论这两套描述体系之间的鸿沟,给传统科学以很大冲击,在某种意义上使传统科学被改造,这必将促进其他学科的进一步发展。10.1.5混沌研究的应用20世纪90年代以来,混沌与其他学科相互交错、渗透、促进、综合发展,使得混沌在生物学、数学、物理学、化学、电子学、信息科学、气象学、宇宙学、地质学、经济学、人脑科学、音乐、美术、体育等领域得到广泛发展。10.1.6混沌的识别水文时间序列性质的鉴别,可以从定性、定量以及将两者结合起来的途径来进行,可236 使用的方法有相图法、Poincare映象、功率谱法、关联指数饱和法、李氏指数(Lyapunov)与κ熵法、BDS检验法、信息论法、连续性法(又称转移误差法)、真实矢量场法、预报效果法、时间相关指数法等(赵永龙,丁晶,邓育仁,1998)。其方法的计算见有关混沌的参考书。这些方法大多用“替代序列”作为参照来对比检验水文序列的混沌性,即用假设检验的途径。先假定水文系统具备某种结构(如线性结构),然后构造出大量与原系统具有相同统计特征(如均值、方差、功率谱或相关结构相同)的随机序列,通过检验原序列与替代序列的差异来判定水文系统的性质。这一类方法对于区别低维混沌和噪声序列(尤其是色噪声序列)是很有效的。在实际工作中,由于只能得到一个样本,因而难以定出误差标准来检验抽样误差的影响,替代序列法则避免了这一问题,且判据客观,但也引出如何生成替代序列、显著水平及统计量选取问题。容易看出,上述方法基本都是从某一个方面判别水文序列是否为混沌序列的必要条件,而我们所关心的是水文序列具有混沌特征的肯定答复。这样就需要采用尽可能多的方法来鉴别水文序列,即使是这样,也只能得出“水文系统可能具有混沌特征”的结论。10.2分形的基本理论10.2.1分形的概念自然界中所有形状大致可以分为两类,一类是具有特征长度的图形,另一类是不具有特征长度的图形。矩形的特征长度是边长,圆的特征长度是半径。日常生活中常见人造的物品大都具有特征长度。某些物体稍加简化,也可找到特征长度,如地球可看作是一个球体,人可以看作是柱体和球体的组合。这一大类形状的物质,其表面处处平滑或部分平滑(如矩形体虽有棱角,但其表面却是平滑的)。对于这一类物体,我们可以用几何学及微积分来描述、刻划。维数是描述某一几何形体的一个特征量。在欧氏几何空间中,点是零维的,线是一维的,面是二维的,体是三维的。如果把时间考虑在内则是四维的,高维抽象空间中可以出现5、6、7,⋯,n维的几何形体。一个几何对象的维数是可以理解为确定该几何对象中某一个点的位置所需要的独立的坐标数目。如,要确定二维平面(x,y)中某条曲线y=f(x)任意一点的位置(xi,yi),需要在x轴和y轴上各选一个数值,且满足yi=f(xi)这一关系。对于这个曲线几何对象来说,虽然使用了两个坐标,但只有一个坐标是独立的,所以它是一维的。其他可依此类推。通常我们把上述定义的维数称作拓扑维数,用d来表示。对于规则的几何对象来说,d的计算是非常简单的事情。例如,某一几何对象的线度放大倍数为l,整个几何对象的放大倍数为K,维数为d,那么有如下关系式:dK(l)=l(10-2)12当l=2时,直线有K(2)=2=2,d=1;平面有K(2)=2=4,d=2;立体有3K(2)=2=8,d=3。237 根据式(10-2),对于规则的几何对象,我们可以得到放大几何对象时的拓扑维数的计算公式:logK(l)d=(10-3)logl同样,对于任何规则的几何对象,如覆盖它所需用的小盒子数目N(r),所用尺子为r,则其缩小几何对象时的拓扑维数为:logN(r)d=(10-4)1logr由上可见,规则几何对象的拓扑维数很容易求出,并且都是正整数,不可能出现分数或小数。自然界中大量存在的另一类形状是不具有特征长度的游走的轨迹等,它们的共同特点是极不规则、极不光滑但不能忽视的大的差异。如弯曲的海岸线,连绵的山峰,蜿蜒的河流,如果随机用具有特征长度的图形去近似的话,都会产生几种常见的不规则图形如海岸线形、河网水系、树枝分叉形等。我们注意到,对于这样一类极不规则、极不光滑图形,当我们逐级放大它们时,就会在越来越小的范围上发现同等程度的不规则性、同等程度的复杂性,在每一个放大级别上,这些曲线的形状在统计意义上都是相似的。这就是所谓的自相似性(Self-simiIadty)——局部的形态与整体的形态相似。对于上述这一类具有自相似性的极不规则、极不光滑的图形,不能从中引出切线,用微分不能定义,传统的几何相经典数学显得束手无策,无能为力。对于这些纷杂多样的几何形体,欧氏几何不能给以精确的描述,认为它们都是“病态的几何对象”。于是,分形几何应运而生。1975年,美国数学家曼德尔布诺特提出一个新名词——分形(fractal),以此来描述自然界中欧氏几何所不能描述的一大类“极不规则”、“极为破碎”的几何对象,该理论就是分形几何学,其核心概念就是非整数维——分维。1.分形的定义一般把在形态(结构)、功能相信息等方面具有自相似性的研究对象称为分形。由于分形具有无标度性,人们不能通过量度的长度、体积等参数来划分形的特性。分形由描写空间和客体的另一个主要参数——整数维,进一步拓宽到分数维(fracratdimension)来作为描写分形的定量指标和参数。分形理论(fractaltheory)是研究分形性质及其应用的科学。按照分形理论,分形体系内任何一个相对独立的部分,在一定意义上都是整体的再现和缩影。自相似性的特点是存在于一定标尺(尺度)范围内,其两端受到某种特征尺度的限制。具有自相似性的范围叫标度区。2.分形的分类分形一般可分为自然分形、时间分形、社会分形、思维分形四类。(1)自然分形凡是自然界中客观存在的或经过理论抽象而得到的具有自相似性的几何客体,都称为自然分形。根据各种系统具有不同的具体特点,自然分形分为以下几种。①几何分形系统在形态和结构上存在着自相似性的几何对象,称为几何分形,如线状分形(科契曲线、高分子链等)、表面分形(二维谢尔宾斯基地毯、催化剂表面等)、体238 积分形(谢尔宾斯基海绵)、规则分形和随机分形。②功能分形或信息分形在功能或信息上存在着自相似性的几何对象,分别称为功能分形或信息分形。这两类分形所涉及的内容也十分宽广。从植物生长到人类发育、从城市边界线的变迁到气象预报都属于此范畴。③能量分形在能量的传播上存在着自相似性的系统称为能量分形。这种分形主要表现在无线电通信中能量的传输和地震波的传播等能量传递过程中。(2)时间分形系统在演变过程中,在时间轴上具有自相似性的研究称为时间分形,也可称为过程分形、一维时间分形或重演分形。典型例子有太阳黑子周期性的爆炸、地震周期重演,以及事物螺旋式和波浪式的发展规则等等,都在时间轴上表现出系统发展和演变的自相似性。(3)社会分形社会科学是研究人类社会各种文化现象的学问。社会分形是指在人类社会活动和社会现象中所表现出来的自相似性。它几乎涉及到一切社会科学,因此,可再分为史学分形、文艺分形、语言分形、美学分形、社会结构分形以及经济分形和管理分形等等。(4)思维分形思维是人对事物的认识过程,它是人类大脑的特有功能。思维科学是研究人的有意识思维的特点、规律、历史发展和人工模拟的科学。思维分形是指人类在认识和意识上具有自相似性。由于人类社会存在着错综复杂的交往联系,所以每个人的思维在一定程度上也反映了周围许多人的思维。许多人中的每个人又反映了别人的思维,这是一个无穷无尽的序列。3.分形研究的意义(1)分形论冲破了整体与部分之间的隔膜,找到了从部分过渡到整体的媒介和桥梁,即整体与部分之间的信息“同构”。(2)分形论的提出,改变了人们传统的思维方法,认识到整体与部分之间的关系可以由线性发展到非线性的阶段,且它与系统论能够共同揭示整体与部分之间多层次、多视角、多维度的相关联方式。因此,分形论从一个新的层次深化和丰富了整体与部分之间的辩证关系。(3)分形论为人们提供了一种如何认识世界的新方法论,从而为人们提供了从部分中认知整体,从有限中认知无限的可能和根据。(4)分形论的提出进一步丰富和深化了唯物辩证法关于普遍联系和世界统一性的原理。4.分形的应用(1)生物学。如研究生物血管分形构造。(2)地球物理学。如研究河流的分形特征,地震的能量分维、时空分维,地震断层分维。(3)物理学和化学。如研究结晶、相变、超导、固体表面、化学振荡、浓度花纹、化学波等。(4)天文学。如研究陨石大小分布。(5)材料科学。如研究材料的断裂韧性和强度。(6)经济学。如研究股票价格变动、商品价格波动等。239 (7)语言学与情报学。如研究词频分布、音乐分形、情报统计等。10.2.2分维的概念及其计算1.分维的概念分维的思想可追溯到20世纪初的数学家豪斯道夫(Hausdorff),但真正将其纳入科学轨道的是曼德尔布诺特。他于1973年在法兰西学院讲学时首次提出了分维的概念,并创立了分形理论。所谓分维(fractaldimension)是描述非规则几何对象时所产生的非整数维,也称分数维。它反映了客观事物的真实情景,是科学的一大进步。根据自然事物的复杂性和多样性,人们提出了多种多样的分维计算方法,因此分维又分为多种类型。常见的维数有:①拓扑维和豪斯道夫维;②相似维数;③信息维数;④关联维数。本章仅介绍两种最常用的分维及其计算方法。2.容积维所谓容积维(capacitydimension)是指用无限小的单位元去覆盖被测几何对象,通过分析单位元数目及其尺度之间的关系所得到的分维数。这里所说的单位元可以是线段、正方形、立方体等,统称其为小盒子,因此容积维计算法也称小盒子计数法或计盒法。现在,我们用海岸线维数的计算实例导出容积维的计算公式。海岸线都不是平直的,而是呈现岬角和海湾相间分布的复杂的弯曲形态。假设我们想计算某段海岸线的维数,首先把海岸线的直线长度看作单元长度,即为1,然后取某一长1度的线段r=为小盒子,从海岸线的一端开始用r一段一段地去覆盖海岸线直至终端。n若用N(r)表示覆盖整个海岸线所用的小盒子数目,根据式(10-4),显然有:logN(r)d=(10-5)1logr如果海岸线是平直的,那么d=1。然而海岸线是曲折的,其长度随小盒子尺度的缩小而增大,即符合下式:1−1N(r)∞=r(10-6)r在极限情况下,r→0,海岸线长度L(r)→∞,对式(10-5)取极限,有logN(r)D1=lim(10-7)r→01logr式中,D1为容积维,也称豪斯道夫(Hausdorff)维。3.关联维上述容积维只是分维的一种定义形式,还可以通过其他办法定义分维。其中关联维就是一种比容积维更准确且更实用的分维形式。关联维(correlationdimension)亦称相关维,它是通过分析时间序列变量在重构相空间轨道上的相关性而计算得到的一种分维。这个概念是1983年Grassberger和Procaccia首次提出的,之后在很多领域得到了广泛应用。240 容积维对分析低维空间的几何对象非常有用,但是它在高维空间中的应用却受到很大限制,因此从理论上讲迫切需要定义其他分维形式。自然界的事物十分复杂,目前我们完全认识的只是其中较简单的那一部分,对复杂巨系统的组成、状态、演化还缺乏透彻的了解。可以肯定,地理系统的状态空间、参量空间以及乘积空间都是高维空间,其维数可能成百上千甚至上万。对于如此复杂的巨系统,我们能否寻找一种方法降低它的维数呢?甚至用一种简单的时间序列变量来映射系统的运动变化特征呢?人们通过长期工作(气象水文观测等)已经获得了大量的时间序列资料,这些时间序列是水文系统运动变化的综合反映,它们包含着系统演化的信息。如果找到一种从时间序列资料出发反推系统演化特征的定量方法,无疑具有重大的科学价值。关联维就是在这种背景下应运而生的。以下介绍关联维的计算方法。设有观测等时间间隔的时间序列为x1,x2,x3,L,xi,L。为了在相空间中能够分析单变量时间序列的系统演化行为,需要重构相空间。先取时间序列的前m个数据x1,x2,x3,L,xm,以每个数据为轴,即支撑起一个m维相空间,m个数据在m维相空间中就确定出一个相点p1,然后去掉第一次所取的m个数据中的第一个数据x1,按时间序列的顺序递补一个数据xm+1,仍保留m个数据x2,x3,x4,L,xm+1。由于时间序列资料的单位都是一样的,所以第二组数据仍可在上述m维相空间中表现为一个点p2。按照这种方法依次进行,直至把最后一个时间序列数据包含在内。这样,在m维相空间中就得到一大批相点:⎧p1:x1,x2,x3,L,xm⎪⎪p2:x2,x3,x4,L,xm+1⎪⎨p3:x3,x4,x5,L,xm+2(10-8)⎪⎪p4:x4,x5,x6,L,xm+3⎪⎩LL把这些相点依次连结起来就构成轨线。这种方法就叫作时间序列的重构相空间,它为我们分析单变量时间序列的系统行为提供了一种新的方法。有了相轨道(低维空间),我们就可以运用上述小盒子计数法计算它的容积维。对于高维空间,这里我们将用另外一种新的思路,即从各相点之间的关联程度来计算它的分维。我们知道,两点之间的距离越近,它们的关联程度就越高,反之关联程度就越低。现在假设m维相空间中共生成N个相点,并给定一个比较各相点关联程度的统一尺度ε。然后计算一遍时间序列中有多少点对(pi,pj)之间的距离pi−pj<ε,把各相点距离小于2ε的点对数占相空间中总点对数N的比例记作C(ε),即:N1∑()C(ε)=2θε−pi−pj(10-9)Ni,j=1;i≠j式中,θ(p)为阶跃函数(stepfunction),其定义为:241 ⎧1,p>0θ(p)=⎨(10-10)⎩0p<0由θ(p)的定义可以看出,相空间中两相点之间的距离pi−pj<ε时,可以认为这两个相点是相互关联的,θ≠0,它对C(ε)有贡献;反之,两相点之间的距离pi−pj>ε时,则认为这两个点相互无关,θ=0,它对C(ε)没有贡献。可见,C(ε)表示相空间中平均有多少个点对是相互关联的,即相空间中状态点的密集程度,从而也表示系统运动变化的关联性或规律性。显而易见,C(ε)表示的关联性与所选定的ε有关。如果ε取值太大,那么所有的点对之间的距离都不会超过它,从而使C(ε)→1,这说明所有的相点都是相关的,不能反映系统运动的特征;反之,若ε取值太小,那么所有的点对之间的距离都会超过它,从而使C(ε)→0,这说明所有的点对都无关联,彼此独立,也不能反映系统运动的特征。由于C(ε)的大小可以反映相空间中相点的相关程度,而相点的相关程度又反映了相空间中轨道的疏密程度,所以C(ε)的大小应与维数有关。在适当的ε取值范围内,一定有如下关系式:γC(ε)=ε(10-11)式中,γ表示与相轨道(吸引子)维数有关的一个量。对式(10-11)两边取对数,得:lnC(ε)=γlnε(10-12)我们可从式(10-12)直接定义关联维:lnC(ε)D2=limγ=lim(10-13)ε→0ε→0lnε式(10-12)中,取极限主要是表示ε减小的一个方向,并不一定要求ε接近于零。如前所述,当ε极小时,C(ε)→0,不能反映系统的实际运动状况。另外,ε太小,时间序列中的一些随机干扰(噪声)将会表现出来,影响我们对客观规律的认识。所以,适当选取ε值(不大不小)对于描述系统的运动特征是极为重要的。那么,究竟如何确定ε呢?通常是利用现有的时间序列资料,在双对数坐标中通过绘制lnC(ε)~lnε关系曲线来解决问题的。对于一个给定的m值就有一系列相点,再选用不同的ε值,即可得到不同的C(ε)值,据此可画出一条lnC(ε)~lnε关系曲线。用同样的方法,通过选用不同的m值和ε值,就可得到若干条lnC(ε)~lnε关系曲线。当m为某一值时,曲线中直线部分的斜率不再发生大的变化,这就表明,m维空间中的轨道足可以准确地描述系统的行为,再增加维数的意义不大。还可以看出,曲线的斜率随ε值的增大而变化。当ε值较小时,各曲线的斜率变化都很大,表明C(ε)中包含了较明显的噪声影响,是计算时不能被使用的(实质上,当ε值非常小时,各点对都相关,曲线的斜率都比较小,稳定在较低的C(ε)水平上,计算时更不能使用);当ε值很大时,曲线的斜率非常平缓,且各曲线趋向一致,表明各相点之间242 毫无关联,求关联维也就失去了意义;只有在ε值中等时,即图中曲线斜率不变部分所对应的ε值,才具有特征意义,是计算时应该采用的。因此,根据图中的直线部分的斜率,我们即可计算出该时间序列重构相空间吸引子的关联维数值D2。10.3混沌与分形理论在水文学中的应用现状从哲学意义上讲,水文系统的混沌演化应该是肯定的和普遍的。首先,水文系统是一个复杂的非线性系统,具有产生混沌的基本条件——对初始条件的敏感性和内在随机性。研究表明,在同一水文系统(流域),不同的初始条件会产生完全不同的水文过程。如一次暴雨过程,可能因其时空分布及流域储水条件的很小变化,而使在流域出口断面产生的洪水过程完全不同。长期以来,人们一直试图准确预报水文过程,但是,即使是采用了当前最先进的预测(报)技术,预测(报)与实际之间仍存在一定差距或误差,特别是对具有战略意义的大时空尺度水文系统预报的准确率还很低,甚至表现出不可预测性。这种误差和不可预测性,除了预测(报)技术与方法上的不足外,还可能与受水文系统内在随机性和对初始条件的敏感性的影响有关。其次,水文系统是一个远离平衡态的开放系统,遵循着混沌→有序→新的混沌→新的有序⋯⋯的自然演化的基本规律。根据耗散结构理论、协同学等非平衡系统的自组织理论,一个远离平衡态的开放系统,通过与外界交换物质和能量,从外界获得负熵流,来抵消自身的熵产生,有可能在一定条件下使系统从一种混乱无序的状态,转化成一种稳定有序的结构。这说明,远离平衡态的开放水文系统的平衡和有序是有条件的、相对的,而非平衡和无序则是无条件的、绝对的。水文系统正是在平衡和非平衡、稳定和不稳定、有序和无序等的对立统一中演化的。水文计算课题通常涉及水文现象时空分布的统计结构特性及其相似问题。如地面的水系是一种分枝图像,大流域和小流域的水系存在着自相似性,水系是一种分形。流域的出口流量过程线,具有统计上的相似性。一年内的各分期之间(如过渡期和洪水期之间)点群的结构特性有较显著的差异,而在同一期内(例如洪水期)却有大致相同的结构特性,即各分期之间洪峰点群结构无自相似性,而同一期内却具有自相似性。分维不仅是刻划复杂几何形态相似特性的定量指标,而且是度量功能、信息和结构相似性的定量指标。如,甲流域日流量过程线的分维值和乙流域的分维值无显著差异,这表明甲和乙两个流域的日流量过程特性相似,并进而将乙流域选择为参证流域以插补延长甲站的流量资料。又如,分析气象条件相似基础上的移置暴雨,水文相似原则下的划分水文区等。因此,分形理论的引入应用,可能会使上述问题的定量解决有所突破。以下将根据现有的研究成果,介绍混沌与分形理论在水文科学中的应用现状和存在的主要问题。10.3.1应用现状1.土壤分形特征分形几何学为人们研究非饱和土壤水分运移提供了一个新途径。目前的研究主要包括以下几种。243 (1)土壤水力分形特性建立土壤水力传导率的分形模型,根据分形参数的预测值用来确定土壤的传导率。研究田间土壤优先流形式(preferentialflowpatterns)的分维特性,评价不同土壤中分形对土壤水分扩散率的影响以及由土壤水分扩散率引起的其他问题。根据土壤颗粒粒径分布和分形理论来确定土壤水分保持力关系。(2)土壤粒径分形特性研究土壤多孔性变化特征。(3)土壤孔隙结构分形特性应用孔隙分布数据建立土壤分维数模型和土壤孔隙结构分维模型,进行层状土湿锋不稳定性的分形度量及土壤和润湿的分形现象。2.河流、渠网、排水网分形特征(1)河流形态、流域水系分形是分形特征研究最为成熟的领域之一。它包括流域水系分形,河道形态的分形,河网分维数确定,湖泊水体面积、水面周界的分维数,流域地形物的分形特性。目前,研究主要集中在以下3个问题:1)确定单河流蜿蜒和流域内河网的分支外形的分形特性;2)河流分布稀疏河网的分形特性;3)河流分布稠密河网的分形特性;4)河流分布稀疏河网与河流分布稠密河网的分形特性对比。(2)渠网、排水网分形特征。包括地面排水网分形分析、树状渠网的分形分析。3.水文序列分形特性包括流量、降水、温度、风速序列的分维数计算。4.泥沙分形特征(1)评价河流泥沙颗粒形态的定量模型包括流域泥沙输移的分形特征,天然沉积砂卵石粒度分布的分形结构,泥沙吸附乳化油特性,宽级配卵石泥沙颗粒特性的分维值,非均匀沙床面粗糙度的分形特征,天然河道床面糙度特征,悬移颗粒运动特征值的分形分布等。(2)凝絮物的形态分析河流悬移质泥沙一般由种类复杂、絮凝物合成粒子组成。絮凝物的特性由源、大小、初生粒子的地质化学特性、水中化学生物凝结过程以及水流剪切应力和紊流度确定。应用分维数进行河道沉积颗粒的凝结结构特征分析,包括单一絮凝体(individualfloc)外形复杂度,群体絮凝体(flocpopulations)特性的度量,主要进行小絮凝体的外形与大絮凝体外形的相关性,通过计算群体絮凝体、单一絮凝体的分维数,评价絮凝体对泥沙源的影响和河流絮凝物的絮凝程度、特性。5.分形地貌主要进行分形地形模拟和分形地貌的应用研究。6.灾害特征主要包括旱涝震的分形时间特征分析,洪水灾害研究的复杂性分析,洪水灾害面积的时序分形特征,暴雨图形分维计算,泥石流分形分析等。10.3.2混沌应用存在的问题和发展趋势1.存在的主要问题(1)分形是一门比较年轻的学科,它的基础理论仍需进一步深入研究和完善。1)关于分形或多重分形的定义,目前,尚未有完整而精确的分形的定义。不少学者认为分形是“看”出来的,而无法严格证明什么是“分形”。2)分形维数是描述分形特征的定量参数,但是,分形维数是否能作为一个独立参数244 存在,目前尚不清楚。3)分形理论主要进行形态描述,对动力学机制研究则很少。4)分形重构问题。分形集基本上与迭代、递归过程有关,表现出某种自相似性或拟自相似性,分形重构问题是指已知一个分形的维数,如何重新构建(还原)这个分形。关于时间序列的动力学重构,目前已取得一些进展,但只限于已知系统。5)Mandelbrot集是局部连通的,它以及其边界维数的计算,目前还未完全研究清楚。Julia集则在复指数函数族和复正弦函数族中存在一定的问题。(2)进一步完善和发展时间序列的分维数计算方法。2.发展趋势(1)分形理论的研究主要包括分形维数的物理意义,分形的动力学机制,分形重构问题,随机多重分形的数学问题,分形曲线的导数,混沌时间序列分维计算的可信度问题,分形小波变换分析,自组织临界现象问题以及图像的分形压缩问题。(2)分形在水文中的应用研究最为成熟的领域包括流域水系、流域地形地貌和水文序列的分形特征研究。随着分形理论的完善和发展,分形在水文其他领域的应用会得到进一步发展。10.4混沌理论在水文学中的应用实例本节引用我国学者温权,张士军,张周胜的文献,介绍推求径流时间序列混沌特征数的方法,说明径流序列混沌特征的识别。本研究选用葛洲坝、隔河岩、朝阳寺、龙洞电站的径流资料。10.4.1径流时间序列的最大Lyapunov指数在混沌系统中不可能对系统的状态进行长期预测,这是由于在初始状态的微小不确定性将会迅速地按指数速度扩大。预测能力的迅速丧失是因为系统有着这样的特性,即那些初始状态比较接近的轨迹总体上会指数发散(最坏的情况),至少,在理论上长期预测是不可能的。这种轨迹收敛或发散的比率,称为Lyapunov指数。它在混沌研究中是非常重要的,对一维系统来说,当Lyapunov指数λ<0时,系统有稳定的不动点;当λ=0时,系统出现周期现象;当λ>0时,系统出现混沌。针对各种径流序列,我们计算了它们的最大Lyapunov指数,结果见表10-1。表10-1各种径流序列的最大Lyapunov指数1234数据序列葛洲坝葛洲坝葛洲坝(月)葛洲坝洪峰隔河岩隔河岸龙洞朝阳寺最大L指数0.002810.004870.01390.2810.006560.002840.0060.00314注:1为相应电站1980~1986年的日径流资料;2为相应电站1987~1993年的日径流资料;3为相应电站1951~1969年的日径流资料;4为相应电站1970~1987年的日径流资料。245 由上表可见,各种径流序列的最大Lyapunov指数都是正数,说明这些序列中都不同程度地存在着混沌现象。日径流序列明显的是周期性更强的序列,其最大Lyapunov指数虽为正值,但小于1接近零,这是因为日径流序列有大约365d的拟周期,这样的序列可以具有未来状态的有限步可预测性。月径流序列的最大Lyapunov指数就比较大,其周期性减弱。至于年最大洪峰流量序列,其最大Lyapunov指数相对是最大的,所以可以认为序列是纯随机的,即认为这种序列是独立同分布的各态历经抽样结果,例如正态分布或Pearson型分布,对此类序列可以用概率统计方法来对未来作出概率预报。10.4.2径流时间序列的分维数非线性系统的状态空间的维数可能很高,有时还不知道维数是多少,而系统的稳定轨迹即吸引子的维数一般都低于相空间维数。采用式(10-8)~(10-13)的关联维数计算,见表10-2。表10-2各种径流序列的关联维数1234序列葛洲坝葛洲坝隔河岸隔河岩朝阳寺龙洞葛洲坝(月)隔河岩(月)关联维数0.880.760.940.780.680.785.896.99嵌入维数333333131510.5分形理论在水文学中的应用实例本节引用我国学者冯平、冯焱的文献,介绍河流形态特征的分维计算方法。10.5.1河长1.河长分维的计算网格法这是一种利用分形基本定义来确定分维的方法。当要测量某一河长时,可在某一比例尺的流域图上,采用一定长度的尺子沿河流测量,然后由测量次数与流域图比例尺的关系,就可以确定河流长度。即L=N⋅r(10-14)式中,L为河长;N为尺子的测量总数;r为尺子所代表的实际距离,或称比例尺比值。可以发现,使用不同比例尺的流域图或不同长度的尺子会影响河长的测量结果,原因是河道十分不规则,不同比例尺的流域图由于忽略河道弯曲程度不同使得河长的测量结果不同,即河流长度是不定的。当比例尺比值r趋近于0时(r0→0),应测得到收敛的真正河流长度L0=limN0⋅r0(10-15)r0→0−1或N0=L0⋅r0(10-16)246 然而,人们发现上式常不收敛。原因是式(10-15)中r0的指数可能不为1。若令r0的指数为一分数d,可得dL0=N0⋅r0=const.(10-17)Mandelbrot称此d为分形维数,由式(10-17)可得−dL0~r0(10-18)由此式可得分形维数的定义lnN(r0)d=−lim(10-19)r0→0lnr0可见只要点绘lnN(r0)和lnr0的关系线,通过其直线段的斜率就可估算d值。由式(10-16)还可推出:d1−dL0=N0⋅r0~r0(10-20)式(10-19)通过分维的基本定义,利用不同比例尺比值进行测量的计算网格法给出了河长分维的推求方法。它还适用于推求与之有类似分形性质的流域周边长度等的分维。各河流的分维不同,可代表其受地形等因素影响而形成的不同蜿蜒曲折程度。一般而言,分维越大,河流的蜿蜒程度越高,因此分维也反映了河流发育的自然特征。另外联系到河长与某流域参数有关,还可以利用Horton河系定律来推求河长的分维。2.河长分维的河系定律法如果一个水系是按Strahler分级原则来划分河流级别,那么根据Horton分析了数百条河流,从而总结出的河系定律,就有Ω−kNk=RB(10-21)k−1Lk=L1RL(10-22)k−1Ak=A1RA(10-23)式中,Nk、Lk和Ak分别为k级河流的数目、平均河长和平均面积;RB、RL和RA分别为河流分枝比、长度比和面积比;Ω表示河流的最高级。对高河长L和流域面积A的关系,通常采用下列形式:αL~A(10-24)式中,参数α与河长分维d的关系,Mandelbrot取d=2α(10-25)这样若测量河长的比例尺比值取为ε时,由式(10-20)有1−d[]d2L(ε)=CεA(ε)(10-26)式中,C为常量参数。247 对于Ω级河流,据Horton河系定律,由式(10-22)得流域河长为ΩΩL(ε)=∑Lk(ε)=L1(ε)(RL−1)(RL−1)(10-27)k=1把此式和式(10-23)代入式(10-26),可解得{}Ωlog[RL−1](RL−1)d=2(10-28)[Ω−1]logRA当ε趋于0,则Ω会趋于∞,并考虑到d≥1,则有d=max[1,2logRLlogRA](10-29)此式表明河长的分维是河流的河长比和面积比的函数,而与河流的分枝比无关。有些文献用此式来确定河网的分维似乎是不恰当的。10.5.2流域面积关于分形特性对流域面积的影响,可以认为符合Mandelbrot在1983年的假设,亦即流域面积随流域图比例尺的变化很小。因为虽然更大比例尺的流域图会使流域的边界显得更加不规则,但相对面积而言,因不规则而增加与减少的面积可能近似相等。这样流域面积受比例尺的影响很小,理论上应为零。10.5.3河网河网是由干流及其支流组成的网络系统。干流有许多支流,每条支流又有各自的支流。这种分枝现象直观上说是一种典型的自相似性,可以进行分形分析。河网分维的估算和河长一样,一种方法仍是依据基本定义的计算网格法,另一种方法则是从河系定律出发来进行估算。1.河网分维的计算网格法河网的形态特征一般用河网密度来表示,它是河网的干支流的总长度与流域面积的比值。即ΩDR=∑L(k)A(10-30)k=1前面分析已说明,分形特征对流域面积是没有影响的,这样只要给出干支流总长度的分维,也就给出了河网密度的分维。因此类似河长分维的计算网格法,利用式(10-19)就可以给出河网的分维D。即选择不同的比例尺比值r0,对河网中的干支流总长度进行测量,可以得到不同的测量次数N(r0),然后点绘lnN(r0)和lnr0的关系线,通过直线段的斜率就可以估算河网的分维D。2.河网分维的河系定律法由Horton河系定律可得k级河流的总长k−1Ω−kL(k)=Nk⋅Lk=L1RLRB(10-31)248 若将河网中各级河流的总长加起来,便得整个河网干支流的总长度⎡Ω⎤Ω−1⎢⎛RB⎞⎥L1RL⎜⎜⎟⎟−1Ω⎢⎣⎝RL⎠⎥⎦∑L=∑L(k)=(10-32)RBk=1−1RLSmart曾统计了数百条河流,发现RB值在3.0~3.5,RL值在1.5~3.5,因此一般河流RBRL通常大于1.0。当比例尺比值趋近于0时,Ω会趋于∞,这样便有ΩΩ−1⎛⎜RB⎞⎟Ω−1∑L=L1RL⎜⎟=L1RB(10-33)⎝RL⎠Ω−其中L1=LΩ()1RL(10-34)将式(10-34)两边取对数,并代入式(10-33)得L=L1−(logRBlogRL)(10-35)∑1由于当Ω→∞,则L1→0,这样就可以视L1为比例尺的比值r,比较式(10-20)和式(10-35),得D=logRBlogRL(10-36)考虑到D≥1,则有D=max()1,logRBlogRL(10-37)这就是LaBarbera和Rosso给出的河网分形维计算公式。可见河网的分维与河流的分枝比及河长比有关。分枝比越大,说明支流越多,河网发育的程度越好,其分维也就越大。河网的分维应介于1.0与2.0之间,当D接近2时,即认为河网水系充满了整个流域平面。10.5.4方法的应用42海河流域总面积达31.79×10km,它源于太行山,蜿蜒曲折。西部与黄土高原接壤,北部与内蒙草原及东北山丘平原相连,南界黄河,东临渤海。流域内包括湾河、永定河、子牙河及大清河等水系。流域形态特征的分维研究是在1∶100000的流域图上进行的。1.河长的分维对于计算网格法,是选择不同的比例尺比值,对各水系的河长进行实际测量,然后按式(10-19)给出各水系河长的分维,结果见表10-3。而对于河系定律法,是先在各流域图上,统计出各水系的河流参数,然后按式(10-29)便可以估算出河长的分维(表10-3)。从表10-3结果可见,二者的吻合较好,这说明按河系定律法估算河长分维也是可行的。从计算网格法的实测结果上看,海河水系河长的分维在1.01~1.14之间,其中湾河、大清河的分维较大,而永定河的分维最小。这在流域图上也可以证实,湾河与大清河的河道蜿蜒曲折,而永定河的河道则比较规则、顺直。海河水系河长的平均分维为1.10。表10-3同时还给出了考虑分形特性的各水系河长的估算结果,即式(10-17)给出的河长,它可以避免比例尺比值不同对河长测量的影响,估算出稳定的河长值。249 表10-3海河主要水系河长的分维河长Horton河流参数河长的分维D水系(km)RLRA计算网格法河系定律法湾河9152.073.561.141.15永定河4522.405.181.011.07大清河4451.953.071.141.19子牙河9252.123.791.091.132.河网的分维同样也采用上述2种方法估算了这些水系河网的分维,结果见表10-4。表10-4海河主要水系河网的分维面积Horton河流参数河长的分维D水系2(km)RBRL计算网格法河系定律法湾河479303.302.071.501.64永定河474404.262.401.571.66大清河402903.091.951.511.69子牙河637303.832.121.691.79从表10-4结果可见,二者基本吻合,这说明先估算河网的Horton河流参数,然后再按河系定律法给出河网分维也是可行的。RB和RL一般随自然地带不同而异,海河流域水系的RB为3.09~4.26,RL为2.07~2.40,符合前述的Smart统计结果。从这些水系上看,河网分维的实测值在1.50~1.69之间。LaBarbera和Rosso曾分析大量水系,发现河网的典型分维值在1.5~2.0之间,平均值为1.6~1.7。而海河水系河网分维的平均值为1.57,这表明海河是一个发育接近常规的流域。参考文献1马建华,管华.系统科学及其在地理学中的应用.北京:科学出版社,20032赵永龙,丁晶,邓育仁.混沌分析在水文预测中的应用和展望.水科学进展,1998,9(2):181~186.3黄润生.混沌及其应用.武昌:武汉大学出版社,20004吴伯贤,丁晶.分形、分维与水文科学.水文科技情报,1992,9(4):2~55张济忠.分形.北京:清华大学出版社,19956冯国章,李佩成.论水文系统混沌特征的研究方向.西北农业大学学报,1997,25(4):97~1017AminElshorbagy,SPSimonovic,USPanu.Estimationofmissingstreamflowdatausingprinciplesofchaostheory.JournalofHydrology,2002,255(1~4):123~133250 8YinkangZhou,ZhiyuanMa,LachunWang.ChaoticdynamicsofthefloodseriesintheHuaiheRiverBasinforthelast500years.JournalofHydrology,2002,258(1~4):100~1109AWJayawardena,WKLi,PXu.Neighbourhoodselectionforlocalmodellingandpredictionofhydrologicaltimeseries.JournalofHydrology,2002,258(1~4):40~5710BellieSivakumar,Ronny,Magnus.Monthlyrunoffpredictionusingphasespacereconstruction.HydrologicalSciencesJournal,2001,46(3):377~38811Jaya,AW.降雨和径流时间序列的混沌分析与预测.人民长江,1996,27(6):43~4612蒋传文,权先璋.径流序列的混沌神经网络预测方法.水电能源科学,1999,17(2):39~4113冯金良,张稳.海滦河流域水系分形.泥沙研究,1999.1:62~6414金德生,陈浩.河道纵剖面分形-非线性形态特征.地理学报,1997,52(2):154~16115De-Boer,DH,Stone,-M,Levesque,LMJ.Fractaldimensionsofindividualflocsandflocpopulationsinstreams.HydrologicalProcesses,2000,14(4):653~66716De-Boer,DH,tone,M.Fractaldimensionsofsuspendedsolidsinstreams:comparisonofsamplingandanalysistechniques.HydrologicalProcesses,999,13(2):239~25417De-Boer,DH.Anevaluationoffractaldimensionstoquantifychangesinthemorphologyoffluvialsuspendedsedimentparticlesduringbaseflowconditions.HydrologicalProcesses,997,11(4):415~42618冯平,冯焱.河流形态特征的分维计算方法.地理学报,1997.52(4):62~6419温权,张士军,张周胜.探求径流序列中的混沌特征.电能源科学,1999.(3):21~23251 第11章小波变换及其在水文科学中的应用1980年,法国工程师Morlet在分析地震资料时提出了小波分析(子波分析)。它是继傅立叶分析以后,纯粹数学与应用数学殊途同归的又一范例,素有“数学显微镜”的美称,是纯粹数学家和应用数学家、工程师各自独立发现的,并经过他们的共同努力而得以迅速发展。在随后的20多年里,小波分析成为国际研究热点。目前小波分析在信号处理、图像压缩、语音编码、模式识别、地震勘探、大气科学以及许多非线性科学领域内取得了大量的研究成果。由于水文现象变化异常复杂,水文时间序列显示出各种各样的特性,其特性变化规律分析还没有公认的方法。将小波分析引入水文科学应用研究中,并与现代科学理论和方法结合,为多途径揭示水文科学的内在规律提供了一种新的分析方法。本章引用我国徐建华,管华,冉启文,王文圣,丁晶等学者的文献,侧重介绍小波变换的基本方法、基本思想、基本工具和它在水文科学中的应用。11.1小波分析方法11.1.1小波和小波函数为了叙述方便,本章约定,用小写字母,如f(x)表示时间信号或函数,括号里的小写字母x表示时间域自变量,对应大写字母F(ω)表示相应函数或信号的傅立叶变换,ω表示频率域自变量。时间域中的尺度函数用φ(x)表示,对应的频率域中,则用φ(ω)表示。2+∞2函数空间L(R)是定义在整个实数轴R上,且满足∫f(x)dx<+∞的可测函数f(x)−∞的全体组成的集合,并带有相应的函数运算和内积。工程上常常说成是能量有限的全体信号的空间。直观地说,就是在远离原点的地方衰减得比较快的那些函数或者信号构成的空间。2小波(Wavelet)是函数空间L(R)中满足下述条件的一个函数或者信号ψ(x)2ψ(ω)Cψ=∫R∗dω<∞(11-1)ω∗式中,R=R−{0}表示非零实数全体。ψ(x)也称为小波母函数。对于任意实数(a,b),其中a必须为非零实数,称如下形式的函数252 1⎛x−b⎞ψ(a,b)(x)=ψ⎜⎟,b∈R,a∈R,a≠0(11-2)a⎝a⎠为由小波母函数ψ(x)生成的依赖于参数()a,b的连续小波函数,简称为小波。满足式(11-1)的称为“容许性条件”。式中,ψ(a,b)(x)为小波;a为尺度因子或频率因子;b为时间因子或平移因子。以下给出几个比较典型的小波。sin(2πt)−sin(πt)(1)Shannon小波:ψ()t=πt2−t2(2)Shannon小波:g(x)=e2icx−t2(3)Morlet小波:ψ(x)=ee22−t2(4)Mexican小波:h(x)=(1−t)e11.1.2小波变换及其性质1.小波变换对于任意的函数或者信号f(x),其小波变换定义为1⎛x−b⎞Wf(a,b)=∫f(x)ψ(a,b)(x)=∫f(x)ψ⎜⎟dx(11-3)RaR⎝a⎠式中,ψ(x)为ψ(x)的复共轭函数。因此,对任意的函数f(x),它的小波变换是一个二元函数,这是小波变换和傅里叶变换很不相同的地方。另外,因为小波母函数ψ(x)只有在原点的附近才会有明显偏离水平轴的波动,在远离原点的地方函数值将迅速衰减为0,所以,对于任意的参数对()a,b,小波函数ψ(a,b)(x)在x=b的附近存在明显的波动,远离x=b的地方将迅速地衰减到0。因而,从形式上可以看出,函数的小波变换Wf(a,b)数值表明的本质上是原来的函数或者信号f(x)在x=b点附近按ψ(a,b)(x)进行加权的平均,体现的是以ψ(a,b)(x)为标准快慢的f(x)的变化情况,这样,参数b表示分析的时间中心或时间点,而参数a体现的是以x=b为中心的附近范围的大小,所以,一般称参数a为尺度参数,而参数b为时间中心参数。因此,当时间中心参数b固定不变时,小波变换Wf(a,b)体现的是原来的函数或信号f(x)在x=b点附近随着分析和观察的范围逐渐变化时表现出来的变化情况。253 2.小波变换的性质小波变换具有以下性质:(1)Parseval恒等式dadbCψf(x)g(x)dx=Wf(a,b)Wg(a,b)(11-4)∫R∫∫R22a2对空间L(R)中的任意的函数f(x)和g(x)都成立,这说明,小波变换和傅里叶变换一样,在变换域保持信号的内积不变,或者说,保持相关特性不变(至多相差一个常数倍),2只不过,小波变换在变换域的测度应该取为dadba,而不像傅里叶变换那样取的是众所周知的Lebesgue测度,小波变换的这个特点将要影响它的离散化方式,同时,决定离散小波变换的特殊形式。(2)小波变换的反演公式2利用小波变换的Parseval恒等式,容易证明在空间L(R)中,小波变换有反演公式1dadbf(x)=C∫∫R×RWf(a,b)ψ(a,b)(x)2(11-5)ψa特别是,如果函数f(x)在点x=x0处连续,那么,小波变换有如下的定点反演公式1dadbf(x0)=C∫∫R×RWf(a,b)ψ(a,b)(x0)2(11-6)ψa式(11-5)和式(11-6)说明,小波变换作为信号变换和信号分析的工具在变换过程中是没有信息损失的,这一点保证了小波变换在变换域对信号进行分析的有效性。特别应注意的是反演公式的测度不是Lebesgue测度,对于尺度参数a,它是带有平方伸缩的2Lebesgue测度daa。(3)吸收公式当吸收条件22+∞ψ(ω)+∞ψ(−ω)∫dω=∫dω(11-7)0ω0ω成立时,可得到如下的吸收Parseval恒等式1+∞+∞⎡+∞⎤da2Cψ∫−∞f(x)g(x)dx=∫∫0⎢−∞Wf(a,b)Wg(a,b)db⎥2(11-8)⎣⎦a(4)吸收反演公式当前述吸收条件成立时,可得相应的吸收逆变换公式2+∞⎡+∞⎤daf(x)=W(a,b)ψ(x)db(11-9)C∫∫0⎢−∞f(a,b)⎥2ψ⎣⎦a254 2这时,对于空间L(R)中的任何函数f(x),它所包含的信息完全被由a>0所决定的变换域上的小波变换{Wf(a,b);a>0,b∈R}所记忆。这一特点是傅里叶变换所不具备的。11.1.3离散小波和离散小波变换无论是出于数值计算的实际可行性考虑,还是为了理论分析的简便,对小波变换进行离散化处理都是必要的。对于小波变换而言,将它的参数对(a,b)离散化,分成两步实现,并采用特殊的形式,即先将尺度参数a按二进的方式离散化,得到著名的二进小波和二进小波变换,之后,再将时间中心参数b按二进整倍数的方式离散化,最后得到出人意料的正交小波和函数的小波级数表达式,真正实现小波变换的连续形式和离散形式在普通函数的形式上的完全统一,对于傅里叶变换的两部分即傅里叶级数和傅里叶变换来说,这是无法想象的。1.二进小波和二进小波变换如果小波函数ψ(x)满足稳定性条件+∞2A≤∑ψ(ω)≤B(11-10)j=−∞则称ψ(x)为二进小波,对于任意的整数k,记kψ(x)=22ψ(2−k(x−b))(11-11)−k(2,b)−k它是连续小波ψ(a,b)(x)的尺度参数a取二进离散数值ak=2。函数f(x)的二进离散k小波变换记为Wf(b),定义如下k−kWf(b)=Wf(2,b)=∫f(x)ψ(2−k,b)(x)dx(11-12)R−k这相当于尺度参数a取二进离散数值ak=2时连续小波变换Wf(a,b)的取值。这时,二进小波变换的反演公式是+∞kkf(x)=∑2∫Wf(b)×t(2−k,b)(x)db(11-13)Rk=−∞其中,函数t(x)满足+∞kk∑ψ(2ω)T(2ω)=1(11-14)k=−∞称为二进小波ψ(x)的重构小波。这里,记号ψ(ω),T(ω)分别表示函数ψ(x)和t(x)的傅里叶变换。重构小波总是存在的。例如,可取255 +∞2kT(ω)=ψ(ω)∑ψ(2ω)(11-15)k=−∞当然,重构小波一般不是惟一的,但容易证明,重构小波一定是二进小波。−k由上述这些分析可知,二进小波是连续小波之尺度参数a按二进方式ak=2的离散化,函数或信号的二进小波变换就是连续小波变换在尺度参数a只取二进离散数值−kak=2时的取值。无论是数值计算的需要,还是为了理论分析的方便,同时将尺度参数和时间中心参数离散化是很必要的,正交小波变换恰好满足了这些要求。2.正交小波和小波级数设小波为ψ(x),如果函数族⎧k⎫⎪2k⎪⎨ψk,j(x)=2ψ(2x−j);(k,j)∈Z×Z⎬(11-16)⎪⎩⎪⎭2构成空间L(R)的标准正交基,即满足下述条件的基ψ,ψ=ψ(x)ψ(x)dx=δ(k−l)δ(j−n)(11-17)k,jl,n∫k,jl,nR则称ψ(x)是正交小波,其中符号δ(m)的定义为:⎧1;m=0δ(m)=⎨(11-18)⎩0;m≠0称为Kronecker函数。这时,对任何函数或信号f(x),有如下的小波级数展开+∞+∞f(x)=∑∑Ak,jψk,j(x)(11-19)kj=−∞=−∞其中的系数Ak,j由公式(11-20)得出,A=f(x)ψ(x)dx(11-20)k,j∫k,jRAk,j称为小波系数。容易看出,小波系数Ak,j正好是信号f(x)的连续小波变换−kWf(a,b)在尺度参数a的二进离散点ak=2和时间中心参数b的二进整倍数的离散点−k−k−kbj=2j所构成的点(2,2j)上的取值,因此,小波系数Ak,j实际上是信号f(x)的离散小波变换。也就是说,在对小波添加一定的限制之下,连续小波变换和离散小波变换在形2式上简单明了地统一起来了,而且,连续小波变换和离散小波变换都适合空间L(R)上的全体信号。正交小波的简单例子就是有名的Haar小波。Haar小波是法国数学家A.Haar在20世纪30年代给出的。具体定义是256 ⎧1;0≤x<0.5⎪h(x)=⎨−1;0.5≤x≤1(11-21)⎪⎩0x∉[0,1)这时,函数族⎧j⎫⎪2j⎪⎨hk,j(x)=2h(2x−k);(j,k)∈Z×Z⎬(11-22)⎪⎩⎪⎭2构成函数空间L(R)的标准正交基。11.2小波分析在水文中的应用现状水文时间序列是一个信息量有限的观测样本。由于小波分析具有多分辨力的功能,应用小波分析可以充分利用现有信息量,深刻揭示水文序列的变化特性,进行不同序列过程识别分类。如日流量过程中,枯期变化较为平稳,汛期变化则剧烈,涨水落水之间则会发生峰点。对于这种过程,前者的分辨力低,后者的分辨力高。因此,小波分析可为水文水资源和水环境领域开创一条崭新的研究分析途径,大大丰富水文学的内容。小波分析在水文中具有巨大的应用潜力,通过小波分析,可建立合适的预测模型;通过小波分解和重构,可以模拟水文水资源分析和计算所需的水文序列(丁晶,李贤彬,李后强等,1997)。11.2.1研究现状从1993年Kumar和FoufoularGegious将小波分析引入水文中以来,小波分析在水文科学中已取得了一定的研究成果,主要表现在水文多时间尺度分析、水文时间序列变化特性分析、水文预测预报和随机模拟方面(丁晶,李贤彬,李后强等,1997)。1.小波分析在水文多时间尺度分析中的应用这一方面主要是降水、径流的多时间尺度分析。研究表明,空间降水存在标度的自相似性和时间尺度的多种成分。小波分析提供了为分解二维空间非均质和各向异性降水场、识别降水时间—频率尺度、能量分解、降水序列突变点的存在和位置的定量分析,为降水偏多和偏少区域组成、周期振荡和周期变化分析、降水变化对时间尺度的依赖性、未来的演变趋势的定性估计等开辟了新途径。年径流量多时间尺度变化研究则集中在不同时段的周期变化及突变点的位置分析。2.小波分析在水文时间序列变化特性上的应用小波分析在水文水资源时间序列变化特性上的应用包括奇异性检测和过程特性定量表征。根据小波变换良好的时、频局部化特性,确定时间序列奇异点的分布情况及位置和强弱,进而准确地将之去掉。采用Mallat算法,研究分形时间序列分维数的估计方法,探讨表征水文过程变化特征的信息量系数。如年、月平均流量过程和汛期日流量过程,一些研究表明,信息量系数从频率能量分布出发刻画过程变化的复杂程度,即水文过程越复杂,信息量系数越大;反之257 亦然。通过河流洪峰流量序列研究,借助小波分析揭示水文序列的长持续性结构。3.小波分析在水文预测预报中的应用主要为小波分析与分形、混沌、ANN、随机理论等结合,进行水文预测预报,探讨水文预测预报的新途径。其耦合的途径有小波分析与分形结合,小波分析与混沌、ANN结合,小波分析与混沌耦合,小波与ANN结合等。一些研究成果表明,耦合模型对历史样本具有很好的拟合效果,样本的预报结果也令人满意。4.小波分析在水文随机模拟中的应用通过建立上述各种组合模型,进行水文随机模拟。一些研究成果表明,基于小波变换的组合随机模型和随机模拟研究,模型实用性检验是可行的。11.2.2进一步需解决的问题主要包括小波函数、小波变换算法、小波分析的多时间尺度变化应用、小波变换奇异性检测和去噪方法、小波分析与其他分析方法等的耦合研究等问题(王文圣,丁晶,向红莲,2002;丁晶,李贤彬,李后强等,1997)。1.小波函数选择研究小波函数不仅是小波理论的重要内容,也是水文水资源时间序列分析的前提和条件。现有多种小波基,各有其特点,如何选择小波基以及改进现有的小波基以适应水资源分析计算和预测的需要是研究的关键问题之一。可从已有的小波函数中选取,或作适当修正,或重新构建新的小波函数。2.小波变换算法研究现有算法中的塔式Mallat进行算法、流式Mallat和ATrous算法等都较为成熟。在水文中,研制快速小波变换算法是必要的。这种算法应具有:(1)具有良好压缩功能,能对大量的水文水资源数据进行储存,可节省存储空间和时间,带来巨大经济效益;(2)具有扫描特点,能准确跟踪数据流中每一点变化特性,便于详细分析计算和预测。3.应用小波分析研究水文水资源多时间尺度变化小波变换具有时—频局部化特征,能准确地找到时间序列的大小时间尺度(周期)和突变点,判断所处的阶段。利用小波变换,揭示水文水资源时间序列多尺度特性,为水资源合理开发利用和优化配置提供有力的依据。4.探讨小波变换奇异性检测和去噪方法在水文水资源中的应用5.小波分析与其他分析方法等的耦合途径研究进一步加强小波分析与分形、混沌、ANN、随机理论等耦合途径研究,充分发挥各自的优点,为水文水资源预测预报和随机模拟提供更有效、更精确的模型。小波变换的应用使人们能够从新的角度去把握时间序列过程的分形特征。所以小波和分形结合可以扩大分形分析在水文上的应用,同时使小波分析在揭示水文序列变化特性方面更为有效。在许多网络中,前馈网络最为广泛。这种网络的隐单元非线性变换用Sigmoid函数,存在一定的缺陷。引用小波函数构成小波神经网络,根据它的正交性和局部时频分辨等特点,可望从根本上弥补前馈网络的缺陷。小波神经网络是小波和神经网络的有机结合,吸取了258 两者的优点,它将为水文预测提供有效的网络模型。小波分析通过变换系数在时频平面上,同时以不同尺度和时间表示时间序列的结构特性。在变换系数的分析中引进随机思路(即对反映急剧变化成分的系数随机化)可能达到随机重构的目的。这种小波重构和随机模拟结合可望在模拟水文序列方面有重大进展。11.3小波分析在水文中的应用实例本节介绍王文圣,丁晶,向红莲(2002)利用Marr小波和Morlet小波变换法探讨水文时间序列的多时间尺度演变特性研究。11.3.1基本资料及预处理收集了长江宜昌站98年(1890~1987)年平均流量资料,将年平均流量过程进行标准化处理。11.3.2Marr小波变换在水文时间序列的多时间尺度分析中的应用将标准化年平均流量过程f(k∆t),k=1,2,L,98;∆t=1和Marr小波代入如下所示的离散小波变换计算公式。1D⎛k∆t−b⎞Wf(a,b)=a2∆t∑f(k∆t)ψ⎜⎟(11-23)k=1⎝a⎠取不同的a和b,计算小波系数Wf(a,b),Wf(a,b)随参数b和a变化。绘制以b为横坐标、a为纵坐标的小波系数二维等值线图。通过二维等值线图分析可得到关于水文时间序列变化的特征。每一年的小波特征通过垂直向截取来考察,每一种周期小波随时间变化通过水平截取来考察。不同时间尺度下的小波系数可以反映不同时间尺度下径流变化特征,正的小波系数对应于丰水期,负的小波系数对应于枯水期,小波系数为零对应着突变点;小波系数绝对值越大,表明该时间尺度变化越显著。经分析,尺度为30~32时,宜昌站年径流可能存在50年以上大时间尺度变化,即1939年以前的多水期和1940年以后的少水期,分别对应1939年以前的小波系数高值区和1940年以后的低值区域,丰枯突变点在1940年。对于分辨度为12~14的时间尺度而言,近100年来出现4次丰枯交替,分别为1925年以前的多水期、1926~1945年的少水期、1946~1964年的多水期和1965年以后的少水期,丰枯突变点在1925年、1945年和1964年。对于分辨度为3~4的时间尺度来说,近100年来出现13次丰枯交替,对应的突变点的位置及分布相当清晰。对于更小时间尺度,丰枯变化更频繁且较零乱。11.3.3Morlet小波变换在水文时间序列多时间尺度分析中的应用复数小波较实型小波更真实反映径流的各尺度周期性的大小及这些周期在时域中的分布。复数小波变换系数的模和实部是两个重要的变量。模的大小表示特征时间尺度信号的强弱,实部可表示不同特征时间尺度信号在不同时间的强弱和位相两方面的信息。259 将宜昌站标准化年平均流量过程和Morlet小波函数代入式(11-23),分别计算出Morlet小波变换系数的模平方和实部。做以b为横坐标,a为纵坐标的二维等值线图。通过绘制年平均流量标准化序列Morlet小波变换系数的模平方的时频变化图,经分析,年际尺度(小于10年)和年代际尺度(大于10年)特征十分明显。其年际变化的周期之一是3~4年,最强信号发生在1904~1913年、1934~1940年、1952~1957年和1966~1970年期间。另一年际变化周期为8~9年,主要发生在1891~1906年、1934~1956年和1968~1984年期间。年代际变化主要周期有15年左右,主要发生在1920~1970年这一期间,更长的周期在45年左右。通过绘制年平均流量标准化序列Morlet小波变换系数的实部的时频变化图,经分析15年左右强周期对应的位相结构,正负位相以15年左右的时间振荡,在1890~1895年、1902~1909年、1917~1924年、1931~1938年、1946~1954年、1962~1970年和1978~1987年各时段为正位相,表示径流量偏多;而1896~1903年、1910~1916年、1925~1930年、1939~1945年、1955~1961年及1971~1977年各时段为负位相,表示径流量偏少。又如32年左右的周期也比较明显,正负位相以32年的时间振荡,有4个偏多期,3个偏少期。从图中还可以看出,存在着45年以上的强振荡,有3个偏少期和2个偏多期。11.3.4与传统谐波分析的对比传统上用谐波分析研究时间序列的周期,其中方差谱密度较常用。用方差谱密度法对宜昌站年平均流量过程进行分析,该过程含有15年、8年、3年和2年的周期。不难发现,小波分析不仅具有Fourier变换的功能,而且还能同时给出时间序列时频局部结构,很容易识别出水文时间序列的各种尺度变化、分布和突变点。参考文献1徐建华,管华.现代地理学中的数学方法.北京:高等教育出版社,20022王文圣,丁晶,向红莲.小波分析在水文学中的应用研究及展望.水科学进展,2002,13(4):515~5203丁晶,李贤彬,李后强.水文水资源分析新方法——子波分析.水文科技信息,1997,14(2):16~214冉启文.小波变换与分数傅立叶变换理论及应用.哈尔滨:哈尔滨工业大学出版社,20015王文圣,丁晶,向红莲.水文时间序列多时间尺度分析的小波变换法.四川大学学报(工程科学版),2002,34(6):14~17260'