• 3.38 MB
  • 62页

工程水文学第四章水文统计基本方法

  • 62页
  • 关注公众号即可免费下载文档
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档由网友投稿或网络整理,如有侵权请及时联系我们处理。
'第四章水文统计基本方法⒈概率的基本概念⒉随机变量及其概率分布⒊水文频率曲线线型⒋P—Ⅲ型分布参数估计⒌水文频率计算—适线法⒍相关分析 第一节概述一、水文现象的随机性:二、概率论和数理统计学在水文分析中的应用:三、水文统计解决的问题:给定样本,求指定频率的设计值例:求指定频率的设计洪水。方法:确定频率曲线。 第二节概率的基本概念一、事件指在一定条件组合下,随机试验的结果。分为:必然事件、不可能事件、随机事件。水文测验可看作随机试验。二、概率反映随机事件出现的可能性大小的数量标准:三、频率对于水文现象,用频率作为概率的近似值: 第三节随机变量及其概率分布一、随机变量随试验结果而发生变化的变量,用X表示,取值用表示。例:水文特征值:年径流、洪峰流量。离散型随机变量:连续型随机变量:水文特征值属连续型随机变量。 二、随机变量的概率分布随机变量的取值与其概率的对应关系,称为随机变量的概率分布。对于水文变量;常研究大于等于某一取值x的概率,即:水文上通常称随机变量的累积频率曲线,简称频率曲线。 三、概率分布函数与概率密度函数的关系概率分布函数导数负值,称为概率密度函数。 四、随机变量的统计参数⒈总体统计参数、样本统计参数⒉均值、均方差、变差系数、偏态系数⒊总体:随机变量所有取值的全体。⒋样本:从总体中抽取的一部分。⒌样本容量:样本包括的项数,样本大小。⒍水文样本系列:统计参数是样本统计参数。 ⒈均值():定义模比系数:则:反应系列总水平 ⒉均方差σ、变差系数Cv:反映系列中各变量值集中或离散的程度例4-2:5,10,15x=10σ=4.08Cv=0.48995,1000,1005x=1000σ=4.08Cv=0.0048 ⒊偏态系数(Cs):反映系列在均值两边对称程度 正态曲线或正态分布:密度函数:密度曲线: 样本系列13002200318541655150例4-3:计算系列的统计参数均值、变差系数、偏态系数。 样本系列统计参数计算(P.40)样本系列(xi-x)2(xi-x)3KiKi-1(Ki-1)313001000010000001.50.50.1252200001003185225-33750.925-0.075-0.0004218741651225-428750.825-0.175-0.0053593851502500-1250000.75-0.25-0.015625均值20027901657500.10359375均方差52.8变差系数0.2641021.12偏态系数1.12 第四节水文频率曲线线型一、经验频率曲线由实测资料(样本)绘制的频率曲线。⒈绘制设某水文要素(如年径流量)的实测系列共n项,按由大到小的次序排列为x1、x2、...、xm、...、xn。第m项的经验频率就是在系列中大于及等于样本xm的项数出现次数(m次)与样本容量(n)之比值,即 当m=n时,p=100%,即样本的末项xn是总体中的最小值,显然不符合实际,因为随着观测年数的增多,总会出现更小的数值。对上式进行修正,有:数学期望公式:在频率格纸上以系列各项的频率为横坐标、各项的值为纵坐标点图,再通过点群中心目估绘光滑曲线即经验频率曲线。 年份年最大洪峰流量序号由大到小排列经验频率(1)(2)(3)(4)(5)1961720126509.1196210802206018.2196310303144027.3196412504142036.4196514405137045.5196614206125054.5196711207112063.6196820608108072.7196913709103081.8197026501072090.9例4-4:已知某水利枢纽,年最大洪峰流量系列,绘制经验频率曲线。 某枢纽年最大洪峰流量经验频率曲线 二、理论频率曲线:1、皮尔逊Ⅲ型分布曲线(P-Ⅲ)一端有限,一端无限的不对称单峰曲线可以推证:形状、尺度和位置参数 水文计算:一般需求出指定频率P所对应的随机变量取值,即。例如:频率为1%(百年一遇)的设计洪峰流量。这就需要对密度曲线进行积分,求出等于及大于的累积频率P值。理论频率曲线绘制: 即求出的应满足:令:,Φ是均值为零,标准差为1的标准化变量(离均系数)则有:取决于四个参数。 该式包含CS、P与Φp的关系,根据拟定CS值,可得不同P的Φp值,附表。然后利用已知的和CV值,通过下式即可求出与各种P相应的值,从而可绘出理论频率曲线。 理论频率曲线的绘制:已知统计参数,求不同频率对应的值:然后在频率格纸上绘曲线,横坐标为频率,纵坐标为水文特征值。 例4-5:某站年径流系列符合P-Ⅲ型分布,已知该系列的,,CV=0.25,CS=2Cv,试绘理论频率曲线。解:当CS=2Cv时,查附表得不同频率下的Kp,代入下式:P0.010.10.20.330.512Kp2.221.961.871.811.771.671.58Xp144312741215.51176.51150.51085.51027P10205075909599Kp1.331.20.980.820.70.630.52Xp864.5780637533455409.5338 理论频率曲线 三、频率与重现期的关系水文上常用“重现期”来代替“频率”1.当研究暴雨或洪水时(一般P≤50%)2.当研究枯水或年径流时(一般P≥50%)例如:当某一洪水的频率为P=1%时,则T=100年,称此洪水为百年一遇洪水,表示大于等于这样的洪水平均100年会遇到一次。对于p=80%的枯水流量,则T=5年,称作以五年一遇枯水流量作为设计来水的标准。表示小于等于这样的流量平均5年会遇到一次。说明具有80%的可靠程度。 第五节P—Ⅲ型分布参数估计用有限的样本观测资料估计总体分布线型中的参数,如P—Ⅲ型的、CV、CS。一、矩法用样本矩估计总体矩,并通过矩与参数之间的关系,来估计频率曲线的参数。⒈均值无偏估计: ⒉CV的无偏估计量:⒊CS的无偏估计量: 二、权函数法马秀峰(1984)提出。 三、抽样误差由随机抽样引起的误差,称为抽样误差。以均值为例;抽样误差定义为:样本均值是随机变量,抽样误差也为随机变量。抽样误差近似服从正态分布。 可以证明,系列的均方差可作为度量抽样误差的指标,称为均方误。各参数的均方误(抽样误差): CV=2CS时样本参数的均方误(相当误差,%)cv参数均值变差系数偏态系数1005025101005025101005025100.1112371014221261782523990.33469710152351721021620.557101681116254158821300.77101422912172740568012611014203210142032426085134 第六节水文频率计算—适线法(配线法)适线法:是以经验频率点据为基础,在一定的适线准则下,求解与经验点据拟合最优的频率曲线参数,得到一条理论频率曲线。目估适线法、优化适线法。 一、目估适线法(1)将实测资料由大到小排列,计算各项的经验频率,在频率格纸上点绘经验点据。(2)选定水文频率分布线型(一般选用P-Ⅲ型)。(3)初估一组参数、CV、CS。为了使初估值大致接近实际,可用矩法或其它方法求出3个参数,作为3个参数第一次的假定值。当用矩法估计时,因CS的抽样误差太大,一般不计算CS,而是根据经验假定CS为CV的某一倍数(如CS=2CV)。 (4)根据假定的、CV、CS,查附表,计算xP值,以xP为纵坐标,p为横坐标,即可得到频率曲线。将此线画在绘有经验点据的图上,看与经验点据配合的情况,若不理想,则修改参数再次进行计算。(5)最后根据频率曲线与经验点据的配合情况,从中选择一条与经验点据配合较好的曲线作为采用曲线。相应于该曲线的参数便看作是总体参数的估值。 二、统计参数对频率曲线的影响:(1)均值对频率曲线的影响1.均值大的位于小的之上。2.均值大的较小的陡。 (2)CV对频率曲线的影响1.随着CV的增大,频率曲线越来越陡。 (3)CS对频率曲线的影响1.CS越大,均值(K=1)对应的频率越小,频率曲线中部越向左偏,且上段越陡,下段越平缓。 例4-6:某枢纽处最大洪峰流量频率计算某枢纽处年最大洪峰流量计算表年份洪峰流量序号排序模比系数(Ki)Ki-1(Ki-1)2频率(P)(1)(2)(3)(4)(5)(6)(7)(8)19451540127502.2071.2071.45624.51946980223901.9180.9180.84249.119471090318601.4930.4930.242613.619481050417401.3960.3960.157018.219491860515401.2360.2360.055622.719501140615201.2200.2200.048327.31951790712701.0190.0190.000431.819522750812601.0110.0110.000136.41953762912100.971-0.0290.000840.9195423901012000.963-0.0370.001445.5195512101111400.915-0.0850.007350.0195612701210900.875-0.1250.015754.5195712001310500.843-0.1570.024859.1195817401410500.843-0.1570.024863.61959883159800.786-0.2140.045668.219601260168830.709-0.2910.084972.71961408177940.637-0.3630.131777.319621050187900.634-0.3660.134081.819631520197620.611-0.3890.151086.41964483204830.388-0.6120.375190.91965794214080.327-0.6730.452495.5总计261702617021.000.0004.252均值1246变差系数0.46 1、矩法估计参数 洪峰频率曲线选配计算表频率P(%)第一次配线第二次配线第三次配线Q=1246CV=0.5CS=2CV=1.0Q=1246CV=0.6CS=2CV=1.2Q=1246CV=0.6CS=2.5CV=1.5(1)(2)(3)(4)(5)(6)(7)12.5131272.8936013373851.9424172.1526792.172704101.6720811.822431.82243201.3817191.4417941.421769500.9211460.8911090.861072750.647970.566980.56698900.445480.354360.39486950.344240.263240.32399990.212620.131620.24299 2、权函数法估计参数: 序号排序Qi(m3/s)(1)(2)(3)(4)(5)127500.00069429-3.420.032.262.733.292223900.00069429-1.980.149.578.798.065318600.00069429-0.570.5739.2419.339.520417400.00069429-0.370.6947.9919.027.536515400.00069429-0.130.8860.9214.363.386615200.00069429-0.110.8961.9813.622.992712700.000694290.001.0069.371.330.025812600.000694290.001.0069.410.770.009912100.000694290.001.0069.29-2.010.0581012000.000694290.001.0069.21-2.570.0951111400.00069429-0.020.9868.25-5.820.4961210900.00069429-0.040.9666.91-8.391.0511310500.00069429-0.060.9465.50-10.311.6231410500.00069429-0.060.9465.50-10.311.623159800.00069429-0.110.9062.37-13.322.845168830.00069429-0.200.8256.86-16.574.829177940.00069429-0.310.7350.94-18.486.707187900.00069429-0.320.7350.66-18.556.789197620.00069429-0.360.7048.68-18.917.349204830.00069429-0.880.4128.74-17.6010.779214080.00069429-1.060.3523.96-16.1210.839总和2617015.6649261087.60785-79.0174747189.90943292均值1246.19E-4689.1G6648976.8CS1.6 两种参数估计方法配线结果对比 第七节相关分析一、相关关系的概念1、相关分析:研究两个或多个随机变量之间的联系。例如:降雨与径流之间、上下游洪水之间、水位与流量之间等。水文计算中的应用:资料的插补展延、水文预报等。2、注意的问题:必须先分析变量在成因上是否有联系。 3、两变量之间关系(简单相关) 二、简单直线相关关系方法:相关图解法相关分析法1、相关分析法最小二乘法确定参数a、b。设:两变量之间的相关关系为:原理:在所有观测点与配合的直线在纵轴方向的离差平方和最小的前提下求a、b: 观测点与配合的直线在纵轴方向的离差为: 在:为极小值的条件下求a、b。 欲使上式取得极小值,可分别对a和b求一阶导数,并使其等于零,即令:得方程组 解方程组,可得:r:相关系数。 将a、b代入是回归线的斜率,一般称为y倚x的回归系数,记为:即: 2、相关分析的误差1.回归线的误差常用均方误表示。y倚x的回归线的均方误: 2.相关系数误差(1)y与x完全相关;(2)y与x零相关或非直线相关(3)y与可能存在相关关系。r>0,正相关;r<0负相关。 相关关系存在的判断:可用相关系数的机误(随机误差)来判断:3.相关分析时应注意的问题:1)必须先分析变量在成因上是否有联系,不能在两个毫不相关的变量之间硬凑出相关关系。2)同期观测资料不能太少,n≧12。3)统计判断是否存在相关关系。 例4-7:已知某水文站断面以上流域年降雨量与年径流量资料如下表,利用相关关系将缺测的资料展延。 年份年降雨量x(mm)年径流量y(mm)年份年降雨量x(mm)年径流量y(mm)193298219499221933108019501460193413201951119519358801952133019361159195399519371410195420141362193813601955121172819391010195617281369194087019571157695194111701958125772019429301959102953419431040196013067781944885196110293371945126519621310809194611651963135692919471070196412667961948136019651052383'