• 2.17 MB
  • 101页

水文学第三章青岛理工大学课件.ppt

  • 101页
  • 关注公众号即可免费下载文档
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档由网友投稿或网络整理,如有侵权请及时联系我们处理。
'基本原理与方法第三章水文统计2021/8/251 了解其它有关水文统计的知识。掌握经验累积频率曲线绘制;PⅢ形理论频率曲线;直线相关分析;统计参数计算;重点2021/8/252 §3—1水文统计的意义及基本概念本节自学:1、水文统计为何要采用数理统计法2、自然界中的现象可分为哪三种类型,举例说明3、统计规律性、连续性随机变量、离散性随机变量、总体、样本、随机样本、样本容量、有限总体。2021/8/253 4、数理统计法对水文资料的要求是什么检查资料的可靠性检查资料的代表性检查资料的一致性检查资料的随机性检查资料的独立性简介2021/8/254 §3—2概率与频率P(A)=mn一、概念1、概率0≤P(A)≤1——随机事件在客观上出现的可能性大小的数值,也称机率。P(A)——随机事件A的出现机率;m——事件A在客观上出现的结果总数;n——一切可能出现的结果总数(总体容量)。2021/8/255 事先概率总体是有限的,其随机变量的机率可事先算出事后概率经验概率总体是无限的,其随机变量的机率无法事先算出水文统计是事后机率,因为水文特征值是无限总体2021/8/256 2、频率——在若干次重验复实验中,某事件出现的次数与实验总次数之比。W(A)=mnW(A)——随机事件A的频率。m——随机事件A的频数。n——总的实验次数。频率是随机实验时的实测值2021/8/257 3、频率与概率的关系频率是实测值概率是理论值当试验次数越多,频率与概率的值越接近2021/8/258 二、概率运算定理1、概率相加定理:p(A1+A2+……+An)=P(A1)+P(A2)+……+P(An)2、概率相乘定理:p(A1*A2*……*An)=P(A1)*P(A2)*……*P(An)2021/8/259 三、随机变量的概率分布随机变量与其概率的一一对应关系,称随机变量的概率分布。1、随机变量的概率分布2、频率及有关概念将水文观测资料由大到小排列,按等区间分成若干组,各组出现的次数与总次数之比,即为频率。(1)频率——表示每组所在区间的变量值出现的可能程度2021/8/2510 (2)频率密度(A)频率~变量;(B)频率密度~变量;——频率在区间内的平均值即:(3)直方图——(4)频率密度曲线——当△x→0时,直方图近乎曲线,此曲线即频率密度曲线。2021/8/2511 pxx频率密度曲线(A)密度函数:dxdpxDpxp=D=lim)(2021/8/2512 (B)密度曲线形状见图3.2多呈铃形(正态)分布,中间值频率较大,两头较小。由曲线形状可以知道:密度曲线呈中间大,两头小的。而大多数的水文现象具有此规律性。故密度曲线和密度函数可用来描述连续型随机变量的统计规律。2021/8/2513 四、累积频率与重现期1、累积频率——等量或超量值的累积频数与总观测次数之比。是机率相加定理的应用公式2021/8/2514 p(x≥xi)——累积频率m——累积频数n——总观测次观测年限越长,则样本容量越大,其预见性越可靠。其中:2021/8/2515 xp观测年限越长,则样本容量越大,其预见性越可靠。累积频率曲线频率分布曲线2021/8/2516 2、重现期——等于或大于某随机变量xi的值,平均多少年(或多少次)可能遇见一次,简称多少年(或多少次)一遇。重现期较累积频率更易懂、具体2021/8/2517 T=1p(p≤50%)T=11-p(p≥50%)其中:T——重现期p——累积频率对于洪水频率对于枯水频率2021/8/2518 p=95%时,表示20年一遇的枯水p=5%时,表示20年一遇的洪水例而重现期是指长期内平均若干年可能出现一次,而不是固定周期。注意频率是指多年平均出现的机会2021/8/2519 同等级建筑物的设计频率值相同,但因实际的水文现象不尽相同,故设计值也存在着差异。设计频率标准由工程的重要性及建筑物的等级确定;五、设计频率标准(简介)2021/8/2520 1、频率设计标准——是根据工程的重要性及建筑物的等级来制定的允许破坏率和安全率——建筑物正常运转遭到破坏的可能性——在年内都能保证安全的机率破坏率保证率它与安全率是两个不同的概念2021/8/2521 2、保证率的计算PM=(1-p)n在n年内都能保证安全的机率n——保证安全的年数P——破坏率n越小,保证率越大,即要求保证的年数越小,可以达到的保证率越大。2021/8/2522 §3—3经验累积频率曲线一、经验累积频率曲线——将某水文变量按由大到小的顺序排列,计算大于等于某变量的累积频数,并计算其累积频率。以累积频率作为横坐标,相应的变量作为纵坐标,并将其对应值点绘在坐标中,且目估一条光滑的曲线,此曲线即经验累积频率曲线。经验累积频率曲线2021/8/2523 二、经验累积频率公式1、古典公式:其中:m——随机变量序号n——随机变量总数适用于系列比较长,即n很大时,否则p不合理,故水文计算中一般不采用此种公式。2021/8/2524 注意:m是按由大到小排列的变量序号。如:m=10,n=10,则p=100%,显然与事实相背,因为样本中的,最小值不一定是总体中的最小值,故此式不尽合理。2021/8/2525 2、数学期望公式(维泊尔公式):3、中值公式(切哥达也夫):符号的意义同上。常用此公式2021/8/2526 4、海森公式:以上几个公式各有特点,从形式上难以确定哪个更符合实际,因为不管哪个公式都存在一定的抽样误差,且愈靠近两端,误差愈大,故只有增大样本容量,才能使计算结果更接近实际。实践证明,维泊尔公式的结果偏于安全,且公式形式简单,工程水文中常用此式。2021/8/2527 2021/8/2528 三、经验累积频率曲线的绘制和应用选定经验累积频率公式据公式计算系列中变量的经验频率以频率为横坐标,随机变量为纵坐标,将各计算值点绘在坐标纸上将各点用一条光滑的曲线相连,即为经验累积频率曲线。步骤2021/8/2529 四、经验累积频率曲线的外延由于在实际工程中,往往需要将实测的频率曲线向两端延长,以满足于设计频率标准。但若在普通坐标纸上点绘曲线,由于曲线两端曲率变化较大,如果只凭目测使其延长,则误差太大,故可采用以下的方法:2021/8/2530 1、应用机率格纸绘制经验累积频率曲线一般采用海森机率格纸(1)可以使密度曲线为正态分布的分布曲线,在海森机率格纸上呈现一条直线;(2)由于实测水文资料系列,其密度曲线很少呈现严格的正态分布,故此分布曲线也并非一条完全的直线,外延仍有一定的误差。特点2021/8/2531 2、利用数学方程式(即理论累积频率曲线)对水文资料的频率密度曲线选配一条合适的数学模型,利用数学的方法推求累积频率曲线方程式安全与经济是一对矛盾体,解决问题的办法就是由国家统筹考虑给出的设计频率。2021/8/2532 §3-4随机变量的统计参数统计参数某些随机事件虽然有共同的统计规律,但不同的系列中,其取值也不同,故描述频率分布的密度曲线和分布曲线也具有不同的形状。为了选配合适的密度曲线数学模型,就必须选好合适的统计参数。——在数理统计法中,为描述不同系列的频率分布和曲线形状,所采用的能反映其特征的几个具体数据。2021/8/2533 水文统计常用的几个统计参数:1、均值x与系列中所有变量有关,反映系列变量平均水平的参数,是系列量的代表。2、计算:一、均值加权平均法算数平均法2021/8/2534 如:有一实测系列:x1,x2,x3,……,xn,相应的频数是:f1,f2,f3,……,fn。则有:(1)加权平均法2021/8/2535 (2)算数平均法:当各变量占有同等比重(即出现的次数相同)时。可写为:均值的大小能反映系列分布中心和密度曲线的位置2021/8/2536 二、均方差、变差系数(离散系数)1、均值的数学特性:2、均方差s描述系列各变量的离散程度。可用以比较系列的均值相同时,其离散程度的大小。2021/8/2537 (1)公式:水文资料应是样本,故一般应用此式。总体样本n——总数2021/8/2538 如:有两系列甲:10,50,90s=40=50乙:49,50,51=50s=1(2)注:只用均值无法表示系列的离散程度,由s可以知道甲系列比乙系列的离散程度大。故若比较系列的离散程度应考虑均值和均方差2021/8/2539 当均值都相同时,均方差越大,则离散程度越大。当均方差相同时,均值越大,则离散程度越小。此时可用以下的变差系数判别2021/8/2540 表示系列的相对离散程度3、变差系数Cv均方差与均值的比可用来比较均值不同,均方差相同的两个系列的离散程度。2021/8/2541 (1)公式总体样本若引入模比系数则公式为:3—16式2021/8/2542 (2)例:乙系列:995,1000,1005甲系列:5,10,15=10,s甲=5,Cv甲=0.5x甲=1000,s乙=5,Cv乙=0.005X乙注:当甲、乙系列的s相同,但可比较Cv,Cv小则离散程度小。不相同时,即:当均方差相同时,均值越小,离散程度越大2021/8/2543 (3)影响Cv的因素1>流域形状狭长形流域的Cv>枝状形流域的Cv大流域的<小流域的径流均匀、波动小的<波动激烈的2021/8/2544 2>河网的布置下游<上游同一流域,各支流洪水汇合后的干流段Cv<汇合前;3>实测系列时段的长短同一水文现象,时段长的Cv<时段短的Cv2021/8/2545 三、偏态系数(偏差系数)1、偏态系数Cs衡量一个系列在均值两侧对称程度的参数。(1)公式:总体样本2021/8/2546 (2)Cs对曲线的影响Cs>0Cs=0Cs<0正偏态分布正态分布负偏态分布2021/8/2547 §3—5理论累积频率曲线理论累积频率曲线——用数学方程式建立起的频率曲线方程理论累积频率曲线并非是由理论导出的公式,只是这种数学方程式的特点与水文统计规律能较好的符合,故此式只是可用以分析水文样本系列的数学工具,不能说明水文现象的本质。用数学公式可以达到延长经验频率曲线的目的。而频率曲线的形状与三个参数有关,故要选配合适的理论曲线,就须先设定好三个参数。2021/8/2548 一、皮尔逊Ⅲ型曲线1、方程:若将坐标原点定在众值处,可写成:)1(0dxdaeaxyy-+=)()()(100-G=---axeaxybaaab3—26式3—25式2021/8/2549 其中:Γ(α)——函数;a0——曲线左端起点到系列零点的距离;α、β——曲线的参数。d——均值到众值的距离(偏差半径);y0——众值处的纵坐标;a——曲线左端起点到众值的距离;e——自然对数的底。众值——系列中出现次数最多的变量。2021/8/2550 2、曲线方程中各参数的计算见式3—273、皮尔逊Ⅲ型曲线的应用皮尔逊Ⅲ型曲线积分,可以得到理论累积频率曲线的随机变量值公式。2021/8/2551 φp—离均系数(查附录3)kp—模比系数(查附录4)是p、cs的函数(1)公式:其中:(2)举例:设某水文站平均Q=1000m3/s,cv=0.5,cS=1.5,求此理论频率曲线及设计洪峰流量Q1%。2021/8/2552 1>皮尔逊Ⅲ型曲线只是一种数学模型,具体应用时应联系具体的水文现象作分析;(2)问题:2>为了寻求一条与经验频率符合的较好的理论频率曲线的参数,需多次调整参数:x、cv为此,可采用试算的方法。2021/8/2553 4、统计参数对皮—Ⅲ型曲线的影响皮—Ⅲ型曲线是密度曲线Cv次之,最小。X用三个统计参数建立起的数学模型去推论总体的情况,Cs带来的误差最大,2021/8/2554 (1)均值反映位置变化x1x2yx当Cv、Cs不变时,曲线形状基本不变,X但曲线位置随变化沿X轴移动。<2021/8/2555 (2)Cv反映密度曲线的高矮情况:yxCv1Cv20,曲线峰偏左,Cs越大,峰越向左偏。因为年最大流量系列Cs无负值,故曲线总是峰偏左(正偏态)。>2021/8/2557 5、统计参数对理论累积频率曲线形状的影响的影响:(1)cv、cS一定时,曲线形状不变,分布曲线水平的高低随而变。xp<的增减即上、下位置影响曲线的2021/8/2558 (2)cv的影响:、cS一定时,cv增大,则曲线左端上升,右端下降;cv=0时,曲线变为一条水平线。xPcv1cv3cv2cv1cv2cv3=0>>2021/8/2559 (3)cS的影响:cv、一定,且cS>0时,cS愈大,则曲线左上端愈陡,中段下落,右端变缓。当cS>2~3时,曲线下端水平。xPcS1cS2cS3cS1cS2cS3=0>>2021/8/2560 二、克里茨基—闵凯里曲线——是水文学中常用的理论频率密度曲线之一(3)具有一个众值0均方误——误差的平均值或平均误差2>机误——凡是使误差落在与不落在它们均方误两侧(即大于和小于误差均值)各一个定值范围内的机率相等(50%),则这一定值称机误。3>最大误差——误差理论一般认为,左右一个均方误为一般误差范围;三个均方误或四个机误为误差的极限范围,即最大误差。2021/8/2566 由误差理论可知,当误差界限取均值两旁各一个均方差或机误时,有:由此可知,均方差或机误是给实际样本以一种估计其准确性的界限,并称之为置信区间。置信区间越小,则误差越小,因而样本的代表性也越好。2021/8/2567 (1)抽样误差的作用:1>为保证设计安全,可作为一种安全系数加以考虑2>可用来评价所统计的水文资料是否超出给定的精度3>选配理论累积频率曲线时,可作为修正统计参数的参考值。2、计算2021/8/2568 (2)计算:见p62水文计算中常以皮—Ⅲ型曲线或正态分布曲线为机率密度函数的假想数学模型2021/8/2569 §3—7水文频率分析频率分析——即确定合适的统计参数在水文计算中,统计参数的正确与否会直接影响最终的设计值,故应使统计参数尽可能的与实测资料相符。(1)试错适线法(2)矩法常用的频率分析法有经验适线法p682021/8/2570 一、方法公式:1、矩法——由实测系列算出三个统计参数,而后计算cvcS设计值xp。此法要求系列长,即样本容量要大,否则cS误差大,会造成计算结果不可靠,故一般极少直接应用。2021/8/2571 2、适线法——矩法与经验累积频率点据相结合,以选配合适的理论频率曲线的方法。试错适线法三点适线法有略2021/8/2572 先假定一个cS值,与实测系列的及cv相结合,求得一条理论曲线,经过多次调整cS值,使其与实测曲线基本吻合,最后再计算xp。试错适线法2021/8/2573 (1)将实测点据点绘在机率格纸上(x~p)的关系;经验累积频率曲线(2)由实测系列计算有关的参数:、cv,ki(ki–1)2据此查出φp,算出kp=φpcv+1。试选几种cS[(2~4)cv],步骤2021/8/2574 (4)据选定的曲线查算xp。(3)将不同cS对应的理论曲线同时点绘在经验累积频率曲线的机率格纸上,找出一条最合适的理论曲线。例3—102021/8/2575 §3—8相关分析自然界中许多现象不是孤立的,而是相互之间有一定的联系,人们在长期的实践中发现,两个变量之间的关系可以归纳为两大类。函数关系相关关系即:2021/8/2576 ——变量之间有确定的一一对应值,这种关系称作函数关系。(1)函数关系(2)相关关系——对于变量的每一个确定的值,对应的值没有确切的值,但经大量的观察后可发现它们之间存在某种关系,这种关系称为相关关系。2021/8/2577 一、相关分析的意义1、相关分析——对变量之间数量关系的分析,称为相关分析。2、意义——当某一水文现象资料较短,而与之有关的另一水文现象资料较长时,可用相关分析法来延长较短的系列或插补缺测的资料。2021/8/2578 1、按相关变量的多少可分为:二、相关分析分类简单相关复相关研究两个以上变量的关系研究两个变量之间的关系2021/8/2579 2、按相关的密切程度可分为:——变量之际的关系非常密切,相互成严格的函数关系。——变量各自独立,互不影响,彼此之间没有关系。——介于以上两者之间,变量之间不是相互独立的,但彼此间的关系也不是非常的密切。完全相关零相关统计相关水文计算多属于统计相关计算2021/8/2580 xyxy直线相关曲线相关统计相关2021/8/2581 xyxyxy完全相关xy零相关2021/8/2582 1、相关图解法适用条件:计算精度要求不太高;特点:简单、方便。三、简单直线(线性)相关方法多点平均定线法目估法两点平均定线法2021/8/2583 (1)目估法——在点据中心且过均值绘一条直线,两侧点据的正负离差大致相等。B、此法在相关较密切,点据变化规律较明显时,效果较好。A、利用解析几何法确定直线方程。2021/8/2584 (2)*两点平均定线法:步骤:(1)将资料xi由大到小排列(yi与之对应);(2)按项目n分成上、下两部分(偶数时上、下部分相等;奇数时,可一部分多一项);(3)计算上、下两部分的平均值(xa,ya),和(xb,yb);2021/8/2585 方程式:(5)通过a、b两点连成一直线,即y依x变回归直线。(4)将实测点据与平均值点据点在同一坐标纸上;2021/8/2586 (3)*多点平均定线法当实测点据较散乱时可用此法。步骤:(1)将资料xi由大到小排列(yi与之对应);(2)取相邻两点的平均值,再取平均值的平均值……,分别得到四点、八点……平均值。(3)将实测点据与平均值点据点在同一坐标纸上;(4)通过平均值点据作一条直线(或曲线),再按解析几何法求直线方程。2021/8/2587 2、相关分析法(2)回归线——将两系列的随机变量对应值点绘在坐标纸上,若点据的分布趋势呈直线,则证明两系列的变量之间存在直线相关,可通过点据配合一条最佳的直线,此直线称变量之间的回归线。——即两个变量之间的关系可近似的配成一条直线(1)简单直线相关2021/8/2588 (3)回归方程——描述回归线的方程式称变量之间的回归方程y依x变回归方程式baxy+=)(xxssyyxy-=-g3—48式x依y变回归方程式b’ya’x+=)(yyssxxyx-=-g2021/8/2589 xyxyx0y0x0y0y0△y∑△yi2=最小x0△x∑△xi2=最小y依x变回归方程式x依y变回归方程式2021/8/2590 3、、相关系数γ和回归系数其中:<10<(1)γ=0γ(2)=1γ(3)统计相关完全相关零相关(1)相关系数γ:计算式:3—46式2021/8/2591 (2)回归系数见p75——回归系数=0,零相关>0,正相关<0,负相关y依x变回归2021/8/2592 在统计相关的计算中,因两变量之间不是函数关系,回归线也只是实测点据的最佳配合线,故相关分析也存在误差。4、相关分析的误差2021/8/2593 (1)回归直线误差(y依x变回归)一般可按均方误差或机误计算1>均方误差)(2-=ånyysiy总体——2)(2--=ånyysiy样本——3—49式(n-2)相当于自由度,当只有两个测点时,直线必过此二点,无误差;若有三个点,会出现点线之间的离差,此是因多一个点据所造成的;若有n个点据,则认为将有(n-2)个点引起误差。2021/8/2594 2>机误Ey=0.6745sy3>回归直线误差的几何意义最大误差范围可认为是3sy或4Ey。1>散点图中的实有点据68.3%落在(y±Sy)范围内;2>散点图中的实有点据99.7%落在(y±3Sy)范围内;3>散点图中的实有点据50%落在(y±Ey)范围内;4>散点图中的实有点据99.3%落在(y±4Ey)范围内。2021/8/2595 yxyxSy-Sy3Sy-3SyEy-Ey4Ey-4Ey2021/8/2596 (2)相关系数误差计算式:1>标准误差:2>机误:Eγ=0.6745sγ3—51式3—52式最大误差4Eγ。γ±4Eγ=99.3%即总体相关系数的机率为:2021/8/2597 5、相关分析时应注意的问题(1)观测项数nn应有一定的长度,以减小误差,一般的应不少于10~15项。(2)判别相关的可靠性总体不相关的两个变量,由于抽样的原因,γ不一定为零。2021/8/2598 一般的,当γ>0.8,且回归线误差Sy不大于均值时,即可认为变量是相关的,分析成果可用。的10%~15%y(1)可用sy或Ey来判别t检验法——样本相关系数分布变成另一变量t的分布。(2)*采用统计检验法来判别。2021/8/2599 f(γ)γA区B区γα-γα如图:若计算的γ值位于A、B区(A、B面积共占k%),即:可以判定总体是相关的,γ≥γα时,但犯错误的可能性是k%,这是因为既使总体不相关,样本相关系数γ也有k%的可能性出现在A,B区,此时却推断总体相关。2021/8/25100 有n=12年的观测资料,得γ=0.88,若取信度α=0.05,则查有关表格可知:γα=0.58。γ≥γα,判定总体相关,但失误的可能性是5%。举例:在水文统计中常选α=0.05。αγαn-20.100.050.020.010.98769…………………………………………0.58…………1210……2021/8/25101'