- 197.01 KB
- 2022-09-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
地统计学知识点第一章概论1.地统计学:以区域化变量理论为基础、以变异函数为主要工具,研究在空间分布上既有随机性和结构性,或空间相关和依赖性的自然现象的科学2.地统计学发展:1951年南非克里金和西舍尔提出克里金法20世纪60年代(1962年)法国马特隆提出地统计学概念出版《应用地统计学论》,该书中第一次阐明了地统计学原理,地统计学诞生1977年美国Parker博士将地统计学概念引入中国3.地统计学与经典统计学的区别经典统计学地统计学研究对象研究纯随机变量研究区域化变量观测次数变量可大量重复观测变量不能重复实验样本关系样本相互独立样本具有空间相关性研究目的研究样本的数字特征研究样本的数字特征和区域化变量的空间分布特征4.地统计学研究内容:P3-4空间估值(定义)、局部不确定性预测、随机模拟、多点地统计学(该方法产生于石油领域)5.地统计学适用范围6.地统计学应用领域(地质、土壤、生态、环境、气象)第二章地统计学基础1.总体抽取样本的四种方案(理解如何抽取样本):随机抽样、机械抽样、分层抽样、分组抽样2.随机变量的数字特征(各定义)P15-21a)集中性度量(平均数):算数平均值、中数、众数、数学期望b)离散性度量(离散数):极差、离差、方差、协方差、矩、变异函数c)形态度量(形态数):偏度、峰度期望:E(X)=xi∙Pi设C是常数,则有E(C)=C设X是一个随机变量,C是常数,则有E(CX)=CE(X)设X、Y为两个随机变量,则有E(X+Y)=E(X)+E(Y)设X,Y是相互独立的随机变量,则有E(XY)=E(X)E(Y)方差:DX=EX-EX2=(xi-E)2∙Pi设C是常数,则有D(C)=0设X是一个随机变量,C是常数,则有D(CX)=C2D(X)D(C+X)=D(X)设X、Y为两个随机变量,则有D(X+Y)=D(X)+D(Y)+2E{[X-E(X)][Y-E(Y)]}若X,Y是相互独立的随机变量,则有D(X+Y)=D(X)+D(Y)协方差:Cov(X, Y)=EXY-E(X)E(Y)3.相关关系:指事物之间的关系数值存在着一定的依存关系,即某一现象在其发展变化中,当数量上为一确定值时,与之有联系的其他现象可以有若干个数值与之对应,但这些值按某种规律在一定范围内进行波动。4.特点:一个变量的取值不能由另一个变量唯一确定,也不能用函数形式给予描述,但并不是无规律可行的。5.分类①所涉及变量的多少:单相关:两个变量之间的相关。复相关:三个或三个以上变量之间的相关。②按相关关系的表现形态:直线相关和曲线相关③简单相关关系下按变量变动的方向:正相关:两个变量同方向变化。负相关:两个变量反方向变化。无相关(或零相关):两个量的变化互不影响。6.判断两变量是否存在相关性方法:散点图法、假设检验法7.简单相关系数概念及计算(掌握)\nrxy=i=1n(xi-x)(yi-y)i=1n((xi-x))2×i=1n((yi-y))2记Lxy=i=1n(xi-x)(yi-y)Lxx=i=1n((xi-x))2Lyy=i=1n((yi-y))2则rxy=LxyLxxLyyr=0不相关(不存在线性相关关系)r<0极低度相关0.3≤r<0.5低度相关0.5≤r<0.8中度相关r≥0.8高度相关r=1完全正相关或完全负相关1.偏相关:当研究某一个要素对另一个要素的影响或相关程度时,暂不考虑其它要素的影响,而单独研究那两个要素之间的相互关系的密切程度时,则称为偏相关。2.偏相关系数:用来度量偏相关程度的统计量。性质:系数范围在-1和1之间;系数的绝对值越大,其偏相关程度越大;系数的绝对值小于等于由同一系列资料求得的负相关系数。3.一元线性回归模型步骤(掌握各步骤)P32-34①立一元线性回归方程:y=a+bxy是y的估计值a为回归常数b为回归系数②回归系数的估计。③对一元回归方程的评价:拟合优度的评价,回归方程显著性检验。4.回归分析种类:按自变量多少:一元回归、多元回归分析按回归方程表现形式:线性回归、非线性回归分析5.回归分析与相关分析的区别和联系:相关分析回归分析区别相关分析研究的都是随机变量,不分自变量和因变量回归分析研究的变量要定出自变量(确定的变量)与因变量(随机变量)。联系相关分析需要依靠回归分析,来表明现象数量相关的具体形式;回归分析则需要依靠相关分析,来表明现象数量变化的相关程度。6.非线性回归模型:掌握P39表2-2①数曲线y=debx可以将其转化为直线形式:y'=a+bx',a=lnd②对数曲线y=a+blnx可以将其转化为直线形式:y'=a+bx'③幂函数曲线y=dxb可以将其转化为直线形式:y'=a+bx',其中,a=lnd④双曲线1y=a+bx可转化为直线形式:y'=a+bx'⑤⑤对于S型曲线y=1a+be-x,可转化为直线形式:y'=a+bx'7.地理数据:地理数据是用一定的测度标准去衡量地理要素而取得的地理信息地理要素:构成地理环境整体的各个独立的、性质不同的组成部分8.地理数据分类:间隔尺度数据定量地理数据比例尺度数据地理数据有序数据定性地理数据二元数据名义尺度数据9.频率分析检验方法:频率分布直方图、正态QQplot分布10.离群值分析分为全局离群值(对于数据中的所有点具有很高或很低值的观测样点)、局部离群值(数据中对于其周围的点的值具有很高或很低观测值的样点)\n1.识别离群值方法(看书吧)P45-47直方图识别全局离群值半变异函数云图识别离群值Voronoi图识别离群值(V多边形计算方法)2.全局趋势分析:指从总体上分析数据集在空间某一特定方向上的变化趋势3.空间自相关分析特点:随着样点距离的增大,变异函数值会逐渐增大,点云会从低逐渐升高4.各向异性:在不同的方向上,数据的变异情况呈现出差异的性质第三章区域化变量理论1.随机场:当随机函数依赖于多个自变量时,称为随机场2.区域化变量:以空间点x的三个直角坐标xu,xv,xw为自变量的随机场,称为区域化变量区域化变量与普通随机变量的不同a)普通随机变量的取值按某种概率分布而变化b)区域化变量则根据其在一个域内的位置取不同的值。即区域化变量是普通随机变量在域内确定位置上的特定取值,它是随机变量与位置有关的随机函数。c)区域化变量有二维的、三维的。例:矿石品位、矿体厚度、大气污染浓度、气温、降水量、海拔高度、土壤重金属含量等等。3.区域化变量的性质:随机性和结构性特性:空间局限性;不同程度的空间连续性;不同类型的各向异性4.协方差函数的概念:随机过程Z(t)在时刻t1和t2处两个随机变量Z(t1),Z(t2)的二阶混合中心矩性质:先验方差不小于零;C(h)=C(-h),是一个偶函数;协方差函数的绝对值小于等于先验方差;γ(∞)=C(0);构成的变异函数矩阵必须是条件非负定矩阵。计算C*h=1N(h)[Z(xi)-Z(xi)]2(PPT33)5.变异函数的概念:变异函数是在任意方向α,相距|h|的两个区域化变量值Z(x)与Z(x+h)的增量的方差。性质:h=0时,变异函数为零;γh=γ(-h),是一个偶函数;γ(h)≥0)即研究现象的变异函数值只能大于或等于零;|h|→∞时,γ(h)→C(0),即当空间上样点间距离无限大时,变异函数值接近先验方差;[-γ(h)]必须是一个条件非负定函数。功能:变异函数通过“变程”反映变量的影响范围,“基台值”反映区域化变量在研究范围内变异的强度;不同方向上的变异函数图可反映区域化变量的各向异性;块金常数C0的大小可反映区域化变量的随机性大小;变异函数在原点处的性状可反映区域化变量不同程度的空间连续性计算γ*h=12N(h)[Z(xi)-Z(xi+h)]2(PPT39~44)6.掌握P61-65的例题7.二阶平稳的条件P66a)在整个研究区内,EZx=m(常数)存在,∀xb)在整个研究区内,区域化变量Z(x)的协方差函数存在且平稳(即只依赖于位移h,而与x无关)CovZx,Zx+h=EZx∙Zx+h-EZx∙EZx+h=EZx∙Zx+h-m2=C(h)8.二阶平稳下对变异函数公式推导的推论P66-679.判断估计量好换的标准P69a)无偏性E[Z(xi)]=EZ*xi=mb)最优性(方差最小)σE2=varZxi-Z*xi⇒0第四章变异函数结构分析1.变异函数的理论模型(PPT5~16)a)有基台值模型:纯块金效应模型球状模型指数模型\n高斯模型线性有基台值模型a)无基台值模型线性无基台值模型幂函数模型对数模型(掌握各公式,为第五章克里金计算做准备)1.孔穴效应:当变异函数γ(h)在h大于一定的距离后,并非单调递增,而在具有一定周期波动时就显示出一种“孔穴效应”。2.掌握书上79页表4-13.结构分析:构造一个变异函数模型对于全部有效结构信息作定量化的概括,以表征区域化变量的主要特征。结构分析的主要方法是套合结构4.单一方向上套合:每一个变异函数代表同一方向上一种特定尺度的变异,并可以用不同的变异函数理论模型来拟合,即单一方向的套合结构5.各向异性的种类:几何异向性、带状异向性P86①几何异向性(当区域化变量在不同方向上表现出变异程度相同而连续性不同时称为几何异向性)②带状异向性(当区域化变量在不同方向上变异性差异不能用简单几何变换得到时,就称为带状异向性)6.结构分析的步骤P91-94①域化变量选择②数据的获取与审议③数据的统计分析④变异函数的计算⑤变异函数的结构分析——各向异性⑥理论变异函数模型的最优拟合及检验⑦变异函数理论模型的专业分析第五章克里金法1.克里金法:又称为空间局部估计或空间局部插值法,克立格法是建立在变异函数理论及结构分析基础上,在有限区域内对区域化变量的取值进行线性无偏最优估计的一种方法。种类:简单克立格法;普通克立格法;泛克立格法;对数正态克立格法;指示克立格法;概率克立格;析取克立格法;协同克立格法\n1.最合理的估计方法必须满足的条件P982.克里金估值的过程:数据检查;模型拟合;模型诊断;模型比较3.简单克里金法掌握书上102页的例题4.普通克里金法掌握书上115页的例题5.泛克里金法漂移:非平稳区域化变量Z(x)的数学期望,在任一点x上的漂移就是该点上区域化变量Z(x)的数学期望涨落:是一个数学期望为0的区域化变量,可认为涨落是围绕漂移m(x)摆动的随机误差。理解126页的例题6.非线性克里格法1)对数正态克里格法2)指示克里格法指示克里格法步骤P1303)析取克里格法7.协同克里格法1)协同区域化变量理论中,满足二阶平稳假设、内蕴假设的协同区域化变化条件P145-1462)交叉协方差函数性质:当k=k’时Ckk'h=Ck(h)γkk'h=γk(h)交叉变异函数性质:交叉变异函数关于k和k'对称,即γkk'h=γk'k(h)交叉变异函数关于h和-h对称,即γkk'h=γkk'(-h)3)交叉协方差函数和交叉变异函数计算公式P148PPT(95、96)掌握书上149页例题4)协同克里格法使用条件P154a)由协同克里格法的定义和公式推导可知,协同克里格法在以下条件下使用:i.估计邻域中待估变量至少有一个样品数据。ii.待估变量与其它变量的数据不在同一支撑上。b)协同克里格法在以下条件下不使用:i.估计邻域中,待估变量若没有样品数据,无偏条件αk0nk0λαk0=1不成立。ii.可以证明,在同一支撑上只利用待估变量的数据进行估值时,和同时使用待估变量与其它变量进行估值,其精度是相同的。特别是当待估变量与其它变量的数据支撑雷同时,协同克里格方差即为普通克里格方差。此时用普通克里格估值即可,不必实施复杂的协同克里格法