预测模型的建立及应用

2024-05-17 17:31

1. 预测模型的建立及应用

本节课讲解空间预测模型理论及实践应用技巧解析

预测模型的建立及应用

2. 预测模型的介绍

常见的预测模型有一元线性回归模型,计算公式为Y=a+b*x.一元非线性回归模型:Y=a+bl*x1+b2*x2+…+bm*xm。

3. 预测模型的简介

学科:矿产资源经济与管理词目:预测模型英文:prediction model

预测模型的简介

4. 临床预测模型的分类及实际应用

临床预测模型 (又称临床预测规则、预测模型或者风险评分):指利用多因素模型估算患有某病的概率或者将来某结局发生的概率。包括 诊断模型 (Diagnostic models)和 预后模型 (Prognostic Models)。
  
  1、两模型不同之处: 
  
 (1)诊断模型:是基于研究对象的临床症状和特征,诊断当前患有某种疾病的概率,多见于 横断面研究 ;自变量(X)为诊断检测,因变量(Y)为是否患病。
  
 (2)预后模型:是在当下的疾病状态下,未来某段时间内疾病复发、死亡、伤残以及出现并发症等结局的概率,多见于 队列研究 。自变量(X)为预后因子,因变量(Y)为是复发、死亡、伤残等。
  
  2、两模型相似之处: 
  
 (1) 结局多为二分类 ,虽然少数情况下也有血压、血脂、血糖、疼痛评分以及生存质量评分等连续指标作为结局;
  
 (2) 研究的效应指标均为结局出现的绝对风险 ,即发生的概率,而非相对危险度(RR)、比值比(OR)或者风险比(HR)等相对风险效应指标;
  
  (3)模型的技术层面相同,都有预测因子的选择、建模的策略、模型性能的评价等环节。
  
 
  
  
 
  
 借助临床预测模型,医生和病人可以更好的做出共同决策,临床研究者可以更精准的筛选合适的研究对象,政府部门与卫生管理者也可以更好的进行医疗质量的管理,合理的配置医疗资源。
  
  临床预测模型的作用也体现在疾病的三级预防体系中 :
  
 (1)疾病的一级预防。临床预测模型可以给病人和医生提供基于当前的健康状态,未来患有某病的量化风险值(概率),为健康教育和行为干预提供更直观、有力的科学工具。例如,基于福明翰心脏研究的福明翰心血管病危险评分就明确了降低血脂、血压可以预防心肌梗死。(2)疾病的二级预防。临床预测模型,尤其是诊断模型,常可借助无创的、低成本、易采集的指标,给出高灵敏度和特异度的诊断方案,践行“早发性,早诊断,早治疗”的疾病预防理念,具有重要的卫生经济学意义。
  
 (3)疾病的三级预防。预后模型可对疾病的复发、死亡,伤残以及出现并发症的概率给出量化的估算,从而指导对症治疗和康复方案的制定,防止伤残和促进功能恢复,提高生存质量,延长寿命,降低病死率。
  
 本文多讨论的临床预测模型与“预测研究策略”研究组(PROGRESS)曾提出过“预测研究”(Prognosis Research)的基本框架既有部分交叉重叠,也有部分区别。
  
 “ 预测研究策略”研究组提出的“预测研究“框架包括四个方面: 
  
 (1)基本预后研究,即自然状态以及当前医疗质量下疾病的进程;(传统流行病学中疾病的基本描述与危险因素研究)
  
 (2)预后因素研究,即与预后相关的特定因素;(传统流行病学中疾病的基本描述与危险因素研究)
  
 (3)预后模型研究,即建立、验证预测个体未来结局风险的统计模型,并评估其影响;(即预后模型)
  
 (4)分层医学研究,即利用预后信息调整个体或是具有相同特征人群的治疗决策。(与精准医学相对应)

5. 预测模型的建立与求解

( 1) 变量选取与基础数据的获取
依据数量化理论选取相对瓦斯涌出量作为因变量 ( 理论 Y 值) 。首先,对历年发生的煤与瓦斯突出资料进行统计。计算出各次突出过程中,突出煤的影响范围和突出瓦斯的影响范围。经分析,大多数情况下,突出煤的范围和突出瓦斯的范围相比较,突出煤的范围远远小于突出瓦斯的范围。若在同一张曲线图里对比二者,其各自特征不易寻求,考虑到突出煤的影响范围较小,故不予作图分析。绘制瓦斯突出范围的曲线图,但由曲线图并不能看出煤与瓦斯突出的相对趋势,只可看出图中大多数的点落在突出量为 100t 的范围以内。如果对各点影响距离进行平均计算,平均大约为 80m,故取 80m 为危险影响范围的半径。因此,在已开采区瓦斯地质图上以突出点为圆心,80m 为半径画圆。
在通过上述方法画出的图中,寻求钻孔和突出点的远近关系。根据钻孔和突出点的远近确定钻孔区域危险值 ( 即实测值 Y) 。根据现场实际情况与专家意见在影响范围圈内的钻孔的危险值定为 45,离突出点非常近的钻孔其危险值定为 80,远离突出点的钻孔其危险值定为 4 ~5。
自变量的选取首先应考虑所选变量是否与煤与瓦斯涌出量密切相关,是否充分反映瓦斯涌出量的变化规律,其次还应考虑预警区能否取得相应的观测数据。从相关变量与瓦斯涌出的关系考虑,煤与瓦斯突出的预警指标选择了基岩厚度、煤层厚度、泥岩厚度、顶板含砂率和煤层变异系数等比较容易取得的数值,并将各数值进行归一化处理,同时考虑到变异系数的精确度不如前面几项,故将其转换为定性变量参加计算。
所用公式如下:

煤矿安全地理信息系统设计与开发

式中: δ 为标准差; 为矿井的平均煤层厚度,m; n 为勘探区见煤点数;xi为勘探区见煤点实测厚度,m。
通过公式计算出结果后,以结果中间值 0. 2 为界,将该变量划分为两个类目,取得的定量数据属于哪个类目,便将其记为 “1”,另一个类目则记为 “0”。这样,表示煤层变异系数的变量就转化为定性变量。
影响煤与瓦斯突出的巷道类型、开采方式等只能作为定性变量考虑,鉴于这些指标的主观性较强,本研究不进行考虑。至此,本研究所取变量已经满足了验证应用数量化理论解决问题的条件。
通过以上方法,可得各统计单元因变量和自变量的取值结果见表 8. 2。
( 2) 预测方程的建立
根据表 8. 2 中的基础数据,采用数量化理论计算预测瓦斯涌出量的数学模型。首先计算了包括全部 6 个自变量的预测方程。结果表明,煤层变异系数小于 0. 2 和预测方程的关系不密切。因此,将此变量删去,不作为预测方程的自变量考虑。对其余的 5 个变量重新进行计算,最后得到如下形式的预测方程:
表 8. 2 已知统计单元基础数据


续表



煤矿安全地理信息系统设计与开发

式中: 为相对瓦斯涌出量预警值,m3/t;X1为基岩厚度,定量变量;X2为煤层厚度,定量变量;X3为泥层厚度,定量变量;X4为含砂率,定量变量;δ(1,2)为煤层变异系
数,>0.2的类目的反应。
(3)基于数量化理论的预测结果采用前述各自变量的取值方法,对各个统计单元逐一取值。然后,将各统计单元的各自变量数据(4个定量数据和1个定性数据)代入预测方程(8.2),便可计算出各个预测统计单元的相对瓦斯涌出量预测值。预测结果见表8.3。
表 8. 3 基于数量化理论 (Ⅰ) 预测结果


续表


( 4) 煤与瓦斯突出危险性级别确定
根据计算结果,得出基于数量化理论的单元的 IND 值,并根据生产中煤与瓦斯突出危险性的实际情况,参考专家意见,划分警限与警度区间见表 8. 4。
表 8. 4 基于数量化理论的煤与瓦斯突出危险性分级标准


( 5) 试验数据与结果分析
本研究选用 5 个预警指标: 基岩厚度、煤层厚度、泥岩厚度、顶板含砂率和煤层变异系数,既有定量变量,也有按照定性变量来处理的定量变量。从验证模型建立方法和步骤方面考虑,已经满足条件,若再增加指标模型建立的方法和步骤不会改变,只是计算过程变复杂而已。v运用本研究结果与试验矿井 2005 ~2008 年生产过程中的数据记录进行了对比,对比结果显示,本研究所得结果与实际生产时遇到的情况基本一致,表明应用数量化理论分析研究煤与瓦斯突出危险性是可行的。

预测模型的建立与求解

6. 预测模型还是解释模型。两者区别及联系

 欢迎访问我的个人网站: data-scientist    统计模型是一个在开发和测试理论中强有力的工具,包括因果解释,预测和描述。在很多原则中都是用统计模型,并且认为统计模型有很高的解释性和预测能力。解释性和预测性的冲突是普遍存在的,因此我们必须了解和处理它们之间的关系。
   1.introduction
   1.1解释性模型
   Causal theoretical model. 统计模型用于测试因果假设,通常是测量变量X对Y的潜在影响。
   解释模型的作用通常是通过因果假设来进行理论创建。
   1.2 预测性模型
   预测同学通常是通过统计模型和数据挖掘来进行预测新的数据或未来。通过新的观测X来预测新的结果Y。预测包括时序预测,点预测,区间预测,分布预测活拍下预测,通常使用贝叶斯,频繁项,数据挖掘算法和统计模型。
   1.3 描述性模型
   描述性模型通常是用一种更简洁的方式来总结和表示数据的结构。
   1.4 预测模型的科学价值
   通常统计学家认为预测模型不具有科学性,所以被统计学家所抛弃。即使在统计学派中也被分为两类,预测性作为主要目的被认为是unacademic。
   当然预测模型也是必要的科学尝试。预测模型的主要功能
   (1)大规模的丰富的数据集通常很复杂,并且模式难以进行假设,使用预测模型可以解释一些潜在的新的机制。
   (2)预测模型可以被用于发现新的测量和评价的体系
   (3)对于复杂模式和关系的挖掘,预测模型通常可以得到更好的结果。
   (4)科学发展需要严格的相关研究,预测模型是一种介于理论和实验的产物.虽然解释模型可以解释变量之间的因果关系,但是预测能力可能不如预测模型
   (5)预测能力评估提供一种straightforward的方式来比较解释模型的预测能力
   (6)预测模型来量化预测能力,创建benchmark上十分重要。因为预测模型可以有相比于解释模型更高的预测能力。一个较低的预测模型通常意味着我们需要进行新的数据收集,测量方式,或新的经验注意的方式。当解释模型的结果接近预测模型时表示我们对现象的理解已经很全面了。另一方面,当解释性模型的结果距离预测模型的benchmark较低时,说明我们还需要接下来的探索和理解。
   1.5预测和解释模型的不同
   预测模型和解释模型的冲突在于它们的科学性的根基。
   预测模型和解释模型的不同在于数据不能精确的来表示和结果之间的关系。
   在解释模型中,X,y时估计函数f的工具,同时,x,y也用于测试因果假设。
   但是在预测模型中,函数f时工具,用于产生产生对y的预测。事实上,即使潜在的因果关系是y=f(x),但是y=f1(x)可能在x1而不是x上取得更好的结果,因为估计可能是有偏的估计,有偏估计可能会有更好的结果。
    因果关联 :在解释性模型中f代表着潜在的因果关系的函数,X被认为可以造成y。而预测模型中,函数f是找到X,Y 之间的关系。
    理论-数据 : 在解释模型中,f是完全建立在支持解释预先估计的在X,Y 之间的因果关系。而在预测模型中,直接的解释X,Y 之间的因果关系是不需要的,虽然有时候一些透明的f是期望的。
   Retrospective-prospective: 预测模式是forward-looking,f时用于预测新的数据。相反的是在解释模型中,更多的是回溯,f用于检测现有的数据和假说。
   Bias-variance: 方差和偏差,
   [图片上传失败...(image-8f86e5-1553739784176)]
   在解释性模型中,我们的目标是最小化bias来获得最精确的表达。相反,预测模型寻找最小化的bias和estimation variance的组合误差,有时会牺牲一些理论的准确度来提高经验的准确度,
   1.6 void in the statistics literature
   使用预测模型和解释模型的争论一直存在,但是并没有被翻译成统计语言。在模型选择中一直存在着争议,
   There may be no significant difference between the point of view of inferring the true  structure and that of making a prediction if an infinitely large quantity of data is available or if the data are noiseless. However, in modeling based on a finite quantity of  real data, there is a significant gap between these two points of view, because an optimal model for prediction purposes may be different from one obtained by estimating the ‘true model.’
   2.1 研究设计和数据收集
   (1)
   对于解释和预测,数据的收集也不太一样,考虑样本的大小。
   在解释模型中,目标是估计theory-based f 并且来使用它去推断,统计的能力是主要的考虑。减少bias需要足够的数据来进行模型测试。到达一定数量的数据后,超过的部分对于精度的提高可以忽略不计,而对于预测模型,f通常是数据决定的,通常更多的数据会带来更好的结果。
   (2)对于抽样的方式:
   在hierarchical data中,对于预测模型,group size的增加比group number 更有效,而解释模型则相反。
   (3)实验设计的考量:
   解释模型需要更多的可解释数据,但是这受限于实验环境和可获得的资源,同时解释需要需要非常干净的数据,
   预测模型需要更多的其他的数据,数据维度越多越好。
   (4)数据收集的设施:
   解释性模型需要构建一个比较好的理论来支持,比如item的心理上含义。预测模型更多的是要保证预测数据的质量和数据的含义清楚。
   (5)实验设计的方式:
   Factorial designs 关注与因果解释,找到结果的含义
   Response surface methodology design, 使用优化技术和非线性变换来提高解释性
   2.2 数据准备
   (1)缺失值的处理
   如果你有很少一部分的缺失数据,对于解释模型,可以直接扔掉。而对于预测模型,则不需要扔掉这些数据。
   在回归模型,对缺失变量进行dummy处理可以增加预测模型的表现,但是对于解释模型却不符合要求。
   确实值的意义是否对预测有影响或者对于预测的含义不明确,所以用确实值来做解释模型通常不太合理。
   (2)数据切分data partitioning
   通常避免过拟合的方式是在保留测试集上进行评估模型,防止过拟合,通过交叉验证,或其他采样的方式,boost 来使得预测模型在小数据集上进行。
   数据切分的目的是为了最小化方差和偏差之和。对于预测模型来说更小的样本通常会导致更大的bias,因此通过data partitioning 可以有效的提高模型的表现,但是对于解释模型的帮助很小。对于预测模型,数据切分是一个关键的步骤。
   对于解释模型,做data partitioning 通常用于评估模型的鲁棒性和预测能力。
   2.3 EDA
   在解释模型中,EDA指向特定的因果关系,然而在预测模型中,EDA更多的是free-form,为了支撑模型来找个更多未知的关系,可能并没有正式的公式。
   eda可以是毫无目的的探索,或者来验证已有的假设,评估潜在的模型,共线性和变量的转换。
   降维,在预测模型中可以减少采样方差。PCA或其他降维方式解释性会比较差,但是可以作为压缩变量变量放入模型中,
   2.4 变量选择。
   在解释模型中,变量选择根据变量之间的因果结果和变量自身的操作。更加关注因果关系
   预测模型主要关系x,y之间的关联关系而不是因果关系。主要关注响应,数据质量,数据的可获得性。对于时间序列的建模,X必须是在y之前能获得的。
   2.5 选择方式(choice of methods)
   causation–association, theory–data, retrospective–prospective and bias–variance
   四种不同的方式将会导致不同的结果。解释性模型可以很容易的连接到潜在的理论。
   对于预测模型,顶部的优先级模型可以产生更加准确的结果,但是模型f可能更加未知。虽然模型的透明性很多情况下未知,但是有很多情况下都是先提高准确度,然后再试图理解模型。
   Bias-variance方面对于提高预测模型比较有效,比如ridge regression和lasso, 通过对稀疏惩罚的方式来引入bias但是降低variance.另外还有ensembke模型和bagging, boosting。
   2.6 model evaluation and selection
   从一系列的模型中选择最优的模型,评估模型的表现在解释模型和预测模型中采用不同的方式。
   Validation:
   在解释模型中,验证包含两个部分,模型验证f是否能够表示F和模型是能能很好的fit现有数据。
   而对于预测模型,主要关注的是泛化能力,即模型在保留测试集上的表现。
   对于解释模型,验证主要考率模型的系数是否over/under-specification,goodness of fit tests, 还有一些模型的诊断包括残差分析 residual analysis.
   对于预测模型,最大的挑战是防止过拟合,通过对比测试集和训练集的表现,来检查是否出现过拟合。
   对于大规模的数据验证,对于解释模型和预测模型不太相同。比如说检查共线性对于解释模型非常相关,多重共线性可以导致标准差的增大,因此很多已有的文献来剔除共线性。相反对于预测模型来说,多重共线性不是罪恶的。
   去重共线性对于系数的解释能力很关键,和考率一个变量对另一个变量影响是十分关键。另外还可以评估变量变化对于结果的影响。监测波动要去除共线性。
   model evaluation
   考虑两方面的能力,解释能力和预测能力。
   解释模型考虑变量对于结果的关系,研究者常用R2值和统计意义的F统计来表明对结果的影响。
   相反预测模型聚焦于预测准确度和预测能力,考虑f在新数据上的表现。不同的任务需要考虑的评价指标不一样,例如ranking模型或者分类模型不一样。
   model selection
   在解释模型中,比较模型之前的解释能力。使用stepwise的方法来增加删除变量,变量的增删通过统计模型来清楚的表达。主要通过AIC,BIC来进行筛选。
   AIC和BIC 提供估计不同的事情。 If the question of which estimator is better is  to make sense, we must decide whether the average likelihood of a family [=BIC] or  its predictive accuracy [=AIC] is what we want to estimate.
   2.7 Model use and reporting
   解释模型倾向于验证现有的因果推断理论,查看统计结果是否合理。
   对于预测模型,f通常用于对新数据预测。在实际的应用中,目标通常专注让预测模型来支持科学研究,通过构建新的理论来产生新的假说,解释性模型的文章据记载模型理论构建和未被观测的参数和统计推断,预测部分聚焦于预测能力和比较不同的模型结果。
   总结:
   (1)在模型研究中,需要制定一个优化的目标
   (2)即使目标是预测模型或者是解释模型,两方面的模型都要做来验证互相的结果。
   对于预测模型,或许解释不是必须的,但是能够解释目的和重要性十分重要。
   Reference:
   [1] Shmueli G. To explain or to predict?[J]. Statistical science, 2010, 25(3): 289-310.

7. 预测模型建立及应用

6.5.2.1 数据组织
利用已经建立的西南三江中段空间数据库作为研究区成矿预测的数据基础。该数据库包括重力数据库、航磁数据库、遥感构造解译数据库、化探数据库、地质图空间数据库、矿产地数据库、地理底图数据库。
对上述各个数据库的建立都转换为1:50万的比例尺存储在MAPGIS地图库中,并通过投影变换统一使用高斯坐标系。
6.5.2.2 证据层选择
根据对西南三江中段地区各控矿因素的分析认为:本区的Au,Ag,Cu,Pb,Zn矿的主要控矿因素取决于以下几个方面:①有利地层岩性组合发育;②中基-中酸性岩浆岩脉群发育;③线性构造带发育;④有利地球化学异常;⑤有利地球物理异常。
根据该区主要控矿因素分析,提取了三叠纪地层证据层(有矿点分布和断层切过)、中基-中酸性岩浆岩证据层、北西向控矿构造证据层、Au元素异常证据层、Ag元素异常、Cu元素异常证据层、Pb元素异常证据层、Zn元素异常证据层、K2O异常证据层、Na2O异常证据层、Th元素异常证据层、重力异常证据层、航磁异常证据层、成矿势能证据层、断裂密度证据层、汇水盆地证据层等17种异常作为成矿有利信息(图6-12~图6-31)。分别从数据库中提取相应的证据层。用设置缓冲区的方法,将线状控矿标志转化为面状标志,北西向控矿构造的缓冲半径为1km。
(1)赋矿地层
(2)岩浆岩
中酸性岩体(印支期、燕山期花岗岩、二长花岗岩、花岗斑岩、花岗闪长岩等)在本区广泛出露,中生代岩体规模较大,新生代岩体规模较小,二者与热液矿床成矿关系密切,岩体周围有热液矿床产出。德格-乡城、类乌齐-左贡两个城矿带的岩浆岩与成矿关系最为密切。
与岩浆矿床有关的岩体:三叠纪未分超基性岩,沿板块结合带和断裂带侵入,与部分铜钼镍矿成矿关系密切;海西期以来的中酸性复式岩带(三叠纪花岗闪长岩、侏罗纪二长花岗岩、侏罗纪二长花岗岩),与岩浆矿床成矿关系最密切的是燕山-喜马拉雅期花岗岩(图6-14)。
火山矿床和三叠纪中酸性岩浆岩有关,产出在这些岩体的周围。
从上总结可知研究区内矿床产出和中基-中酸性岩浆岩有关。
(3)构造控矿作用
北西-南东向区域大断裂旁侧的北西向、北东向断裂与近南北向次级断裂控制着热液矿床的产出(图6-15)。岩浆矿床、火山矿床受北西-南东向区域大断裂旁侧的北西向次级断裂控制。
(4)化探异常
从图6-12~图6-23可以看出,元素异常和矿床基本上是吻合的,有矿床产出的地方地球化学异常相应较高。
(5)重力异常
由图6-24可见,重力异常沿着构造线分布,而岩体亦是沿着构造侵位,重力异常和岩体相符。热液矿床、岩浆矿床、火山矿床大部分在重力异常圈内或者其附近。热液矿床主要分布在德格-乡城、类乌齐-左贡两个带内,德格-乡城成矿带重力异常突出。岩浆矿床、火山矿床主要产出在德格-乡城成矿带内。

图6-12 分布有矿点的上三叠统地层


图6-13 有北西向断裂切过的上三叠统赋矿地层图


图6-14 岩浆岩图


图6-15 北西向构造控矿作用图


图6-16 Ag异常图与矿点分布


图6-17 Au异常图与矿点分布


图6-18 Cu异常图与矿点分布


图6-19 Pb异常与矿点分布


图6-20 Zn异常与矿点分布


图6-21 K2O地球化学异常


图6-22 Na2O地球化学异常


图6-23 Th地球化学异常


图6-24 重力异常

(6)航磁异常
由图6-25可见,航磁异常沿着构造线分布,而岩体亦是沿着构造侵位,航磁异常和岩体分布基本相符。航磁异常主要分布在江达成矿带内。热液矿床、岩浆矿床、火山矿床部分在航磁异常圈内或者其附近。
(7)成矿势能
在以前的研究工作积累的基础上,我们认为:成矿势能可以是一个重要的控矿因素(图6-26)。所谓的成矿势能,是指研究区某点势能场的数量特征。国外有学者提出的“成矿块体异常成层”的一种表现,就是在矿体、矿床、矿田、矿结、矿区、成矿区和成矿省范围内,随深度发生物质组织构造面的变化,即所谓“螺旋构造”。建议其可以作为一种找矿标志(В.А.Арсеньеъ,В.А.Дубоь,1999)。
表现在西南三江中段地区,研究区内的矿点具有在一定高程范围内集中分布的特征。因此,我们从DEM数据中提取出研究区内405个矿点的高程值,并进行了统计分析,结果如图6-27。

图6-25 航磁异常


图6-26 成矿势能与矿点分布图


图6-27 矿点在高程(m)上的分布

从图6-27中可以看出,矿点基本上集中于4100~5100m的海拔高度范围内。这一点解释如下:研究区本身海拔就很高,为 3000~5500m,对于海拔过高的地区(>5100m),矿体抬升后容易受到风化剥蚀,不易保留;而对于海拔过低的地区(<4000m),在成矿作用过程中,一是(成矿)异常可能发生再次迁移,二是成矿就位机制决定其矿体赋存的深度。
同时我们还发现矿点与高程的分布关系具有双峰规律:一个峰值位于4400~4510m,一个峰值位于4950~5060m。具体是什么原因造成的,还需要进一步分析。
(8)断裂密度
断裂密度即断裂频数,指的是单元网格中断裂构造的条数(不论方向)。这里单元网格取8km×8km大小,断裂密度结果等值线如图6-28所示。
从图6-28中可以看出,在类乌齐东北、妥坝以北、江达、甘孜以西、巴塘以西、德荣以西等六个地区(深色部分)断裂发育程度较高,而在这些地区附近往往有比较密集的矿床(化),甚至是超大型矿床出现。同时,将单元网格加密为2km×2km大小,对全区内矿点所在处的断裂密度进行分析(图6-29),发现矿点一般集中分布于断裂密度范围为1.006~1.038和1.049~1.070的地区,位于中间段。这是因为适当的断裂发育程度是有利成矿的重要条件:断裂密度大的地方,断裂过于发育,往往是岩浆晚期或期后气液组分等成矿物质运移的通道,而断裂密度小的地方,断裂不发育,往往又不利于成矿物质的富集,同时也不能提供有利的赋矿空间。
(9)汇水盆地
汇水盆地控制着化学元素的迁移,是成矿异常分析的重要因素。从图6-30中可以看出,各类地球化学综合异常总体分布于四—五级的汇水盆地中,表明区域元素异常没有经过较大范围的地表迁移,元素漂移并不严重。
6.5.2.3 模型应用
证据权法的预测评价结果是一个成矿后验概率图,其值在0~1之间,后验概率值的大小对应着成矿概率的大小。在确定整个预测评价范围内的临界值之后,图中后验概率大于临界值的地区即为预测的找矿远景区。证据权法应用的一个前提就是具备一定量的基础图件,并能够在成熟的成矿地质模型的指导下,从这些基础图件中优选编制可应用于预测的各种辅助性图件。如前所述,西南三江中段地区各种地质、矿产、物探、化探及遥感数据库的建立为证据权法的应用提供了必备的数据基础,对西南三江中段地区各种有利证据层的分析为证据权法的应用提供了各种辅助性的数据。在此基础上,根据前面所建立的有利证据层的专题图件,分别计算各证据层与成矿的相关程度和预测评价证据权值(表63),并以此对研究区内各个单元进行成矿概率有利度的计算。

图6-28 断裂密度异常与矿点分布


图6-29 矿点-断裂密度统计


图6-30 汇水盆地与化探异常分布


表6-3 西南三江中段地区各证据层权值参数表


续表

表6-3分析结果显示,本区各致矿证据层变量对矿化指示作用的大小依次为:L12,L1,L11,L9,L10,L8,L3,L2,L6,L5,L16,L4,L13,L7,L15,L17,L14。进一步对计算结果进行分析可以得出以下几个基本认识:①本区三叠纪地层与成矿关系密切;②中酸性岩浆岩在本区虽然所占面积大,其与成矿的关系一般,但岩体接触带与成矿关系密切;③各时代构造中新生代构造相对与成矿关系密切;④Au,Ag,Cu,Pb,Zn五个地球化学异常证据层中,Zn异常,Pb异常和Ag异常与成矿的关系比较密切,其相关值分别为1.37011,1.0542和1.008349,其次是Cu异常,Au异常最小;⑤航磁异常、成矿势能、汇水盆地与成矿关系不密切;⑥区域断裂、重力异常与成矿呈负相关。
对于17个证据层进行条件独立性检验,在显著性水平为0.05下,χ2检验结果列于表6-4中,可以看出,上述17个因素基本上满足条件独立性。

表6-4 证据因子相对于矿点分布的条件独立性检验


续表

6.5.2.4 预测结果及评价
以所建立的西南三江中段地区证据权模型,计算各个预测单元的成矿有利度(以成矿的后验概率值来代表),图6-31为西南三江中段地区成矿的后验概率图。由图6-31可知,已知矿床(化)点大部分落入成矿的后验概率高值区,并且可以看出,其成矿后验概率的高值区域主体的走向基本和构造线的方向一致。

图6-31 西南三江北段成矿后验概率图

结合本区矿产地质综合研究成果,图6-32标明西南三江中段重点成矿区(带)远景区,即:①石渠-甘孜铜银锡多金属及金矿成矿带;②玉河坡-昌台银多金属矿成矿带;③巴塘义敦银多金属矿成矿区;④甘孜-理塘中南段铜金成矿带;⑤金沙江中段铜金成矿带;⑥江达火山-岩浆岛弧北段银多金属成矿带;⑦昌都-芒康斑岩铜钼金成矿带;⑧类乌齐-左贡构造带北段锡铅锌多金属成矿带。

图6-32 西南三江北段重点成矿区(带)成矿预测图

预测模型建立及应用

8. 三种预测模型效果比较

唐益群(2007)提出的工程中常用的基坑降水造成沉降的经验公式:

基坑降水工程的环境效应与评价方法

式中:ΔH——降水深度,为降水面和原地下水位面的深度差;
ΔP——降水产生的自重附加应力,ΔP=ΔH·γw/4;
E——降水深度范围内土层的压缩模量。
对于同样5组实测数据应用三种不同方法预测地面沉降量的结果见表4-13。由表可见工程经验估算法结果的相对误差大多大于40%,基于BP神经网络地面沉降预测模型预测误差可控制在不大于20%,支持向量基地面沉降预测模型预测误差可控制在不大于10%。可见无论是基于BP神经网络理论还是基于支持向量机理论的预测模型,其预测精度均好于传统经验公式。

表4.12 工程经验估算法误差分析


表4.13 三种方法误差对比

导致以上结果的原因如下:
(1)工程经验法考虑的引发基坑周边地面沉降的因素较少,且其推导过程很难准确反映真实的水土耦合作用过程。
(2)BP神经网络虽然理论上能够得到较理想的预测结果,但其准确度高度依赖于样本数量的多少和样本质量,而在实际工程应用中,很难获得大量高质量的工程监测数据作为训练样本,可能是此次项目研究中采用该方法没能得到理想结果的原因。
(3)支持向量机能够适应根据小样本数据进行预测的情况,并且能够从有限样本中剔除低质量的较为离散的样本数据,从而对于基坑降水引发的地面沉降的预测给出了较为理想的结果。