PCA 算法优化地震属性
时间:2015-12-02 10:30
来源:
在储层量化过程中,地震属性作为衡量标准对最小计算单元内的各相邻地震道进行分类,进而求解信息量。在基于地震属性的储层预测中,地震道被抽象成一组地震属性的集合,进而利用模式识别算法建立整个区块的含油气模型。由此可知,地震属性优选及优化是关乎后续两个研究点成功与否的重要一环。地质构造在不同岩性类型、地质、区块及不同解释层位具有互异性,敏感地震属性可用于反映地质构造,因此应当通过一定方法选取对当前地质构造较敏感的地震属性。振幅、地震差异振幅、主频、波阻抗等地震属性是岩性油气藏地质结构中常用的敏感地震属性。
基于单井属性综合分析法,可选取均方根振幅、最大振幅、最小振幅、平均振幅、均方根振幅(能量)差异、最大振幅差异、最小振幅差异、平均振幅差异、均方根主频率、最大主频率、最小主频率、平均主频率、均方根道积分、最大道积分、最小道积分、平均道积分、波形弧长、波阻抗共18 种敏感地震属性。由于不同地震属性之间存在一定程度的冗余,这将导致计算维度及复杂度的增加,因此需要对优选的地震属性进行优化。通过PCA 算法可对优选的18 种地震属性进行优化。
地震属性优化的必要性
通过分析合成地震数据与实际地震数据可知,地震属性与储层流体性质、储层参数、储层物性之间存在复杂的非线性关系。不同区块和不同储层对象具有完全不同的敏感地震属性,即使是在同一区块、同一储层,预测对象不同也会导致敏感地震属性的不同。
当前可以提取地震属性达上百种,但是目前为止真正具有实际意义的属性并不是很多。通常优选的地震属性存在如下的问题:某些属性可能反应的是干扰的变化,而与目的层位本身无关。若不对输入的属性进行优化,会带来错误;属性的增加意味着计算维度的增加。在模式识别过程中,维度的无限制增加往往带来维度灾难。即使不带来维度灾难,也会增加计算方面的困难,过大的数据量要占用大量的内存空间和计算时间;不同属性之间往往存在较大耦合度,如在振幅与能量之间,包含着许多彼此相关的因素,容易导致信息的重复和浪费;就模式识别而言,当训练样本个数固定时,属性过多会造成分类效果的恶化及过学习现象的发生。因此,在利用地震属性进行储层预测的过程中,为了避免上述问题的发生,需结合所研究区块的地质概况选取具有代表性的敏感地震属性,并对优选的地震属性进行优化,通过地震属性的优化亦可达到降低耦合度、简化计算的目的。
基于PCA 的地震属性优化
根据各指标间的相互关系或各指标值的变异程度来确定权重系数,能够真实地反映事物间的现实关系,避免人为因素带来的偏差。在研究多变量问题时,变量太多会增大计算量和增加分析问题的复杂性,研究人员希望在进行定量分析的过程中涉及的变量较少,而得到的信息量又较多,主成分分析成为解决这一问题的理想工具,可以将这种降维并选取主成分的思想应用到地震属性优化上,在利用PCA 算法进行属性优化时需按照如下方式进行:首先确定输入向量维度及待选分量,确定待优化属性;其次选取个样本道(地震道属性信息)作为输入样本,样本个数大于等于向量维度。
样本道的选取应尽量覆盖所研究工区,而且尽量在同一地震相内选取,在工区地震道规模较小的情况下可以考虑选用全部地震道作为输入。在实际应用中,通常对各指标作标准化变换,以消除原指标量纲、数量级的不同。由于PCA 是基于方差来确认贡献率,在某衡量标准上方差越大则各样本在该衡量标准上的离散程度越大,则此时识别样本的效果越佳。利用PCA 算法进行属性优化的具体过程如下:首先选取所有待求地震道的18 个优选地震属性作为PCA 的输入并计算相关矩阵;其次计算该相关矩阵的特征值及特征向量,并将特征值按由大到小顺序排序;选取累计贡献率(特征值之和)达到总贡献率85% 以上的前m 个特征值对应特征向量作为优化主成分,属性优化PCA 主成分矩阵结果。经过上述步骤后即可利用优化主成分将所有地震道地震属性由初始维度降低到m 维。若m=5, 即利用PCA 算法将地震属性从初始18 维空间降低到5 维空间。
通过PCA 算法达到了去除属性相关性及降低维度的目的。由于不同地震区块、不同层位、不同岩性对不同地震属性敏感,因此需要针对特定区块、特定层位、特定岩性做地震属性敏感性分析,通过统计测井与地震属性之间的耦合关系优选地震属性;同时由于不同地震属性之间往往存在一定的耦合度,通过PCA 算法可达到属性优化的目的。