降低38%的误差率分配:使可靠性工程师更有效地处理数据

通过188appcob ．2021年9月13日

4喜欢

0评论

主题

简介

近年来，随着数据收集和分析技术的突飞猛进，机器学习(ML)和“大数据”技术被证明是许多行业的强大工具，包括石油和天然气精炼领域。Pinnacle最近完成了一项研究，将ML模型预测的资产退化率的准确性与应用当前行业标准的人类主题问题专家(SME)预测的资产退化率进行了比较。具体来说，该分析考察了炼厂重整装置资产退化的预测精度。简而言之，与现有的行业标准实践和SME估计相比，ML模型能够以更高的精度预测退化率和相关的可变性，并将平均绝对误差减少了38%。分析结果展示了如何使用“大数据”来帮助可靠性和腐蚀工程师比目前的行业实践更快、更准确地解决现实世界的可靠性挑战的令人兴奋的可能性。

什么是机器学习以及它如何提高可靠性?

机器学习是一种数据分析方法，在这种方法中，先进的算法能够识别数据中的模式，并从这些模式中学习，而无需显式编程。随着时间的推移和数据的收集，机器学习算法分析数据中的参数来做一些事情，如预测未来的事件和对不希望发生的情况提供主动警告。

尽管现在大多数设施都有丰富的可用数据，但由于这个原因，许多设施很难有信心地做出可靠性决策。过多的数据，加上缺乏既能分析大量数据又能有效地将见解与可靠性管理系统集成的技术系统，使得设施负责人无法利用收集到的所有数据来优化可靠性策略，并获得可信的见解。

这就是数据驱动的机器学习方法可以派上用场的地方。机器学习如果应用在合适的环境中，可以帮助减少可靠性模型中的不确定性，让领导者专注于无法建模的不确定性，从而做出更自信的决策。通过使用机器学习，资产退化建模可以变得更加精确，这可以对基于风险的检查(RBI)程序或其他可靠性管理和性能优化量化方法的结果和建议输出产生深远影响。

退化预测精度:数据驱动模型与当前行业标准的比较

本研究的目的是使用数据驱动的ML模型来准确预测改造单元资产的退化率，并将ML模型的准确性与当前行业实践进行比较。该研究利用了从37个重整装置收集的数据集，用于ML模型和当前行业标准的应用。数据集包括检查历史、资产属性、流程流数据和指定的损坏机制等信息。

数据驱动模型:它是如何工作的以及它与当前行业实践的区别

ML模型不同于当前的行业实践，因为它们没有明确地用规则进行编码。相反，美国石油学会(API)的推荐实践，API RP 581，基于风险的检测技术，提供了应用于RBI项目的推荐程序和方法。

ML模型不是基于规则的，而是被输入的数据将帮助它们识别模式并做出明智的预测。例如，为了预测未来的退化率，向模型输入描述给定资产或组件(操作条件、流程流数据等)的数据以及测量的退化率。然后，他们使用这些数据来了解不同变量是如何影响退化率的。一旦它们学会了这些模式，就能做出准确的预测。例如，它们可以识别出较高的温度通常与较高的降解率相一致，而无需直接编码来了解这一信息。

为了进行比较，考虑盐酸(HCl)降解，可以使用API RP 581中的方法或材料和腐蚀工程师的专业知识来建模。根据API RP 581, HCl降解被建模为资产的冶金、温度、pH值等的函数。材料和腐蚀工程师通常使用这些信息，加上丰富的经验，来估计降解率。ML模型不遵循一组规定的规则(如API 581中的规则)，而是使用所有可用的相关数据来学习如何处理常见情况。

研究结果

为了比较这种ML模型的准确性，有两个例子演示了ML模型和当前行业实践之间的结果差异。第一个是滚筒的降解率与ML模型和工业方法的比较。第二个例子考察了预测超过10,000个资产的退化率的准确性。

例1 -滚筒退化建模

下图展示了数据集中一个操作人员对滚筒的退化建模。蓝绿色曲线表示在状态监测位置(CML)水平上实际观察到的退化。灰色曲线为ML模型计算的降解速率分布。由ML模型生成的降解分布表明，速率可能在4 mils/年左右，而大于7 mils/年的速率则极不可能。

相比之下，绿色竖线表示2 mils/年的平均降解率，蓝色竖线表示标准工业方法(API 581表)产生的降解率，约为18 mils/年。

当将ML模型的预测与标准行业方法提供的预测进行比较时，ML模型被证明更接近真实的历史测量值，而行业方法提供了高度的稳健性。

例2 -组件退化建模

第二个例子比较了ML模型与标准工业方法在更准确地预测一组组件的退化率方面的表现。在本实验中，从数据的训练集中随机选择并删除了数千个资产，其中包含超过10,000个资产价值的数据，用于训练ML模型。数据被删除，这样ML模型就可以使用剩下的数据“学习”，然后为数据被删除的11个组件生成预测降解率，然后将其与实测的实际降解率进行比较。

在ML模型与剩下的数据集进行训练以生成降解率预测之后，将其与使用相同数据集的资产的材料和腐蚀主题材料专家(SME)预测降解率(使用API 581表)的结果进行比较。ML模型和SME被赋予相同的数据，以提供一个公平和无偏见的测试环境。

将预测降解率与实测降解率进行比较，得出行业标准方法的平均绝对误差为5 mils/年，ML模型的平均绝对误差为3.1 mils/年。这意味着与标准行业实践相比，ML模型实现了平均绝对误差的38%减少。

除了提供更高的准确性之外，ML模型还可以在大量资产上实时运行，从而在新数据可用时实现快速实现和持续常绿。这种优势为评估不断变化的工艺条件导致的降解变化提供了机会，例如，在完整性操作窗口(IOW)偏移期间，或者如果所有者/运营商需要快速模拟原料变化的潜在影响。

结论

在这两个实验中，数据驱动的ML模型比从当前行业实践中得到的预测更准确地预测了降解率。通过使用数据驱动、基于推理的学习，ML模型能够实时做出更好、更有依据的预测。该研究的结果为油气行业提供了令人兴奋的机会，可以将数据分析应用于可靠性，更快地识别潜在威胁，提高可预见性，并集中有限的资源来推动全设施的可靠性改进。