基于LCS算法的管道内检测数据对齐及应用
来源:《管道保护》2023年第2期 作者:段明伟 刘志军 王沂沛 毕祯哲 栾奕 高雨晴 张磊 蔺文楠 时间:2023-4-25 阅读:
段明伟 刘志军 王沂沛 毕祯哲 栾奕 高雨晴 张磊 蔺文楠
国家管网集团北方管道沈阳检测技术分公司
摘要:为高效准确对比分析两次管道内检测数据,基于最长公共子串(LCS)算法,研究明确了数据对齐流程。将该数据对齐方法应用于实际案例,结果发现:管道阀门、三通、法兰对齐比例达到100%,环焊缝对齐比例达99%以上,金属损失类缺陷对齐比例达80%以上。对于存在改线换管的管道,该方法能实现准确识别并跳过改线区域,以避免数据误对齐。通过引入缺陷“簇”概念,提高了数据对齐中一对多、多对一、多对多的准确性。
关键词:管道内检测;数据对齐;LCS算法;缺陷“簇”
国家市场监管总局要求长输管道定期检验中优先使用内检测技术。随着超高清漏磁内检测器的推广应用,每百公里长输管道产生的内检测数据达到十万条以上,海量内检测数据深度对比分析变得越来越复杂,不同检测运营商采用各种内检测器对同一条管道开展多次内检测更加剧这种情况。建立可靠的模型算法进行内检测数据对齐分析,及时预测和发现管道腐蚀风险,对管道安全运行具有重要意义。
1 数据对比技术现状和提升途径
1.1 技术现状
国外油气管道内检测数据对比技术发展较早,主要内检测运营商均开展了油气管道内检测数据对比研究。一些学者通过应用回归树算法和内检测比对分析软件,研究了腐蚀缺陷的生长模型[1];有人以内检测数据自动对齐来代替人工对齐的方法,用于标识未能对齐的异常点和分析腐蚀增长情况[2]。
国内学者通过研究球阀、弯头、焊缝与基线对齐方法以及缺陷对齐算法,将对齐结果与基线偏差精确到0.01 m[3];通过计算两次内检测数据分布的KL散度,利用Pearson相似系数获得两次内检测数据对齐结果的评价系数曲线,证明了对齐算法模型的可行性[4]。
1.2 提升途径
(1)通过标准化内检测特征数据库,识别具备更多细节的管道组件,包括较短节、阀门、法兰等附近比较复杂的环焊缝,将管道划分成更多细小管段,从根本上提升对齐比例。
(2)LCS(Longest Common Subsequences,最长公共子串)算法是将两个给定字符串分别删去零个或多个字符,但不改变剩余字符的顺序后得到的长度最长的相同字符序列。基于该算法,实现管段拆分方案的最优化,提升数据对齐的性能和准确性。
(3)通过试错法识别改线换管的管段,跳过该管段以避免数据误对齐。
(4)引入缺陷“簇”的概念,对于缺陷对齐中的一对多、多对一、多对多等复杂情况,提高其准确性和可靠性。
2 数据对齐算法
通过对不同内检测数据进行标准化清洗处理,建立统一标准化的内检测特征数据库。特征数据库中的特征点包括阀门、三通、环焊缝、弯头、法兰、金属损失等。将特征点分为三类,一类特征点包括阀门、三通;二类特征点为管节划分组件,包括环焊缝、弯头、法兰;三类特征点包括除一类、二类外的其他特征点。
2.1 一类特征对齐
根据标准化内检测特征数据库,分别识别两组内检测数据中的一类特征点,根据里程分布将两组数据中相同的一类特征点对齐,将对齐的一类特征点设置为锚点,基于锚点将管道划分多个管段,并定义为一级管段。
2.2 二类特征对齐
根据标准化内检测特征数据库,识别一级管段中的二类特征点,采用管节拆分算法,对两组内检测数据中上述二类特征点进行对齐,管段拆分算法步骤如下:
(1)基于LCS算法,查找两组内检测数据中对齐的两个一级管段的序列中最长公共子序列,将两组内检测数据按照检测时间分别定义为基准数据和对齐数据,最长公共子序列存在于基准数据中的序列(x0,x1,x2....xi)和对齐数据中的序列(y0,y1,y2....yj)中,最长公共子序列的长度C[i,j]为:
(2)对找到的最长公共子序列中所包括的二类特征点逐个对齐,使用里程偏差阈值函数计算对齐数据二类特征点的里程估值范围 t:
t = k(M1±△m) (2)
式中:k为基准数据和对齐数据中二类特征点所在一级管段的长度比;M1为基准数据二类特征点距上游已对齐一级特征点或二类特征点的距离;Δm为基准数据二类特征点的里程偏差范围。
(3)如果对齐数据二类特征点距上游已匹配特征点的距离M2∈t,则认为该二类特征点对齐成功,将该对齐二类特征点作为最新的节点数据,导入里程偏差阈值函数进行更新训练;若未对齐,则在里程估值范围内,找出两组内检测数据中最接近k×M1的相同类型的二类特征点,将该点作为最新的节点数据,导入里程偏差阈值计算函数,进行更新训练。通过以上方法将对齐的二类特征点设置为锚点,将各个一级管段划分为多个细小二级管段。
2.3 三类特征对齐
(1)对当前二级管段内的缺陷进行“簇”划分(集群划分),有两种划分方法。一种是相邻缺陷边界间距小于3倍壁厚,另一种是相邻缺陷边界轴向间距小于两缺陷中最小长度且周向间距小于两缺陷中最小宽度。
(2)以划分的二级管段为单位,对二级管段内剩余的特征点及缺陷依次进行对齐处理,特征点对齐重复二类特征对齐中的方法,并设置角度阈值,缺陷对齐采用“簇”划分方法进行对齐。
3 应用示例
某长输管道全长193 km,2013年和2021年分别进行两次漏磁内检测,期间实施2次改线换管。采用提升后的对齐算法和对齐分析软件对两次内检测结果进行数据对齐。
3.1 管道特征对齐结果
管道特征对齐结果如表 1所示。从表 1中可以看出,本文提出的对齐算法对不同内检测商检测的数据对齐比例很高,阀门、三通、法兰都达到100%,比例最低的环焊缝达到99.35%。环焊缝未对齐的原因是管道改线增加阀门、三通数量,不同内检测商对阀门、法兰、弯头区域环焊缝标记方式不同所致。
表 1 两次内检测管道特征对齐结果
3.2 缺陷对齐结果
两次内检测缺陷对齐结果如表 2所示。从表 2中可以看出,缺陷对齐比例较特征对齐比例有所降低,金属损失类缺陷对齐比例为84.21%。两次内检测缺陷报告的数量、内外部类型相差较大,尤其是环焊缝异常数量变化明显。主要原因包括:内检测器识别模型能力不同、内检测器精度不同、管道改线换管影响。此外,为处理管道小范围内金属损失集群的复杂情况,引入缺陷“簇”的概念,在对齐的26610个金属损失缺陷中,发现对齐的金属损失缺陷“簇”1819组。
表 2 两次内检测缺陷对齐结果
3.3 应用效果
基于LCS算法,对于管道特征对齐,两次内检测数据对齐可实现阀门、三通、法兰对齐比例100%,管道环焊缝对齐比例99%以上。对于管道缺陷,因内检测器识别能力、检测精度差异,受管道运营条件变化导致的缺陷增长以及管道改线换管等因素的影响,管道缺陷对齐比例较特征对齐比例有所下降,但金属损失类缺陷的对齐比例仍可达到80%以上。
4 结论
(1)本文研究建立的内检测数据对齐算法应用于实际管道,高效、准确地实现了管道特征和缺陷的对齐,可为有效预测管道腐蚀增长变化以及管道检验评价提供数据支撑。
(2)数据对齐过程中,引入缺陷“簇”概念,提高了数据对齐中一对多、多对一、多对多的准确性,增加了识别和分析管道面积形缺陷成因的效率。但面临大面积复杂的缺陷“簇”时,数据对齐效果有所下降,可采用人工干预的方法提高数据对齐算法的准确性。
(3)不同检测运营商内检测器的识别能力、精度、置信度等参数会直接影响内检测数据的质量,也会对多次内检测数据对齐结果产生影响,影响程度的关系有待进一步研究。
参考文献:
[1]GU B, KANIA R, SHARMA S, GAO M. Approach to assessment of corrosion growth in pipelines[C]. Calgary: 2002 4th International Pipeline Conference, 2002:1837-1847.
[2]DAN M R, DANN C. Automated matching of pipeline corrosion feature from in-line inspection date[J]. Reliability Engineering & System Safety, 2017, 162:40-50.
[3]杨贺,刘新凌,李强,等. 油气管道多轮内检测数据对齐算法研究及应用[J]. 管道技术与设备,2020(1):21-24,28.
[4]孙鹏,谢裕喜,张勇,等. 管道内检测数据对齐方法与应用[J].油气储运,2021,40(2):151-156.
作者简介:段明伟,1987年生,工程师,硕士研究生毕业于河北大学应用化学专业,现从事检验检测与评价工作。联系方式:13998832692,duanmw@pipechina.com.cn。
上篇:
下篇: