发布网友 发布时间:2022-04-22 14:12
共1个回答
热心网友 时间:2023-10-06 06:59
李红霞1符京生1张永胜2惠玉凤2
(1.中石油长庆油田公司档案馆;2.中石油东方公司研究院长庆分院)
摘要 为抢救和保护地震勘探数据磁带档案,改变长期以来地震磁带容量利用率低,保管成本高的现状,长庆油田应用地震资料全容量存储技术,完成了地震勘探数据载体的转换,实现了地震磁带全容量存储,有效解决地震勘探数据保存和再组织问题,效果显著。本文介绍了长庆油田地震资料全容量存储技术开发的背景、研究成果及应用实施情况。
关键词 地震勘探数据 磁带存储 容量利用率 测线标签 磁带操作程序
地震勘探数据磁带是油气勘探的重要资料,是地震勘探工程施工成果的载体,是物探科技工作者智慧的结晶,是企业的宝贵财富。石油天然气行业标准亦规定磁带为地震勘探数据成果长期和永久保存介质,这一管理形式在油田企业一直沿用至今。近年来,随着地震勘探技术水平的发展,施工设备的更新换代,存储技术的不断发展,传统的保管利用模式已无法适应现代化办公条件下生产科研工作的需求,加之所保存的地震勘探资料时空跨度大,严重制约着磁带档案的规范化、标准化、现代化管理水平的发展,潜藏着因历史资料载体到期老化等因素致使数据无法正常读取和使用的巨大风险。基于此,长庆油田开展了将库存地震勘探数据由低密度磁带向新型高密度磁带的数据转储工作,探索出地震勘探数据磁带全容量存储技术,从根本上解决了地震勘探数据磁带档案管理中的诸多问题。
1 长庆油田地震勘探数据磁带管理现状
长庆油田档案馆保存着迄今为止30多年来在鄂尔多斯盆地及其周边地区采集的全部地震勘探原始及成果数据磁带,是长庆油田唯一的地震勘探档案集中保管地,库存各类地震磁带9万多盘。近年来,随着档案管理系统的推广应用,狠抓了地震勘探数据磁带档案基础业务,实现了磁带档案目录的电子化,其中成果磁带采取了案卷级和文件级相结合的编目规则,利用效率得以有效提升。然而磁带这一载体的特殊性,影响着磁带的安全管理,制约着磁带管理水平的进一步提高,主要表现在以下几个方面:
一是磁带数量大、型号繁杂,部分已到保管期限。现库存磁带包括3480、3490、3590、3592及九轨半英寸磁带共5种,其中3480、3490、九轨半英寸磁带占库存总量的97.45%,库存一半的磁带已到规定的保管期限,加之磁带机对不同型号磁带的互不兼容性,导致部分陈旧磁带数据随着相应磁带机生产下线而无法正常读取使用。
二是数据格式多样,不便利用和管理。其中大部分为SEG-D格式,部分是TIPEX、TAR格式,现阶段已无与之匹配的操作系统,数据无法读取,这种多格式共存给地震勘探数据的标准化、规范化管理也带来不便。
三是磁带容量利用率低,增加了保管成本。传统磁带管理因受磁带物理标签及现场施工方式的影响,通常磁带容量利用率仅有21%,容量空置率高,造成磁带数量的无谓增加和成本的极大浪费。
四是利用效率低。一直以来,长庆油田采用磁带对磁带一对一拷贝,通过复制归档磁带数据开展对外提供利用工作,这一管理方式在确保管理安全方面效果显著,但利用效率却大受影响,在面对利用量小且任务较分散的利用工作时,这一方式基本能够满足,也未突显明显矛盾,然而面对近几年油田勘探生产任务的大量攀升,经常面临集中大量的数据利用工作,即使工作人员24小时不停歇加班加点,但因这种传统数据拷贝速度受限于设备数量、设备运转情况的影响,常常很难满足实际工作的需要。所以对地震勘探数据开展抢救式介质转换、升级,探索改进地震勘探数据磁带档案管理已迫在眉睫。
2 地震资料全容量存储的目的
1)抢救和保护油田勘探资料,确保资料信息随时代发展、软硬件条件进步,能得到完整保护。
2)采用国际国内通用格式形式加以转录、存储,使不同设备不同时期地震勘探资料得以通用性识别。
3)大容量存储的应用,保证地震资料信息完整,今后复制、抢救数据更加高效,便于长期安全性保存。
4)便于高效服务油田勘探开发,由于油田勘探程度愈来愈高,隐蔽性、小型性、复杂性油气藏也成为勘探的主要目标,对地震资料的进一步应用也愈来愈多。
3 地震资料全容量存储技术
3.1 地震资料全容量存储技术概述
地震资料全容量存储是采取标准的SEGY磁带格式,将包含地震测线的关键标识性信息(包括测线名称、地区等)和档案管理重要元素(包括全宗、目录号、保管号等)组成的具有重要识别性质的简单的测线编码电子标签,记录在SEGY卷头未定义区域,通过地震数据磁带操作程序,完成地震测线数据的卸带和磁带检索。将测线数据及相应的电子标签一同写入直至记满一盘3592磁带为止。
地震资料全容量存储理论上是对历史地震勘探数据载体的升级转换,是对数据格式和载体型号的统一规范;这一技术的核心是使得地震勘探数据存储不再受限于磁带物理标签*,而是取决于磁带本身的存储量,可将传统磁带容量提高至98%左右,这对于磁带档案保管的集中地——档案部门来说,将有效减少磁带数量,降低管理成本,缓解库存压力;同时这一技术符合地震磁带标准格式,形成的存储磁带能够在GeoEAST、CGG等处理系统中直接读出,便于利用和管理。
3.2 测线标签和磁带标签目录
测线标签和磁带标签目录是一行限长EBCDIC码字符串,包含卷盘号、卷内序号、测线名、成果类型、队号、数据范围、工区、生产年度、数据来源等测线标示信息(表1),与测线SEGY数据文件一一对应。将一盘地震SEGY磁带的测线标签顺序存放,形成磁带标签目录文本文件。
表1 测线数据文件与测线数据标签
3.3 地震资料全容量存储操作程序
地震数据的SEGY格式,实际上是一种特殊的加密格式,通常只能由理解SEGY格式的软件来读取,如GeoEAST、PROMAX、CGG等,且须有地震资料数据处理背景的人员操作完成。在Linux系统下,使用C语言编制一组SEGY格式磁带专用程序,根据磁带标签目录,脱离通用处理系统直接驱动磁带机,完成标准地震SEGY格式磁带的写入、读出和磁带扫描。
3.3.1 磁带机工作特点
与磁盘直接访问不同,磁带是一种流式数据设备,只能顺序访问。磁带基本读写单位为块(BLOCK),块与块间有一物理间隙(GAP),用于磁头定位。SEGY磁带数据文件有若干块组成,文件尾有一特殊数据标志EOF标示文件结束,而双EOF通常表示磁带数据结束。程序设计中,通过系统调用磁带设备数据结构,完成磁带的寻块和读写EOF等控制操作。
3.3.2 写磁带
程序功能是将磁带标签目录文件所列的测线SEGY磁盘文件及其测线标签,顺序写入一盘磁带(图1)。写带前应先用tpsize命令估算写带容量,以确保磁带全容量存储。有记带日志帮助确定写带正确。实际应用中,譬如在提供磁带拷贝记带时,测线标签可以选择空白。
3.3.3 读磁带
程序功能是从一盘磁带中顺序卸出全部或指定序号的SEGY文件到磁盘(图2)。查询标签目录获得卸带文件号。有读带日志帮助确定读带正确。
图1 写磁带流程
图2 读磁带流程
3.3.4 磁带扫描
程序功能是扫描一盘地震成果磁带,列出全部SEGY文件标签和卷头及道头信息,检查SEGY数据磁带或SEGY数据文件的合规性。
4 地震资料全容量存储的应用
4.1 应用方案
1)将多格式数据向SEGY格式转换。
2)转储数据编目规则,采用档案著录规则与物探技术规则相结合,包含卷盘号、卷内序号、测线名、成果类型、队号、数据范围、工区、生产年度、数据来源等信息内容。
3)数据采用磁带加磁盘双模式存储,其中磁带采用近年通用、普通的350 GB容量的3592磁带,这种新型的高密度磁带可大幅度减少磁带数量,便于保管和保护;磁盘采用RAID6冗余技术方式,便于日常频繁大量的数据利用。
4.2 应用实例
长庆油田利用上述技术历时两年半完成了1980~2010年共9万多盘各类地震勘探数据(包含原始与成果)的转储,共形成转储磁带90多盘,存储量40TB。特别是档案目录中的原始测线,全部得到样本保存,实现并保证了长庆油田地震历史成果的永久保存。
4.3 应用效果
4.3.1 磁带数量大幅减少,有效缓解了库存压力
转储前,9万多盘不同种类不同型号磁带共占用两个库房320平方米存放空间,转储后,同样的数据量只形成了90多盘3592磁带(350GB),仅用了一个资料柜的1/3。
4.3.2 抢救保护了地震勘探数据,保证资料持续可用
通过转储,抢救恢复了无法读取的TIPX格式和掉粉损坏磁带的地震勘探数据,保证了所有地震数据的有效性,同时也为下一步确定4万多盘已到保管期限的九轨半英寸磁带鉴定处置方案提供了可靠依据。
4.3.3 实现了标准化、规范化,便于管理和利用
通过地震资料全容量转储,长庆油田所有不同历史时期不同格式地震勘探数据全部实现了以国际通用的3592高密度数字磁带为载体,数据格式为SEG-Y的标准存储模式,便于硬件设施的配备及日常维护工作的开展,使管理更加便捷,利用更加顺畅。
4.3.4 提高检索效率,全面提升了地震勘探数据的利用服务水平
检索效率大幅提升。通过集中统一更改、补充、完善,规范和丰富了长庆油田30多年来的地震勘探数据及目录信息,提高了检索的准确性;完善了地震勘探磁带管理信息电子编码技术规则,制定了由卷盘号、卷内顺序号、测线名、队号、工区等10个信息因素组成的具有地震测线和档案目录独特识别信息的地震勘探磁带测线信息电子编码和档案编目、著录规则,用以地震勘探数据库的检索;形成了以档案目录号、保管号为内容的互见目录,可实现磁带测线信息电子编码标签与档案测线目录的双向信息查询,提高了检索效率。
利用服务方式有了突破性发展。本次转储除采用传统的磁带存储外,开创了磁盘阵列备份存储的新模式,实现了地震勘探磁带数据的数字化管理,实现了从目录检索到数据直接拷贝的系统管理操作,改变了传统通过目录检索获得实物档号,取出实体采取磁带对磁带的一对一拷贝的半信息化操作,在提高利用效率的同时,也为快速高效地开展地震勘探数据的再组织奠定了基础,开启了地震数据管理利用新篇章。
4.3.5 提高了工作效率,降低了劳动强度
以3490磁带为例,一天按8小时工作时间计算,在机器运转良好,工作人员不间断工作的情况下,每天一台3490磁带机最多能完成30多盘磁带数据的拷贝,若一条测线原始数据磁带350盘左右,存储量约150GB,采用传统地震数据磁带拷贝,用一台机器拷贝最快10天,而通过磁盘阵列数据拷贝仅用2个多小时即可完成。据初步测试,完成1TB数据量拷贝需18个小时左右。经转储整理后,在实现高效率数据拷贝和再组织的同时,大大降低了劳动强度,了人力。也符合大数据时代快速、高效生产科研工作的需要。
4.3.6 两种存储互为补充,提升了地震勘探数据的安全有效性
采取磁带和磁盘阵列两种方式存储,可根据实际需要相互转换,互为补充,降低了保管风险,最大限度地维护了企业的利益;降低了对磁带数据的重复利用次数,有效地保护了存储介质及地震勘探数据;历史数据载体的升级转换,是一次全面地毯式的核查,是对过去收集检验工作的又一次复核、巩固和补充,是对存放多年数据有效性的全面检验,是做好数据档案保护工作的又一举措,对于档案保管部门意义重大。
5 结束语
地震资料全容量存储成果在实际工作中的应用证明,其提高磁带容量,减少库藏量,降低管理成本效果显著,规范标准化程度高,适合地震勘探数据信息化数字化管理;磁带及磁盘阵列双模式存储在有效降低保管风险,实现方便灵活利用及数据再组织等功能方面,得到相关科研生产部门的一致认同。地震资料全容量存储技术适合地震勘探数据磁带档案管理或地震勘探数据信息的集中管理部门,且数据量越大,效果也越明显。该技术不仅解决了传统地震勘探数据磁带档案管理中的诸多问题,而且使地震勘探数据磁带档案迈上数字化管理新台阶,将更好地服务于油气田的勘探开发与科研工作。