今天是

全站搜索:

您的位置:首页 > 档案学会 > 学术论文
试论大数据背景下的档案工作创新
【作者】中山市地税局小榄税务分局 姬小芬 【文章来源】《中山市档案学会2016-2017年论文集》 【成文日期】2017-06-30 【点击率】

 

[内容摘要] 随着云计算、移动互联网、大数据等新技术的不断涌现,人类社会真正进入数据化时代。本文通过从大数据的定义入手,接着分析了大数据时代对档案管理工作的影响,最后从基层单位的实际角度出发,提出基层分局应用大数据技术进行档案管理工作创新的建议。
[关 键 词大数据 档案管理 挑战 机遇 
随着云计算、移动互联网、大数据等新技术的不断涌现,人类社会真正进入数据化时代。据预计,2020年全球以电子形式存储的数据量将达到35ZB,是2009年全球存储量的40倍。数据的爆炸式增长大大超乎了人们的想象,整个世界迎来了大数据时代。大数据时代给档案管理工作提供了全新的视角和工具,也对档案管理工作提出了新要求。
一、大数据定义
所谓大数据,简单来讲,指的就是规模巨大的海量资料,其具有四“V”特征,即Volume(体量)、Variety(种类)、Value(价值)、Velocity(速度)。一是数据体量巨大;二是数据种类繁多,包括结构化数据、半结构化数据和非结构化数据等;三是商业价值高,但价值密度低;四是处理速度快,要实时获取所需要的信息,这是区别于传统数据最显著的特征。
大数据的精髓在于分析信息过程的转变:第一,不再依赖于随机采样,而是更多的分析整体数据;第二,不再热衷于高精确度,而是更倾向于混杂性;第三,不再单纯探求因果关系,而是更为关注事物间的关联。这三大转变体现了大数据的核心——预测。
二、大数据时代对档案管理工作的影响分析
(一)档案管理信息化将提升到全新阶段
档案管理工作长期以来存在信息化滞后、管理工具无法跟上快速发展的经济变化等情况,传统纸质信息时代对大量的档案信息资源进行分析整合开发需要耗费巨大的人力物力,大数据时代的到来使这一问题迎刃而解。只要拥有良好的数字资源基础,计算机快速处理海量的不同类型信息的能力就能够快速地廉价地挖掘档案信息资源潜在价值,为经营和管理决策服务,从而产生看得见的效益。大数据时代不仅仅是使得构建规范化、可扩展性的信息系统变得廉价和方便,更重要的是分析利用档案信息资源,挖掘数据这个金矿成为可能。
(二)档案概念将重新定义
冯惠玲、张辑哲主编的《档案学概论》(第2版)中对档案的定义是档案是社会组织和个人在社会实践活动中直接形成的具有清晰、确定的原始记录作用的固化信息,认为原始记录性是档案的本质属性。虽然在信息时代,早已出现电子档案的概念,但是,在电子文件收集、整理、归档和保管过程中依然沿用纸质档案的分类和鉴定方法。
随着进入大数据时代,大规模数字存储系统的应用使数据存储的成本越来越低,许多以前不能存储的信息都可以保存下来。当这些价值密度低的数据汇合成PB级别时,人们便可以从中挖掘出价值。商场可以根据大量顾客在商场的行进路线、滞留时间、关注方向等数据来设计商品的布局;日本先进工业技术研究所的专家可以根据人体对汽车座椅施加压力的数据建立模型进行乘坐者身份识别,从而实现汽车防盗功能;当收集了大量的机械运行时产生的震动、温度、转速等数据后,就可以建立预测模型,在机械故障发生之前消除存在的隐患。这些价值密度低的原始记录在大数据时代整体上便产生了巨大的价值,具有了档案的完全属性。这促使学者重新审视电子档案的范围。
学者们一般把档案定义为事件结束后经过整理归档的文件,且将档案分割为小的相对独立的信息单元。在信息化时代,记录即是档案,数字化的记录一旦生成便变成了不可删改的档案。广泛应用于社会实践的税务管理系统、户籍管理系统、车辆交通管理系统等实时地将记录转化为档案,而每一条记录都将变成具有长期保存价值的档案,这些单位价值密度低的记录信息将作为不可分割的整体来发挥档案的价值。在大数据时代,档案概念存在着严重的泛化问题,经济活动过程中的任何数据都可以被存储和记录,并进行分析和应用,这使得大数据时代档案管理工作的范围和内容无限扩展。
(三)重塑电子文件管理方式,数据挖掘等分析技术将占据重要位置
在大数据时代,要求对信息进行数据化而不仅仅是数字化。数据化是指将现象变成指标分析的量化形式的过程,而不仅是转化成“0”“1”的数字格式的过程。当前,很多档案部门重数字化而轻数据化,对纸质档案进行图片化处理,造成文件格式混乱、元数据收集不全,这都将成为未来大数据开发利用的障碍。因此大数据时代电子文档的储存将数据化,数据挖掘等分析技术将成为档案管理的重中之重,这使得档案管理工作成为数据管理的重要组成部分。
三、大数据背景下推动档案工作创新的几点建议
大数据时代下作为基层单位,要推动档案工作创新,除了吸取大数据的相关理论,应用大数据信息技术之外,更要对基层单位档案管理工作进行全面分析和总结,在既有条件下有选择有步骤的稳步推进档案工作创新,笔者认为可以从以下几点开展工作:
(一)适当购买引进大数据服务公司的产品及服务
在对本单位档案管理工作进行全面分析的基础上,与大数据服务公司尤其是各类云计算平台接触,通过外部力量分析目前档案管理工作的不足,在条件允许的情况下购买相关产品和服务,尤其需要通过大数据公司的服务过程的学习,自行掌握和借鉴大数据的相关理念,提高本单位自身档案人才的水平和能力。
(二)适当促进大数据技术与档案管理技术的有机融合
大数据时代,作为基层单位在应用大数据的同时,要加强大数据技术与档案管理技术的有机融合。在大数据环境下,档案管理需要有更充分的技术支持,能够对各类档案数据进行分析和整合,从而为用户提供更具参考价值的信息。大数据技术的应用,能够从根本上改变以往档案管理的陈旧模式,以用户需求为主导,建立起服务型档案管理机制,充分发挥档案数据的历史价值。此外,大数据技术的引入,也为档案管理拓展了新的方向,档案不再是对历史资料的整理与保存,同时也融入了数据整合、发掘、应用等全新功能,从而使档案信息价值不断提升。
(三)适当促进档案资源共享,提高资源利用效率。
大数据时代最为典型的特征就是资源共享,在资源共享基础上,信息的应用价值会进一步提高,而信息共享的实现,则需要信息资源的融合与共建。因此,作为基层单位,在目前档案信息管理中,可以进行档案资源数字化利用的尝试,将影印化的文字转化为数字进行存储,进一步转化图片、音频等档案资源,利用语义分析、数据发掘等技术,提高档案数据的应用效率,使得大数据技术可以从理论到实践应用不断深化,最终为以后大数据下的档案管理工作奠定良好基础。
 
参考文献:
[1]张欣.解读大数据时代下档案管理的价值提升[J].理论观察,20141):108-109.
[2]高茂科.对档案大数据关键环节的认识[J].中国档案,201310):72-73.
[3]冯海超.大数据创业样本[J].互联网周刊,201223):45.
【关闭窗口】