简述大数据时代背景下基于云计算未来图书馆数字信息资源建设

更新时间:2024-04-11 作者:用户投稿原创标记本站原创
摘要:大数据时代的到来为图书馆服务提出了挑战,图书馆的传统业务受到冲击和压力,在大数据环境下使用云计算技术发展业务将成为图书馆未来的发展趋势。本文介绍了大数据和云计算的概念和特性,阐述了现阶段图书馆信息资源建设所面对的理由,分析了云计算在未来图书馆信息资源建设中的应用,最后探讨了云计算在数字图书馆中应用需注意的理由。
关键词:大数据;云计算;图书馆;信息资源建设
1 大数据
1.1 "大数据"的含义和分类 大数据之所以被称为大数据首先因为它的数据是海量的,而且目前随着科技发展,随着人们对互联网的依赖程度不断提高,这个海量的数据正在超速增长。其次,大数据是海量的数据被整理纳入大数据仓库里,然后对其进行分析挖掘,再利用有价值的结论进行下一步行动的决策[1]。
大数据从数据内容结构上可分为结构化数据、半结构化数据和非结构化数据。结构化数据即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据,在形式上有诸如文字、数字、符号,能够用统一的形式加以标识。非结构化数据包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像、音频和视频信息等等,这些内容无法用简单的逻辑表达实现,分析起来也需要特别的硬软件。半结构化数据,就是介于结构化数据和非结构化数据之间的数据,它一般是自描述的,数据的结构和内容混在一起,没有明显的区分。
1.2 图书馆的"大数据" 图书馆的大数据首先包括书目数据。这些数据一般属于图书馆稳定的结构化数据,目前这些数据的使用多用SQL工具分析。对于结构化的数据,小规模的数据,目前的分析工具足可以用了。对这些数字化书目数据做分析可以反映出一个图书馆馆藏的级别、服务的对象、服务的倾向和服务的质量。
图书馆的大数据虽然以结构化数据为主,但随着图书馆新服务的开展,图书馆与读者的互动信息,以及读者面对图书馆的各种信息行为都会被记录,这些信息将成为图书馆大数据中的非结构化数据。这些动态的非结构化数据可以来自图书馆业务内容,也可以来自读者服务体验。
2 云计算
2.1 云计算的概念 云计算是并行计算(Parallel Computing)、分布式计算(Distributed Computing)和网格计算(Grid Computing)以及Internet 结合起来的新的网络资源提供模式。云计算是以虚拟化技术为基础,以网络为载体,以提供基础架构、软件、平台等服务为形式,整合大规模可扩展的计算、数据、存储、应用等分布式计算资源,进行协同工作的超级计算模式[2]。它不仅是资源的简单汇集,而且为我们提供了一种管理机制,让整个体系作为一个虚拟的资源池对外提供服务,并赋予开发者透明获取资源、使用资源的自由。
2.2 云计算的特点
2.2.1超强的计算能力 云计算由成千上万台服务器组成的集群能赋予用户前所未有的能力。用户可以拥有超大的存储和管理空间,以及超强的计算能力。
2.2.2海量的存储空间 云计算为数据的存储提供了广阔的空间,它是将大量的服务器集群共同组合在一起,形成巨大的空间,所有的数据通过云计算中心运算处理后返回给用户。
2.2.3可靠的安全保障 云计算使用了数据多副本容错、计算节点同构可互换等措施来保障服务,存储在云里的数据资源丢失或硬件崩溃都不会受到影响,云计算技术存储数据安全可靠。
2.2.4便利的资源共享 由于是将大量的信息汇聚成一个整体,对于同一资源可以供多方共同使用,从而避开了资源不必要的重复,进而提高了信息资源的共享程度。同时,云计算可以针对不同应用即时应对,规模可以动态伸缩,云计算下的资源可以根据应用和用户规模增长的需要随时进行动态扩展和配置。
2.2.5良好的系统兼容 对于不同的操作系统,不同的数据格式,不同的数据库之间的数据,云计算可以通过一站式检索不同系统中的相同信息,系统之间可以无缝连接和访问。
3现阶段图书馆信息资源建设面对的理由
图书馆的数字资源包括图书馆引进或自建的,拥有磁、光介质或网络使用权的数字形态的文献资源。根据数字资源的种类可分为:电子书、电子刊、二次文献数据库和其他数据库。根据数字资源的存在形式可分为:在线资源和本地镜像资源。根据数字资源的来源可分为:购买的数据库、自建数据库、试用数据库和免费数据库[3]。现阶段图书馆都是各自为政,在建设的过程中存在着很多理由。
3.1 数字资源重复建设理由 目前,馆与馆之间数字资源的建设都是相互独立的,在建设过程中都是按照学校经费多少和专业的需求进行资源建设,一般都不会考虑其他馆的建设情况,只埋头建设自己的数字资源。这样势必造成了大量的人力、财力的浪费,从宏观的角度看不利于高校图书馆的发展。
3.2 存储及检索技术理由 随着数字图书馆的发展,图书馆的数字资源海量增加,而其数据管理、备份、存储设备能力都十分有限。同时,数字资源的图片检索技术、多语言检索、不同数据标准之间的数据交换、人机交互技术、数字图书馆所需的软件和工具等都还有待于技术上的进一步发展[4]。
3.3 信息资源共享理由 目前,图书馆资源的共享往往局限在一些对口的、接口相同的数据资源上。由于数字图书馆平台技术不统

一、各馆间有的数据无法相通,这样就谈不上共享。

4 云计算在未来图书馆信息资源建设中的应用
图书馆信息资源建设的最终目的是为了满足用户的需求,提高服务质量。云计算的出现使分布在互联网中各个图书馆的资源和服务整合成为一个整体,使其服务的时间、空间、服务方式等有了无限扩大完善的可能。分析云计算的特点和它所提供的服务形式,我们可以看出,云计算的模式也适用于图书馆的数字信息资源建设。
4.1 云计算可提供图书馆海量信息资源数据存储的能力和提升数据安全。

点赞:8773 浏览:26902