您的当前位置:首页正文

高校数据中心的智慧数据体系的规划与设计

2023-12-16 来源:我们爱旅游
Compu ̄r Knowle内e and Technology电脑知识与技术 需求,分析各部门业务体系、数据管理和应用现状,设计基于全 校的数据体系,是智慧数据体系的基础。 以上图为例,采用面向对象的方法,从业务和信息的视角, 对学校各部门使用的业务系统的相关组成对象和业务过程进 行抽取和分类,形成教学、人财物和科研、学生、公共服务四类 信息的聚合体,描述各对象之间的业务关系,形成学校顶层业 务视图,为学校信息化建设、数据的管理和综合应用建立了顶 层框架。 通过对学校各部门使用的应用系统的分析,首先对学校各 业务系统中产生和存储的信息进行梳理,对业务数据进行分 类、体系化,建立了学校信息资源体系架构,在信息资源体系框 架下,根据各类业务系统中数据之间的关联关系,进行学校数 据模型的设计;其次根据学校各部门数据应用需求和数据技术 分类,规划基于全校统一的数据体系框架,对数据的获取、存 储、应用、管理需求进行分析,研究智慧数据体系建设中使用的 关键技术,设计各类技术架构,指导数据中心的建设。 3数据采集 教学和科研是高校的两大重要工作,因此,教学信息和科 研信息是高校的两大核心功能的重要数据,要提高学校的教学 水平和科研能力,需要有效的从各业务系统中取得相关数据。 高校的智慧数据体系架构必须以学校现有的业务系统为基础, 能够应对未来信息化的发展以及各业务系统产生的数据管理 需求,因此,业务系统中各阶段产生的数据都是非常有意义的, 对其进行采集,并按生命周期进行管理,既保证了数据的完整 性又能提高学校数据的质量。高校的智慧数据体系架构的数 据采集包括数据的产生、交换、存储、管理等内容。 3.1数据的获取 在学校信息化发展过程中,大部分高校已经基本建立了各 类信息系统等,积累了大量的结构化数据,同时还有许多包括 XML等半结构化数据,以及多种形式存在的非结构化数据。 数据的获取通过使用ETL工具对多种来源的数据进行抽取,转 换和加载,并通过企业服务总线(Enterprise Service Bus,ESB)以 及文件传输技术,实现学校各部门业务系统之间数据的关联和 聚合,并采用统一的数据结构进行数据的存储。高校只有将各 个业务充分整合,数据有效的获取,以提高数据的质量,才能将 信息化对学校发展的推动作用发挥出来。根据数据类型和来 源的不同,需要制定不同的数据抽取策略如抽取方式、抽取时 间、抽取周期等,既要满足数据分析的需要,又不能影响业务系 统的性能。 3.2数据的存储 学校近年来建设了各类业务系统,产生大量的数据,为保 证不同系统之间的数据合理存储和高效利用,避免共享时出现 数据不一致的问题,需要合理规划学校的数据存储,建立统一 的数据存储标准。数据存储架构设计就是将清洗后的数据按 计划增量的方式导人到数据仓库中,用于解决学校数据的存储 和管理难题。目前,在高效中各部门产生的业务数据分布总体 成星型分布,因此数据存储架构采用数据集中存储和数据分布 存储相结合的模式。学校数据中心存放的是各部门需要共享 的交换数据、记录生命周期的数据、历史数据,以及用于决策分 析的数据。其他数据仍存放于原来的各业务系统的数据库中, 用以支持各业务系统的正常运行。另外,在数据存储的时候还 4 …数据库与信息蕾理 m 第11卷第19期(2015年7月) 要考虑对非结构化数据按照统一的标准进行有序、高效的存 储,以方便下一步数据的分析。 3.3数据的管理 学校数据中心的数据积累是个漫长的过程,数据从产生、 交换、存储到应用有完整的生命周期。在数据产生和积累过程 中,要有效管理才能确保数据质量,使学校数据具有更高的价 值。数据管理的目的就是去寻找优化手段,建立有效的数据生 命周期管理,有效的控制数据资源,重视历史数据积累,提升数 据资源的利用率。高校数据管理架构应以数据为中心,以需求 主导服务方向,建立并实施数据管理标准规范(包括编码标准 化、数据标准化和维护数据标准化三方面),完善数据最优化。 4数据分析 数据采集完成后的数据将作为数据分析的原始数据。数 据分析是智慧数据体系中数据处理流程的重中之重,它将在这 个环节体现数据价值之所在。数据分析技术可以从采集的大 量的实际应用数据中找到真正有价值的信息和知识,为教师提 供学生学习和教学相关的信息以提高教学质量,为科研者提 供,为高校管理者提供更科学的统计分析作为决策基础,从而 有效的提高学校的教学质量、科研水平等,这对于学校的发展 非常重要。在宏观上,高校可以在学科规划、合理设置课程、院 系办学评估、智慧化校园网络建设等方面借助大数据分析技 术,挖掘数据中潜在的价值。也可以从一些特定的数据中分析 挖掘某一方面信息,比如:上网行为分析、学生心理健康、就业 情况分析、学习者特征挖掘。 5信息服务 信息服务是根据不同校园网用户的需求,为用户提供公共 信息服务、专业信息服务、信息处理服务、决策信息服务等。由 于信息服务面向最终用户,因此它也是智慧数据体系的“窗 口”。系统存储的大量数据通过对数据分析体系有效、清晰、灵 活地呈现给用户,满足不同决策层级用户的决策需求。在高 校,数据挖掘可用于学校教学、科研、管理等业务层面进行宏观 的挖掘和预测,还能用于评估和判断在微观方面的服务需求, 为学校更早的发现问题。比如学习行为分析、干预师生行为、 对上网行为分析进行心理干预等。 6总结 当今,云计算及大数据技术快速发展,我们可以利用此类 技术及时方便的获取需要的数据,但随着数据的大量累积,要 将海量的数据转换成有用的信息或知识,变得越来越难,必需 运用许多专业工具进行挖掘和分析,发现数据之间暗含的信 息。因此,在高校中建立基于全校范围的智慧数据体系迫在眉 睫,只有通过统一的规划,自动的获取和存储存储,有目的的分 析与挖掘,给校园网各类用户提供各种统计、分析和决策信 息。因此,建立智慧数据体系是高校建设与发展的必由之路, 也是智慧校园建设的一部分。本文从智慧数据体系架构设计 方面对高校当前和未来信息资源应用和管理的内容和技术架 构进行了初步的探讨,希望能对高校信息化建设,以及数据的 应用和管理起到参考作用。 参考文献: f11朱士中,先晓兵,陈凤.挖掘大学数字价值,建设高校决策支持 [J].电子商务,2010(11):90—92. (下转第10页) 本栏目责任编辑:王力 Compu ̄r Knowledge and Technology电脑知识与技术 第11卷第19期(2015年7月) 提高爬虫效率,则需要设置合适的并发线程或进程服务数目。 软件工程中要求,“高内聚、低耦合”,领域词义关联体系在 各个模块部分中要求把数据处理好,每个块块都只有一个入 口,一个出口,这样才能保证输入输出数据一致。在语料爬取 模块分为三个部分:维基百科,由于这部分语料更新较慢,所以 提前做好的;百度新闻,则是面对各大网站的新闻,还包换个人 点事件新介入的因素进行关注和评论。 参考文献: 【1】王忠振,王涛,杜晓莉.基于领域词义关联的研究【J】.中国电 子商情,2013(6):1 17—122. [2】张睿涵.基于RSS的聚焦网络爬虫在高校网站群中的研究 [D】.南昌大学,2012:23—33. 的博客,论坛的帖子等,这里先不考虑其语料的真实性;新浪微 博,以每天人们对新兴事件的发帖、评论或转发,也以继续对热 [3]涂新辉,张红春.汉语维基百科的结构化信息抽取及词语相 关度计算方法[J1_汉语信息学报,2012(5):109—1 15. (上接第4页) [5]丁建华.数据仓库技术在电信企业中的应用[D】.南京:南京邮 电大学,2006. [2】潘伟锵.高校智慧数据体系的探讨[J]’中国教育网络,2012 (2):66—67. 【6】史兴领,黄雪松,王文明.基于大数据的发电集团数据体系规 【3]罗军锋锁志海.大数据时代的高等教育信息化[J].中国教育 信息化,2014(1):8—9. [4】孙其伟陆春.大数据在高校中的应用研究『J1.中国教育网 络.2014(1):63—65. 划与设计[J].电力信息与通信技术,2014,12(8):130-134. [7]张上游,王燕.数字化校园建设中数据分析的意义[J]_西南民 族大学学报:自然科学版,2008,34(5)1051—1054. (上接第6页) 本文下一步工作将针对于阈值的设定,数据的划分与发送 6结论 本文提出了分布式实时存储方法DRS,该方法基于实时车 辆数据进行了一系列实验。结果证明该方法在大部分情况下 拥有良好的性能,并应用于某市交通监管实时系统中,成效显 著,提高了系统的性能。 数据的速率之间的关系做进一步分析,使该方法更有使用价 值。 参考文献: [1]杨或剑,林波.分布式存储系统中一致性哈希算法的研究 [J]_电脑知识与技术,201 1,7(22). 1O …数据库与信息蕾理 m 本栏目责任编辑:王力 

因篇幅问题不能全部显示,请点此查看更多更全内容