自考生网为考生收集整理了“00911互联网数据库自考资料:数据仓库“以供考生们复习使用。自考教材每隔几年都会更新、变动,但相关知识大体不变,考生们抓住考点进行复习即可。
更多资料可查看:互联网数据库考试题库、自考互联网数据库视频、自考教材(相同课程各省教材不一定相同,请按省搜索)。
【学习要求】
通过本章的学习,考生应了解数据仓库的基本概念、框架以及基本操作,并对OLAP有一定的了解。对本章的要求是达到“识记”层次。
【重点、难点】
(一)数据仓库的概念及好处
(二)数据仓库的框架
(三)数据仓库的基本操作
(四)联机分析处理(OLAP)的数据组织模式
【考核知识点】
(一)数据仓库的定义
在支持管理的决策生成过程中,一个面向主题的、集成的、时变的、非易失
的数据集合。
(二)数据仓库的最终目的
将企业范围内的全体数据集成到一个数据仓库中,用户可以方便地从中进行信息查询、产生报表和进行数据分析等。数据仓库是一个决策支撑环境,它从不同的数据源得到数据,组织数据,使得数据有效地支持企业决策。总之,数据仓库是数据管理和数据分析的技术。
(三)数据仓库的好处(选择)
数据仓库的成功实现能为一个企业带来的主要好处是:
①提高公司决策能力②竞争优势③潜在的高投资回报
(四)开发和管理数据仓库的问题
开发和管理一个数据仓库常出现的问题有:低估数据装载工作、源系统隐藏的问题、从现存的数据源捕捉不到的数据、终端用户的需求不断增长、数据差异被忽略、对资源过高需求、数据的所有权问题、高维护性和集成的复杂性。
(五)数据仓库的结构
数据仓库的结构:数据源、装载管理器、数据仓库管理器、查询管理器、详细数据、轻度和高度汇总的数据、归档/备份数据、元数据和终端用户访问工具。
(六)数据仓库的目的是为公司决策者作出战略决策提供信息。这些用户用终端用户访问工具与仓库打交道。有五类访问工具:报表和查询工具、应用程序开发工具、执行信息系统(EIS)工具、联机分析处理(OLAP)工具、数据挖掘工具。此处的执行信息系统工具,又称每个人的信息系统的工具,是一种提供给个人的可按自己风格裁剪系统的所有层次(数据管理、数据分析、决策)的支持工具。
(七)数据仓库主要对五种信息流进行管理:入流(inflow)、上流(upflow)、下流(downflow)、出流(outflow)和元流(metaflow)。
入流:源数据的析取、纯化和装载。
上流:通过对数据汇总、包装和分配增加数据到数据仓库中(增加各级汇总数据)。
下流:存档和备份或恢复仓库中的数据。
出流:使终端用户可以使用数据。
元流:处理元数据。
(八)数据仓库要求多项技术的支持,大致可分为五方面(简答)
(1)导购多数据源集成技术
(2)RDBMS对数据仓库的支撑技术
(3)硬件系统
(4)数据模式设计
(5)决策用的工具和接口软件
(九)数据仓库的工具和技术:析取、纯化和变换工具,数据仓库DBMS,数据仓库元数据和管理工具。
(十)数据仓库管理工具必须能支持的任务:监督来自于多个源的数据装载,数据质量和完整性检查,管理和更新元数据,监督数据库性能以确保高效的查询响应时间和资源利用,统计数据仓库的使用并提供用户费用信息,复制数据同时构造数据子集和分配数据,维护有效的数据存储管理,净化数据,归档和备份数据,实现从故障中恢复和安全管理。
(十一)数据仓库的设计过程主要有:
(1)提取数据特征;(2)设计星状模式;(3)设计雪花状模式;(4)设计星片状模式
(十二)OLAP的数据组织模式(填空)
目前主要有两种组织模式:一种是建立专用的多维数据库系统;另一种是利用现有的关系数据库技术来模拟多维数据,用二维关系表示多维概念。这两种组织方式对应的OLAP系统分别称为多维OLAP(MD-OLAP)和关系OLAP(ROLAP)。
更多复习资料可查看“自考复习资料”栏目。
全专业电子资料、题库、学位、网课
最高直省2344元
上千+科次精品网课
买网课即送全真模考题库
五千+科次教材资料
电子资料满三件9折
五千+科次在线题库
全真呈现历年考试试题