概念模型例子
就像画房子的设计图,只关注房间布局、功能分区,不关心用砖还是用钢筋建造。
掌握数据建模、数据运维、数据质量、数据利用以及数据库安全等数据工程的核心概念和方法。
概念模型(信息模型):
逻辑模型:
物理模型:
数据建模过程:
| 阶段 | 内容 | 关注点 | 产出 |
|---|---|---|---|
| 数据需求分析 | 采用数据流图作为工具 | 了解业务需求 | 需求规格说明 |
| 概念模型设计 | 按用户的观点来对数据和信息建模 | 业务逻辑 | 概念模型图 |
| 逻辑模型设计 | 确定模型的数据结构 | 数据结构 | 关系模型图 |
| 物理模型设计 | 考虑技术实现因素 | 性能优化 | 物理模型设计 |
需求分析 → 概念模型 → 逻辑模型 → 物理模型
主要内容:元数据标准化、数据元标准化、数据模式标准化、数据分类与编码标准化
四个阶段:
备份策略:
| 策略 | 定义 | 优点 | 缺点 | 可靠性 |
|---|---|---|---|---|
| 完全备份 | 对整个系统的所有数据进行完整备份 | 恢复简单、数据完整性最好 | 备份时间长、占用空间大 | 高(独立完整) |
| 差分备份 | 只备份自上一次完全备份后发生变化的数据 | 比完全备份快、恢复只需两份 | 差分文件会越来越大 | 中(依赖单次全备) |
| 增量备份 | 只备份自上一次任何类型备份后发生变化的数据 | 备份最快、空间最小 | 恢复最复杂(需拼凑多份) | 中低(依赖备份链) |
数据容灾:
完全=全部备份 | 差分=相对完全备份的变化 | 增量=相对上次备份的变化
数据清理的三个步骤:
| 步骤 | 操作内容 | 方法 | 记忆要点 |
|---|---|---|---|
| 数据分析 | 从数据中发现控制数据的一般规则 | 统计分析、规则提取 | 发现规律 |
| 数据检测 | 根据预定义的清理规则检测数据是否正确 | 规则匹配、异常检测 | 检查问题 |
| 数据修正 | 手工或自动地修正检测到的错误数据 | 手工修正、自动清洗 | 修复错误 |
数据挖掘:
数据服务:
数据库安全机制:
| 安全机制 | 功能 | 记忆要点 |
|---|---|---|
| 身份认证 | 验证用户身份 | 证明身份 |
| 存取控制 | 控制用户访问权限 | 控制权限 |
| 数据库加密 | 保护数据机密性 | 数据保护 |
| 数据审计 | 记录操作日志 | 记录行为 |
| 推理控制 | 防止敏感信息泄露 | 防止泄露 |
概念模型例子
就像画房子的设计图,只关注房间布局、功能分区,不关心用砖还是用钢筋建造。
逻辑模型例子
就像确定房子用框架结构还是砖混结构,选择具体的建筑方式。
物理模型例子
就像具体施工,确定用多少号水泥、什么规格钢筋、多厚的墙体。
数据容灾例子
就像买房,RPO是能接受多大损失(如房子没了但地还在,损失不大),RTO是多久能重新有房住(如租房过渡一段时间)。
数据挖掘例子
超市发现买尿布的人通常也会买啤酒,这就是通过分析购物数据发现的关联规律,用于商品摆放和促销。
| 知识点 | 关键要点 | 记忆口诀 |
|---|---|---|
| 数据模型三类 | 概念模型(用户观点)、逻辑模型(数据结构)、物理模型(实现方式) | 三模型 |
| 关系完整性三约束 | 实体完整性、参照完整性、用户定义完整性 | 三约束 |
| 数据标准化四阶段 | 确定需求→制定标准→批准标准→实施标准 | 四阶段 |
| 备份三策略 | 完全、差分、增量 | 三策略 |
| 容灾两指标 | RPO(数据丢失量)、RTO(恢复时间) | 两指标 |
| 数据清理三步骤 | 数据分析→数据检测→数据修正 | 三步骤 |
| 数据库安全五机制 | 身份认证、存取控制、加密、审计、推理控制 | 五机制 |