跳转到内容

4.1 数据资源平台

掌握计算服务器、存储设备、数据库技术和数据中心组网技术的核心概念和特点。

计算服务器

  • 主要功能:承载和提供各类业务应用、管理服务及数据资源共享服务
  • 特点要求
    • 高速的CPU计算能力
    • 较大的存储空间
    • 长时间的可靠运行
    • 强大的I/O外部数据吞吐能力
    • 更好的扩展性

人工智能(AI)服务器

  • AI三要素:算力、算法、数据
  • AI芯片分类
    • 训练芯片:注重强大的计算能力
    • 推理芯片:注重综合指标

存储产品类型

存储类型说明
磁盘阵列多个磁盘组合提供高性能存储
磁带机与磁带库适合大容量、长期备份
光盘库适合归档存储
存储区域网络(SAN)采用光纤通道技术,高带宽、低延迟,价格较高,可扩展性较差
网络附加存储(NAS)通过标准网络拓扑结构连接,以文件为传输协议,可扩展性好、价格便宜、用户易管理
对象存储保留大量非结构化数据,兼具SAN的高速直接访问及NAS的分布式共享特点
集中式存储数据集中存储于中心节点,核心部件集中,冗余性和扩展能力较差
分布式存储数据分散存储在多台独立存储设备上,成本较低,扩展能力强,但延迟高、有数据一致性问题

存储技术选择要点

  • SAN:高性能需求,价格不敏感
  • NAS:文件共享,成本敏感
  • 对象存储:海量非结构化数据
  • 集中式:小规模、简单应用
  • 分布式:大规模、高可用需求

数据分类

  • 结构化数据:符合关系型数据库,二维表格式
  • 非结构化数据:没有固定结构的数据

数据库系统分类

数据库类型说明典型产品
关系型数据库存储格式直观反映实体间关系,保证ACID特性Oracle、DB2、MySQL、SQL Server、Access
非关系型数据库(NoSQL)分布式、非关系型、不保证遵循ACID原则,适合文档、图片、文件形式MongoDB、HBase、Redis、Neo4j、GaussDB(for Mongo)

NoSQL特点

  • 灵活的应用场景
  • 使用灵活
  • 适合文档形式、图片形式、文件形式等

数据中心定义: 为互联网业务提供商、内容提供商、政府、企业、媒体、各类网站、个人提供大规模、高质量、安全可靠的专业化服务器托管、空间租用、云计算资源租用、业务应用部署等服务。

数据中心网络结构

  • 网络连接模块
  • 业务接入模块
  • 后台管理模块

数据中心组网架构

  • 核心层:高速交换
  • 汇聚层:汇聚接入
  • 接入层:设备接入
重点 ★★★★☆

数据中心三层架构

核心层→汇聚层→接入层

计算服务器例子

就像银行的总行服务器,需要处理全国所有分支机构的业务,必须具备强大的计算能力、存储能力和稳定性。

SAN和NAS的区别

对比维度SAN(存储区域网络)NAS(网络附加存储)
连接方式光纤通道技术以太网连接
传输协议块级数据传输文件级数据传输
性能特点高带宽、低延迟速度适中、成本低
扩展性较差
价格
适用场景高性能需求(数据库)文件共享、小型应用
形象比喻专用高速公路普通公路

集中式和分布式存储例子

  • 集中式存储:像大型图书馆,所有书都集中在总馆,借阅方便但容量有限
  • 分布式存储:像社区图书馆网络,每个社区都有自己的小图书馆,覆盖面广但协调复杂
知识点关键要点记忆口诀
AI三要素算力、算法、数据AI三要素
SAN特点光纤通道、高带宽、低延迟、价格高、扩展性差SAN特点
NAS特点以太网连接、文件协议、可扩展性好、价格便宜NAS特点
对象存储海量非结构化数据对象存储
集中式vs分布式集中(简单但扩展差)、分布(复杂但扩展强)存储对比
关系型数据库Oracle、DB2、MySQL、SQL Server、ACID特性关系型
NoSQL数据库MongoDB、HBase、Redis、非关系型NoSQL
数据中心三层核心层、汇聚层、接入层三层架构
数据中心三模块网络连接、业务接入、后台管理三模块
练习

SAN存储技术的特点是( )

  • A A. 价格便宜
  • B B. 可扩展性好
  • C C. 高带宽、低延迟
  • D D. 基于以太网
练习

以下属于关系型数据库的是( )

  • A A. MongoDB
  • B B. HBase
  • C C. MySQL
  • D D. Redis
练习

分布式存储的特点不包括( )

  • A A. 成本较低
  • B B. 扩展能力强
  • C C. 延迟低
  • D D. 数据一致性问题
练习

AI服务器的三要素是( )

  • A A. 计算、存储、网络
  • B B. 算力、算法、数据
  • C C. CPU、内存、硬盘
  • D D. 训练、推理、优化
  1. AI三要素:算力、算法、数据
  2. SAN特点:光纤通道、高带宽、低延迟、价格高、扩展性差
  3. NAS特点:以太网连接、文件协议、可扩展性好、价格便宜
  4. 关系型数据库:Oracle、DB2、MySQL、SQL Server,保证ACID特性
  5. NoSQL数据库:MongoDB、HBase、Redis,非关系型
  6. 数据中心三层架构:核心层、汇聚层、接入层
💬 讨论区