关系型数据库设计规则

关系型数据库的典型数据结构就是数据表，这些数据表的组成都是结构化的（Structured）。

将数据放到表中，表再放到库中。

一个数据库中可以有多个表，每个表都有一个名字，用来标识自己。表名具有唯一性。

表具有一些特性，这些特性定义了数据在表中如何存储，类似Java和Python中 “类”的设计。

表、记录、字段

E-R（entity-relationship，实体-联系）模型中有三个主要概念是：实体集、属性、联系集。一个实体集（class）对应于数据库中的一个表（table），一个实体（instance）则对应于数据库表中的一行（row），也称为一条记录（record）。一个属性（attribute）对应于数据库表中的一列（column），也称为一个字段（field）。

ORM思想（Object Relational Mapping）体现：

数据库中的一个表 <----> 一个类
表中的一条数据 <----> 类中的一个对象（或实体）
表中的一个列 <----> 类中的一个字段、属性(field)

表的关联关系

表与表之间的数据记录有关系(relationship)。现实世界中的各种实体以及实体之间的各种联系均用关系模型来表示。四种：一对一关联、一对多关联、多对多关联、自我引用。

实现关系

一对多(多对一)：如：部门和员工实现方式：在多的一方建立外键，指向一的一方的主键。
多对多：如：学生和课程实现方式：多对多关系实现需要借助第三张中间表。中间表至少包含两个字段，这两个字段作为第三张表的外键，分别指向两张表的主键。
一对一(了解)：如：人和身份证实现方式：一对一关系实现，可以在任意一方添加唯一外键指向另一方的主键。

案例

以旅游网站为例，可能存在着旅游线路分类表、旅游线路表、用户表。其中，在旅游线路分类中会有多个旅游线路，一个用户可以收藏多个旅游线路，一个旅游线路可以被多个用户收藏。

 -- 创建旅游线路分类表 tab_category
 -- cid 旅游线路分类主键，自动增长
 -- cname 旅游线路分类名称非空，唯一，字符串 100
 CREATE TABLE tab_category (
     cid INT PRIMARY KEY AUTO_INCREMENT,
     cname VARCHAR(100) NOT NULL UNIQUE
 );

 -- 创建旅游线路表 tab_route
 /*
 rid 旅游线路主键，自动增长
 rname 旅游线路名称非空，唯一，字符串 100
 price 价格
 rdate 上架时间，日期类型
 cid 外键，所属分类
 */
 CREATE TABLE tab_route(
     rid INT PRIMARY KEY AUTO_INCREMENT,
     rname VARCHAR(100) NOT NULL UNIQUE,
     price DOUBLE,
     rdate DATE,
     cid INT,
     FOREIGN KEY (cid) REFERENCES tab_category(cid)
 );
         
 /*创建用户表 tab_user
 uid 用户主键，自增长
 username 用户名长度 100，唯一，非空
 password 密码长度 30，非空
 name 真实姓名长度 100
 birthday 生日
 sex 性别，定长字符串 1
 telephone 手机号，字符串 11
 email 邮箱，字符串长度 100
 */
 CREATE TABLE tab_user (
     uid INT PRIMARY KEY AUTO_INCREMENT,
     username VARCHAR(100) UNIQUE NOT NULL,
     PASSWORD VARCHAR(30) NOT NULL,
     NAME VARCHAR(100),
     birthday DATE,
     sex CHAR(1) DEFAULT '男',
     telephone VARCHAR(11),
     email VARCHAR(100)
 );
         
 /*
 创建收藏表 tab_favorite
 rid 旅游线路 id，外键
 date 收藏时间
 uid 用户 id，外键
 rid 和 uid 不能重复，设置复合主键，同一个用户不能收藏同一个线路两次
 */
 CREATE TABLE tab_favorite (
     rid INT, -- 线路id
     DATE DATETIME,
     uid INT, -- 用户id
     -- 创建复合主键
     PRIMARY KEY(rid,uid), -- 联合主键
     FOREIGN KEY (rid) REFERENCES tab_route(rid),
     FOREIGN KEY(uid) REFERENCES tab_user(uid)
 );

数据库设计的范式

概念

设计数据库时，需要遵循的一些规范。要遵循后边的范式要求，必须先遵循前边的所有范式要求。

设计关系数据库时，遵从不同的规范要求，设计出合理的关系型数据库，这些不同的规范要求被称为不同的范式，各种范式呈递次规范，越高的范式数据库冗余越小。

目前关系数据库有六种范式：第一范式（1NF）、第二范式（2NF）、第三范式（3NF）、巴斯-科德范式（BCNF）、第四范式(4NF）和第五范式（5NF，又称完美范式）。

几个概念

函数依赖：A→B,如果通过A属性(属性组)的值，可以确定唯一B属性的值。则称B依赖于A例如：学号–>姓名。（学号，课程名称） → 分数
完全函数依赖：A→B，如果A是一个属性组，则B属性值的确定需要依赖于A属性组中所有的属性值。例如：（学号，课程名称）→分数
部分函数依赖：A–>B，如果A是一个属性组，则B属性值的确定只需要依赖于A属性组中某一些值即可。例如：（学号，课程名称）→姓名
传递函数依赖：A→B, B→C，如果通过A属性(属性组)的值，可以确定唯一B属性的值，在通过B属性（属性组）的值可以确定唯一C属性的值，则称 C 传递函数依赖于A。例如：学号→系名，系名→系主任
码：如果在一张表中，一个属性或属性组，被其他所有属性所完全依赖，则称这个属性(属性组)为该表的码。例如：该表中码为：（学号，课程名称）
主属性：码属性组中的所有属性。
非主属性：除过码属性组的属性。