数据库:是按照数据结构来组织、存储和管理数据的仓库,是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。
一般来说存储数据用文件就可以了,为什么还要专门搞一个数据库来存储数据呢?
文件保存数据有以下几个缺点:
文件不利于数据查询和管理,例如我们要在一个大的IP文件中查找IP地址为127开头的所有IP地址,那么我们只能使用一些系统调用加上一些编程语言进行边读取边分析,最后得到结果,通过这我们会发现,我们对于文件的数据的查询和管理是比较麻烦的。
安全性问题:数据如果误操作后无法进行回滚。
不利于存储海量数据:文件中数据量越大,用户操控数据的成本越高。
为了解决上述问题,专家们设计出更加利于管理数据的东西——数据库,它能更有效的管理数据。
以MySQL数据库为例,当我们安装好MySQL软件并启动了服务端以后,我们可以在命令行中使用:
ps -axj | head -1 && ps -axj | grep mysql | grep -v grep
我们可以看到有一个mysqld的进程,这个d代表其是守护进程。这个就是mysql的服务端,我们需要使用我们的客户端mysql(不带d)连接mysqld然后才能够管理我们的数据。
mysqld本质是一个网络服务器,我们使用mysql命令连接MySQL服务端时,本质就是MySQL客户端在向MySQL服务端发起连接请求,连接建立成功后MySQL客户端就会将用户输入的SQL语句发送给MySQL服务端,之后MySQL服务端就会根据SQL语句对数据进行对应的操作。
我们可以使用下面的命令,来查看我们的mysqld的网络相关信息,可以看到mysqld数据服务默认采用3306端口号提供服务。
netstat -nltp
数据库的存储介质有以下两种:
所谓安装数据库服务器,只是在机器上安装了一个数据库管理系统程序,这个管理程序可以管理多个数据库,一般开发人员会针对每一个应用创建一个数据库。
为保存应用中实体的数据,一般会在数据库中创建多个表,以保存程序中实体的数据。
SQL Sever: 微软的产品,.Net程序员的最爱,适用于中大型项目。
Oracle: 甲骨文公司的产品,适合大型项目,复杂的业务逻辑,并发一般来说不如MySQL。
MySQL:世界上最受欢迎的数据库,属于甲骨文,并发性好,不适合做复杂的业务。主要用在电商,SNS,论坛。对简单的SQL处理效果好。
PostgreSQL :加州大学伯克利分校计算机系开发的关系型数据库,不管是私用,商用,还是学术研究使用,可以免费使用,修改和分发。
SQLite: 是一款轻型的数据库,是遵守ACID的关系型数据库管理系统,它包含在一个相对小的C库中。它的设计目标是嵌入式的,而且目前已经在很多嵌入式产品中使用了它,它占用资源非常的低,在嵌入式设备中,可能只需要几百K的内存就够了。
H2: 是一个用Java开发的嵌入式数据库,它本身只是一个类库,可以直接嵌入到应用项目中。
解释说明:
此外,如果要连接的是本地的MySQL服务器,那么连接时只需要指明用户名和用户密码即可。如下:
mysql -u 用户名 -p
连接到MySQL服务器后,就可以输入各种SQL语句让服务器执行了,当要退出mysql时直接输入quit或exit或\q即可。如下:
通过systemctl stop mysqld命令或service mysqld stop命令可以停止MySQL服务器。比如:
通过systemctl start mysqld命令或service mysqld start命令可以启动MySQL服务器。比如:
通过systemctl restart mysqld命令或service mysqld restart命令可以重启MySQL服务器。这里没有实验效果,不再演示。
一般来说MySQL配置文件的绝对路径为/etc/my.cnf,打开这个文件
vim /etc/my.cnf
这里面的内容我们的可能不太一样,没有太大的关系。
配置文件中datadir对应的值为/var/lib/mysql,将来MySQL创建的数据库文件都会存储在该目录下,我们可以转到对应的路径下看一看里面的内容。
cd /var/lib/mysql sudo ll
可以看到,里面有一些相关文件,也有一些文件夹,这里的一个文件夹就是一个数据库。
这里我们只是为了见一见数据库的相关操作,关于细节的语法规则我们后面的文章进行讲述。
连接MySQL服务器后,我们可以通过show语句来查看数据库,比如下面的语句来查看mysql的存储目录下的数据库(注意要加;代表结束):
show databases;
可以看到当前目录下有四个数据库,忽略掉information_schema,我们发现,剩下的三个数据库就是上面/var/lib/mysql下的文件夹。
通过create语句创建一个名为db1的数据库,如下:
create database db1;
这时/var/lib/mysql目录下,就会多出一个名为db1的目录。如下:
查看db1目录下的文件,发现只有一个名为的db.opt的文件,该文件中指明了当前数据库的「默认字符编码」和「字符校验规则」(继承自我们的配置文件)。
因此我们创建数据库时,本质就是在MySQL的数据存储路径下新建了一个目录。
通过drop语句删除一个名为db1的数据库,如下:
drop database db1;
此时在MySQL的数据存储路径下的db1目录也就不存在了,因此删除数据库本质就是删除数据存储路径下对应的目录。
通过use语句使用一个名为db1的数据库,如下:
use db1;
使用数据库可以理解成,就是使用cd命令进入到该数据库对应的目录当中。
这里我们通过create语句创建一个简单的student表。比如:
create table if not exists student (id int, name varchar(20), gender varchar(2));
通过show语句可以查看创建的student表时输入的命令(显示的结果与你输入的命令不一定完全一致,因为mysql内部也要进行对命令进行优化)。比如(\G表示格式化输出):
show create table student \G
这时我们在去查看db1目录下的文件,发现多了两个文件分别是student.frm和student.ibd,这时由于student表采用的存储引擎是InnoDB,如果是其他引擎,可能产生的是其他文件。
其中student.frm是表结构文件,student.ibd是表数据和索引的文件。
如果说创建数据库的本质是在数据存储路径下新建一个目录的话,那么创建表本质实际就是在特定的数据库目录下新建若干个文件(InnoDB存储引擎对应的是两个,MyISAM存储引擎对应的是三个),因此在创建表之前一定要先选择一个数据库。
通过desc语句可以查看对应的表结构。比如:
desc student;
通过insert语句可以向表中插入数据,比如:
insert into student (id, name, gender) values ('1', '张三', '男')); insert into student (id, name, gender) values ('2', '李四', '女'); insert into student (id, name, gender) values ('3', '王五', '男');
通过select语句可以查看表中的数据。比如:
select * from student;
可以看出表中的数据是以二维表格的形式进行呈现的,包括行和列。如下:
其中每一行我们称之为是一条「记录」,而每一列都代表一个「属性」(属性列)。
MySQL 是一个可移植的数据库,几乎能在当前所有的操作系统上运行,如 Unix/Linux、Windows、Mac 和 Solaris。各种系统在底层实现方面各有不同,但是 MySQL 基本上能保证在各个平台上的物理体系结构的一致性。
MySQL的架构设计如下:
连接层 :与客户端打交道,上面已经写明了能支持的的语言。客户端的链接支持的协议很多,比如在 Java 开发中的 JDBC。
服务层:在MySQL数据库系统处理底层数据之前的所有工作都是在这一层完成的,包括权限判断、SQL接口、SQL解析、SQL分析优化、缓存查询的处理以及部分内置函数执行等。各个存储引擎提供的功能都集中在这一层,如存储过程、触发器、试图等。
服务层:由多种可拔插的存储引擎共同组成,真正负责MySQL中数据的存储和提取,每个存储引擎都有自己的优点和缺陷,服务层是通过存储引擎API来与它们交互的。
存储层:将数据存储在裸设备的文件系统之上,完成存储引擎的交互。
站在操作系统角度:上三层都属于用户层,存储层是内核层
站在网络的角度:上三层都属于应用层,存储层属于传输层和网络层。
DDL【data definition language】 数据定义语言,用来维护存储数据的结构,代表指令: create, drop, alter。
DML【data manipulation language】 数据操纵语言,用来对数据进行操作,代表指令: insert,delete,update
DCL【Data Control Language】 数据控制语言,主要负责权限管理和事务,代表指令: grant,revoke,commit
MySQL服务器会收到MySQL客户端发来的SQL语句,并根据SQL语句执行对应的操作。
mysql命令本质是一个可执行程序,通过file命令可以看到该可执行程序是采用动态链接的方式生成的,通过ldd命令可以看到该可执行程序依赖的C/C++库文件。如下:
也就是说,mysql命令本身就是C/C++编写的,因此在编写mysql程序时,一定需要调用MySQL提供给C/C++的语言接口客户端。当然,MySQL不仅仅提供了C/C++对应的语言接口,像Python、Java、PHP等都有对应的MySQL接口。
存储引擎是:数据库管理系统如何存储数据、如何为存储的数据建立索引和如何更新、查询数据等技术的实现方法。
MySQL的核心就是插件式存储引擎,支持多种存储引擎。
通过show语句可以查看MySQL支持的存储引擎。比如:
show engines;
其中MySQL底层默认使用的存储引擎是InnoDB,该存储引擎支持事务、行级锁、外键等。
存储引擎对比
建议记忆:InnoDB存储引擎是支持事务的,而MyISAM存储引擎是不支持的,其他的有需要再根据表进行查看就行了。