【腾讯云 TDSQL-C Serverless 产品体验】| 实战分享_百度小程序

一. 🦁 产品引入

在当今云计算时代，不同类型的业务对高弹性、高可用性和可扩展性的需求越来越强烈，按需使用资源成为企业所需要的关键功能。为了满足这些需求，云原生数据库的Serverless化已经成为云数据库发展的重要方向之一。

过去，云数据库的发展经历了几个时代。在1.0时代，主要侧重于提供云托管的数据库服务，使用户能够将数据库迁移到云中，但管理仍然需要一定程度的关注。在2.0时代，随着容器技术的发展，出现了容器架构的云原生数据库，使数据库能够更好地与容器和微服务一起工作，实现更灵活的部署和管理。

然而，3.0时代正在迅速到来，云Serverless数据库将成为主流趋势。Serverless数据库将进一步解放用户，让他们无需关心底层基础设施的管理。这种模型下，用户只需关注数据和应用逻辑，而云服务提供商会自动处理底层的资源管理、扩展性和备份等任务。这不仅可以提高开发效率，还可以降低成本，因为资源使用是按需付费的。

【腾讯云 TDSQL-C Serverless 产品体验】| 实战分享,在这里插入图片描述,第1张

腾讯云数据库的"TDSQL-C Serverless"新版本的发布，标志着云原生数据库的Serverless化进程已经进入全面推进的阶段。这个趋势将继续推动云数据库的创新，满足不断变化的业务需求，为企业提供更强大、更灵活的数据库解决方案。

新升级的TDSQL-C推出全球首个可释放存储架构的Serverless服务。当前，业内的Serverless无法完全做到不使用不付费，一般实例暂停后仍然会收取高昂的存储费用，可释放存储将彻底解决这一问题。当实例暂停后，数据会进行归档存储，用户无需再为高额的分布式存储进行付费，可在原实例暂停后的存储费用上降低成本80%。

看到这里小伙伴们已经非常迫不及待了吧？跟着狮子来体验一下这个产品的性能是否真如介绍那样优秀叭！！！

二. 🦁 TDSQL-C数据库使用体验——实战案例

2.1 实战案例介绍

本次我们使用python 语言进行TDSQL Serverless MySQL 进行体验, 实现思路如下:

读取多个本地的 excel 文件 ,并将读取的数据存储到TDSQL 中
从TDSQL 读取存储的数据
将读取的数据生成词云图,并展示；

2.2 实操指导

1. 购买TDSQL数据库

点击链接进入腾讯云腾讯云链接注册并登录

在搜索框输入 TDSQL-C MYSQL 版 , 点击搜索

【腾讯云 TDSQL-C Serverless 产品体验】| 实战分享,在这里插入图片描述,第2张

2. 配置选择

注意选择Serverless 的实例形态哦!!!

【腾讯云 TDSQL-C Serverless 产品体验】| 实战分享,在这里插入图片描述,第3张

【腾讯云 TDSQL-C Serverless 产品体验】| 实战分享,在这里插入图片描述,第4张

3. 配置TDSQL-C 集群

将外部读写地址开启

【腾讯云 TDSQL-C Serverless 产品体验】| 实战分享,在这里插入图片描述,第5张

4. 点击授权并创建

【腾讯云 TDSQL-C Serverless 产品体验】| 实战分享,在这里插入图片描述,第6张

5. 记住主机名和端口

【腾讯云 TDSQL-C Serverless 产品体验】| 实战分享,在这里插入图片描述,第7张

6. 登录TDSQL

点击集群的登录按钮

7. 链接数据库

【腾讯云 TDSQL-C Serverless 产品体验】| 实战分享,在这里插入图片描述,第9张

8. 自己创建相应的库（这里省略）

【腾讯云 TDSQL-C Serverless 产品体验】| 实战分享,在这里插入图片描述,第10张

9. 项目目录结构

拉取完相关资源文件后，来实操一把，项目目录结构如下：

【腾讯云 TDSQL-C Serverless 产品体验】| 实战分享,在这里插入图片描述,第11张

10. 创建读取excel文件的函数

def excelTomysql():
    path = '词频'  # 文件所在文件夹
    files = [path + "/" + i for i in os.listdir(path)]  # 获取文件夹下的文件名,并拼接完整路径
    for file_path in files:
        print(file_path)
        filename = os.path.basename(file_path)
        table_name = os.path.splitext(filename)[0]  # 使用文件名作为表名，去除文件扩展名
        # 使用pandas库读取Excel文件
        data = pd.read_excel(file_path, engine="openpyxl", header=0)  # 假设第一行是列名
        columns = {col: "VARCHAR(255)" for col in data.columns}  # 动态生成列名和数据类型
        create_table(table_name, columns)  # 创建表
        save_to_mysql(data, table_name)  # 将数据保存到MySQL数据库中，并使用文件名作为表名
        print(filename + ' uploaded and saved to MySQL successfully')

11. 根据excel文件名创建数据库表名

def create_table(table_name, columns):
    # 建立MySQL数据库连接
    conn = pymysql.connect(**db_config)
    cursor = conn.cursor()
    # 组装创建表的 SQL 查询语句
    query = f"CREATE TABLE IF NOT EXISTS {table_name} ("
    for col_name, col_type in columns.items():
        query += f"{col_name} {col_type}, "
    query = query.rstrip(", ")  # 去除最后一个逗号和空格
    query += ")"
    # 执行创建表的操作
    cursor.execute(query)
    # 提交事务并关闭连接
    conn.commit()
    cursor.close()
    conn.close()

12. 将读取的excel 数据保存到数据库对应的表中

def save_to_mysql(data, table_name):
    # 建立MySQL数据库连接
    conn = pymysql.connect(**db_config)
    cursor = conn.cursor()
    # 将数据写入MySQL表中（假设数据只有一个Sheet）
    for index, row in data.iterrows():
        query = f"INSERT INTO {table_name} ("
        for col_name in data.columns:
            query += f"{col_name}, "
        query = query.rstrip(", ")  # 去除最后一个逗号和空格
        query += ") VALUES ("
        values = tuple(row)
        query += ("%s, " * len(values)).rstrip(", ")  # 动态生成值的占位符
        query += ")"
        cursor.execute(query, values)
    # 提交事务并关闭连接
    conn.commit()
    cursor.close()
    conn.close()

13. 读取数据库中存入的数据

def query_data():
    # 建立MySQL数据库连接
    conn = pymysql.connect(**db_config)
    cursor = conn.cursor()
    # 查询所有表名
    cursor.execute("SHOW TABLES")
    tables = cursor.fetchall()
    data = []
    dic_list = []
    table_name_list = []
    for table in tables:
        # for table in [tables[-1]]:
        table_name = table[0]
        table_name_list.append(table_name)
        query = f"SELECT * FROM {table_name}"
        # # 执行查询并获取结果
        cursor.execute(query)
        result = cursor.fetchall()
        if len(result) > 0:
            columns = [desc[0] for desc in cursor.description]
            table_data = [{columns[i]: row[i] for i in range(len(columns))} for row in result]
            data.extend(table_data)
        dic = {}
        for i in data:
            dic[i['word']] = float(i['count'])
        dic_list.append(dic)
    conn.commit()
    cursor.close()
    conn.close()
    return dic_list, table_name_list

14. 执行函数,并生成词云图

if __name__ == '__main__':
    ##excelTomysql()方法将excel写入到mysql
    excelTomysql()
    print("excel写入到mysql成功！")
    # query_data()方法将mysql中的数据查询出来，每张表是一个dic，然后绘制词云
    result_list, table_name_list = query_data()
    print("从mysql获取数据成功！")
    for i in range(len(result_list)):
        maskImage = np.array(Image.open('background.PNG'))  # 定义词频背景图
        # 定义词云样式
        wc = wordcloud.WordCloud(
            font_path='PingFangBold.ttf', # 设置字体
            mask=maskImage,  # 设置背景图
            max_words=500,  # 最多显示词数
            max_font_size=100)  # 字号最大值
        # 生成词云图
        wc.generate_from_frequencies(result_list[i])  # 从字典生成词云
        # 保存图片到指定文件夹
        wc.to_file("词云图/{}.png".format(table_name_list[i]))
        print("生成的词云图【{}】已经保存成功！".format(table_name_list[i] + '.png'))
        # 在notebook中显示词云图
        plt.imshow(wc)  # 显示词云
        plt.axis('off')  # 关闭坐标轴
        plt.show()  # 显示图像

15. 词云图效果展示

【腾讯云 TDSQL-C Serverless 产品体验】| 实战分享,在这里插入图片描述,第12张

【腾讯云 TDSQL-C Serverless 产品体验】| 实战分享,在这里插入图片描述,第13张

【腾讯云 TDSQL-C Serverless 产品体验】| 实战分享,在这里插入图片描述,第14张

16.终端效果展示

【腾讯云 TDSQL-C Serverless 产品体验】| 实战分享,在这里插入图片描述,第15张

17. 完整代码

import pymysql
import pandas as pd
import os
import wordcloud
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt
# MySQL数据库连接配置
db_config = {
    'host': "gz-xxxxxxysql-grp-kb212sal.sql.tencentcdb.com",  # 主机名
    'port': 25648,  # 端口
    'user': "root",  # 账户
    'password': "TDSQL-C@!@Rgpk14.",  # 密码
    'database': 'db0',
}
def create_table(table_name, columns):
    # 建立MySQL数据库连接
    conn = pymysql.connect(**db_config)
    cursor = conn.cursor()
    # 组装创建表的 SQL 查询语句
    query = f"CREATE TABLE IF NOT EXISTS {table_name} ("
    for col_name, col_type in columns.items():
        query += f"{col_name} {col_type}, "
    query = query.rstrip(", ")  # 去除最后一个逗号和空格
    query += ")"
    # 执行创建表的操作
    cursor.execute(query)
    # 提交事务并关闭连接
    conn.commit()
    cursor.close()
    conn.close()
def excelTomysql():
    path = '词频'  # 文件所在文件夹
    files = [path + "/" + i for i in os.listdir(path)]  # 获取文件夹下的文件名,并拼接完整路径
    for file_path in files:
        print(file_path)
        filename = os.path.basename(file_path)
        table_name = os.path.splitext(filename)[0]  # 使用文件名作为表名，去除文件扩展名
        # 使用pandas库读取Excel文件
        data = pd.read_excel(file_path, engine="openpyxl", header=0)  # 假设第一行是列名
        columns = {col: "VARCHAR(255)" for col in data.columns}  # 动态生成列名和数据类型
        create_table(table_name, columns)  # 创建表
        save_to_mysql(data, table_name)  # 将数据保存到MySQL数据库中，并使用文件名作为表名
        print(filename + ' uploaded and saved to MySQL successfully')
def save_to_mysql(data, table_name):
    # 建立MySQL数据库连接
    conn = pymysql.connect(**db_config)
    cursor = conn.cursor()
    # 将数据写入MySQL表中（假设数据只有一个Sheet）
    for index, row in data.iterrows():
        query = f"INSERT INTO {table_name} ("
        for col_name in data.columns:
            query += f"{col_name}, "
        query = query.rstrip(", ")  # 去除最后一个逗号和空格
        query += ") VALUES ("
        values = tuple(row)
        query += ("%s, " * len(values)).rstrip(", ")  # 动态生成值的占位符
        query += ")"
        cursor.execute(query, values)
    # 提交事务并关闭连接
    conn.commit()
    cursor.close()
    conn.close()
def query_data():
    # 建立MySQL数据库连接
    conn = pymysql.connect(**db_config)
    cursor = conn.cursor()
    # 查询所有表名
    cursor.execute("SHOW TABLES")
    tables = cursor.fetchall()
    data = []
    dic_list = []
    table_name_list = []
    for table in tables:
        # for table in [tables[-1]]:
        table_name = table[0]
        table_name_list.append(table_name)
        query = f"SELECT * FROM {table_name}"
        # # 执行查询并获取结果
        cursor.execute(query)
        result = cursor.fetchall()
        if len(result) > 0:
            columns = [desc[0] for desc in cursor.description]
            table_data = [{columns[i]: row[i] for i in range(len(columns))} for row in result]
            data.extend(table_data)
        dic = {}
        for i in data:
            dic[i['word']] = float(i['count'])
        dic_list.append(dic)
    conn.commit()
    cursor.close()
    conn.close()
    return dic_list, table_name_list
if __name__ == '__main__':
    ##excelTomysql()方法将excel写入到mysql
    excelTomysql()
    print("excel写入到mysql成功！")
    # query_data()方法将mysql中的数据查询出来，每张表是一个dic，然后绘制词云
    result_list, table_name_list = query_data()
    print("从mysql获取数据成功！")
    for i in range(len(result_list)):
        maskImage = np.array(Image.open('background.PNG'))  # 定义词频背景图
        # 定义词云样式
        wc = wordcloud.WordCloud(
            font_path='PingFangBold.ttf', # 设置字体
            mask=maskImage,  # 设置背景图
            max_words=500,  # 最多显示词数
            max_font_size=100)  # 字号最大值
        # 生成词云图
        wc.generate_from_frequencies(result_list[i])  # 从字典生成词云
        # 保存图片到指定文件夹
        wc.to_file("词云图/{}.png".format(table_name_list[i]))
        print("生成的词云图【{}】已经保存成功！".format(table_name_list[i] + '.png'))
        # 在notebook中显示词云图
        plt.imshow(wc)  # 显示词云
        plt.axis('off')  # 关闭坐标轴
        plt.show()  # 显示图像

三. 🦁 传统主从架构与TDSQL-C 计算与存储分离架构的对比

【腾讯云 TDSQL-C Serverless 产品体验】| 实战分享,在这里插入图片描述,第16张

3.1 传统MySQL主从架构痛点

复制延迟：主从复制中，从服务器复制主服务器上的数据。由于网络延迟、大事务、复杂查询等原因，从服务器上的数据可能会滞后于主服务器，造成数据不一致。
单点故障：主从复制架构中，主服务器是关键的单点。如果主服务器发生故障，从服务器无法继续同步数据，可能需要进行手动切换以恢复。
数据一致性：由于复制延迟等原因，从服务器上的数据可能不是实时更新的，这可能会导致应用程序在读取从服务器时获得不一致的结果。
写入压力集中：所有写入操作都要发送到主服务器，可能会导致主服务器成为性能瓶颈，尤其是在高写入负载下。
复制链路故障：如果主从复制链路遇到故障，可能会导致从服务器无法正常复制数据，需要进行手动干预来修复。
数据冲突：如果在主从复制架构中同时进行写入操作，可能会导致数据冲突和不一致，需要谨慎处理。
拓扑复杂性：在复杂的应用场景中，可能涉及多个主服务器和从服务器，管理和维护这些服务器的拓扑关系可能会变得复杂。
备份和恢复：备份和恢复可能会变得复杂，需要确保备份不会影响主从复制的正常运行。
数据处理能力不均衡：由于主从复制是单向的，从服务器无法直接处理写入操作，可能导致主服务器和从服务器之间的数据处理能力不均衡。

3.2 TDSQL-C 计算与存储分离架构的优势

在传统的 MySQL 主从复制架构的基础上进行了创新，带来了许多优势：
- 性能与扩展性：基于全新架构 HTAP 能力，基于列的数据存储和查询处理,与面向行的传统存储相比，最多可实现十倍以上的查询性能提升，计算与存储分离架构使得计算节点和存储节点可以独立扩展。这意味着可以根据实际需求，独立地扩展计算资源和存储资源，从而更好地适应不同的负载情况，提高了数据库的整体性能和扩展性。
- 资源隔离：通过将计算和存储分开，可以更好地隔离不同的工作负载。计算节点可以专注于处理查询、分析等任务，而存储节点可以专注于数据的持久化和管理，从而降低了互相干扰的可能性。
- 灵活性和弹性：由于计算和存储是独立的，可以根据需要灵活地调整计算资源和存储资源的比例。这样在负载波动较大的情况下，可以更有效地分配资源，提供更好的弹性。
- 降低复杂性：传统的主从复制架构中，主从之间需要保持同步，管理复杂。计算与存储分离架构简化了复制和同步的逻辑，减少了复杂性和潜在的问题。
- 高可用性：由于计算和存储是分离的，可以更容易地实现计算节点和存储节点的高可用性。在某个节点发生故障时，可以更快速地进行故障转移或恢复。
- 资源利用率：通过独立扩展计算和存储节点，可以更有效地利用资源。例如，可以根据查询和分析的需求，灵活地配置计算资源，从而提高资源利用率。
  
  3.3 存储架构原理
  - DBClient数据路由机制
  - 1. 当计算节点启动时，DBClient 从 DBMaster 查询 Space 信息、Range 列表等；
  - 1. 计算节点写入表数据时,DBClient 根据路由信息,将 log 发送到对应的 cell pair。存储层接受日志并持久化到物理存储后回复 DBCIient,后者回复给计算节点，最终完成写入；
  - 1. 当计算节点读取数据时，将请求委派给 DBCIent，后者通过路由信息从存储获取数据页，并返回给计算节点，从而完成数据读取。
  - 存储层架构
  - 1. 1个存储集群由几十或上百个 cell pair 组成；
  - 1. cell pair 采用主从架构，保证数据三副本；
  - 1. 每个range 是2G(可调整)文件,一张大表(比如 100G)拆分成多个range 分布在多个 cell pair,最终实现海量存储空间及超高10 能力；
    四. 🦁 总结
    
    云原生时代，面对海量数据的存储，高并发负载和复杂查询等场景，这样的数据库出现，你爱了吗？
    
    更多活动可继续关注上方🦁的博客，好运总会轮到你！！！

上一篇：MySQL(62)MySQL INSERT：插入数据（添加数据）

下一篇：【SpringMVC篇】5种类型参数传递&&json数据传参

目录