DP读书:鲲鹏处理器 架构与编程(十四)ACPI与软件架构具体调优
作者:mmseoamin日期:2023-12-11

一分钟速通ACPI和鲲鹏软件移植

  • 操作系统内核
  • 鲲鹏软件移植
    • 鲲鹏软件移植流程
    • 编译工具选择
      • 编译参数移植案例
      • 源码修改案例
      • 鲲鹏分析扫描工具 Dependency Advisor
      • 鲲鹏代码迁移工具 Porting Advisor
      • 鲲鹏软件性能调优
        • 鲲鹏软件性能调优流程
        • CPU与内存子系统性能调优
        • 网络子系统性能调优
        • 磁盘I/O子系统性能调优
        • 应用程序性能调优
        • 基础软件性能调优
        • 鲲鹏性能优化工具 Tuning Kit

          操作系统内核

          ACPI(Advanced Configuration and Power Interface)

          是一种由英特尔、微软、惠普、索尼等公司共同开发的电源管理标准。它提供了一种通用的电源管理接口,用于管理计算机系统的电源状态、性能和配置等方面。

          在计算机系统中,ACPI负责处理电源管理事件,例如系统启动、关机、休眠、唤醒等。它还提供了对硬件设备、散热设备、电池和其他设备的控制能力。

          ACPI在计算机系统中扮演着重要的角色,它能够提高系统的能源效率和延长电池寿命,同时提供更好的系统性能和稳定性。

          DP读书:鲲鹏处理器 架构与编程(十四)ACPI与软件架构具体调优,ACPI的ARM关系图,第1张

          ARM64平台的Device Tree定义在Linux源码的arch/arm64/boot/dts/目录下。Device Tree是用于描述系统硬件的一种数据结构,它被用于在引导过程中初始化硬件。

          下面是一个简单的ARM64平台Device Tree的示例,这是一个虚拟设备树,只为了理解基本概念。在实际设备树中,会有更多详细的属性和配置。

          对不起,我不能直接处理C语言的代码。但是我可以帮你理解一个ARM64平台设备树(Device Tree)的基本结构,并且我可以给你一个例子。

          git clone https://github.com/torvalds/linux.git
          cd linux
          cd scripts/dtc/
          make
          sudo make install PREFIX=/usr/local
          // SPDX-License-Identifier: GPL-2.0
          /*
           * Example Device Tree for ARM64 SoC
           *
           * This is a simple example showing the basic structure of a Device Tree for an ARM64 platform.
           */
          /dts-v1/;
          / {
              compatible = "example,arm64";
              model = "Example ARM64 SoC";
              memory@80000000 {
                  device_type = "memory";
                  reg = <0x0 0x80000000 0x0 0x80000000>; // 2 GiB of memory starting from 0x80000000
              };
              chosen {
                  bootargs = "console=ttyAMA0,115200";
              };
              uart@9000000 {
                  compatible = "example,uart";
                  reg = <0x0 0x9000000 0x0 0x1000>;
                  interrupt-parent = <&gic>;
                  interrupts = <0 13 4>; // interrupt number 13, active high, level triggered
              };
              gic: interrupt-controller {
                  compatible = "example,gic-v3";
                  interrupt-controller;
                  #interrupt-cells = <3>;
                  interrupt-parent = <&gic_cpuif>;
              };
              gic_cpuif: interrupt-controller@5000 {
                  compatible = "example,gic-v3-cpuif";
                  reg = <0x0 0x5000 0x0 0x1000>;
                  interrupts = <0 8 1>; // interrupt number 8, active high, edge triggered
                  interrupt-parent = <&gic>;
              };
          };
          

          鲲鹏软件移植

          DP读书:鲲鹏处理器 架构与编程(十四)ACPI与软件架构具体调优,高层软件的架构,第2张

          鲲鹏软件移植流程

          鲲鹏软件移植流程包括以下步骤:

          1. 准备JDK:安装ARM版本JDK。
          2. 配置环境变量:配置JDK路径等环境变量。
          3. 编译:Java源码生成字节码。
          4. 测试:启动Java程序,调试功能。

          以上就是鲲鹏软件移植的完整流程

          编译工具选择

          编译工具的选择主要取决于你使用的编程语言和开发环境。以下是一些常见的编译工具:

          1. Microsoft Visual Studio:这是一个完整的开发工具集,适用于C/C++/C#等编程语言,适用于微软支持的所有平台。它包括了UML工具、代码管控工具、集成开发环境(IDE)等,是一个非常实用且强大的代码编写开发软件。
          2. GCC:GNU Compiler Collection(GCC)是一个用于编程语言编译的软件,它支持C、C++、Objective-C、Fortran、Ada等语言。
          3. Clang:Clang是一个基于LLVM的C/C++/Objective-C编译器,它主要用于优化编译效率和代码质量。
          4. Java Development Kit (JDK):如果你正在开发Java应用程序,那么你需要JDK,它包含了Java编译器(Javac)和其他工具。
          5. Python解释器和编译器:Python是一种解释型语言,因此它不需要编译器。但是,Python有各种解释器和编译器,如CPython、Jython、IronPython等。

            这只是其中的一部分,实际上还有很多其他的编译工具可供选择。你应该根据自己的具体需求和习惯来选择适合你的编译工具。

          编译参数移植案例

          在编译过程中,一些特定的编译参数可能会影响到编译的结果和适应性。以下是一些编译参数的案例,这些参数在移植过程中可能会起到关键作用:

          1. -march 和 -mtune:这两个参数用于指定目标处理器架构。例如,-march=native 将使编译器优化为运行在本地硬件上,而 -march=x86_64 将优化为运行在64位x86处理器上。
          2. -fPIC (Position-Independent Code):该参数用于生成位置无关的代码,这在实现共享库时非常重要。
          3. -I:该参数用于指定头文件的搜索路径。在移植过程中,可能需要修改此参数以适应新的环境。
          4. -L:该参数用于指定库文件的搜索路径。同样,在移植过程中,可能需要修改此参数。
          5. -l:该参数用于指定要链接的库。这可能涉及到链接到不同的库文件,以适应新的环境。
          6. -D:该参数用于定义宏。在移植过程中,可能需要定义新的宏以适应新的环境。
          

          请注意,以上只是一些常见的编译参数示例,实际上还有许多其他的编译参数可以在移植过程中使用。具体的参数选择将取决于你的需求和目标平台的具体情况。

          源码修改案例

          源码修改案例主要是针对特定的需求或问题,对程序源代码进行修改和优化。以下是一个简单的源码修改案例:

          假设我们有一个C语言程序,其中有一个函数名为 calculate_average,它接收一个整数数组和数组的长度作为输入,计算数组的平均值并返回结果。

          double calculate_average(int* arr, int length) {
              double sum = 0.0;
              for (int i = 0; i < length; i++) {
                  sum += arr[i];
              }
              return sum / length;
          }
          

          现在我们想要修改这个函数,使其能够忽略数组中的任何负数并直接跳过计算。我们可以添加一个简单的判断语句来实现这个功能。

          double calculate_average(int* arr, int length) {
              double sum = 0.0;
              for (int i = 0; i < length; i++) {
                  if (arr[i] >= 0) {
                      sum += arr[i];
                  }
              }
              return sum / length;
          }
          

          通过这个修改,函数现在只会计算数组中的非负数,并返回它们的平均值。这可以应用于任何包含负数的数组,以忽略它们并获得更准确的结果。

          请注意,这只是一个简单的例子,实际的源码修改可能会更加复杂和涉及更多的细节。在修改源代码之前,建议进行充分的测试和备份(在虚拟机上跑没问题再上),以确保修改不会引入错误或破坏原始功能。

          鲲鹏分析扫描工具 Dependency Advisor

          Dependency Advisor 是一款可以简化客户应用迁移到鲲鹏服务器过程的工具。它主要安装在X86服务器上,用于分析可移植性和移植投入。该工具支持检查用户软件资源包(RPM、JAR、TAR、zip、gzip 文件)中包含的 SO 依赖库,并评估 SO 依赖库的可移植性;检查指定的用户软件安装路径下的 SO 依赖库,并评估 SO 依赖库的可移植性;检查用户软件 C/C++ 软件构建工程文件,并评估该文件的可移植性;以及检查用户软件 C/C++ 源码,并评估软件源文件的可移植性。

          此外,Dependency Advisor 会自动分析并输出指导报告,提供软件移植报告以及移植工作量评估。它还支持命令行方式和 Web 两种工作模式。

          鲲鹏代码迁移工具 Porting Advisor

          Porting Advisor 是一款可以帮助开发者将应用从 x86 平台迁移到鲲鹏平台的代码迁移工具。具体功能包括:

          1. 分析可迁移性:Porting Advisor 可以分析用户的源代码以及相关依赖,判断其是否可以迁移到鲲鹏平台。
          2. 自动分析:Porting Advisor 可以自动分析出需要修改的代码内容,并给出修改建议。
          3. 提供指导:Porting Advisor 可以帮助开发者解决在迁移过程中遇到的问题,提供相应的解决方案。

          使用 Porting Advisor 进行代码迁移可以降低人工排查的工作量,提高整体迁移效率。

          鲲鹏软件性能调优

          鲲鹏软件性能调优流程

          鲲鹏软件性能调优流程包括以下步骤:

          1. 建立基准:在优化或监视开始之前,首先要建立一个基准数据和优化目标。这包括硬件配置、组网、测试模型、系统运行数据(CPU/内存/IO/网络吞吐/响应延时等)。我们需要对系统做全面的评估和监控,才能更好的分析系统性能瓶颈,以及实施优化措施后系统的性能变化。优化目标即是基于当前的软硬件架构所期望系统达成的性能目标。
          2. 压力测试与监视瓶颈:使用峰值工作负载或专业的压力测试工具,对系统进行压力测试。使用一些性能监视工具观察系统状态。在压力测试期间,建议详细记录系统和程序的运行状态,精确的历史记录将更有助于分析瓶颈和确认优化措施是否有效。
          3. 性能分析:基于压力测试的结果,进行性能分析,找出性能瓶颈。这包括查找CPU、内存、I/O、网络等方面的瓶颈。
          4. 优化:根据性能分析的结果,采取相应的优化措施。优化的具体方法可能因系统和应用的不同而有所不同。
          5. 再测试:在实施优化措施后,需要重新进行压力测试和性能监视,确认优化效果。
          6. 迭代:性能调优是一个反复迭代的过程,需要持续进行,不断优化系统的性能。

          以上就是鲲鹏软件性能调优的一般流程,具体实施时可能需要根据具体情况进行调整。

          CPU与内存子系统性能调优

          为了进行CPU和内存子系统的性能调优,可以采取以下措施:

          1. CPU方面:

            • 多线程优化:合理地利用多线程,将计算任务划分为多个线程并行执行,充分利用多核CPU的性能。
            • 减少上下文切换:减少线程之间的频繁切换,避免由于上下文切换带来的开销。
            • 缓存优化:充分利用CPU缓存,避免缓存未命中带来的性能损失。例如,使用局部性原理优化数据访问模式,减少缓存未命中。
            • 内存方面:

              • 内存分配优化:合理设置内存分配策略,避免频繁的内存分配与释放。可以采用对象池、内存池等技术来优化内存管理。
              • 内存访问模式优化:充分利用局部性原理,优化内存的访问模式。例如,通过连续访问、对齐访问等方式减少内存访问的随机性。
              • 内存压缩与分片:对于内存占用较大的数据结构或对象,可以考虑进行内存压缩或分片,以减少内存占用和提高访问效率。

          另外,还可以通过性能监控和性能分析工具,对CPU和内存子系统进行监测和分析,找出性能瓶颈,并采取相应的优化策略。不同的应用场景和需求可能需要采取不同的优化手段,因此建议结合具体情况进行调优,并进行性能测试和评估,以验证优化效果。

          网络子系统性能调优

          对于网络子系统的性能调优,可以采取以下措施:

          1. 减少网络延迟:

            • 使用高性能网络设备:选择高性能的网络交换机、路由器等网络设备,以减少数据包的传输延迟。
            • 使用更快速的网络协议:例如,采用更快速的传输协议(如TCP Fast Open、QUIC)来减少握手延迟和连接建立时间。
            • 优化网络拓扑结构:合理规划网络拓扑结构,减少数据包的传输距离,降低网络延迟。
            • 提高网络带宽:

              • 网络负载均衡:通过配置负载均衡设备或软件,将网络流量均匀分配到多个服务器上,提高整体网络带宽。
              • 数据压缩与加速:使用数据压缩和加速技术,减少数据传输量,从而提高可用带宽。
              • 增加带宽容量:升级网络设备,增加带宽容量,以满足高并发的网络请求。
              • 优化网络协议和策略:

                • TCP/IP参数调优:根据具体应用场景,调整TCP/IP协议的参数,如窗口大小、拥塞控制算法等,以提高网络传输效率。
                • 数据包优先级管理:通过配置网络设备的QoS(Quality of Service)功能,对不同类型的数据包进行优先级管理,确保重要数据的及时传输。
                • 缓存与缓冲区管理:

                  • CDN加速:使用内容分发网络(CDN)来缓存静态资源,加快数据的传输速度。
                  • 缓存技术应用:根据实际需求,合理地使用缓存技术,将热门数据、查询结果等缓存在内存中,加快数据访问速度。
                  • 缓冲区大小优化:针对网络设备的缓冲区大小进行优化,避免过大或过小的缓冲区导致的性能问题。

          此外,还可以通过监控和分析网络流量、延迟等指标,找出网络性能瓶颈,并进行相应的调优策略。综合考虑应用程序的特点、网络环境以及业务需求,选择合适的调优方案,并进行性能测试和评估,以验证优化效果。

          磁盘I/O子系统性能调优

          对于磁盘I/O子系统的性能调优,可以采取以下措施:

          优化磁盘I/O性能的常见措施包括:

          1. 使用RAID技术:RAID技术可以提供更高的磁盘读写性能和冗余容错能力。

          2. 块大小优化:根据应用程序的访问模式和数据块大小,调整磁盘块的大小以提高磁盘I/O性能。

          3. 操作系统参数调优:操作系统参数调整相关参数来改善磁盘I/O性能。

          4. 文件系统选择与优化:选择适合特定应用场景的文件系统,并进行相应的优化。

          5. I/O缓存与缓冲区管理:I/O缓存和缓冲区管理技术来减少磁盘I/O操作次数。

          6. 应用程序优化:应用程序优化,减少不必要的磁盘I/O操作。

          7. 磁盘性能监控与故障诊断:磁盘性能监控磁盘的性能指标,及时发现潜在问题,并采取相应的故障诊断和修复措施。

          这些措施综合起来可以提升磁盘I/O子系统的性能和可靠性。但需要根据具体情况进行调优,并进行性能测试和评估,以验证优化效果。

          应用程序性能调优

          对于应用程序的性能调优,可以采取以下措施:

          1. 代码优化:优化算法和数据结构和提高代码执行效率。
          2. 数据库优化:数据库索引优化和提高数据检索操作。
          3. 缓存技术应用:使用缓存技术和提高读取速度。
          4. 网络通信优化:减少网络请求次数和提高速度。
          5. 性能监控与调试:使用性能监控工具和评估系统的性能表现。
          1. 代码优化:

            • 优化算法和数据结构:选择高效的算法和数据结构,减少不必要的计算和内存消耗,提高代码执行效率。
            • 减少资源占用:及时释放不再使用的资源,避免资源泄露。合理使用内存、文件句柄、数据库连接等资源,避免资源瓶颈。
            • 并发编程优化:合理使用多线程、多进程或异步编程模型,利用多核处理器和异步操作提高并发性能。
            • 数据库优化:

              • 数据库索引优化:分析数据库查询的频率和模式,创建适当的索引来加速数据检索操作。
              • 数据库连接管理:合理维护和管理数据库连接,减少连接的建立和关闭开销。
              • 批量操作和事务管理:将多个数据库操作批量提交或使用事务进行管理,减少单次数据库交互的次数,提高效率和数据一致性。
              • 缓存技术应用:

                • 使用缓存技术:将频繁读取的数据缓存在内存中,减少对底层存储系统(如数据库)的访问,提高读取速度。
                • 合理设置缓存策略:根据数据的更新频率和重要性,设置合适的缓存策略,如缓存过期策略、LRU(最近最少使用)策略等。
                • 网络通信优化:

                  • 减少网络请求次数:合并多个网络请求、采用批量操作,减少网络开销和延迟。
                  • 压缩和加速数据传输:使用数据压缩和加速技术,减少网络传输数据量,提高速度。
                  • 性能监控与调试:

                    • 使用性能监控工具:通过监控工具来获取应用程序的性能指标,如CPU使用率、内存占用、数据库查询时间等,找出性能瓶颈和潜在问题。
                    • 进行性能测试:模拟实际使用场景,进行负载测试和性能测试,评估系统的性能表现,及时发现和解决性能问题。

          除了以上措施,还可以根据具体应用场景和需求进行针对性的优化。关注应用程序的瓶颈和低效点,不断进行测试和改进,以提高应用程序的性能和响应速度。同时,注意平衡性能调优和可维护性之间的关系,避免过度优化导致代码难以理解和维护。

          基础软件性能调优

          基础软件(如操作系统、数据库、Web服务器等)的性能调优,可以采取以下措施:

          1. 增加硬件资源:

            • 增加CPU、内存和磁盘等硬件资源,以提高基础软件的执行速度和并发处理能力。
            • 使用更快的存储设备或网络传输设备,以提高数据的访问速度和传输效率。
            • 调整软件参数:

              • 根据应用的工作负载和硬件配置,调整操作系统或数据库的参数,以达到最优性能。
              • 对于Web服务器,可以调整连接池大小、缓存策略、请求过滤等参数,以提高并发处理和响应速度。
              • 优化软件架构和设计:

                • 应用合适的软件设计模式和开发框架,以提高代码复用性和可维护性。
                • 良好的软件架构可以提高基础软件的并发处理能力和可扩展性。
                • 资源的合理利用:

                  • 对于数据库系统,可以通过使用数据库缓存、合理索引等手段,减少访问磁盘的次数,提高数据访问速度。
                  • 对于Web服务器,可以使用缓存技术对经常访问的数据进行缓存,降低数据库访问的频率。
                  • 进行性能测试和优化:

                    • 对基础软件进行负载测试和性能测试,找出瓶颈和性能瓶颈。
                    • 评估不同参数组合或优化技术的性能效果,选择最优方案。
                    • 系统监控和调试:

                      • 通过系统监控工具实时监控系统的性能、资源利用率等指标,在系统出现异常时及时进行调试和修复。
                      • 收集日志信息,及时发现潜在问题,并对系统进行诊断。

          除了以上措施,还可以根据不同的基础软件进行针对性的调优。例如,对于数据库系统,还可以使用分区、分片等技术,提高数据处理的并行性和可扩展性。对于Web服务器,还可以使用负载均衡技术,提高并发处理能力和可用性。总之,基础软件的性能调优需要多方面的考虑和综合处理。

          DP读书:鲲鹏处理器 架构与编程(十四)ACPI与软件架构具体调优,应用程序读写优化机制,第3张

          鲲鹏性能优化工具 Tuning Kit

          Tuning Kit 是一款针对鲲鹏计算平台的性能分析和优化工具,能收集处理器硬件、操作系统、进程/线程、函数等各层次的性能数据,分析出系统性能指标,定位到系统瓶颈点及热点函数。

          Tuning Kit 支持以下功能特性:

          1. 系统配置全景分析:采集整个系统的软硬件配置信息,分析并针对不合理项提供优化建议。
          2. 系统性能全景分析:借鉴业界的 USE(utilization、saturation、errors)方法,通过采集系统 CPU、内存、存储 IO、网络 IO 等资源的运行情况,获得它们的使用率、饱和度、错误等指标,识别系统瓶颈。
          3. 针对部分系统指标项,根据已有的基准值和优化经验提供优化建议。
          4. 系统资源调度分析:基于 CPU 调度事件分析 CPU 核、进程/线程在各时间点的运行状态,进程/线程切换情况,给出相应的优化建议。

          Tuning Kit 可以帮助用户更好地了解系统性能,识别和解决系统瓶颈,提高系统整体效率。

          DP读书:鲲鹏处理器 架构与编程(十四)ACPI与软件架构具体调优,鲲鹏BoostKit,第4张

          鲲鹏开发者社区:https://www.hikunpeng.com/developer/boostkit

          DP读书:鲲鹏处理器 架构与编程(十四)ACPI与软件架构具体调优,kunpengBoostKit 23.0,第5张

          DP读书:鲲鹏处理器 架构与编程(十四)ACPI与软件架构具体调优,代码迁移模块,第6张

          Kunpeng官方文档地址

          https://www.hikunpeng.com/document/detail/zh/kunpengdevps/porting/qs/qs-pa-kunpengdevps.html

          鲲鹏小智

          https://www.hikunpeng.com/zh/airobot

          参考文献:

          [1]GB/T 7714:戴志涛、刘健培.鲲鹏处理器架构与编程:华为智能计算技术丛书[M].北京:清华大学出版社,2020.

          [2]https://www.hikunpeng.com/

          [3]戚正伟、管海兵.深入浅出系统虚拟化:原理与实践[M]北京:清华大学出版社,2021.