2024-04-02  阅读(4)
原文作者:LoyenWang 原文地址: https://www.cnblogs.com/LoyenWang/p/12182594.html

背景

  • Read the fucking source code! --By 鲁迅
  • A picture is worth a thousand words. --By 高尔基

说明:

  1. Kernel版本:4.14
  2. ARM64处理器,Contex-A53,双核
  3. 使用工具:Source Insight 3.5, Visio

1. 概述

Contiguous Memory Allocator, CMA,连续内存分配器,用于分配连续的大块内存。
CMA分配器,会Reserve一片物理内存区域:

  1. 设备驱动不用时,内存管理系统将该区域用于分配和管理可移动类型页面;
  2. 设备驱动使用时,用于连续内存分配,此时已经分配的页面需要进行迁移;

此外,CMA分配器还可以与DMA子系统集成在一起,使用DMA的设备驱动程序无需使用单独的CMA API

2. 数据结构

内核定义了struct cma结构,用于管理一个CMA区域,此外还定义了全局的cma数组,如下:

    struct cma {
    	unsigned long   base_pfn;
    	unsigned long   count;
    	unsigned long   *bitmap;
    	unsigned int order_per_bit; /* Order of pages represented by one bit */
    	struct mutex    lock;
    #ifdef CONFIG_CMA_DEBUGFS
    	struct hlist_head mem_head;
    	spinlock_t mem_head_lock;
    #endif
    	const char *name;
    };
    
    extern struct cma cma_areas[MAX_CMA_AREAS];
    extern unsigned cma_area_count;
  • base_pfn:CMA区域物理地址的起始页帧号;
  • count:CMA区域总体的页数;
  • *bitmap:位图,用于描述页的分配情况;
  • order_per_bit:位图中每个bit描述的物理页面的order值,其中页面数为2^order值;

来一张图就会清晰明了:

202404022326231391.png

3. 流程分析

3.1 CMA区域创建

3.1.1 方式一 根据dts来配置

之前的文章也都分析过,物理内存的描述放置在dts中,最终会在系统启动过程中,对dtb文件进行解析,从而完成内存信息注册。

CMA的内存在dts中的描述示例如下图:

202404022326233662.png

dtb解析过程中,会调用到rmem_cma_setup函数:

    RESERVEDMEM_OF_DECLARE(cma, "shared-dma-pool", rmem_cma_setup);

202404022326236653.png

3.1.2 方式二 根据参数或宏配置

可以通过内核参数或配置宏,来进行CMA区域的创建,最终会调用到cma_declare_contiguous函数,如下图:

202404022326239534.png

3.2 CMA添加到Buddy System

在创建完CMA区域后,该内存区域成了保留区域,如果单纯给驱动使用,显然会造成内存的浪费,因此内存管理模块会将CMA区域添加到Buddy System中,用于可移动页面的分配和管理。CMA区域是通过cma_init_reserved_areas接口来添加到Buddy System中的。

    core_initcall(cma_init_reserved_areas);

core_initcall宏将cma_init_reserved_areas函数放置到特定的段中,在系统启动的时候会调用到该函数。

202404022326241745.png

3.3 CMA分配/释放

  • CMA分配,入口函数为cma_alloc

202404022326244436.png

  • CMA释放,入口函数为cma_release
    函数比较简单,直接贴上代码
    /**
     * cma_release() - release allocated pages
     * @cma:   Contiguous memory region for which the allocation is performed.
     * @pages: Allocated pages.
     * @count: Number of allocated pages.
     *
     * This function releases memory allocated by alloc_cma().
     * It returns false when provided pages do not belong to contiguous area and
     * true otherwise.
     */
    bool cma_release(struct cma *cma, const struct page *pages, unsigned int count)
    {
    	unsigned long pfn;
    
    	if (!cma || !pages)
    		return false;
    
    	pr_debug("%s(page %p)\n", __func__, (void *)pages);
    
    	pfn = page_to_pfn(pages);
    
    	if (pfn < cma->base_pfn || pfn >= cma->base_pfn + cma->count)
    		return false;
    
    	VM_BUG_ON(pfn + count > cma->base_pfn + cma->count);
    
    	free_contig_range(pfn, count);
    	cma_clear_bitmap(cma, pfn, count);
    	trace_cma_release(pfn, pages, count);
    
    	return true;
    }

3.4 DMA使用

代码参考driver/base/dma-contiguous.c,主要包括的接口有:

    /**
     * dma_alloc_from_contiguous() - allocate pages from contiguous area
     * @dev:   Pointer to device for which the allocation is performed.
     * @count: Requested number of pages.
     * @align: Requested alignment of pages (in PAGE_SIZE order).
     * @gfp_mask: GFP flags to use for this allocation.
     *
     * This function allocates memory buffer for specified device. It uses
     * device specific contiguous memory area if available or the default
     * global one. Requires architecture specific dev_get_cma_area() helper
     * function.
     */
    struct page *dma_alloc_from_contiguous(struct device *dev, size_t count,
    				       unsigned int align, gfp_t gfp_mask);
     
     /**
     * dma_release_from_contiguous() - release allocated pages
     * @dev:   Pointer to device for which the pages were allocated.
     * @pages: Allocated pages.
     * @count: Number of allocated pages.
     *
     * This function releases memory allocated by dma_alloc_from_contiguous().
     * It returns false when provided pages do not belong to contiguous area and
     * true otherwise.
     */
    bool dma_release_from_contiguous(struct device *dev, struct page *pages,
    				 int count);

在上述的接口中,实际调用的就是cma_alloc/cma_release接口来实现的。

整体来看,CMA分配器还是比较简单易懂,也不再深入分析。

4.后记

内存管理的分析先告一段落,后续可能还会针对某些模块进一步的研究与完善。
内存管理子系统,极其复杂,盘根错节,很容易就懵圈了,尽管费了不少心力,也只能说略知皮毛。
学习就像是爬山,面对一座高山,可能会有心理障碍,但是当你跨越之后,再看到同样高的山,心理上你将不再畏惧。

接下来将研究进程管理子系统,将任督二脉打通。

未来会持续分析内核中的各类框架,并发机制等,敬请关注,一起探讨。

202404022326247127.png


Java 面试宝典是大明哥全力打造的 Java 精品面试题,它是一份靠谱、强大、详细、经典的 Java 后端面试宝典。它不仅仅只是一道道面试题,而是一套完整的 Java 知识体系,一套你 Java 知识点的扫盲贴。

它的内容包括:

  • 大厂真题:Java 面试宝典里面的题目都是最近几年的高频的大厂面试真题。
  • 原创内容:Java 面试宝典内容全部都是大明哥原创,内容全面且通俗易懂,回答部分可以直接作为面试回答内容。
  • 持续更新:一次购买,永久有效。大明哥会持续更新 3+ 年,累计更新 1000+,宝典会不断迭代更新,保证最新、最全面。
  • 覆盖全面:本宝典累计更新 1000+,从 Java 入门到 Java 架构的高频面试题,实现 360° 全覆盖。
  • 不止面试:内容包含面试题解析、内容详解、知识扩展,它不仅仅只是一份面试题,更是一套完整的 Java 知识体系。
  • 宝典详情:https://www.yuque.com/chenssy/sike-java/xvlo920axlp7sf4k
  • 宝典总览:https://www.yuque.com/chenssy/sike-java/yogsehzntzgp4ly1
  • 宝典进展:https://www.yuque.com/chenssy/sike-java/en9ned7loo47z5aw

目前 Java 面试宝典累计更新 400+ 道,总字数 42w+。大明哥还在持续更新中,下图是大明哥在 2024-12 月份的更新情况:

想了解详情的小伙伴,扫描下面二维码加大明哥微信【daming091】咨询

同时,大明哥也整理一套目前市面最常见的热点面试题。微信搜[大明哥聊 Java]或扫描下方二维码关注大明哥的原创公众号[大明哥聊 Java] ,回复【面试题】 即可免费领取。

阅读全文