目录
文章目录
- 目录
- 前言
- NUMA 架构中的多线程性能开销
- 1、跨 Node 的 Memory 访问开销
- 2、跨 Core 的多线程 Cache 同步开销
- 3、多线程上下文切换开销
- 4、多线程模式切换开销
- 5、中断处理的开销
- 6、TLB 缓存失效的开销
- 7、内存拷贝的开销
- NUMA 架构中的性能优化:使用多核编程代替多线程
- NUMA 亲和性:避免 CPU 跨 NUMA 访问内存
- CPU 亲和性:避免跨 CPU 的 Kernel Thread 切换
- IRQ(中断请求)亲和性
- 使用大页内存
前言
NOTE:本文中所指 “线程” 均为可执行调度单元 Kernel Thread。