首页
/ 正文

微基准测试中的错误

更新时间: 2023-05-31 10:49:19

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战(已更新的所有项目都能学习) / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新开坑项目:《Spring AI 项目实战》 正在持续爆肝中，基于 Spring AI + Spring Boot 3.x + JDK 21...， 点击查看 ;

《从零手撸：仿小红书（微服务架构）》 已完结，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;演示链接： http://116.62.199.48:7070 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 100w+ 字，讲解图 4013+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 3700+ 小伙伴加入学习，欢迎点击围观

所以在我的上一篇文章中，我展示了一堆小的微基准测试，除了实际结果之外，我不太确定那里发生了什么。幸运的是，我认识一些 perf 专家，所以我可以依靠他们。

具体而言，建议的更改是：

不要只做一个微小的操作，如果操作太便宜，很容易在调用设置中产生过多的抖动。
注意潜在的数据问题，编译器/jit 可以决定将某些内容放在寄存器中，在这种情况下，您将直接让 cpu 工作，而现实世界中不会出现这种情况。

我还学习了如何运行实际的程序集，这很棒。总而言之，我们得到以下基准代码：


 [benchmarktask(platform: benchmarkplatform.x86,
            jitversion: benchmarkjitversion.ryujit)]
[benchmarktask(platform: benchmarkplatform.x86,
            jitversion: benchmarkjitversion.legacyjit)]
[benchmarktask(platform: benchmarkplatform.x64,
                jitversion: benchmarkjitversion.legacyjit)]
[benchmarktask(platform: benchmarkplatform.x64,
                jitversion: benchmarkjitversion.ryujit)]
public unsafe class tocastornottocast
{
    byte* p1, p2, p3, p4;
    fooheader* h1, h2,h3,h4;
    public tocastornottocast()
    {
        p1 = (byte*)marshal.allochglobal(1024);
        p2 = (byte*)marshal.allochglobal(1024);
        p3 = (byte*)marshal.allochglobal(1024);
        p4 = (byte*)marshal.allochglobal(1024);
        h1 = (fooheader*)p1;
        h2 = (fooheader*)p2;
        h3 = (fooheader*)p3;
        h4 = (fooheader*)p4;
    }
[benchmark]
[operationsperinvoke(4)]
public void nocast()
{
    h1-&gt;pagenumber++;
    h2-&gt;pagenumber++;
    h3-&gt;pagenumber++;
    h4-&gt;pagenumber++;
}

[benchmark]
[operationsperinvoke(4)]
public void cast()
{
    ((fooheader*)p1)-&gt;pagenumber++;
    ((fooheader*)p2)-&gt;pagenumber++;
    ((fooheader*)p3)-&gt;pagenumber++;
    ((fooheader*)p4)-&gt;pagenumber++;
}

}

以及以下结果：


 [benchmarktask(platform: benchmarkplatform.x86,
            jitversion: benchmarkjitversion.ryujit)]
[benchmarktask(platform: benchmarkplatform.x86,
            jitversion: benchmarkjitversion.legacyjit)]
[benchmarktask(platform: benchmarkplatform.x64,
                jitversion: benchmarkjitversion.legacyjit)]
[benchmarktask(platform: benchmarkplatform.x64,
                jitversion: benchmarkjitversion.ryujit)]
public unsafe class tocastornottocast
{
    byte* p1, p2, p3, p4;
    fooheader* h1, h2,h3,h4;
    public tocastornottocast()
    {
        p1 = (byte*)marshal.allochglobal(1024);
        p2 = (byte*)marshal.allochglobal(1024);
        p3 = (byte*)marshal.allochglobal(1024);
        p4 = (byte*)marshal.allochglobal(1024);
        h1 = (fooheader*)p1;
        h2 = (fooheader*)p2;
        h3 = (fooheader*)p3;
        h4 = (fooheader*)p4;
    }
[benchmark]
[operationsperinvoke(4)]
public void nocast()
{
    h1-&gt;pagenumber++;
    h2-&gt;pagenumber++;
    h3-&gt;pagenumber++;
    h4-&gt;pagenumber++;
}

[benchmark]
[operationsperinvoke(4)]
public void cast()
{
    ((fooheader*)p1)-&gt;pagenumber++;
    ((fooheader*)p2)-&gt;pagenumber++;
    ((fooheader*)p3)-&gt;pagenumber++;
    ((fooheader*)p4)-&gt;pagenumber++;
}

}


 [benchmarktask(platform: benchmarkplatform.x86,
            jitversion: benchmarkjitversion.ryujit)]
[benchmarktask(platform: benchmarkplatform.x86,
            jitversion: benchmarkjitversion.legacyjit)]
[benchmarktask(platform: benchmarkplatform.x64,
                jitversion: benchmarkjitversion.legacyjit)]
[benchmarktask(platform: benchmarkplatform.x64,
                jitversion: benchmarkjitversion.ryujit)]
public unsafe class tocastornottocast
{
    byte* p1, p2, p3, p4;
    fooheader* h1, h2,h3,h4;
    public tocastornottocast()
    {
        p1 = (byte*)marshal.allochglobal(1024);
        p2 = (byte*)marshal.allochglobal(1024);
        p3 = (byte*)marshal.allochglobal(1024);
        p4 = (byte*)marshal.allochglobal(1024);
        h1 = (fooheader*)p1;
        h2 = (fooheader*)p2;
        h3 = (fooheader*)p3;
        h4 = (fooheader*)p4;
    }

    [benchmark]
    [operationsperinvoke(4)]
    public void nocast()
    {
        h1->pagenumber++;
        h2->pagenumber++;
        h3->pagenumber++;
        h4->pagenumber++;
    }

    [benchmark]
    [operationsperinvoke(4)]
    public void cast()
    {
        ((fooheader*)p1)->pagenumber++;
        ((fooheader*)p2)->pagenumber++;
        ((fooheader*)p3)->pagenumber++;
        ((fooheader*)p4)->pagenumber++;
    }
}

有趣的是，nocast 方法在几乎所有设置中都更快。

这是 x64 中 legacyjit 的汇编代码：

对于 ryujit，该代码与 cast code 相同，无 cast 代码的唯一区别是 mov edx, ecx 是 ryujit 中的 mov rdx,rcx。

顺便说一句，x64 汇编代码比 x86 汇编代码更容易阅读。

简而言之，强制转换或不强制转换的性能差异非常小，但不强制转换允许我们在对象中保存一个指针引用，这意味着它会稍微小一些，如果我们要有很多，那么可以很好地节省空间。

微基准测试中的错误

最新发布

DataGrip 2026.1 最新激活码，破解版安装教程（亲测至2099年~）

IDEA 2026.1 最新激活码，破解版安装教程（亲测至2099年~）

PhpStorm 2025.3.4 最新激活码，破解版安装教程（亲测至2099年~）

IDEA 2025.3.4 最新激活码，破解版安装教程（亲测至2099年~）

DataGrip 2025.3.5 最新激活码，破解版安装教程（亲测至2099年~）

RubyMine 2025.3.3 最新激活码，破解版安装教程（亲测至2099年~）

Rider 2025.3.3 最新激活码，破解版安装教程（亲测至2099年~）

Clion 2025.3.3 最新激活码,破解版安装教程（附激活码，至2099年~）

GoLand 2025.3.3 最新激活码，破解版安装教程（附激活码，至2099年~）

PhpStorm 2025.3.3 最新激活码，破解版安装教程（亲测至2099年~）