在高性能处理器领域,英特尔是天花顶一般的存在(先不算地位特殊的IBM公司),国内发展CPU处理器的公司很多,绝大多数实力跟英特尔相比都差很远,但是大家都非常想看到国内这些小公司跟英特尔比拼处理器性能。在国产CPU领域,龙芯是起步较早的公司之一,不过龙芯处理器走的是MIPS指令集体系,目前已经发展出了多款龙芯处理器,其中针对桌面市场的最新产品是龙芯3A3000,它的性能到底如何呢?有龙芯爱好者做了实际性能测试,测试下来单核性能相当于intel i5-7200U的30%~40%,不过下一代龙芯3A4000处理器同频性能将从i5-7200U的60%~70%提升到80%~90%,不过总体差距还是非常大的,龙芯要走的路还很长。
有关龙芯处理器的测试这几年来零零散散在网上出现过多次,前不久有龙芯爱好者在龙芯社区发表过龙芯3A处理器的全面性能测试,只是这篇文章的图片挂了,他最近在知乎上也发了一次,发表在龙芯往事专栏中,知乎ID是第一千零一人。
这套平台是去年9月份龙芯俱乐部的龙芯3A主板团购时买的,由作者自行搭建好一套平台,使用phronix-test-suite对龙芯 3A3000 处理器做了一个尽可能理性、中立、客观、全面的评测,不吹不黑,不夸大成绩也不回避问题。
这里节选龙芯3A3000处理器的测试及总结部分,首先来看看龙芯3A3000平台的样子。
龙芯 3A3000 主板照片,风扇下面是龙芯的 CPU。另外两块散热片下面分别是南桥和北桥。
拆下风扇后,龙芯 3A3000 CPU 的近照, 其中的 LS3A3000D-LP 意思是说这是一个低功耗版本的龙芯 3A3000CPU。
开机后 BIOS 中的信息,可以看到 CPU 的主频是 1400MHZ,一级指令缓存 64KB,一级数据缓存 64KB,二级缓存 4MB。
主板上的国产 Unilc(西安紫光国芯半导体)内存条。
补充一下龙芯官方的龙芯3A3000处理器的架构及规格
上图是龙芯3A3000的主要规格,频率最高1.5GHz,不过原文作者拿到的这块龙芯3A3000处理器不是性能最高的1.5GHz主频版本,而是性能略低的1.4GHz 版本。因此,在估算龙芯3A3000(1.5GHz)的性能时,应该将我的测试结果乘以1.07。此外,需要说明的是龙芯3A3000笔记本里带的龙芯3A3000的主频被限制在了1.2GHZ。
规格对比
性能测试基本环境
龙芯3A3000处理器性能测试
测试是在Linux系统上进行的,很多测试内容都偏重CPU理论性能测试,跟大家熟悉的Windows下CPU性能测试不同,原作者对每个测试项目有详细的解释,感兴趣的可以仔细看下,这里就不对测试性能一一介绍了,觉得长的直接看最后的结论。
对比的CPU除了英特尔酷睿i5-7200U、赛扬J1900之外还加入了国内另外的处理器FT-1500A、FT-2000+的。
作者的结论:
从纵向上看龙芯的发展,相比龙芯 2F,龙芯 3A3000 的性能有了很大的进步。工艺上,从龙芯 2F 的 90nm,提高到了龙芯 3A3000 处理器的 28nm;主频从龙芯 2F 的 800MHZ 提高到了 1.5GHz。在用户实际应用上,基本可以达到流畅使用的程度。与 Intel 处理器相比,龙芯 3A3000 综合性能相当于 Intel J1900 处理器,单核性能相当于 intel i5-7200U 的 30%~40%。通过本文中所进行的 34 项测试,我们发现龙芯 3A3000 在性能不好的根源有以下几个:同主频性能较弱
从同主频性能来看,龙芯 3A3000 已经超过了 J1900, 但只有 intel i5-7200U 的 60%~70%。预计 2019 年流片的龙芯 3A4000 同主频性能至少有 30%的性能提升。主频太低
这是龙芯处理器让众多爱好者耿耿于怀的的一个难以回避的弱点。诚然,主频不代表所有性能,但主频太低是万万不行的。J1900 的同主频性能弱于龙芯 3A3000,但由于它的主频可以到 1.99GHz,并且还可以睿频到 2.4GHz,在多项测试中一样超过了龙芯 3A3000。Intel i5-7200U 基础主频达到 2.5GHz,睿频可以到 3.1GHz。飞腾 2000+主频可以到 2.2GHz,而兆芯的 KX-6000 主频甚至可以到3.0GHz。飞腾、兆芯处理器可能在同主频性能上弱于龙芯,但还是可以靠着较高的主频击败龙芯 3A3000。龙芯主频较低的原因之一是落后的工艺制程,目前还在使用 28nm 工艺,而Intel、飞腾、兆芯等已经在使用 14nm 工艺。根据龙芯的发展规划,到 2020 年龙芯将使用 14nm 工艺对了龙芯 3C5000 进行流片,主频能够达到 2.5GHz。系统软件优化不够
在测试中,我们发现的问题有三角函数等数学函数运算速度过慢,看起来部分硬件浮点运算的没有得到应用,而且龙芯缺少一个优化的 数学函数库。在加密解密指令上,缺少AES 硬件实现。在测试中,我们发现使用Debian 操作系统、GCC 7.3 和 1.4GHz 的龙芯 3A3000 进行的各项测试基本优于使用 Loongnix 操作系统、GCC 4.9 编译器和 1.5GHz 龙芯 3A3000 的组合。我们认为编译器的优化对发挥龙芯的性能非常重要。在测试中,我们也发现使用 4.14 的 Linux 内核会比3.10 的 Linux 内核上有相当程度的性能提升,龙芯依然缺少优化的 Linux 内核。应用软件优化不够
由于 MIPS 架构缺少软件生态,各种应用软件缺少针对MIPS 架构的优化。具体表现就是在很多软件有针对 X86 系统的汇编优化。要建立龙芯的生态,发挥龙芯处理器的性能,相同级别的优化不可缺少。随着龙芯未来架构的优化、主频的提升,影响龙芯发展的瓶颈将不是处理器的性能,而是软件生态的建设,也就是系统软件优化以及应用软件优化。其中,各种应用软件的优化将是提升龙芯用户体验的捷径。实际上,龙芯也已经意识到了这些问题,提出了要学习苹果,”app by app, feature by feature, pixel by pixel” 的进行优化。
龙芯下一代处理器龙芯3A4000的展望
原作者对龙芯3A3000处理器的评价确实做到了不吹不黑,龙芯3A3000处理器有进步有优点,不过不足之处也非常多,除了架构方面的原因之外,落后的制造工艺也限制了龙芯3A处理器的性能,这些问题想解决也不是一蹴而就的,好在龙芯3A3000已经是问世几年的产品了,下一代龙芯3A4000处理器也箭在弦上,预计2019年初问世,第一千零一人也对此作了性能预测:
当下,龙芯 3A4000 的流片工作正在开展,预计到 2019 年初就能看到芯片了。在3A4000出现之前,我们对 3A4000 的性能进行一下预测。基于我们的评测,我们认为,3A4000的同主频性能将从 i5-7200U 的 60%~70%,提升到 80%~90%,2.0GHz 下单核性能达到 i5-7200U 的 2/3,多线程性能超过 i5-7200U。和国内其他 CPU 相比,龙芯 3A4000 的同主频性能将超过飞腾以及兆芯,单核性能也将超过飞腾 2000+,但由于 3A4000 落后的28 nm工艺、依旧较低的主频(2.0 GHz),龙芯3A4000 的综合性能将可能依旧无法超过采用 14 nm 工艺,主频 3.0GHz 的兆芯 KX-6000。但鉴于KX-6000 并没有看大规模量产出货的迹象,龙芯 3A4000 依然可能会是 2019 年国内可以买到的单核性能最强的国产自主处理器。龙芯处理器和 Intel、AMD 的高性能处理器差距还是非常巨大,龙芯要走的路还很长。期待龙芯在未来采用更好的工艺,更优化的微架构,也期待龙芯能够在编译器、数学库、操作系统等系统软件支持上有更好的表现,构建更好的应用软件生态系统,期待着龙芯 3A4000、3B 4000、 龙芯 3C 5000 早日流片成功。
想了解更多有关科技、数码、游戏、硬件等专业问答知识,欢迎右上角点击关注我们【超能网】头条号。