当前位置:首页 > 股票行情

首页|深度揭秘:中国X86CPU技术源自何方
本文摘要:的指令集中在SSE4.1之前,反对x86-64指令集。

的指令集中在SSE4.1之前,反对x86-64指令集。C4600芯片cpuinfo的信息显示,C4600的设计制造商(vendor_id)是VIA的Centaur公司,没有返回ZX的标志。美国Centaur公司和Glen。Henry根据维基的资料,Centaur(半马人)科技公司成立于1995年,创立者是Glnhery,TerryParks,Darius是Gaskins和AlSato,其投资来自IDT公司。

其公司的目标是开发相容的x86处理器,目标是开发比Intel公司的x86芯片价格低,消耗电力小的芯片。早期的产品被称为WinChip,1999年9月,Centaur被IDT公司出售给VIA公司,之前的产品是VIAC3和VIAC7,VIANano。

Centaur公司的芯片主要面向嵌入式市场,也包括移动市场,即面积小、价格便宜、功耗低的x86芯片市场。Centaur的设计理念是面向特定市场的需求。

VIANanoIsaiah(在赛亚)是Centaur最初的微克量、乱序执行的CPU,最初的64位CPU、Nano芯片在这个时候特别强调性能,但是依然遵循性能消耗比的等式,但是与C7完全相同的消耗电力(TDP)。根据Centaur(半马人)公司网站的说明,Centaur(半马人)科技公司位于德克萨斯-奥斯丁。主要设计高性能、低功耗的x86互换的微处理器,具有最慢的设计流程,设计周期是竞争对手制造商的三分之一。该公司没有管理者,所有工程师都需要向Centaur公司的创始人和社长GlenNHenry报告,GlenNHenry是前DELL公司的CTO和IBM工程系列的Fellow(20年的Fellow)。

CA88官网登录平台

1999年8月,Centaur公司被VIA公司收购。但是,这次并购没有改变Centaur的文化,也就是说Centaur作为VIA公司的子公司独立国家运营,受VIA的影响。Cyrix退出后,VIA公司的x86芯片设计来自Centaur公司,VIAQuadCoreC4650芯片也来自Centaur公司的Glenn、Henry。

图4GlennHenry在此说明GlennHenry。GlenHenry于1967年重新加入IBM,在IBM腊21年,兼任首席设计师,是RISC工作站、AIX操作系统和AS/400等创造性产品的主要研发管理者,1985年获得IBMfellow称号,1988年离开IBM重新加入DELL公司,为DELL公司负责管理研发的副总经理和CTO,1994年离开DELL公司,兼任MIPS公司咨询顾问,希望将x86和MIPS架构融合在一起,195年获得自己的投资成本低、成本。

揭开赛亚谜团的面纱,就像Intel开发了核心2一样,AMD开发了Zen后,可以和Intel进行比较的产品一样,CPU最重要的是其微结构,QuadCoreC4650芯片的微结构如何?图5TheVIAiahArchitectureCentaur公司的灵魂人物和社长和Glennhenry写的文章《TheVIAIAIsaiaharchitecture》(图5)分析了为什么3升、混乱的构造和Intel的Core有什么优势,为了降低功耗而使用了什么样的权衡。文章说明非常详细,感兴趣的网民可以去原文读。从图6可以看出,在赛亚使用类似Core结构的设计7个部件、2个定点I1和I2、2个浮点MA和MB、1个取数LD、1个库存ST和1个SA地址。

也就是说,两个定点,两个浮点,两个访问。属于中规中矩的设计。图6以赛亚微结构框图Cache的设计为64KB64KBL1.cache,16路两组串联,2MB的uninclusiveL2Tcache。

保持站点的项目数为76项(micro-ops),micro-ops类似Intel处理器的uops,每个X86指令对应1~3个uops),规模和Intel的Core和AMD的K10几乎非常大。它还使用了大量的低功耗技术,例如为了降低功耗,分支预测器的表只有4K项,取指令时只取16字节的大小等。从文章的说明和测试数据来看,该处理器结构是2008年非常篮子的微结构,考虑到低功耗和性能。

从性能上可以输掉当时的顺序上升的IntelAtom,但由于技术团队的人数受到限制,电力消耗控制的构筑没有那么终极,市场定位不会变高。高性能不能与Intel的Core和AMD的K10对抗,低功耗不能设计风扇,与Atom和近年来兴起的ARM相比。

Nano的芯片主要用于网络书籍等市场,但由于出货量少,片成本高,随着网络市场的消失,Nano芯片也基本解散了主流市场。GlennHenry曾在2008年拒绝接受记者Dave,Altavilla的采访中,GlennHery对低功耗的赛亚结构处理器的说明。以下是访问链接:图7GlennHenry说明赛亚结构图8赛亚结构Nano处理器布局图ZX-CQuadCoreC4600和VIAQuadCoreC4650关系密切根据媒体报道确实南北市场化,揭露中国兆芯X86处理器国产品二代兆芯X866处理器-雨亭ZX-CC4600处理器体验兆芯傅城:国产X86标准化处理器类似于国际水平三篇报道是比较全面的说明兆芯的X86处理器。

在文章中,兆核心公司制作了中国X86的CPU,也说明了兆核心ZX-C四核心处理器,ZX-C处理器是国家十二五核基本科学技术的特别创造性成果,使用了28nm技术等内容。但是,这些报道中的一些内容不能敲打。

例如,兆芯ZX-C四核处理器的发售,国产处理器的性能从十二五初期严重不足国际主流水平的10%提高到现在的80%。但是,这个词不是媒体语言,而是来自兆芯(VIAlliancesemiconductor)在十二五科技成果展上的宣传资料。

但是,兆芯官方宣传资料中超过国际主流水平的80%是不客观的。但是,经过实际测试,兆芯ZX-C四核处理器中主要频率超过2.0G的C4600与IntelG1840和I5tel460相比。

从图10可以看出,在定点上,I5460是ZX-C的3.3倍,G1840是ZX-C的2.4倍。就浮点而言,I5460是ZX-C的4.4倍,G1840是ZX-C的2.8倍。在这种情况下,声称ZX-C超过国际主流的80%,不存在欺诈宣传不道德。

(图10)回到正传,一起探索以下ZX-C处理器和VIAQuadCoreC450的关系。根据2014年的报道,Report:VIAsquad-core,64bit工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员工作人员2014年VIA的2GHz的Isaiah,IIQuadCore处理器的性能基本上和AMDKabini的Athlon5350和Intelatom的Z3770非常详细的参数图11。

(图11)以下链接:根据2015年的文章,VIAsNew28nmC4650QuadCorex86ProcsorSpotted-GamingTondGandToneral为PurposeburporkSurface,Impresssivelow-EndTondGandToralPurance。由此可见,VIA至少在2015年拥有VIAQuadCoreC4650。2016年,兆芯宣布批量生产100万套ZX-C四核X86处理器。

在此说明C4600和ZX-C的关系。根据兆芯官方网站的资料,ZX-C可分为C4200/4210、C4400/4410、C4600/C4610三个类别,其差异在于主频,C4600是ZX-C系列处理器的2.0G主频版本,兆芯官方图像闻图12和图13。(图12)(图13)并且,C4600芯片cpuinfo的信息显示,C4600的设计制造商(vendor_id)是VIA的Centaur公司,没有返回ZX的标志。

兆芯的C4600与VIA公司QuadCoreC4650密切相关。这种联系不存在两种可能性。

第一,Centaur公司已经从威盛公司出售给兆核心公司,因此需要用于Centaur公司的标志,Centaur公司的技术成果也合理地成为国家十二五核高基本科技专业创造成果。第二,通过VIA的关系,兆芯需要出售QuadCoreC4650的设计和布局,或者需要带来新的台积电流片,然后改变国家十二五核基本科学技术的特殊创造性成果。根据赛亚和赛亚2的区别,兆芯ZX-A处理器,例如C4350AL的微结构是赛亚,ZX-C系列处理器,例如C4600的微结构是赛亚2。

那么,赛亚和赛亚2有什么区别呢?接下来,VIANano,X2、C350AL和兆芯C4600正在进行测试。在实验中,为了尽可能少地将C4600和C4350al的频率降低到1.33GHz。

然而,不受条件限制的原因仍然存在一些差异——C4600用于DDR3-1600,C4350al用于DDR3-1333,C4600编译选项至少用于SSE4.2,而C4350al编译选项至少反对SSE4.1。此外,两个平台的前端总线(FSB)频率也不同,C4600为1333MZ,C4350al为1066MHz。

(图14)从图14的比较可以看出,在完全相同的主频率下,C4600和C4350al的SEPC2006的得分基本上非常相同,即两者在完全相同频率下的性能基本相同。充满着主频的影响和编译器的影响,处理器性能的不同在于微结构的不同。因为即使同一个处理器跑了两次SEPC2006的分数也有点上下浮动。因此,兆芯的c型处理器C4600和兆芯的a型处理器VIANanotC4350AL可以推测使用完全相同的微型结构,或者在赛亚和赛亚2的差异很小,性能上处于当场踏步状态。

除了前端巴士的频率和技术的不同,各种微结构的参数没有变化。也就是说,赛亚2和赛亚只不过是同一个东西,或者变更的地方很少,性能上处于当场的踏步状态,变更可以忽略。必须说明的是,在实验中,C4600的定点性能比C4350al的金额低,主要原因是C4600前端巴士的频率上升,C4600的浮点性能反而上升,主要原因是SSE4.2指令集没有硬件的逻辑构筑,DDR3-1600的比特率的上升反而无法延迟兆芯C4600和VIA是赛亚短板Centaur公司设计的赛亚当时是差异化竞争的产物,赛亚也是轻量级的架子,2009年这个设计很好。

但是,随着技术的变革,赛亚今天有点看不见了,面对ARMCortex,A57/A72/A73不能战斗。兆芯C4600和VIA00和VIA在赛亚的短板:短板1:根据最近的命令系统在微结构和硬件上没有发生变更的VIA官方资料,VIAnano只反对SSE4.1命令集系统,原因只要追溯Intel命令集系统的发展历史,MMX(1996),访问SSE2(2001),SSE3(2004),SS。SSE3(2006)、SSE4.1(2006)SSE4.2(2007)、AES、AVX(2011)、F16C(2009)、ACE、PCLMUL(2010)、VMX、BMI1、bmi2、AVX2(2013)。由于历史原因和Intel对外的X86许可因素,当时的VIA公司没有得到Intel最近的命令集系统的许可,2009年的Nano处理器至少反对SSE4.1。

相比之下,VIAQuadCoreC4650和兆芯C4600处理器反对以前的SSE4.2和最近的AVX和AVX2等指令集系统。VIAQuadCoreC4650和兆芯C4600反对最近的AVX和AVX2等命令集系统,VIA可能已经购买了Intel公司最近命令集系统的许可。但是,VIA如何允许将命令集转让给兆芯,这个问题无论是Intel还是VIA、兆芯都没有公开发表声明。

的确,这不是本文关注的焦点。本文关注的是,为什么AVX和AVX2等指令集系统C4600的性能反而上升了。Intel和AMD的CPU在最近的256位AVX/AVX2向量指令集中使用后,性能提高了-Intel和AMD处理器使用向量指令(128位和256位),INT2006的性能平均值提高了5%,FP2006的性能平均值提高了16-18%。

从128位的SSE到256位的AVX/AVX2的命令,INT2006的性能可以提高2~3%,FP2006的性能可以提高6~8%。需要说明的是,使用向量指令提高性能的前提是,Haswell为了反对256位的AVX/AVX,使用3个访问端口,反对256位的load操作者和256位的store操作者。

无视Intel和AMD的CPU,C4600处理器与Intel最近的256位向量命令AVX/AVX2等相容(不反对FMA命令)。编译器关闭AVX2、AVX、bmi等最近命令编译器的选项,但编译器的程序计算性能反而提高了。明确的成绩是图15。

(图15)从图15中可以看出,使用最近的命令集系统,对于大部分CPU2006的程序,性能反而提高了。对于INT2006,几何平均业绩上涨1.76%,如401.bzip2上涨5.01%,456.hmmer上涨3.74%,462.libquantum上涨13.04%;对于FP2006,几何平均业绩上涨4.82%。416.games涨7.52%,433.milc涨8.93%,435.gromacs涨8.12%,454.calculix涨11.18%,454.calculix涨14.06%,459.gemsFDTD涨6.98%,482.sphinx3涨16.41%。这些程序是更容易分析的程序,使用了256位的AVX命令。

例如459.GemsFDTD中256位的Packed、Double动态指令数占16.53%。为什么使用新型指令集系统,SPECCPU2006程序性能反而有所提升?兆芯C4600处理器有Centaur公司的完整设计的可能性很高,最近的命令系统没有在微结构和硬件上进行变更。也就是说,微结构除了命令译码部分外,数据通道和访问通道没有变化。这也在法庭上作证了以前提到的:以赛亚2和以赛亚只是同一件事,或者改变的地方很少。

首先,让我们看看处理器在命令译码部分如何反对最近的命令集系统。目前的CISC命令集系统的构建是将外部CISC命令翻译为内部类型的RISC,即uops,一般来说,CISC命令可以在内部翻译为1~3条内部的uops命令。uops命令在赛亚中被称为micro-ops,听到VIAIsaiaharchitectural文章中的microcodesubsystem、赛亚结构中的微码子系统(microcodesubsystem)还包括24K微码指令和强有力的补丁(patch)功能,微码可以改版,每个ROM中的微码指令被翻译为最少3个融合的微操作。以赛亚结构依然延长X86处理器初期部分的简单X86指令微代码构建方式,如果反对新的AVX指令,可以通过改版微代码构建,通过微代码指令切换为内部微操作指令构建。

第二,256名存储器的构建,既然要反对AVX指令,就必须构建256名系统结构可见的存储器和256名重命名物理存储器。我们推测,其内部只构建了一个系统结构可见的存储器,而不构建256名重命名物理存储器,这将减少开支。在数据通道和访问存储通道的构建中,将256位的向量命令分为多个128位的SSE命令构建的可能性很高,这种方法在第一代AMD的推土机构中构建了256位的AVX命令和第一代K8构建了128位的SSE命令也是如此,通过内部合并在数据通道中反对新的命令集系统,但这样做的结果是,新的命令系统不仅对性能没有好处,而且没有性能上升。因为数据通道和访问存储通道显然没有构建更长的设计,只能通过自己宽的道路,通过2辆车排列4辆车。

此外,更长的向量操作者跟上其结构的访问和供给能力,也导致新的命令集有时性能上升。短板2:前端总线设计和比特率允许兆芯C4600芯片的许多瓶颈是Centaur公司沿袭前端总线(VIAV4bus)的设计,内存控制器没有构筑在处理器上。前端总线(front-sidebus、FSB)是早期Intel芯片的计算机通信模块,与AMD公司的EV6相似,与CPU和北桥芯片相连,存储控制器一般构筑在北桥。

PCI、AGP等各种设备和内存通过北桥和CPU进行通信。前端总线经常出现在1995-2006年,作为互联网的Atom、Celeron、Pentium、Core2芯片和早期的Xeon芯片中,它很快就被现代处理器中AMD的HT(HyperTransport)和Intel的QPI(QuickPathuinterconect)和DMI(Direct将MediaInterterfanterface)所取代。前端总线为64位,8个字节,每拍4次。前端巴士的速度是当时计算机系统最重要的依赖指标,目前前前端巴士最低频率为333~400MHz,每周期可进行4次传输。

由于缺乏设计,前端总线的频率无法进一步提高。假设前端总线的实际频率为33MHz,也就是一般制造商所说的133MHz其峰值理论比特率为10.65GBS,也就是8bytstransfransranstransfransx333MHz×下4transfers/cycle=10656MB/s。前端巴士的设计,CPU必须等待内存中的数据,对于各要素所需的大量简单计算的应用,这种应用于访问并不密集,前端巴士可以跟上CPU的速度。

图像、音频、视频、游戏、FPGA综合、科学应用等一般应用于大工作集的少数数据开展者,前端总线成为主要性能瓶颈。图16是2.0GHz的兆芯C4600、1.5GHz的龙芯3A3000、1.5GHz的AMD小姐K10三种处理器访问比特率测试程序STREAM的比特率值,单线程STREAM的测试显示,C4600的STREAM比特率基本为4-5GB/s,3A3000为8支GB/s,K10为6-7GB/s。

多线程STREAM测试,C4600STREAM比特率基本为3GB/s,3A3000为12-13GB/s,K10位为6GB/s。(图16)国际主流CPU在10年前将内存控制器构筑在CPU芯片中,兆芯C4600后将内存控制器构筑在桥上,访问比特率限于前端总线。VIA在赛亚系列处理器上从2009年开始使用VIAV4BUS的前端巴士设计,没有将存储器控制器构筑在芯片上,即使2014年更新Nanotx2也不想移动其结构和设计。

只是从40nm的技术上升到28nmTSMC的技术,同时V4巴士的频率从800MHZ上升到133MHz,即前端巴士的理论比特率为10.6GB/s。因此,内存比特率低的原因也可以说明。另外,在多线程的情况下,多个CPU核和I/O等不与前端总线竞争,前端总线和内存控制器的期待机制完全不同,导致访问秩序的失调。

因此,多个线程,特别是访问压力相当大的情况下,性能不会急剧下降。这也是C4600多线比特率反而不如单线比特率的原因。C4600、1~2个核基本上不吃访问比特率,对龙芯3A3000来说,访问比特率没有明显的优势,可以满足4~8个处理器核的市场需求。

因此,在单线程性能差异不大的情况下,龙芯3A3000的SPEC与CPU2006多线程rate的性能显着达到了C4600的rate性能。参数文字图17(图17)结语在一系列兆核心官方宣传和中文宣传资料中,但兆核心宣传自律安全性高效(文字图18),在其官方网站上也表示自律高效(文字图19)。但是,与兆芯相关的英语资料显示了BasedonCentaurTechnologie。

(图18)(图19)(图20)微结构源于Centaur公司,命令集许可也模糊不清的情况下,宣布兆芯自律安全性高效,不可避免地有点慢——即使转发技术引进道路,也要以自己的能力消化吸收再创造性例如,在充分消化Centaur公司设计的赛亚之后,国内的设计团队设计与IntelSNB和AMD-Zen匹敌的产品,这是再创造性。以Centaur公司设计的赛亚,提高升格程堆的核心数量,提高总线频率,宣传自律高效,只是欺骗自己。关于Centaur公司年轻时的设计,改变了国家十二五核高基本科学技术的特别创造性成果,需要获得第十八届中国国际工业博览会金奖(温图21)、2017年度中华IC设计成果奖(温图22)、第十一届(2016年度)中国半导体创造性产品和技术奖(温图23),海外资深IC设计工程师也不嘲笑中国IC设计水平。(图21)(图22)(图23)特约原稿允许禁止发布。

下一篇文章发表了注意事项。


本文关键词:CA88官网登录平台,首页

本文来源:CA88官网登录平台-www.rnbcagroworld.com