x86
推出年份 | 1978年(16位)、1985年(32位)、2003年(64位) |
---|---|
设计公司 | Intel、AMD |
是否开放架构? | 部分 |
字长/寄存器资料宽度 | 32、64、128 |
字节序 | 小端序 |
指令集架构设计策略 | CISC |
x86泛指一系列基于Intel 8086且向后兼容的中央处理器指令集架构。最早的8086处理器于1978年由Intel推出,为16位微处理器。
该系列较早期的处理器名称是以数字来表示80x86。由于以“86”作为结尾,包括Intel 8086、80186、80286、80386以及80486,因此其架构被称为“x86”。由于数字并不能作为注册商标,因此Intel及其竞争者均在新一代处理器使用可注册的名称,如Pentium,来描述x86架构下的处理器产品。现时英特尔将其称为IA-32,全名为“Intel Architecture, 32-bit”,一般情形下指代32位的架构。
历史
x86架构于1978年推出的Intel 8086中央处理器中首度出现,它是从Intel 8008处理器中发展而来的,而8008则是发展自Intel 4004的。8086在三年后为IBM PC所选用,之后x86便成为了个人电脑的标准平台,成为了历来最成功的CPU架构。
其他公司也有制造x86架构的处理器,计有Cyrix(现为威盛电子所收购)、NEC集团、IBM、IDT以及Transmeta。Intel以外最成功的制造商为AMD,其早先产品Athlon系列处理器的市场份额仅次于Intel Pentium。
8086是16位处理器;直到1985年32位的80386的开发,这个架构都维持是16位。接着一系列的处理器表示了32位架构的细微改进,推出了数种的扩展,直到2003年AMD对于这个架构发展了64位的扩展,并命名为AMD64。后来英特尔也推出了与之兼容的处理器,并命名为Intel 64。两者一般被统称为x86-64或x64,开创了x86的64位时代。
值得注意的是英特尔早在1990年代就与惠普合作提出了一种用在安腾系列处理器中的独立的64位架构,这种架构被称为IA-64。IA-64是一种崭新的系统,和x86架构完全没有相似性;不应该把它与x86-64或x64弄混。
CPU纪元朝代 | 面市时间 (西元 年) |
卓越的CPU型号 | 存储器位置找寻空间 | 引入功能及注释 | |||
---|---|---|---|---|---|---|---|
序列 | 模拟 | 实体 | |||||
x86 | 第一代 | 1978 | Intel 8086, Intel 8088(1979) | 16位 | 无 | 20位元 | 16位 架构, IBM PC (8088), IBM PC/XT (8088) |
1982 | Intel 80186, Intel 80188 NEC V20/V30(1983) |
8086-2架构, 嵌入技术(80186/80188) | |||||
第二代 | Intel 80286及其克隆产品 | 30位元 | 24位 | 保护模式(16位), IBM PC XT 286, IBM PC AT | |||
第三代 (IA-32)架构 | 1985 | Intel 80386, AMD Am386 (1991) | 32位 | 46位元 | 32位 | 32位 架构(保护模式), 标签页技术,模拟8086模式, IBM PS/2 | |
第四代 (流水线、缓冲存储器) | 1989 | Intel 80486 Cyrix Cx486S/DLC(1992) AMD Am486(1993)/AMD Am5x86(1995) |
流水线, 置晶x87 浮点运算器 (486DX), 置晶CPU缓冲存储器 | ||||
第五代 (超标量) |
1993 | Intel Pentium, Pentium MMX(1996) | 超标量, 64位 地址总线, 更快的浮点运算器, MMX (Pentium MMX), 高级程序化插断控制器, 点对点多元处理 | ||||
1994 | NexGen Nx586 AMD 5k86/K5 (1996) |
分合式微架构(微作业指令转换) | |||||
1995 | Cyrix Cx5x86 Cyrix 6x86/MX(1997)/MII(1998) |
脱序超标量执行引擎 | |||||
第六代 (实存储器位置扩展, 微作业指令转换) |
1995 | Intel Pentium Pro | 36位 (PAE) | 微作业指令转换, 待情形检索指令, 脱序超标量执行引擎, 推理型执行引擎, 三路x86超标量流水线, 超标量浮点运算器, 实存储器位置扩展, 置片二次元缓存 | |||
1997 | Intel Pentium II, Pentium III (1999) Celeron(1998), Xeon(1998) |
置体(Pentium II)或置晶(Celeron)二次元缓存, SSE (Pentium III), SLOT 1, Socket 370 or SLOT 2 (Xeon) | |||||
1997 | AMD K6/K6-2(1998)/K6-III(1999) | 32位 | 3DNow!, 三次元缓存系统 (K6-III) | ||||
增强型平台 | 1999 | AMD Athlon, Athlon XP/MP(2001) Duron(2000), Sempron(2004) |
36位 | MMX+, 3DNow!+, DDR技术引入前端总线, Slot A or Socket A | |||
2000 | Transmeta Crusoe | 32位 | “变形”CMS技术下的x86平台处理器, VLIW-128核心, 置晶存储器控制器, 置晶PCI桥控制器 | ||||
Intel Pentium 4 | 36位 | SSE2, 超线程 (Northwood), NetBurst微架构, QDR技术引入前端总线, 执行跟踪缓存, Socket 478 | |||||
2003 | Intel Pentium M Intel Core (2006), Pentium Dual-Core (2007) |
微作业指令融合, NX位元 (Dothan) | |||||
Transmeta Efficeon | CMS 6.0.4, VLIW-256, NX位元, HT总线 | ||||||
IA-64 | 64位过渡时代 1999 ~ 2005 |
2001 | Intel Itanium (2001 ~ 2017) | 52位元 | 64位 EPIC架构, 128位VLIW指令捆绑, 置晶x86硬件支持x86操作系统和程序(早期版本),软件IA-32 EL模拟x86程序(Itanium 2), Itanium 通用寄存器被映射成x86寄存器 | ||
x64 | 64位拓展时代 从2001起 |
x64是x86架构的64位拓展,在它的遗留模式中原封了完整不变的x86架构。x64处理器的真正架构置于64位模式中,它没有分段式的定位存储器能力,因此它仅拥有架构许诺的64位序列存储器位置,现时情况仅有48位被实现;与这个64位模式共生的是用来支持大部分32位x86程序的兼容模式 | |||||
2003 | Athlon 64/FX/X2(2005), Opteron Sempron(2004)/X2(2008) Turion 64(2005)/X2(2006) |
40位元 | AMD64 (排除早先一些32位Sempron处理器), 置晶存储器控制器, HT总线, 置晶双核心(X2), AMD-V (Athlon 64 Orleans), Socket 754/939/940 or AM2 | ||||
2004 | Pentium 4 (Prescott) Celeron D, Pentium D (2005) |
36位 | EM64T (仅在特定型号的Pentium 4和Celeron D开启), SSE3, 第二代NetBurst流水线, 双核心(置晶: Pentium D 8xx; 置片: Pentium D 9xx), Intel VT(Pentium 4 6x2), socket LGA 775 | ||||
2006 | Intel Core 2 Pentium Dual-Core (2007) Celeron Dual-Core (2008) |
Intel 64 (<<== EM64T), SSSE3(65纳米), 宽域脱序超标量执行引擎, 微作业指令融合, 宏融合, 置片四核心(Core 2 Quad), 智慧分享二次元缓存 | |||||
2007 | AMD Phenom/II(2008) Athlon II(2009), Turion II(2009) |
48位 | Monolithic quad-core(X4)/triple-core(X3), SSE4a, Rapid Virtualization Indexing (RVI), HT总线 3, AM2+ or AM3 | ||||
2008 | Intel Core 2 (45纳米) | 36位 | SSE4.1 | ||||
Intel Atom | 上网本或低功耗智慧装置的处理器, P54C核心的重用 | ||||||
Intel Core i7 Core i5 (2009), Core i3 (2010) |
QuickPath, 置片绘图及存储器总线 (Clarkdale), SSE4.2, 扩展页表 (EPT), LGA 1366 (Nehalem) or LGA 1156 socket | ||||||
VIA Nano | 基于硬件的加密组件; 智慧适应型电源管理 | ||||||
2010 | AMD FX | 48位 | 八核心, CMT(集群多线程), 乘积累加运算, OpenCL, AM3+ | ||||
2011 | AMD APU A and E Series (Llano) | 40位元 | 置晶GPGPU, PCI Express 2.0, Socket FM1 | ||||
AMD APU C, E and Z Series (Bobcat) | 36位 | 低功耗智慧装置APU | |||||
Intel Core i3, Core i5 and Core i7 (Sandy Bridge/Ivy Bridge) |
内部环形连接, LGA 1155 socket. | ||||||
2012 | AMD APU A Series (Bulldozer, Trinity and later) | 48位 | AVX, Bulldozer based APU, Socket FM2 or Socket FM2+ | ||||
Intel Xeon Phi (Knights Corner) | 48位 | 辅助处理器操作系统支撑的PCI-E界面卡形式的XEON系统的辅助处理器, 多异核心晶片, 顺序P54C, 超宽VPU (512位 SSE), LRBni 指令(8× 64位) | |||||
2013 | AMD Jaguar (Athlon, Sempron) |
48位 | SoC, 适用于电子游乐器和低功耗智慧装置的处理器 | ||||
Intel Silvermont (Atom, Celeron, Pentium) |
36位 | SoC, 低或极低功耗智慧装置的处理器 | |||||
Intel Core i3, Core i5 and Core i7 (Haswell/Broadwell) | 39位元 | AVX2, FMA3, TSX, BMI1, and BMI2 instructions, LGA 1150 socket | |||||
2015 | Intel Broadwell-U (Intel Core i3, Core i5, Core i7, Core M, Pentium, Celeron) |
SoC, 置片Broadwell-U PCH-LP (多芯片模块) | |||||
2015/2016 | Intel Skylake/Kaby Lake/Cannonlake (Intel Core i3, Core i5, Core i7) |
46位元 | AVX3 | ||||
2016 | Intel Xeon Phi (Knights Landing) | 48位 | 孤立启动型Xeon系统的加速器, 基于Airmont (Atom)核心技术 | ||||
2016 | AMD Bristol Ridge (AMD (Pro) A6/A8/A10/A12) |
48位 | 置晶FCH, SoC, AM4 socket | ||||
2017 | AMD Ryzen Series/AMD Epyc Series | AMD的多线程技术, LGA (4094, Epyc), 置片多芯片, Epyc将取代Opteron产品线 | |||||
软件模拟时代 ARM64 |
2017 | Windows 10 on ARM64 | Microsoft与Qualcomm的合作结晶将Windows 10带入至基于ARM64的Qualcomm平台,并针对32位x86程序提供CHPE模拟器有效支持,从版本1709 (16299.15)起 | ||||
CPU纪元朝代 | 面市时间 | 卓越的CPU型号 | 实存储器位置找寻空间 | 引入功能及注释 |
设计
x86架构是重要地可变指令长度的CISC(复杂指令集电脑,Complex Instruction Set Computer)。字组(word, 4位组)长度的存储器存取允许不对齐存储器地址,字组是以低位字节在前的顺序存储在存储器中。向后兼容性及Intel量产制程经常领先业界一直都是在x86架构的发展背后一股驱动力量(设计的需要决定了这项因素而常常导致批评,尤其是来自对手处理器的拥护者和理论界,他们对于一个被广泛认为是落后设计的架构的持续成功感到不解)。但在较新的微架构中,x86处理器会把x86指令转换为更像RISC的微指令再予执行,从而获得可与RISC比拟的超标量性能,而仍然保持向前兼容。x86架构的处理器一共有四种执行模式,分别是真實模式,保护模式,系统管理模式以及虚拟V86模式。
在这篇简短的文章中出现的指令和寄存器助忆符号的名称,都在Intel文件中有所指定以及使用在Intel汇编器(Assembler)中(和兼容的,比如微软的MASM、Borland的TASM、CAD-UL的as386等等)。一个以Intel语法指定的指令"mov al, 30h"与AT&T语法的"movb $0x30, %al"相当,都是会被转译为两个字节的机器代码"B0 30"(十六进制)。你可以发现在这段程序中的"mov"或"al",都是原来的Intel助忆符号。如果我们想要的话,我们可以写一个汇编器由代码'move immediate byte hexadecimally encoded 30 into low half of the first register'(移动立即值位元十六进制编码30到第一个寄存器的低半部位),来产生相同的机器代码。然而,传统上汇编器(Assembler)一直使用Intel的助忆符号。
运作模式
实模式
在实模式下,存储器的存取是被区段开来。为了得到最后20位元的存储器地址,要将区段的地址往左移动4位,并且加上偏移的地址。因此,实模式下总共可以寻址的空间是220字节,或者是1MB,于1979年是相当让人印象深刻的象征。在实模式下有两种寻址模式:near和far。在far模式,区段跟偏移都需要被指定;在near模式,只需要偏移模式被指定,而存储器区段是由适当的区段寄存器获得。以资料而言是使用DS寄存器,代码是CS寄存器,堆栈是SS寄存器。举个例子,如果DS是A000h且SI是5677h,DS:SI会指向存储器的绝对地址DS × 16 + SI = A5677h
在这种架构下,两对不同的区段/偏移可以指向一个相同的绝对地址。因此如果DS是A111h且SI是4567h,DS:SI会指向跟上一段相同的A5677h。除了异值同址重复性之外,这种架构无法同时一次拥有4个以上的区段。此外,CS、DS和SS是为了程序正确功能而必须的,因此仅仅只有ES可以被用来指向其他的地方。这种模式原本是为了与Intel 8085兼容,导致程序员永无止尽的痛苦。
除了以上所说的,8086也拥有16-bit的32K(其变种 Intel 8088 是8-bit的64K)输入输出空间,以及一个由硬件支持的64K(一个区段)存储器堆栈。只有words(2字节)可以被推入到堆栈中。堆栈是由存储器的上端往下成长,他的底端是由SS:SP指向。有256个中断,可以由硬件或是软件同时组成。中断是可以串连在一起,使用堆栈来存储返回被中断的程序地址。
16位保护模式
Intel 80286可以在不改变任何东西下,支持8086的实模式16位软件,然而它也支持额外的工作模式称为保护模式,可以将可寻址的物理内存扩展到16MB,可寻址的虚拟内存最大到1GB。这是使用节区寄存器来存储在节区表格中的索引值。处理器中有两个这样的表格,分别为GDT和LDT,每一个可以存储最多8192个节区的描述子,每一个节区可以给予最大到64KB的存储器存取。节区表格提供一个24位的基底地址(base address),可以用此基底地址增加想要的偏移量来创造出一个绝对地址。此外,每一个节区可以被赋予四种权限等级中的一种(称为"rings")。
尽管这个推出的功能是一项进步,但是他们并没有被广泛地使用,因为保护模式的操作系统无法执行当时的实模式软件。这样的能力只有在随后80386处理器的虚拟86模式中出现。
在同时,操作系统比如OS/2尝试使用类似乒乓的方法,让处理器在保护和实模式间切换。这样都会让电脑变慢且不安全,像是在实模式下的程序可以轻易地使电脑当机。OS/2也定义了限制性的程式设计规则允许"Family API"或"bound"程序可以在实模式或保护模式下执行。然而这是给原本为保护模式下设计的程序有关,反之则不然。保护模式程序并不支持节区选择子和物理内存之间的关系。有时候会错误地相信在16位保护模式下执行实模式的程序,导致IBM必须选择使用Intel保留给BIOS的中断调用。事实上这类的程序使用任意的选择子数值和使用在上面提到的“节区运算”的方式有关。
这个问题也在Windows 3.x上出现。这个推出版本想要在16位保护模式下执行程序,而先前的版本只能在实模式下执行。理论上,如果Windows 1.x或2.x程序是写得“适当”且避免使用节区运算的方式,它就有可能在真实和保护模式两者下执行。Windows程序一般来说都会避免节区运算,这是因为Windows实现出软件的虚拟内存方式,及当程序不执行时候,搬移存储器中的代码和资料,所以操作绝对地址的方式是很危险的;当程序不执行时,被认为要保持存储器区块的“handles”,这样的handles已经非常相当于保护模式的选择子。在保护模式下的Windows 3.0执行一个旧的程序,会触发一个警告对话盒,建议在实模式下执行Windows(推测还是仍然可以使用扩展存储器,可能是在80386机器用EMM386模拟,因此它并不被局限于640KB)或是从厂商那更新到新的版本。好的行为之程序可能可以使用特别的工具来避免这样的对话盒。不可能有些GUI程序在16位保护模式下执行,且其它GUI程序在实模式执行,可能是因为这会需要两个分开的环境且会依于前面所提到的处理器在两个模式间的乒乓效应。从Windows 3.1版开始,实模式就消失了。
32位保护模式
Intel 80386推出后,也许是到目前为止x86架构的最大跃进。除了需要值得注意的Intel 80386SX是32位架构但仅只有24位寻址(和16位资料总线)。除此之外其他架构都是32位 - 所有的寄存器、指令集、输出输入空间和存储器寻址。为了能够在后者所说的功能工作,要使用32位扩展的保护模式。然而不像286,386所有的区段可以使用32位的偏移量,即使存储器空间有使用区段,但也允许应用程式存取超过4GB空间而不需要区段的分隔。此外,32位保护模式提供标签页的支持,是一种让虚拟内存得以实现的机制。
没有新的通用寄存器被加入。所有16位的寄存器除了区段寄存器外都扩展为32位。Intel在寄存器的助记符号上加入“E”来表示(因此扩展的AX变成EAX,SI变成ESI,依此类推)。因为有更多的寄存器数量、指令、和运算单元,因此机器代码的格式也被扩展。为了提供与先前的架构兼容,包含执行码的区段可以被标示为16或是32位的指令集。此外,特殊的前置符号也可以用来在16位的区段包含32位的脚本,反之亦然。
标签页跟区段的存储器存取是为了支持现在多工操作系统所必须要的。Linux、386BSD、Windows NT和Windows 95都是一开始为386所发展,因为它是第一颗提供可靠地程序分离存储器空间的支持(每个程序拥有自己的寻址空间)以及可以在必要的情况下打断他们程序的执行(使用ring,一种x86保护模式下权力分级的名称)。这种386的基本架构变成未来所有x86系列发展的基础。
Intel 80386数学辅助运算处理器也在集成到这个CPU之后的x86系列中,也就是Intel 80486。新的FPU可以帮助浮点数运算,对于科学计算和图形设计是非常重要。
Intel首次在80386SL将系统管理模式引入x86体系结构。
虚拟86模式
功能扩展
MMX
1996年Intel的MMX(AMD认为这是矩阵数学扩展Matrix Math Extensions的缩写,但大多数时候都被当成Multi-Media Extension,而Intel从来没有官方宣布过词源)技术出现。尽管这项新的科技得到广泛宣传,但它的精髓是非常简单的:MMX定义了八个64位SIMD寄存器,与Intel Pentium处理器的FPU堆栈有相重叠。不幸的是,这些指令无法非常简单地对应到由原来C编译器所产生的脚本中。MMX也只局限于整数的运算。这项技术的缺点导致MMX在它早期的存在有轻微的影响。现今,MMX通常是用在某些2D影片应用程式中。
3DNow!
1997年AMD推出3DNow!,是对于MMX的SIMD的浮点指令增强(针对相同的MMX寄存器)。尽管这些也没有解决编译器的难题,但这项技术的推出符合了PC上的3D休闲娱乐应用程式之崛起。3D游戏开发者和3D绘图硬件制造商在AMD的AMD K6和Athlon系列处理器上,使用3DNow!来帮助增加他们的性能。微软后来也在其开发的Direct X7.0中加入针对3DNow!的优化,使当时的Athlon处理器在3D游戏性能上首次全面超过对手英特尔的Pentium 3处理器。
SSE
在1999年Intel推出SSE指令集,增加了八个新的128-bit寄存器(不跟其他的寄存器重叠使用)。这些指令类似于AMD的3DNow!,主要是增加浮点数运算的SIMD指令。
SSE2
2001年英特尔推出SSE2指令集,增加了:
- 完整地补充了整数指令(与MMX相似)到原来的SSE寄存器。
- 64位的SIMD浮点运算指令到原来的SSE寄存器。
第一个的增加导致MMX几乎是过时可以舍弃的,第二个则允许这些指令可以让传统的编译器现实地产生。
SSE3
于2004年随着Pentium 4处理器的改版Prescott核心推出。SSE3增加特定的存储器和thread-handling指令来提升Intel超线程的性能,在科学计算方面也有增强。
SSE4
2007年1月,Intel公开发表使用其45纳米制程"Penryn"晶片家族的PC和伺服器。"Penryn"是这一系列依据英代尔Core微架构之手提电脑、台式电脑和伺服器晶片家族的代号,首次正式发布时共有16款处理器,除了一款Intel Core 2 Extreme QX9650是针对普通台式电脑市场外,其余的双核Xeon 5200系列和四核5400系列都是伺服器处理器。基本上Penryn是继Merom之后的缩小版Core 2 Duo,再加上47条新的SSE4指令集等额外配备。SSE4指令集之首次发表时间为2006年9月的英特尔开发者论坛(IDF,Intel Developer Forum)。
另外,x86处理器制造厂商AMD也在该公司K10架构的Phenom处理器中,加入4条新的SSE4A指令集。注意,SSE4与SSE4A无法彼此兼容。
AVX
FMA
AES
SHA
寻址模式
寻址模式在16-bit的x86处理器:
32-bit寻址模式在32-bit或64-bit的x86处理器:
64-bit寻址模式在64-bit的x86处理器:
x86汇编指令lea,是Load Effective Address的缩写,其优势是:
- LEA指令具有单时钟周期,执行效率很高。
- 是CPU地址生成单元参与运算的,而不是ALU参与运算的,所以在流水线上不会与上下文的算术逻辑指令产生流水相关
- INTEL指令集中不存在很多RISC机器所具有的三操作数算术运算指令,比如像ARM的"add r0,r1,r2",而LEA指令恰好提供了同样的功能,以模拟“三元算术逻辑指令”。例如:lea ebx ,[eax+edx]
- 在汇编语言程式设计中,在需要获取一个变量地址时,使用lea是很方便的。而mov指令则常常出错,因为在微软MASM汇编语法中,label和variable是不同的:addr不可前向引用,offset则能;addr可以处理局部变量而 offset则不能。
x86寄存器
16位
自Intel 8086和8088起,有14个16位元寄存器。其中四个(AX, BX, CX, DX)是通用目的(尽管每个寄存器都有附加目的;举个例子:只有CX可以被用来当作loop(循环)指令的计数器。)每个寄存器可以被当成两个分开的字节存取(因此BX的高位元可以被当成BH,低位元则可以当成BL)。除了这些寄存器,还有四个区段寄存器(CS、DS、SS、ES)。他们用来产生存储器的绝对地址。还有两个指针寄存器(SP是指向堆栈的底部,BP可以用来指向堆栈或存储器的其它地方)。两个指针寄存器(SI和DI)可以用来指向数组的内部。最后,有旗标寄存器(包含状态旗标比如进位、溢出、结果为零,等等)。以及IP是用来指向目前执行指令的地址。
32位
自Intel 80386起,四个通用寄存器(EAX, EBX, ECX, EDX),它们较低的16位分别与原本16位的通用寄存器(AX, BX, CX, DX)重叠共享。指针寄存器(EIP, EBP, ESP, ESI, EDI)。区段寄存器除了原本的(CS、DS、SS、ES),另外新增(FS、GS),但是区段寄存器在32位模式下改做为存储器区块的选择子寄存器。旗标寄存器被扩展为32位,较低的16位与原本在16位下的旗标寄存器重叠共享。
64位
MMX寄存器(MM0~MM7),它们分别与浮点运算器〈FP0~FP7〉相重叠,所以MMX与浮点运算不可同时使用,必须透过切换选择要使用哪一种。
AMD64
英特尔原本已经决定在64位的世代推出新的架构IA-64技术的Itanium处理器产品线来接替取代x86,但它与x86的软件天生不兼容,因此藉以各种形式来执行x86的软件,不过,效率十分低下,加之处理器本身和软件移植的成本难以控制,因此这个项目最终流产。
AMD自行把32位x86(或称为IA-32)拓展为64位,并命名为x86-64或Hammer架构,而后更名为AMD64架构,并曾禁止使用之前的名字来称呼这一架构[1]。以这个技术为基础的第一个产品是单核心的Opteron和Athlon 64处理器家族。由于AMD的64位处理器产品线首先进入市场,且微软也不愿意为英代尔代号为Yamhill的64位版x86处理器开发第三个不同的64位操作系统,英代尔被迫采纳AMD64架构且增加某些新的扩展到他们自己的产品,命名为EM64T架构(显然他们不想承认这些指令集是来自它的主要对手),EM64T后来被英代尔正式更名为Intel 64。
这个架构也被称为 64位拓展架构,即x64,譬如四个通用寄存器(RAX, RBX, RCX, RDX)是由32位的(EAX, EBX, ECX, EDX)64位扩展而来,相应的还有 指针寄存器(RIP, RBP, RSP, RSI, RDI),以及增加八个通用寄存器(R8~R15)等等。 这些资源只可在x64处理器的64位模式下使用,在用来支持x86软件的遗留模式和兼容模式中是不可见的。
128位
256位元
SIMD registers YMM0 - YMM15.
512位
SIMD registers ZMM0 - ZMM31.
寄存器结构
64 | 56 | 48 | 40 | 32 | 24 | 16 | 8 |
---|---|---|---|---|---|---|---|
R?X | |||||||
E?X | |||||||
?X | |||||||
?H | ?L |
64 | 56 | 48 | 40 | 32 | 24 | 16 | 8 |
---|---|---|---|---|---|---|---|
? | |||||||
?D | |||||||
?W | |||||||
?B |
16 | 8 |
---|---|
?S |
64 | 56 | 48 | 40 | 32 | 24 | 16 | 8 |
---|---|---|---|---|---|---|---|
R?P | |||||||
E?P | |||||||
?P | |||||||
?PL |
Note: The ?PL registers are only available in 64-bit mode.
64 | 56 | 48 | 40 | 32 | 24 | 16 | 8 |
---|---|---|---|---|---|---|---|
R?I | |||||||
E?I | |||||||
?I | |||||||
?IL |
Note: The ?IL registers are only available in 64-bit mode.
64 | 56 | 48 | 40 | 32 | 24 | 16 | 8 |
---|---|---|---|---|---|---|---|
RIP | |||||||
EIP | |||||||
IP |
虚拟化
Intel CPU的x86虚拟化技术有VT-x、VT-d等。AMD CPU的x86虚拟化技术有AMD-V等。
x86指令格式
x86与x86-64指令集的指令的格式为:
指令前缀 | 指令码 | ModR/M | SIB | 偏移 | 直接数 |
---|---|---|---|---|---|
Instruction Prefixes | Opcode | Displacement | Immediate | ||
可选。 最多4个单字节前缀。 任何顺序均可。 |
单字节、双字节、三字节 | 按需。 0-2位:R/M 3-5位:Reg/Opcode 6-7位:Mod |
按需。 0-2位:Base 3-5位:Index 6-7位:Scale |
0、1、2、4字节长 | 0、1、2、4字节长 |
指令前缀
分为4组,每组用1个字节编码。每组在指令中至多指定1个前缀值。4组的顺序可以任意。
- 第1组锁与重复(Lock and repeat)
- 锁(LOCK)编码为:F0H。用于互斥访问共享内存的操作。
- 非零时重复(REPNE/REPNZ)编码为:F2H。用于字符串操作指令。
- 为零时重复(REP/REPE/REPZ)编码为:F3H。用于字符串操作指令。
- 第2组
- 段覆盖(Segment override):CS、SS、DS、ES、FS、GS的段覆盖前缀的编码分别是2EH、36H、3EH、26H、64H、65H.
- 分支提示(Branch hints),用于条件分支指令Jcc。提示分支不发生编码为2EH;提示分支发生编码为3EH。
- 第3组操作数长度覆盖(Operand-size override)编码为66H。用于在16位与32位操作数切换。
- 第4组地址长度覆盖(Address-size override)编码为67H.用于在16位与32位地址切换。
指令码
长度为1、2或3字节,此外ModR/M中还可能有3位。对于双字节指令码或三字节指令码,其中的第1个字节为0FH,用于与指令前缀区分。
ModR/M与SIB
许多指令的内存操作数需要使用ModR/M字节作为寻址模式说明符。其中的mod与r/m组合,共有32个值,表示8个寄存器与24种寻址模式。reg/opcode表示寄存器号或者额外的3位指令码,其具体含义依赖基本指令码。Mod与R/M的5位表示的第一操作数(源与目的操作数中寻址方式更复杂的那个操作数,指令码中的“方向位”direction bit(d)给出源或目的操作数哪个是第一操作数)的寻址方式如下:
寻址方式 | Mod | R/M |
---|---|---|
[EAX] | 00 | 000 |
[ECX] | 001 | |
[EDX] | 002 | |
[EBX] | 003 | |
[--][--] | 004 | |
disp32 | 005 | |
[ESI] | 006 | |
[EDI] | 007 | |
[EAX]+disp8 | 01 | 000 |
[ECX]+disp8 | 001 | |
[EDX]+disp8 | 002 | |
[EBX]+disp8 | 003 | |
[--][--]+disp8 | 004 | |
[EBP]+disp8 | 005 | |
[ESI]+disp8 | 006 | |
[EDI]+disp8 | 007 | |
[EAX]+disp32 | 10 | 000 |
[ECX]+disp32 | 001 | |
[EDX]+disp32 | 002 | |
[EBX]+disp32 | 003 | |
[--][--]+disp32 | 004 | |
[EBP]+disp32 | 005 | |
[ESI]+disp32 | 006 | |
[EDI]+disp32 | 007 | |
EAX/AX/AL/MM0/XMM0 | 11 | 000 |
ECX/CX/CL/MM/XMM1 | 001 | |
EDX/DX/DL/MM2/XMM2 | 002 | |
EBX/BX/BL/MM3/XMM3 | 003 | |
ESP/SP/AH/MM4/XMM4 | 004 | |
EBP/BP/CH/MM5/XMM5 | 005 | |
ESI/SI/DH/MM6/XMM6 | 006 | |
EDI/DI/BH/MM7/XMM7 | 007 | |
1.[--][--]表示随后的SIB字节指明寻址方式; 2.Mod为11B时,表示寄存器操作数。对于R/M的每个值,根据指令码与操作数长度属性确定具体的寄存器号。 3.当指令需要第2操作数时,由Reg/Opcode的3位给出。第2操作数只能是寄存器操作数。寄存器的指定方式,与Mod为11B时指定作为第1操作数的寄存器的方式完全相同。 |
某些ModR/M字节表示的寻找模式,需要SIB字节来补充寻址方式。scale表示比例系数;index表示变址寄存器号;base表示基址寄存器号。使用scale与index的5位定义比例变址寄存器如下:
比例变址 | Scale | Index |
---|---|---|
[EAX] | 00 | 000 |
[ECX] | 001 | |
[EDX] | 002 | |
[EBX] | 003 | |
无 | 004 | |
[EBP] | 005 | |
[ESI] | 006 | |
[EDI] | 007 | |
[EAX*2] | 01 | 000 |
[ECX*2] | 001 | |
[EDX*2] | 002 | |
[EBX*2] | 003 | |
无 | 004 | |
[EBP*2] | 005 | |
[ESI*2] | 006 | |
[EDI*2] | 007 | |
[EAX*4] | 10 | 000 |
[ECX*4] | 001 | |
[EDX*4] | 002 | |
[EBX*4] | 003 | |
无 | 004 | |
[EBP*4] | 005 | |
[ESI*4] | 006 | |
[EDI*4] | 007 | |
[EAX*8] | 11 | 000 |
[ECX*8] | 001 | |
[EDX*8] | 002 | |
[EBX*8] | 003 | |
无 | 004 | |
[EBP*8] | 005 | |
[ESI*8] | 006 | |
[EDI*8] | 007 |
3位base表示的基址寄存器号,定义如下:
EAX | ECX | EDX | EBX | ESP | [*] | ESI | EDI |
---|---|---|---|---|---|---|---|
000 | 001 | 002 | 003 | 004 | 005 | 006 | 007 |
[*]有两种含义:1.如果Mod为00B,则[scaled index] + disp32,即没有基址寄存器。 2.如果Mod为01B或10B,表示基址寄存器为EBP。 |
在汇编程式设计中,一般把第1操作数的寻址方式总结为如下8种:
寻址方式 | 英文术语 | 举例 |
---|---|---|
立即(数)寻址 | immediate addressing | mov EAX, 01F2H |
寄存器寻址 | register addressing | mov EAX, ESI |
直接寻址 | direct addressing | mov EAX, DWORD PTR [1FFA00H] |
寄存器间接寻址 | register indirect addressing | mov EAX, DWORD PTR [EBX] |
基址加变址寻址 | base-plus-index addressing | mov EAX, DWORD PTR [EBX+ESI] |
寄存器相对寻址 或基址相对寻址 |
register relative addressing | mov EAX, DWORD PTR [EDI+01F4H] |
基址相对加变址寻址 | base relative-plus-index addressing | mov EAX, DWORD PTR 01F4H[EDI+EBX] |
比例变址寻址 | scaled-index addressing | mov EAX, DWORD PTR 01F4H[EDI*8+EBX] |
综合指令格式中的ModR/M与SIB两个字节的语义规定,指令的第1操作数的寻址方式可总结为4种物理实现:
- 立即数:表示在指令的“立即数”部分。包括了直接寻址,即立即数作为内存的地址。
- 寄存器操作数:Mod为11B,根据R/B部分的值、指令码、操作数长度属性,确定具体的寄存器号。
- 基址相对寻址:即[Reg+disp8或disp32]。包括了寄存器间接寻址。这种情况计算第1操作数地址时使用了1个寄存器。
- 基址加比例变址的相对寻址:即[BaseReg+IndexReg*scale+disp8或disp32]。这种情况计算第1操作数地址时使用了2个寄存器。
位移与立即数
某些寻址方式需要给出位移值。有些指令需要给出立即数作为操作数。
生产商
目前仍在设计、生产并贩卖x86处理器的公司包括:
曾经设计、生产并贩卖x86处理器,但现已退出x86处理器市场的公司包括:
- Chips and Technologies
- Cyrix(被威盛电子收购)
- IBM
- IDT
- 国家半导体(NS,National Semiconductor)
- 日本电气(NEC)
- NexGen(被超微收购)
- Rise Technology(被硅统科技收购)
- 意法半导体
- 硅统科技(SiS)
- 德州仪器(TI,Texas Instruments)
- 全美达(Transmeta)
- 联华电子(UMC)
- Montalvo
参考文献
- ^ Rust, Adamson. AMD bans use of Hammer word, X86-64. The Inquirer. 2003-04-24 [2010-10-30].