ARM mimarisi
Vikipedi, özgür ansiklopedi
ARM mimarisi (orijinal adı Acorn RISC Machine) pek çok gömülü tasarımda kullanılan 32-bit RISC işlemci mimarisidir. Güç tasarruf özelliklerinden dolayı, ARM işlemciler mobil elektronik gibi düşük güç tüketiminin kritik bir parametre olduğu pazarda en fazla tercih edilen CPU' dur.
Günümüzde ARM işlemci ailesi tüm yeryüzündeki 32-bit gömülü işlemcilerin %75' ini oluşturmaktadır. ARM işlemciler taşınabilir cihazlardan (PDA, cep telefonu, medya oynatıcılar, avuç içi oyun üniteleri ve hesap makinaları) bilgisayar parçalarına kadar (disk sürücüler, masaüstü router' lar) tüketici elektroniğinin her alanında yoğun olarak kullanılmaktadır. Bu ailenin bugünlerdeki en önemli kolu Intel' n XScale' dir.
Gömülü tasarım uygulamalarında kullanılan en popüler ARM mimarisi komut kümeleri 32-bit'lik ARM ve 16-bit'lik Thumb komut kümeleridir. Her Thumb komutunun bir ARM komut karşılığı vardır fakat bunun tersi doğru değİldir. Bu sorun bu iki komut kümesinin bir arada çalışmasının mümkün olması ile aşılmıştır (interworking). Bu sayede, 16-bit'lik komut kümesinin daha az bellek kullanımı ve 32-bit'lik komut kümesinin üstün işlevsellik özellikleri bir arada kullanılabilmektedir.
Konu başlıkları |
[değiştir] Tarihi
Acorn Computers Ltd tarafından geliştirme projesi olarak ARM dizaynı 1983 yılında başladı.
Roger Wilson and Steve Furber liderliğinde takım, gelişmiş bir MOS Technology 6502'sinin neye benzeyeceğinin geliştirilmesine başladı. Acorn, 6502'sini temel aldığı için programa benzer chip, şirket için önemli bir avantaj sağladı.
Takım, ARM1 isimli geliştirilmiş örneği Nisan 1985[1]'de ve takip eden yılda ilk gerçek ürün olan ARM2'yi tamamladı. ARM2'nin göze çarpan özellikleri, 32-bit veri yolu, 26-bit address space, 64 Mbayt adres alanı ve 16 adet 32-bitlik yazmaç sağlar. Bu yazmaçlardan birtanesi program sayacı olarak kullanılır. Bu sayacın en fazla 6 bit'i ve en az 2 bit'i işlemci durum göstergesi'ni tutar. 30,000 transistör ile yeryüzündeki en basit kullanışlı 32-bit mikroişlemcisi ARM2 işlemcisidir. Bu basitliğin çoğu microkod bulundurmamasından ve günümüzün çoğu işlemcisinde olduğu gibi önbellek içermemesidir. Bu basitlik Intel 80286[kaynak belirtilmeli] işlemcisinden hem daha iyi performans gösterirken hem de daha az güç kullanımı sağlıyordu. ARM3, performansı daha fazla arttırmasını sağlayan 4KB önbellek ile geliştirildi.
ARM6'nın ilk modeli 1991 yılında piyasaya sürüldü ve Apple, kendi Apple Newton PDA'ları için temel olarak ARM6-based ARM 610'nu kullandı. 1994 yılında, Acorn kendi Risc PC bilgisayarlarında ana CPU olarak the ARM6-based ARM 610'nu kullandı.
[değiştir] ARM çekirdekleri
Family | Arch | Core | Feature | Cache (I/D)/MMU | Typical MIPS @ MHz | In application |
---|---|---|---|---|---|---|
ARM1 | ARMv1 | ARM1 | None | ARM Evaluation System second processor for BBC Micro | ||
ARM2 | ARMv2 | ARM2 | Architecture 2 added the MUL (multiply) instruction | None | 4 MIPS @ 8 MHz | Acorn Archimedes, Chessmachine |
ARMv2a | ARM250 | Integrated MEMC (MMU), Graphics and IO processor. Architecture 2a added the SWP and SWPB (swap) instructions. | None, MEMC1a | 7 MIPS @ 12 MHz | Acorn Archimedes | |
ARM3 | ARMv2a | ARM2a | First use of a processor cache on the ARM. | 4K unified | 12 MIPS @ 25 MHz | Acorn Archimedes |
ARM6 | ARMv3 | ARM60 | v3 architecture first to support addressing 32 bits of memory (as opposed to 26 bits) | None | 10 MIPS @ 12 MHz | 3DO Interactive Multiplayer, Zarlink GPS Receiver |
ARM600 | Cache and coprocessor bus (for FPA10 floating-point unit). | 4K unified | 28 MIPS @ 33 MHz | |||
ARM610 | Cache, no coprocessor bus. | 4K unified | 17 MIPS @ 20 MHz | Acorn Risc PC 600, Apple Newton 100 series | ||
ARM7 | ARMv3 | ARM700 | 8KB unified | 40 MHz | ||
ARM710a | 8KB unified | 40 MHz | Acorn Risc PC 700, Apple eMate 300 | |||
ARM7100 | Integrated SoC. | 8KB unified | 18 MHz | Psion Series 5 | ||
ARM7500 | Integrated SoC. | 4KB unified | 40 MHz | Acorn A7000 | ||
ARM7500FE | Integrated SoC. "FE" Added FPA and EDO memory controller. | 4KB unified | 56 MHz | Acorn A7000+ | ||
ARM7TDMI | ARMv4T | ARM7TDMI(-S) | 3-stage pipeline, Thumb | none | 15 MIPS @ 16.8 MHz | Game Boy Advance, Nintendo DS, iPod, Lego NXT |
ARM710T | 8KB unified, MMU | 36 MIPS @ 40 MHz | Psion Series 5mx | |||
ARM720T | 8KB unified, MMU | 60 MIPS @ 59.8 MHz | Zipit | |||
ARM740T | MPU | |||||
ARMv5TEJ | ARM7EJ-S | Jazelle DBX, Enhanced DSP instructions, 5-stage pipeline | none | |||
StrongARM | ARMv4 | SA-110 | 16KB/16KB, MMU | 200 MHz | Apple Newton 2x00 series, Risc PC, Rebel/Corel Netwinder, Chalice CATS, Psion Netbook | |
SA-1110 | 16KB/16KB, MMU | 233 MHz | LART, Intel Assabet, Ipaq H36x0, Balloon2, Zaurus SL-5x00 | |||
ARM9TDMI | ARMv4T | ARM9TDMI | 5-stage pipeline | none | ||
ARM920T | 16KB/16KB, MMU | 200 MIPS @ 180 MHz | Armadillo, GP32,GP2X (first core), Tapwave Zodiac (Motorola i. MX1), Hp49g+, Sun SPOT, Samsung SC32442 (HTC TyTN, FIC Neo1973[2]) | |||
ARM922T | 8KB/8KB, MMU | |||||
ARM940T | 4KB/4KB, MPU | GP2X (second core) | ||||
ARM9E | ARMv5TE | ARM946E-S | Enhanced DSP instructions | variable, tightly coupled memories, MPU | Nintendo DS, Nokia N-Gage, Conexant 802.11 chips | |
ARM966E-S | no cache, TCMs |
ST Micro STR91xF, includes Ethernet [1] |
||||
ARM968E-S | no cache, TCMs | |||||
ARMv5TEJ | ARM926EJ-S | Jazelle DBX, Enhanced DSP instructions | variable, TCMs, MMU | 220 MIPS @ 200 MHz, | Mobile phones: Sony Ericsson (K, W series), Siemens and Benq (x65 series and newer), Texas Instruments OMAP1710, Qualcomm MSM6100, MSM6125, MSM6225, MSM6245, MSM6250, MSM6255A, MSM6260, MSM6275, MSM6280, MSM6300, MSM6500, MSM6800 | |
ARMv5TE | ARM996HS | Clockless processor, Enhanced DSP instructions | no caches, TCMs, MPU | |||
ARM10E | ARMv5TE | ARM1020E | (VFP), 6-stage pipeline, Enhanced DSP instructions | 32KB/32KB, MMU | ||
ARM1022E | (VFP) | 16KB/16KB, MMU | ||||
ARMv5TEJ | ARM1026EJ-S | Jazelle DBX, Enhanced DSP instructions | variable, MMU or MPU | |||
XScale | ARMv5TE | 80200/IOP310/IOP315 | I/O Processor, Enhanced DSP instructions | |||
80219 | 400/600 MHz | Thecus N2100 | ||||
IOP321 | 600 BogoMips @ 600 MHz | Iyonix | ||||
IOP33x | ||||||
IOP34x | 1-2 core, RAID Acceleration | 32K/32K L1, 512K L2, MMU | ||||
PXA210/PXA250 | Applications processor, 7-stage pipeline | Zaurus SL-5600, iPAQ H3900 | ||||
PXA255 | 32KB/32KB, MMU | 400 BogoMips @ 400 MHz | Gumstix, Palm Tungsten E2,Mentor Ranger & Stryder | |||
PXA26x | default 400 MHz, up to 624 MHz | Palm Tungsten T3 | ||||
PXA27x | Applications processor | 800 MIPS @ 624 MHz | HTC Universal, Zaurus SL-C1000, 3000, 3100, 3200, Dell Axim x30, x50, and x51 series, Motorola Q, Balloon3, Trolltech Greenphone, Palm TX, Motorola Ezx Platform A728, A780, A910, A1200, E680, E680i, E680g, E690, E895, Rokr E2, Rokr E6, Fujitsu Siemens LOOX N560 | |||
PXA800(E)F | ||||||
Monahans | 1000 MIPS @ 1.25 GHz | |||||
PXA900 | Blackberry 8700, Blackberry Pearl (8100) | |||||
IXC1100 | Control Plane Processor | |||||
IXP2400/IXP2800 | ||||||
IXP2850 | ||||||
IXP2325/IXP2350 | ||||||
IXP42x | NSLU2 | |||||
IXP460/IXP465 | ||||||
ARM11 | ARMv6 | ARM1136J(F)-S | SIMD, Jazelle DBX, (VFP), 8-stage pipeline | variable, MMU | 740 @ 532-665 MHz (i.MX31 SoC), 400-528 MHz | Texas Instruments OMAP2420 (Nokia N95, Nokia N93), Zune, Nokia N800, Qualcomm MSM7200 (with integrated ARM926EJ-S Coprocessor@274MHz, used in HTC TyTN II (Kaiser), HTC Nike) |
ARMv6T2 | ARM1156T2(F)-S | SIMD, Thumb-2, (VFP), 9-stage pipeline | variable, MPU | |||
ARMv6KZ | ARM1176JZ(F)-S | SIMD, Jazelle DBX, (VFP) | variable, MMU+TrustZone | Apple iPhone, Conexant CX2427X, Motorola RIZR Z8 | ||
ARMv6K | ARM11 MPCore | 1-4 core SMP, SIMD, Jazelle DBX, (VFP) | variable, MMU | |||
Cortex | ARMv7-A | Cortex-A8 | Application profile, VFP, NEON, Jazelle RCT, Thumb-2, 13-stage superscalar pipeline | variable (L1+L2), MMU+TrustZone | up to 2000 (2.0 DMIPS/MHz in speed from 600 MHz to greater than 1 GHz) | Texas Instruments OMAP3 |
Cortex-A9 | Application profile, (VFP), (NEON), Jazelle RCT and DBX, Thumb-2, Out-of-order speculative issue superscalar | MMU+TrustZone | 2.0 DMIPS/MHz | |||
Cortex-A9 MPCore | As Cortex-A9, 1-4 core SMP | MMU+TrustZone | 2.0 DMIPS/MHz | |||
ARMv7-R | Cortex-R4(F) | Embedded profile, (FPU) | variable cache, MPU optional | 600 DMIPS | Broadcom is a user | |
ARMv7-M | Cortex-M3 | Microcontroller profile, Thumb-2 only. | no cache, (MPU) | 125 DMIPS @ 100 MHz | Luminary Micro[2] microcontroller family, ST Microelectronics STM32[3] | |
ARMv6-M | Cortex-M1 | FPGA targeted, Microcontroller profile, Thumb-2 (BL, MRS, MSR, ISB, DSB, and DMB). | None, tightly coupled memory optional. | Up to 136 DMIPS @ 170 MHz[3] (0.8 DMIPS/MHz[4], MHz achievable FPGA-dependent) | "Actel ProASIC3 and Actel Fusion PSC devices will sample in Q3 2007"[5] |
[değiştir] Tasarım Notları
Tasarımın açık, basit ve hızlı olabilmesi için Acorn microbilgisayarlarında kullanılan 8-bit 6502 işlemcisine benzer bir şekilde mikrokod barındırmayacak şekilde geliştirildi.
ARM Mimarisi, aşağıda belirtilen RISC özellikleri içerir:
- Load/store mimarisi
- Yanlış hafıza erişimlerine karşı desteği yok. (ARMv6 çekirdeklerinde destekleniyor.)
- Geniş 16 × 32-bit yazmaç dosyası
Intel 80286 ve Motorola 68020 işlemcilerindeki gibi bazı bilindik tasarım özellikleri kullanıldı:
- Güçlü indeksleme,
- Basit ama hızlı 2-öncelikli-bölüm kesme altsistemi,
- Aritmetik yönergelerde ve adres hesaplamalarında performans sorunu olmadan 32-bit barrel shifter
Her yönergenin öncesinde 4-bit condition code'u kullanması ARM tasarımına ilginç bir eklemedir.
Hafıza erişim talimatlarında yerini almalar olduğu için bu kesmeler, önemli şekilde geçerli bitlerin kodlanmasını ...., fakat öbür tarafdan da küçük if
koşulları için kodlar oluşturulurken dallanma talimatlarından kaçınılır. Euclid'in Euclidean algorithm örneği en bilinen ve standart örnektir:
C programlama dilinde, döngü :
int gcd (int i, int j) { while (i != j) { if (i > j) i -= j; else j -= i; } return i; }
ARM assembly dilinde, döngü:
loop CMP Ri, Rj ; set condition "NE" if (i != j) ; "GT" if (i > j), ; or "LT" if (i < j) SUBGT Ri, Ri, Rj ; if "GT", i = i-j; SUBLE Rj, Rj, Ri ; if "LT", j = j-i; BNE loop ; if "NE", then loop
then
ve else
yantümcelerinde dallanmalardan kaçınılır.
Komut kümelerinin başka tek özelliği de kaydırma ve döndürmeleri "veri işlemleri" (aritmetik, mantıksal, ve yazmaç-yazmaç hareketi) komutlarına bağlayabilmesidir. Örneğin C dilinde
a += (j << 2);
Arm işlemcisinde tek çevrim komutu ve tek bir kelimeymiş gibi dönüştürülür.
ADD Ra, Ra, Rj, LSL #2
Tipik Arm programında bu sonuç beklenenden daha az hafıza erişimi ve boru hattının daha verimli kullanılmasını sağlar. ARM işlemcisinin yavaş hızla çalıştığı düşünülmesine karşın daha gelişmiş işlemciler ile yine de yarışabilir durumdadır.
[değiştir] ARM lisansları
Arm lisanslarını elinde tutan bazı firmalar : Analog Devices, Atmel, Broadcom, Cirrus Logic, Faraday technology, IBM, Infineon Technologies, Nintendo, NXP Semiconductors (spun off from Philips in 2006), OKI, Samsung, Sharp, STMicroelectronics, Texas Instruments and VLSI
[değiştir] Yaklaşık Lisans Bedeli
2.45 milyar ünitenin lisanlama sonucu [6], ARM'nin yıllık raporuna göre lisans bedeli toplam 164.1 milyon amerikan dolarıdır. Bu yaklaşık ünite başına 0.067 amerikan dolarına denk gelir. Tüm çekirdeklerin ortalaması olmasına karşın pahalı ve ucuz eski çekirdekleri de buna dahildir.