Реферати

Реферат: Мікропроцесори для користувачів

Рання творчість А. П. Чехова. Рання творчість А. П. Чехова Автор: Чехов А. П. Тоді людина стане краще, коли ви покажете йому, який він є... А. Чехов Свій творчий шлях Чехов починав з веселого й уїдливого глузування, з гуморесок, у яких дуже незабаром виявився найсильніший сатиричний заряд.

Віконний блок з роздільним плетінням, фрамугами і кватирками. Деревина дуже популярно використовується в народному господарстві, промисловості, побуті, як у натуральному, так і в переробленому виді. Деревину використовують для виготовлення меблів, столярно-будівельних виробів і при будівництві усіх видів будинків. З її роблять елементи мостів, судів, кузовів, вагонів, тару, музичні інструменти, олівці, папір і багато інші не мало важливих предметів людського побуту.

Грошова система Німеччини 2. МІНІСТЕРСТВО УТВОРЕННЯ І НАУКИ РФ МОСКОВСЬКИЙ ДЕРЖАВНИЙ УНІВЕРСИТЕТ ТЕХНОЛОГІЙ І КЕРУВАННЯ ДОПОВІДЬ По дисципліні "Гроші, кредит, банки" Тема: "Грошова система Німеччини"

Санітарія і гігієна перукарських послуг. Федеральне агентство по утворенню Комсомольськ-на-Амуру технікум легкої Промисловості Контрольна робота з дисципліни "Анатомія фізіологія шкіри і волос.

Етика, моральність, мораль співвідношення понять. Етика як наука про мораль. Етика, моральність, мораль: співвідношення понять. Етика як наука про мораль Виникнення етики як науки. Моральність, мораль, етика Що таке етика? Люди вкладають різний зміст у це поняття, думаючи, що етика - це:

Дніпропетровський державний технічний університет залізничного транспорту

Кафедра "КИТ"

Доповідь на тему: "Мікропроцесори для користувача."

склав студент 942 групи

Костін Євген Михайлович

Idea Software (з)

Дніпропетровськ

1996

1. Введення в персональний комп'ютер.

Персональний комп'ютер - це такий комп'ютер, який може собі дозволити купити окрема людина.

Найбільш "вагомою" частиною будь-якого комп'ютера є системний блок (іноді його називають комп'ютером, що є недопустимою помилкою). Всередині нього розташовані блок живлення, плата з центральним процесором (ЦП), відеоадаптер, жорсткий диск, дисководи гнучких дисків і інші пристрої введення / виведення. Часто відеоадаптер і контроллери введення/ висновку розміщені прямо на платі ЦП. У системному блоці можуть розміщуватися кошти мультимедіа: звукова плата і пристрій читання оптичних дисків - CD-ROM. Крім того, в поняття "комп'ютер" входить клавіатура і монітор. Маніпулятор миша є необов'язковою, але вельми важливою деталлю. Тепер коротко про вибір основних компонентів ПК. Процесор є основним компонентом будь-якого ПК. У цей час найбільш поширені процесори фірми Intel, хоч ЦП інших фірм (AMD, Cyrix, NexGen і інш.) складають їм гідну конкуренцію. Є також материнська (MotherBoard) плата. Основною характеристикою материнських плат є їх архітектура. Основними шинами донедавна вважалися ISA (Industrial Standard Architecture) і EISA (Extended ISA), і що мають розрядність 10 і 32 відповідно. Для забезпечення нормальної роботи відеоадаптер був розроблений стандарт VESA (Video Electronic Standart Association), розрахований на застосування процесора серії 486, працюючої на частоті процесора і "префіксом", що є до шини ISA або EISA. З появою процесора Pentium була розроблена самостійна шина PCI, яка на сьогоднішній день є найбільш швидкою і перспективною. Звичайно в ПК присутній дисковод для гнучких дисків. Існує два стандарти: 5.25" і 3.5". На сьогоднішній день більшість комп'ютерів постачається з дисководом 3.5". Жорсткий диск (вінчестер), почавши свій хід з об'єму в 5 МБ, досяг небувалих висот. На сьогоднішній день не здивують диски об'ємом 2 або 4 ГБ. Для більшості додатків цілком досить об'єму 420 - 700 МБ, однак якщо вам доводиться працювати з полноцветними графічними зображеннями або версткою, то доведеться подумати про диск в 1.5- 2 ГБ або навіть пару таких дисків. Потрібно надати значення не тільки ємності диска, але і його тимчасовим характеристикам. Як оптимальні можна порекомендувати вінчестери фірми Western Digital, Seagate або Corner. Для оперативної пам'яті (RAM, ОЗУ) закон простий: чим більше, тим краще. У цей час важко знайти конфігурацію з об'ємом пам'яті менше за 4 МБ. Для нормальної роботи більшості програмних продуктів бажано мати хоч би помітити, що при збільшенні ОЗУ більш ніж 32 МБ швидкодія ПК збільшується менш значно, і така конфігурація необхідна художникам і мультипликаторам. Невід'ємною частиною ПК є клавіатура. Стандартної в Росії є 101 - клавішна клавіатури з англійськими і російськими символами. Миша. Необхідна для роботи з графічними пакетами, кресленнями, при розробці схем і при роботі під Windows. Потрібно відмітити, що деяке ігрове і програмне забезпечення вимагає наявність миші. Основної ха миші є дозволяюча здатність, що вимірюється в точках на дюйм (dpi). Нормальною вважається миша, що забезпечує дозвіл 300-400 dpi. Непогано мати також спеціальну коврик під мишу, що забезпечує її збереження і довговічність. Вибору монітора ПК потрібно приділити особливу увагу, оскільки від якості монітора залежить збереження вашого зору і загальну стомлюваність при роботі. Монітори мають стандартний розмір діагоналі в 14,15,17,19,20 і 21 дюйм. Необхідний розмір діагоналі монітора вибирається виходячи їх дозволу, при якому ви маєте намір працювати. Так, для більшості додатків цілком досить мати 14 дюймовий монітор, який забезпечує роботу при дозволах до 800 на 600 точок. ПК може мати звукову карту. З одного боку, звукова карта не є необхідним елементом комп'ютера, але, з іншого боку, дозволяє перетворити його в могутню підмогу при навчанні і написанні музики, вивченні мов. Так і який інтерес бити ворогів на екрані, якщо не чуєш їх передсмертні крики. НайПростішою картою є Adlib, який дозволяє відтворювати тільки музику без оцифрованої мови. І CD-ROM, з одного боку, також не є необхідною для функціонування комп'ютера частиною, але стає все більш і більш популярними в зв'язку з тенденцією постачати професійне, повчальне і ігрове програмне забезпечення на CD-дисках.

2. Відмінності процесорів.

2.1. Відмінності процесорів SX, DX, SX2, DX2 і DX4.

SX і DX означає "полегшену" і повну версію одного і того ж процесора. Для 386 варіант SX був зроблений з 16 інтерфейсом, що дозволяло економити на обвязке і встановлювати пам'ять по два SIMM, а не по чотири, як для DX. При роботі з 16 програмами 386SX майже не відстає від 386DX на тій же частоті, однак на 32 програмах він працює відчутно повільніше через розділення кожного 32 запиту до пам'яті на два 16. Насправді ж більшість комп'ютерів з 386DX працюють швидше за комп'ютери з SX навіть на 16 програмах - завдяки тому, що на платах з 386DX частіше за все встановлений апаратний кеш, якого немає на більшості плат з SX. Внутрішня архітектура 386SX - повністю 32, і програмно виявити різницю між SX і DX без запиту коду процесора або вимірювання швидкості роботи магістралі в загальному випадку неможливо.

Для 486 SX означає варіант без вбудованого співпроцесора. Ранні моделі являли собою просто отбраковку від DX з несправним співпроцесором - співпроцесор в них був заблокований, і для установки такого процесора замість DX було потрібен перенастроювати системну плату. Більш пізні версії випускалися самостійно, і можуть встановлюватися замість DX без зміни настройки плати. Крім відсутності співпроцесора і ідентифікаційних кодів, моделі SX також нічим не відрізняються від відповідних моделей DX, і програмне розрізнення їх в загальному випадку також неможливе.

SX2, DX2 і DX4 - варіанти відповідних процесорів з внутрішнім подвоєнням або потроєнням частоти. Наприклад, апаратна настройка плати для DX2-66 робиться, як для DX33, і на вхід подається частота 33 МГц, однак в програмній настройці може бути потрібне збільшення затримок при зверненні до пам'яті для компенсації збільшеної швидкості роботи процесора. Всі внутрішні операції в процесорах виконуються відповідно в два і три рази швидше, однак обмін по зовнішній магістралі визначається зовнішньою тактовою частотою. За рахунок цього DX4-100 працює утроє швидше за DX33 тільки на тих дільницях програм, які цілком вміщуються в його внутрішню кеш, на великих фрагментах це відношення може впасти до двох з половиною і менше.

Деякі серії процесорів AMD (зокрема - 25253) випускалися з єдиним кристалом DX4, який міг перемикатися в режим подвоєння по низькому рівню на висновку В-13. Маркіровка як DX2 або DX4 проводилася за результатами тестів; відповідно, процесор, маркірований як DX4, міг працювати як DX2 і навпаки. Процесори Intel DX4-100 можуть перемикатися в режим подвоєння по низькому рівню на висновку R-17.

Процесор AMD 5x86 стандартно працює з потроєнням зовнішньої частоти, а низький рівень на висновку R-17 перемикає його в режим почетверіння.

2.2. Позначення "SL-Enhanced" у процесорів Intel 486.

Наявність SMM (System Management Mode - режим управління системою), що використовується головним чином для перекладу процесора в економічний режим. Ще означається як "S-Series", з додаванням до позначення процесора суфікса "-S". У SL-Enhanced процесорах є також команда CPUID, яка повертає ідентифікатор процесора.

2.3. Відмінності процесорів UMC 486 U5 від Intel, AMD і інших.

Передусім - оптимізованим микрокодом, за рахунок чого команди, що часто використовуються виконуються за менше число тактів, ніж в процесорах Intel, AMD, Cyrix і інших. Процесори U5 не мають внутрішнього множення частоти, а результати в 65 МГц і подібні, що отримуються деякими програмами, виходять тому, що для визначення частоти програмі необхідно правильно пізнати процесор - точніше, число тактів, за яке він виконає тестову послідовність, а більшість поширених програм не уміють правильно пізнавати U5. З цієї ж причини на U5 зависає гра Heretic, помилково знайшовши в ньому співпроцесор - щоб це виключити, треба в командному рядку Heretic указати ключ "-debug".

2.4. Чопи RISC і CISC.

RISC - це абревіатура від Reduced Instruction Set Computer (комп'ютер з скороченим набором команд), а CISC - абревіатура від Comlex Instruction Set Computer (комп'ютер з повним набором команд). Істотна різниця між ними складається в наступному: чопи RISC розуміють лише деякі інструкції, але кожну з них вони можуть виконати дуже швидко. Програми для RISC-машин досить складні, але виконуються вони швидше за тих, які сумісні з CISC-машинами. Але, можливо, це і не так? (Дослідження продуктивності ще не завершені.)

Всі чопи Intel 80x86 (ак і чопи Motorola 680x0

(68010,68020,..,68040), що використовуються в комп'ютерах Macintosh і NeXT)

є яскравими представниками CISC-чопів. Деякі робочі станції, починаючи з IBM, використовують чопи RISC.

2.5. Ідентифікація чопів Intel і AMD.

2.5.1. Кодекси дати.

Просіть у продавця кодекси дати раніше, ніж Ви купите процесор. Все ЦПУ мають дату випуску, яка проставляється на корпусі. Пересвідчіться, що Ви придбаваєте новий процесор, а не торішній.

Наприклад A80486DX33 (by Intel)

V74400223

V - перший символ, код заводу (plant code);

7 - другий символ, це остання цифра року випуску процесора, процесор, що розглядається випущений в 1987 році;

44 - наступні дві цифри, 44-я робочий тиждень в цьому році (1987); 002 - наступні 3 цифри, номер партії (sequence number);

3 - код заміни (change code).

Наприклад E6 9433 DPD (on AMD CPUs)

E6 - версія реалізації (version release);

9433 - випущений на 33 робочому тижні 1994 року;

DPD - шифр серії (wafer number);

2.5.2. Версія процесора.

Просіть дані про версію процесора. Порівняйте версію процесора, який Вам пропонують з процесорами Intel 800-468-3548 або AMD 800-222-9323, оскільки більш ранні версії процесорів мають помилки і різні дефекти.

2.5.3. Demo-зразки.

Ніколи не платіть повну ціну за demo-зразки. AMD і Intel роблять технічні зразки для кожної версії процесора, раніше, чим буде початий серійний випуск процесора. Такий ЦПУ може мати помилки (дефекти), оскільки звичайно створений для випробування. Абсолютно не передбачається, що такий процесор продадуть кінцевому користувачу.

Наприклад:

Нормальна версія (normal version): i486DX-33:

Розробка зразків (engineering samples): i486DX-33 Е

2.5.4. Перемаркированние процесори.

Перемаркированние процесори (remaked CPUs) - це процесори, які розганяють сильніше ніж оригінальні для більш високої ціни і прибутку. Ці дії вважаються незаконними. Використання такого ЦПУ завжди ризиковано. Разгонка процесора іноді буває успішної, наприклад, з 33MHz до 40MHz, або з 25MHz до 33MHz, але не завжди. Використання розігнаного процесора приводить до перегрівання чопа і його нестабільної роботи, що часто служить причиною всіляких помилок, збоїв і зависаний системи. Перемаркированний і розігнаний ЦПУ має набагато менший термін служби, ніж оригінальний процесор, завдяки завдяки перегріванню чопа.

3. Процесори фірми Intel.

3.1. Сучасна микропроцессорная технологія фірми Intel.

Досягнення фірми Intel в мистецтві проектування і виробництва напівпровідників роблять можливим виробляти могутні мікропроцесори у все більш малих корпусах. Розробники мікропроцесорів в цей час працюють з комплементарним технологічним процесом метав-оксид напівпровідник (CMOS) з дозволом менш, ніж мікрон.

Використання субмикронной технології дозволяє розробникам фірми Intel розташовувати більше транзисторів на кожній підкладці. Це зробило можливим збільшення кількості транзисторів для сімейства X86 від 29,000 в 8086 процесорі до 1,2 мільйонів в процесорі Intel486 DX2, з найвищим досягненням в Pentium процесорі. Виконаний по 0.8 мікронній BiCMOS технології, він містить 3.1 мільйони транзисторів. Технологія BiCMOS об'єднує переваги двох технологій: біполярної (швидкість) і CMOS (мале енергоспоживання). З допомогою більш, ніж в два рази більшої кількості транзисторів Pentium процесора в порівнянні з Intel486, розробники вмістили на підкладці компоненти, що раніше розташовувалися зовні процесора. Наявність компонентів всередині зменшує час доступу, що істотно збільшує продуктивність. 0.8 мікронна технологія фірми Intel використовує тришаровий метал і має рівень, більш високий в порівнянні з оригінальною 1.0 мікронною технологією двухслойного металу, що використовується в процесорі Intel486.

3.2. Перші процесори фірми Intel.

За 20-літню історію розвитку микропроцессорной техніки ведучі позиції в цій області займає американська фірма Intel (INTegral ELectronics). До того як фірма Intel почала випускати мікрокомп'ютери, вона розробляла і виробляла інші види інтегральних мікросхем. Головною її продукцією були мікросхеми для калькуляторів. У 1971 р. вона розробила і випустила перший в світі 4-битний мікропроцесор 4004. Фірма спочатку продавала його як вбудований контроллер (щось на зразок засобу управління вуличним світлофором або мікрохвильовою піччю). 4004 був четирехбитовим, т. е. він міг зберігати, обробляти і записувати в пам'ять або прочитувати з неї четирехбитовие числа. Після чопа 4004 з'явився 4040, але 4040 підтримував зовнішні переривання. Обидва чопи мали фіксоване число внутрішніх індексних регістрів. Це означало, що програми, що виконуються були обмежені числом вкладень підпрограм до 7.

У 1972 р., т. е. через рік після появи 4004, Intel випустила черговий процесор 8008, але справжній успіх їй приніс 8-битний мікропроцесор 8080, який був оголошений в 1973 р. Цей мікропроцесор набув дуже широкого поширення у всьому світі. Зараз в нашій країні його аналог - мікропроцесор KP580ИК80 застосовується в багатьох побутових персональних комп'ютерах і різноманітних контроллерах. З чопом 8080 також пов'язано поява стека зовнішньої пам'яті, що дозволило використати програми будь-якої вкладеності.

Процесор 8080 був основною частиною першого невеликого комп'ютера, який набув широкого поширення в діловому світі. Операційна система для нього була створена фірмою Digital Research і називалася Control Program for Microcomputers (CP/M).

3.3. Процесор 8086/88.

У 1979 р. фірма Intel першої випустила 16-битний мікропроцесор 8086, можливості якого були близькі до можливостей процесорів миникомпьютеров 70-х років. Мікропроцесор 8086 виявився "прародителем" цілого сімейства, яке називають сімейством 80x86 або х86.

Дещо пізніше з'явився мікропроцесор 8088, що архітектурно повторює мікропроцесор 8086 і маючу 16-битний внутрішні регістри, але його зовнішня шина даних становить 8 біт. Широкій популярності мікропроцесора сприяло його застосування фірмою IBM в персональних комп'ютерах PC і PC/XT.

3.4. Процесор 80186/88.

У 1981 р. з'явилися мікропроцесори 80186/80188, які зберігали базову архітектуру мікропроцесорів 8086/8088, але містили на кристалі контроллер прямого доступу до пам'яті, лічильник/таймери і контроллер переривань. Крім того, була декілька розширена система команд. Однак широкого поширення ці мікропроцесори (як і персональні комп'ютери PCjr на їх основі), не отримали.

3.5. Процесор 80286.

Наступним великим кроком в розробці нових ідей став мікропроцесор 80286, що з'явився в 1982 році. При розробці були враховані досягнення в архітектурі мікрокомп'ютерів і великих комп'ютерів. Процесор 80286 може працювати в двох режимах: в режимі реальної адреси він емулює мікропроцесор 8086, а в захищеному режимі віртуальної адреси (Protected Virtual Adress Mode) або Р-режимі надає програмісту багато нових можливостей і коштів. Серед них можна відмітити розширений адресний простір пам'яті 16 Мбайт, поява дескрипторів сегментів і дескрипторних таблиць, наявність захисту по чотирьох рівнях привелегий, підтримку організації віртуальної пам'яті і мультизадачности. Процесор 80286 застосовується в ПК PC/AT і молодших моделях PS/2.

3.6. Процесор 80386.

При розробці 32-битного процесора 80386 був потрібен вирішити дві основні задачі - сумісність і продуктивність. Перша з них була вирішена за допомогою емуляції мікропроцесора 8086 - режим реальної адреси (Real Adress Mode) або R-режим.

У Р-режимі процесор 80386 може виконувати 16-битние програми (код) процесора 80286 без яких-небудь додаткових модифікацій. Разом з тим, в цьому ж режимі він може виконувати свої "природні" 32-битние програми, що забезпечує підвищення продуктивності системи. Саме в цьому режимі реалізовуються всі нові можливості і кошти процесора 80386, серед яких можна відмітити масштабовану індексну адресацію пам'яті, ортогональное використання регістрів загального призначення, нові команди, кошти відладки. Адресний простір пам'яті в цьому режимі становить 4 Гбайт.

Мікропроцесор 80386 дає розробнику систем велике число нових і ефективних можливостей, включаючи продуктивність від 3 до 4 мільйон операцій в секунду, повну 32-битную архітектуру, 4 гигабитное (2 байт) фізичний адресний простір і внутрішнє забезпечення роботи зі сторінковою віртуальною пам'яттю.

Незважаючи на введення в нього останніх досягнень микропроцессорной техніки, 80386 зберігає сумісність по об'єктному коду з програмним забезпеченням, у великій кількості написаним для його попередників, 8086 і 80286. Особливий інтерес представляє таку властивість 80386, як віртуальна машина, яке дозволяє 80386 перемикатися у виконанні програм, керованих різними операційними системами, наприклад, UNIX і MS-DOS. Ця властивість дозволяє виробникам оригінальних систем безпосередньо вводити прикладне програмне забезпечення для 16-битних машин в системі на базі 32-битних мікропроцесорів. Операційна система Р-режиму може створювати задачу, яка може працювати в режимі віртуального процесора 8086 (Virtual 8086 Mode) або V-режим. Прикладна програма, яка виконується в цьому режимі, вважає, що вона працює на процесорі 8086.

32-битная архітектура 80386 забезпечує програмні ресурси, необхідні для підтримки "великих " систем, що характеризуються операціями з великими числами, великими структурами даних, великими програмами (або великим числом програм) і т. п. Фізичний адресний простір 80386 складається з 2 байт або 4 гбайт; його логічний адресний простір складається з 2 байт або 64 терабайт (тбайт). Вісім 32-битних загальних регістрів 80386 можуть бути взаємозамінно використані як операнди команд і як змінні різних способів адресації. Типи даних включають в себе 8-, 16- або 32-битние цілу і порядкову, упаковані і неупаковані десятеричні, покажчики, рядки біт, байтів, слів і двійчастих слів. Мікропроцесор 80386 має повну систему команд для операцій над цими типами даних, а також для управління виконанням програм. Способи адресації 80386 забезпечують ефективний доступ до елементів стандартних структур даних: масивів, записів, масивів записів і записів, вмісних масиви.

Мікропроцесор 80386 реалізований за допомогою технології фірми Intel CH MOSIII - технологічного процесу, об'єднуючого в собі можливості високої швидкодії технології HMOS з малим споживанням технології кмоп. Використання геометрії 1,5 мкм і шарів металізації дає 80386 більше за 275000 транзисторів на кристалі. Зараз випускаються обидва варіанти 80386, працюючих на частоті I2 і I6 мгц без станів очікування, причому варіант 80386 на 16 мгц забезпечує швидкість роботи 3-4 мільйона операцій в секунду.

Мікропроцесор 80386 розділений всередині на 6 автономно і паралельно працюючих блоків з відповідною синхронізацією. Всі внутрішні шини, що з'єднують ці блоки, мають розрядність 32 біт. Конвейєрна організація функціональних блоків в 80386 допускає тимчасове накладення виконання різних стадій команди і дозволяє одночасно виконувати декілька операцій. Крім конвейєрної обробки всіх команд, в 80386 виконання ряду важливих операцій здійснюється спеціальними апаратними вузлами. Блок множення/ділення 80386 може виконувати 32-битное множення за 9-41 такт синхронізації, в залежності від числа цифр, що означають; він може розділити 32-битние операнди за 38 тактів (у разі чисел без знаків) або за 43 такти (у разі чисел зі знаками). Регістр групового зсуву 80386 може за один такт зсувати від 1 до 64 біт. Звернення до більш повільної пам'яті (або до пристроїв введення/висновку) може проводитися з використанням конвейєрного формування адреси для збільшення часу установки даних після адреси до 3 тактів при збереженні двотактних циклів в процесорі. Внаслідок внутрішнього конвейєрного формування адреси при виконанні команди, 80386, як правило, обчислює адресу і визначає наступний магістральний цикл під час поточного магістрального циклу. Вузол конвейєрного формування адреси передає цю випереджальну інформацію в підсистему пам'яті, дозволяючи, тим самим, одному банку пам'яті дешифрировать наступний магістральний цикл, в той час як інший банк реагує на поточний магістральний цикл.

3.7. Процесор 80486.

У 1989 р. Intel представила першого представника сімейства 80х86, вмісного більше за мільйон транзисторів в чопі. Цей чіп багато в чому схожий з 80386. Він на 100% програмно сумісний з мікропроцесорами 386(ТМ) DX & SX. Один мільйон транзисторів об'єднаної кеш-пам'яті (сверхбистрой оперативної пам'яті), разом з апаратурою для виконання операцій з плаваючою комою і управлінням пам'яті на одній мікросхемі, проте підтримують програмну сумісність з попередніми членами сімейства процесорів архітектури 86. Операції, що Часто використовуються виконуються за один цикл, що порівнянно з швидкістю виконання RISC-команд. Восьмикилобайтний уніфікований кеш для коду і даних, сполучений з шиною пакетного обміну даними з швидкістю 80/106 Мбайт/січений при частоті 25/33 МГерц гарантують високу продуктивність системи навіть з недорогими дисками (DRAM). Нові можливості розширюють багатозадачність систем. Нові операції збільшують швидкість роботи з семафорами в пам'яті. Обладнання на мікросхемі гарантує несуперечність кеш-пам'яті і підтримує кошти для реалізації багаторівневого кеширования. Вбудована система тестування перевіряє микросхемную логіку, кеш-пам'ять і микросхемное посторінкове перетворення адрес пам'яті. Можливості відладки включають в себе установку пасток контрольних точок у виполненяемом коді і при доступі до даних. Процесор i486 має вбудовану в мікросхему внутрішню кеш для зберігання 8Кбайт команд і даних. Кеш збільшує швидкодію системи, відповідаючи на внутрішні запити читання швидше, ніж при виконанні циклу читання оперативної пам'яті по шині. Цей засіб зменшує також використання процесором зовнішньої шини. Внутрішній кеш прозорий для працюючих програм. Процесор i486 може використати зовнішню кеш другого рівня поза мікросхемою процесора. Звичайно зовнішній кеш дозволяє збільшити швидкодію і зменшити смугу пропускання шини, необхідну процесором i486.

3.8. Intel OverDrive процесор.

Можливість постійного вдосконалення. Користувачі персональних комп'ютерів все частіше стикаються з цим по мірі все зростаючих вимог до мікропроцесорів з боку апаратного і програмного забезпечення. Фірма Intel упевнена: краща стратегія вдосконалення - спочатку закладена в систему можливість модернізації, модернізації згідно з вашими потребами. Уперше в світі така можливість надається нашим споживачам. Фірма Intel приступила до випуску Intel OverDrive процесора, що відкриває нову категорію могутніх співпроцесорів. Після простої установки цього співпроцесора на плату різко виросте швидкість роботи всієї системи і прикладних програм в MS-DOS, Windows, OS/2, Windows'95 і UNIX.

За допомогою цієї однієї-єдиної мікросхеми Ви відразу ж зможете скористатися перевагами нової стратегії фірми Intel, закладеної в нашій продукції. Коли настане невідворотний момент, коли Вам буде потрібна продуктивність більша, ніж у Вашого комп'ютера, то все, що Вам буде треба - це вставити OverDrive процесор в Вашу систему - і користуватися перевагами, які дасть Вам нова микропроцессорная технологія фірми Intel. Більш ніж просто модернізація, OverDrive процесор - це стратегія захисту Ваших справжніх і майбутніх внесків в персональні комп'ютери.

Intel OverDrive процесор гарантує Вам що відповідає стандартам і економічну модернізацію. Усього лише одна мікросхема збільшить обчислювальну потужність Вашого комп'ютера до вимог самого сучасного програмного забезпечення і навіть тих програм, які ще не написані, в MS-DOS, в Windows, в PS/2, в UNIX, від AutoCAD - до WordPerfect.

Отже, наш перший мікропроцесор в серії Single Chip Upgrade (Якісне поліпшення - однією мікросхемою) - це OverDrive процесор для систем на основі Intel i486SX. Встановлений в OverDrive-роз'єм, цей процесор дозволяє системі i486SX використати новітню технологію "подвоєння швидкості", що використовується в процесорі i486DX2, і що дає загальне збільшення продуктивності до 70%. OverDrive процесор для систем i486SX містить модуль операцій над цілими числами, модуль операцій над числами з плаваючою точкою, модуль управління пам'яттю і 8К кеш-пам'яті на одному кристалі, працюючому на частоті, в два рази перевищуючої тактову частоту системної шини. Ця унікальна властивість дозволяє Вам подвоїти тактову частоту Вашої системи, не тратячись на купівлю і установку інших додаткових компонентів. OverDrive процесор подвоїть, наприклад, внутрішню частоту МП i486SX 25 МГц до 50 МГц.

Хоч Intel OverDrive - це абсолютно нова технологія якісної модернізації, в ньому взнаються і сімейні риси Intel. Виготовлений і перевірений відповідно до жорстких стандартів Intel, OverDrive відрізняється властивостями продукції, що зарекомендували себе Intel: якістю і надійністю. OverDrive забезпечений постійною гарантією і звичним сервісом і підтримкою у всьому світі. OverDrive повністю сумісний більш ніж з 50000 прикладних програм. OverDrive процесор для i486SX - тільки перший з наших нових процесорів. У другому півріччі 1992 року ми випустимо OverDrive процесор для систем i486DX2, що самих по собі представляють нове покоління технології МП. Могутній і доступний, OverDrive процесор прокладе для Вас безперервний шлях до якісно нових рівнів продуктивності персональних комп'ютерів.

Деякі результати лабораторних випробувань Intel overdrive процесора:

1. Робота з Microsoft Word for Windows 6.1 в середовищі Windows

3.0, популярним текстовим процесором.

Тест виконувався на системі з i486SX 20 МГц з файлом 330 КВ WordPerfect, перетвореному в формат Windows Word, було виконано 648 контекстних пошуків і замін, перевірка правопису у всьому файлі, потім файл був збережений.

Час виконання:

i486SX без OverDrive =107 з

- - ВИГРАШ = 57%

i486SX з OverDrive = 68 з

2. Робота з Lotus 1-2-3 Release 3.0, електронній таблиці, що наближається по можливостях до інтегрованої середи, що володіє широким вибором аналітичних, економічних і статистичних функцій.

Тест виконувався на i486SX 20 МГц з таблицею об'ємом 433К на 10000 осередків, яка була завантажена і перерахована. Крім того, був оброблений великий блок текстових даних.

Час виконання:

i486SX без OverDrive=250 з

- - ВИГРАШ = 481%

i486SX з OverDrive = 43 з

i486SX з i487SX = 72 з

- - ВИГРАШ = 67%

i486SX з OverDrive = 43 з

3. Робота з AutoCAD, популярною системою САПР.

Тест виконувався на i486SX 20 МГц з трьохмірним архітектурним кресленням, над яким виконувалися операції перерисування, панорамирования, масштабування, видалення прихованих ліній і повторної генерації файла у зовнішньому форматі.

Час виконання:

i486SX з i487SX = 162 з

- - ВИГРАШ = 45%

i486SX з OverDrive = 112 з

А ось що говорять про OverDrive процесор ті, кому вже пощастило попрацювати з ним:

Брент Грехем: (фахівець з автоматизації офісів, US Bank, Портленд) "З тими можливостями модернізації, які надає Intel 486, я не бачу причин не використати OverDrive процесор. Що стосується його установки в систему, то з цим справиться навіть мій 10-літній синишка."

Білл Лодж: (керівник проектної групи, Turner

Corporation, Нью Йорк) "Я працював з Windows і OS/2 в мережі Banyan Wines, використовуючи OverDrive процесор без єдиної заминки. Моя вдосконалена система з i486SX 25 МГц працює не гірше, чим системи на 50 МГц."

Стів Симмонс: (технічний менеджер, CompUSA, Даллас)

"Windows вищить від щастя, коли працює з OverDrive процесором. Розрахунки на електронній таблиці в Excel виконуються вмить."

3.9. Процесор Pentium.

У той час, коли Вінод Дем робив першу наброски, почавши в червні 1989 року розробку Pentium процесора, він і не підозрював, що саме цей продукт буде одним з головних досягнень фірми Intel. Як тільки виконувався черговий етап проекту, відразу починався процес всеосяжного тестування. Для тестування була розроблена спеціальна технологія, що дозволила імітувати функціонування Pentium процесора з використанням пристроїв, що програмуються, об'єднаних на 14 платах за допомогою кабелів. Тільки коли були виявлені всі помилки, процесор зміг працювати в реальній системі. У доповнення до всього, в процесі розробки і тестування Pentium процесора брали активну участь всі основні розробники персональних комп'ютерів і програмного забезпечення, що немало сприяло загальному успіху проекту. У кінці 1991 року, коли був завершений макет процесора, інженери змогли запустити на ньому програмне забезпечення. Проектувальники почали вивчати під мікроскопом разводку і проходження сигналів по підкладці з метою оптимізації топології і підвищення ефективності роботи. Проектування в основному було завершене в лютому 1992 року. Почалося всеосяжне тестування досвідченої партії процесорів, протягом якого випробуванням зазнавали всі блоки і вузли. У квітні 1992 року було прийнято рішення, що час починати промислове освоєння Pentium процесора. Як основна промислова база була вибрана 5 Орегонська фабрика. Більше за 3 мільйонів транзисторів були остаточно перенесені на шаблони. Почалося промислове освоєння виробництва і доведення технічних характеристик, що завершилося через 10 місяців, 22 березня 1993 року широкою презентацією Pentium процесора.

Об'єднуючи більш, ніж 3.1 мільйон транзисторів на одній кремнієвій підкладці, 32-розрядний Pentium процесор характеризується високою продуктивністю з тактовою частотою 60 і 66 МГц. Його суперскалярная архітектура використовує вдосконалені способи проектування, які дозволяють виконувати більш, ніж одну команду за один період тактової частоти, внаслідок чого Pentium спроможний виконувати безліч РС-сумісного програмного забезпечення швидше, ніж будь-який інший мікропроцесор. Крім существуюших напрацювання програмного забезпечення, високопродуктивний арифметичний блок з плаваючою комою Pentium процесора забезпечує збільшення обчислювальної потужності до необхідної для використання недоступних раніше технічних і наукових додатків, спочатку призначених для платформ робочих станцій.

Численні нововведення - характерна особливість

Pentium процесора у вигляді унікального поєднання високої продуктивності, сумісності, інтеграції даних і наращиваемости. Це включає:

- Суперскалярную архітектуру;

- Роздільне кеширование програмного коду і даних;

- Блок прогнозу правильної адреси переходу;

- Високопродуктивний блок обчислень з плаваючою комою;

- Розширену 64-бітову шину даних;

- Підтримку многопроцессорного режиму роботи;

- Кошти завдання розміру сторінки пам'яті;

- Засобу виявлення помилок і функціональної надмірності;

- Управління продуктивністю;

- Наращиваемость за допомогою Intel OverDrive процесора. Суперскалярная архітектура Pentium процесора являє

собою сумісну тільки з Intel двухконвейерную індустріальну архітектуру, що дозволяє процесору досягати нових рівнів продуктивності за допомогою виконання більш, ніж однієї команди за один період тактової частоти. Термін "суперскалярная" означає микропроцессорную архітектуру, яка містить більше за один обчислювальний блок. Ці обчислювальні блоки, або конвейєри, є вузлами, де відбуваються всі основні процеси обробки даних і команд.

Поява суперскалярной архітектури Pentium процесора являє собою природний розвиток попереднього сімейства процесорів з 32-бітовою архітектурою фірми Intel. Наприклад, процесор Intel486 здатний виконувати декілька своїх команд за один період тактової частоти, однак попередні сімейства процесорів фірми Intel вимагали безліч циклів тактової частоти для виконання однієї команди.

Можливість виконувати безліч команд за один період тактової частоти існує завдяки тому, що Pentium процесор має два конвейєри, які можуть виконувати дві інструкції одночасно. Так само, як і Intel486 з одним конвейєром, двійчастий конвейєр Pentium процесора виконує просту команду за п'ять етапів: попередня підготовка, перше декодування (декодування команди), друге декодування (генерація адреси), виконання і зворотне вивантаження.

Внаслідок цих архітектурних нововведень, в порівнянні з попередніми мікропроцесорами, значно більша кількість команд може бути виконана за один і той же час.

Інше найважливіше революційне удосконалення, реалізоване в Pentium процесорі, це введення роздільного кеширования. Кеширование збільшує продуктивність за допомогою активізації місця тимчасового зберігання для програмного коду, що часто використовується і даних, що отримується з швидкої пам'яті, замінюючи по можливості звертання до зовнішньої системної пам'яті для деяких команд. Процесор Intel486, наприклад, містить один 8-KB блок вбудованої кеш-пам'яті, що використовується одночасно для кеширования програмного коду і даних.

Проектувальники фірми Intel обійшли це обмеження використанням додаткового контура, виконаного на 3.1 мільйонах транзисторів Pentium процесора (для порівняння, Intel486 містить 1.2 мільйони транзисторів) створюючих роздільне внутрішнє кеширование програмного коду і даних. Це поліпшує продуктивність за допомогою виключення конфліктів на шині і робить двійчасте кеширование доступним частіше, ніж це було можливе раніше. Наприклад, під час фази попередньої підготовки, використовується код команди, отриманий з кеша команд. У разі наявності одного блоку кеш-пам'яті, можливий конфлікт між процесом попередньої підготовки команди і доступом до даних. Виконання роздільного кеширования для команд і даних виключає такі конфлікти, даючи можливість обом командам виконуватися одночасно. Кеш-пам'ять програмного коду і дані Pentium процесора містить по 8 KB інформації кожна, і кожна організована як набір двухканального асоціативного кеша - призначена для запису тільки заздалегідь перегляненого специфікованого 32-байтного сегмента, причому швидше, ніж зовнішній кеш. Всі ці особливості розширення продуктивності зажадали використання 64-бітової внутрішньої шини даних, яка забезпечує можливість двійчастого кеширования і суперскалярной конвейєрної обробки одночасно із завантаженням наступних даних. Кеш даних має два інтерфейси, по одному для кожного з конвейєрів, що дозволяє йому забезпечувати даними дві окремі інструкції протягом одного машинного циклу. Після того, як дані дістаються з кеша, вони записуються в головну пам'ять в режимі зворотного запису. Така техніка кеширования дає кращу продуктивність, ніж просте кеширование з безпосереднім записом, при якому процесор записує дані одночасно в кеш і основну пам'ять. Проте, Pentium процесор здатний динамічно конфігуруватися для підтримки кеширования з безпосереднім записом.

Таким чином, кеширование даних використовує два різних прекрасних рішення: кеш із зворотним записом і алгоритм, названий MESI (модифікація, виключення, розподіл, звільнення) протокол. Кеш із зворотним записом дозволяє записувати в кеш без звернення до основної пам'яті на відміну від того, що використовується до цього безпосереднього простого кеширования. Ці рішення збільшують продуктивність за допомогою використання перетвореної шини і попереджувального виключення самого вузького місця в системі. У свою чергу MESI-протокол дозволяє даним в кеш-пам'яті і зовнішній пам'яті співпадати - прекрасне рішення у вдосконалених мультипроцессорних системах, де різні процесори можуть використати для роботи одні і ті ж дані.

Блок прогнозу правильної адреси переходу - це наступне прекрасне рішення для обчислень, що збільшує продуктивність за допомогою повного заповнення конвейєрів командами, засноване на попередньому визначенні правильного набору команд, які повинні бути виконані.

Pentium процесор дозволяє виконувати математичні обчислення на більш високому рівні завдяки використанню вдосконаленого вбудованого блоку обчислень з плаваючою комою, який включає восьмитактовий конвейєр і апаратно реалізовані основні математичні функції. Четирехтактовие конвейєрні команди обчислень з плаваючою комою доповнюють четирехтактовую цілочисельну конвейеризацию. Велика частина команд обчислень з плаваючою комою можуть виконуватися в одному цілочисельному конвейєрі, після чого подаються в конвейєр обчислень з плаваючою комою. Звичайні функції обчислень з плаваючою комою, такі як складання, множення і ділення, реалізовані апаратно з метою прискорення обчислень.

Внаслідок цих інновацій, Pentium процесор виконує команди обчислень з плаваючою комою в п'ять разів швидше, ніж 33-МГц Intel486 DX, оптимізуючи їх для високошвидкісних чисельних обчислень, що є невід'ємною частиною таких вдосконалених видеоприложений, як CAD і 3D-графіка.

Pentium процесор зовні являє собою 32-бітовий пристрій. Зовнішня шина даних до пам'яті є 64-бітовою, подвоюючи кількість даних, що передаються протягом одного шинного циклу. Pentium процесор підтримує декілька типів шинних циклів, включаючи пакетний режим, протягом якого відбувається порція даних з 256 біт в кеш даних і протягом одного шинного циклу.

Шина даних є головною магістраллю, яка передає інформацію між процесором і підсистемою пам'яті. Завдяки цій 64-бітовій шині даних, Pentium процесор істотно підвищує швидкість передачі в порівнянні з процесором Intel486 DX - 528 MB/сікти для 66 МГц, в порівнянні з 160 MB/сікти для 50 МГц процесора Intel486 DX. Ця расширеная шина даних сприяє високошвидкісним обчисленням завдяки підтримці одночасного підживлення командами і даними процесорного блоку суперскалярних обчислень, завдяки чому досягається ще більша загальна продуктивність Pentium процесора в порівнянні з процесором Intel486 DX.

Даючи можливість розробникам проектувати системи з управлінням енергоспоживанням, захистом і іншими властивостями, Pentium процесор підтримуємо режим управління системою (SMM), подібний режиму архітектури Intel SL.

Разом з всім, що зроблено нового для 32-бітової микропроцессорной архітектури фірми Intel, Pentium процесор сконструйований для легкої наращиваемости з використанням архітектури нарощування фірми Intel. Ці нововведення захищають інвестиції користувачів за допомогою нарощування продуктивності, яка допомагає підтримувати рівень продуктивності систем, заснованих на архітектурі процесорів фірми Intel, більше, чим тривалість життя окремих компонентів. Технологія нарощування робить можливим використати переваги більшості процесорів вдосконаленої технологи у вже існуючих системах за допомогою простий инсталяції засобу однокристального нарощування продуктивності. Наприклад, перший засіб нарощування - це OverDrive процесор, розроблений для процесорів Intel486 SX і Intel486 DX, що використовує технологію простого подвоєння тактової частоти, використану при розробці мікропроцесорів Intel486 DX2.

Перші моделі процесора Pentium працювали на частоті 60 і 66 МГц і спілкувалися зі своєю зовнішньою кеш-пам'яттю другого рівня по 64-бітовій шині даних, працюючій на повній швидкості процесорного ядра. Але якщо швидкість процесора Pentium зростає, то системному розробнику все важче і дорожче обходиться його узгодження з материнською платою. Тому швидкі процесори Pentium використовують дільника частоти для синхронізації зовнішньої шини за допомогою меншої частоти. Наприклад, у 100 МГц процесора Pentium зовнішня шина працює на 66 МГц, а у 90 МГц - на 60 МГц. Процесор Pentium використовує одну і ту ж шину для доступу до основної пам'яті і до периферійних підсистем, таких як схеми PCI.

3.10. Процесор Pentium Pro.

3.10.1. Загальний опис процесора.

Pentium Pro це високотехнологічний процесор шостого покоління для високоуровневих десктоп, робочих станцій і мультипроцессорних серверів. Масове виробництво процесора Pentium Pro, вмісного на кристалі стільки транзисторів, скільки ніколи не було на серійних процесорах, відразу в декількох варіантах стартує з 1 листопада, т. е. з самого моменту оголошення. Безпрецедентний випадок в історії компанії, так і електронної промисловості.

Нагадаємо деякі його особливості. Агресивна суперконвейерная схема, підтримуюча виконання команд в довільному порядку, умовне виконання далеко наперед (на 30 команд) і трехпоточная суперскалярная микроархитектура. Всі ці методи можуть уразити уяву, але жоден з них не є чимсь оригінальним: нові чопи NexGen і Cyrix також використовують подібні схеми. Однак, Intel володіє ключовою перевагою. У процесори Pentium Pro вбудована повторна кеш-пам'ять, сполучена з ЦПУ окремою шиною. Ця кеш, виконана у вигляді окремого кристала статичного ОЗУ ємністю 256К або 512К, змонтованим на другому посадочному місці незвичайного двомісного корпусу процесора Pentium Pro, значно спростила розробникам проектування і конструювання обчислювальних систем на його основі.

Реальна продуктивність процесора виявилася набагато вище за 200 одиниць, які називалися як запланований стартовий орієнтир при лютневому технологічному анонсуванні P6.

Pentium Pro це значний крок уперед. І хоч в процесорі Pentium уперше була реалізована суперскалярная форма архітектури х86, але це була обмежена реалізація: в ньому інтегрована пара цілочисельних конвейєрів, які можуть обробляти дві прості команди паралельно, але в порядку проходження команд в програмі і без т. н. умовного виконання (наперед). Навпаки, новий процесор це трехпоточная суперскалярная машина, яка здатна одночасно відстежувати проходження п'яти команд. Для узгодження з такою високою пропускною спроможністю був потрібен різко поліпшити схему кеширования, розширити файл регістрів, підвищити глибину упреждающей вибірки і умовного виконання команд, удосконалити алгоритм прогнозу адрес переходу і реалізувати істинну машину даних, що обробляє команди не по порядку, а відразу по мірі готовності даних для них. Ясно, що ця схема щось більше, ніж Pentium, що і підкреслює, на думку Intel, суфікс Pro в імені процесора.

3.10.2. Два кристали в одному корпусі.

Сама разюча межа Pentium Pro - тісно пов'язана з процесором кеш-пам'ять другого рівня (L2), кристал якої змонтований на тій же підкладці, що і ЦПУ. Саме так, Pentium Pro це два чопи в одному корпусі. На одному чопі розміщено власне ядро процесора, що включає два 8-Килобайтових блоки кеш-пам'яті першого рівня; інший чіп це 256-Кб СОЗУ, функціонуюче як четирехканальная порядково-асоціативна кеш другого рівня.

Два цих кристали об'єднані в загальному 387-контактному корпусі, але пов'язані лініями, що не виходять на зовнішні контакти. Деякі компанії називають такий чіп корпусу МСМ (multichip module), однак Intel використовує для нього термін dual-cavity PGA (pin-grid array). Різниця дуже невідчутна і лежить, цілком ймовірно, в області маркетингу, а не технології, оскільки використання МСМ запрацювало собі репутацію технології, що дорого коштує. Але порівнюючи ціни на процесори Pentium і Pentium Pro, можна затверджувати, що нова термінологія виправить положення справ, оскільки P6 претендує на статус масового процесора. Уперше в історії промисловості многокристалльний модуль стане крупносерийним виробом.

Міра інтеграції нового процесора також вражає: він містить 5.5 млн. транзисторів, так ще 15.5 млн. входить до складу кристала кеш-пам'яті. Для порівняння, остання версія процесора Pentium складається з 3.3 млн. транзисторів. Природно, в це число не включена кеш L2, оскільки Pentium вимагає установки зовнішнього комплекту мікросхем статичного ОЗУ для реалізації повторної кеш-пам'яті.

Елементарний розрахунок допоможе зрозуміти 6почему на 256К пам'яті потрібно таке величезне число транзисторів. Це статичне ОЗУ, яке на відміну від динамічного, що має всього один транзистор на біт зберігання і періодично регенирируемого, використовує для зберігання біта осередок з шести транзисторів:

256 х 1024 х 8 біт х 6 тр-рів = 12.5 млн. транзисторів. З урахуванням буферів і обвязки накопичувача якраз і вийде 15.5 мільйонів.

Площа процесорного кристала рівна 306 кв. мм. (для порівняння, у першого процесора Pentium кристал мав площу 295 кв. мм). Кристал статичної пам'яті, як всяка всяка регулярна структура, упакований набагато щільніше - 202 кв. мм. Тільки Pentium Pro 150 MHz виготовляється по 0.6-мікронній технології. Всі інші версії нового процесора виготовляються по 0.35-мікронній BiCMOS-технології з четирехслойной металізацією.

Чому компанія Intel пішла на двухкристалльний корпус, об'єднавши ядро ЦПУ з повторним кешем? По-перше комбінований корпус значно спростив виготівникам ПК розробку високопродуктивних систем на процесорі Pentium Pro.

Одна з головних проблем при проектуванні комп'ютера на швидкому процесорі пов'язана з точним узгодженням з процесором повторного кеша по його розміру і конфігурації. Вбудована в Р6 повторна кеш вже тонко настроєна під ЦПУ і дозволяє розробникам систем швидко інтегрувати готовий процесор на материнську плату.

По-друге, повторна кеш тісно пов'язана з ядром ЦПУ за допомогою виділеної шини шириною 64 біта, працюючою на однаковій з ним частоті. Якщо ядро синхронізується частотою 150 МГц, то кеш повинна працювати на частоті 150 МГц.

Оскільки в процесорі Pentium Pro є виділена шина для повторного кеша, це вирішує відразу дві проблеми: забезпечується синхронна робота двох пристроїв на повній швидкості і відсутність конкуренції за шину з іншими операціями введення-висновку. ОТдельная шина L2, "задня" шина повністю відділена від зовнішньої, "передньої" шини введення-висновку, ось чому в P6 повторна кеш не заважає своїми циклами операціям з ОЗУ і периферією. Передня 64-бітова шина може працювати з частотою, рівній половині, третині або чвертям швидкості ядра Pentium Pro. "Задня" шина продовжує працювати незалежно, на повній швидкості.

Така реалізація представляє серйозний крок уперед в порівнянні з організацією шини процесора pentium і інших процесорів х86. Тільки NexGen приблизно нагадує таку схему. Хоч в процесорі Nx586 немає кеша L2, зате вбудований її контроллер і полноскоростная шина для зв'язку із зовнішньою кеш-пам'яттю. Подібно Р6, процесор Nx586 спілкується з основною пам'яттю і периферійними підсистемами понад окремої шини введення-висновку, працюючою на діленій частоті.

У екзотичному процесором Alpha 21164 компанія Digital пішла ще далі, інтегрувавши прямо на кристалі в доповнення до первинної кеш-пам'яті ще і 96 Кбайт повторної. За рахунок роздуття площі кристала досягнута безпрецедентна продуктивність кеширования. Транзисторний бюджет Альфи становить 9.3 мільйони транзисторів, велика частина якого освічена масивом пам'яті.

Є одна незадача: незвичайний дизайн Pentium Pro, мабуть, утруднить експертам задачку обчислення співвідношення ціни і продуктивності. Інтегрована в процесор кеш на зразок як прихована з очей. Penyium Pro зможе показатися більш дорогим, ніж його конкуренти, але для створення комп'ютера на інших процесорах буде потрібний зовнішній набір мікросхем пам'яті і кеш-контроллер. Ефективний дизайн кеш-структури означає, що іншим процесорам, що претендують на порівнянну продуктивність, зажадається кеш-пам'яті більше, ніж 256 Кбайт.

Унікальний корпус надає свободу створенню нових варіантів процесора. У майбутньому можливо як підвищення об'єму кеш-пам'яті, так і її відділення її від процесора відповідно до традиційного підходу. Якщо останній варіант з'явиться, він виявиться несумісний по зовнішніх висновках з двухкристалльним базовим корпусом, оскільки йому необхідно додати 72 додаткових висновку (64-для "задньої" шини і 8 для контролю помилок). Але він буде майже таким же швидким, якщо буде широко доступна статична пам'ять з пакетним режимом. На думку інженерів Intel, підключення зовнішніх мікросхем пам'яті до "передньої" шини Pentium Pro з метою реалізації кеш-пам'яті третього рівня, навряд чи виправдане. Відправною точкою для такої переконаності служать результати натурного моделювання прототипу системи, яка вследствії високої ефективності інтерфейса кеш L2-процесор, практично до теоретичної межі завантажує обчислювальні ресурси ядра. Процесор Alpha 21164, навпаки, спроектований з урахуванням необхідності кеш L3.

3.10.3. Значення тестів для деяких чопів фірми Intel.

Processor

Benchmarks

Intel

Pentium

Pro

processor

(200MHz)

Intel

Pentium

Pro

processor

(180MHz)

Intel

Pentium

Pro

processor

(166MHz)

w/512K L2

Intel

Pentium

Pro

processor

(150MHz)

Intel

Pentium

processor

(133MHz)

UNIX

SPEC95

SPECint95

SPECint_base95

SPECfp95

SPECfp_base95

8.09

8.09

6.75

5.99

7.29

7.29

6.08

5.40

7.11

7.11

6.21

5.47

6.08

6.08

5.42

4.76

4.14

4.14

3.12

2.48

SPEC92

SPECint92

SPECint_base92

SPECfp92

SPECfp_base92

366.0

336.7

283.2

234.3

327.4

3.5.8

254.6

210.4

327.1

306.6

261.3

209.6

276.3

258.3

220.0

182.0

190.9

175.9

120.6

107.3

Windows

Norton System Index

SI32

86.7

77.6

Not

tested

67.0

34.2

Ziff-Davis

CPUmark32

541

466

Not

tested

412

278

4. Процесори конкурентів Intel.

4.1. Перші процесори конкурентів Intel.

Intel була не єдиною фірмою - виробником мікропроцесорів: існували ще MOS Technologies, Mostek, Motorola, Rockwell, Standart Microsystems Corporation, Synertek, Texas Instruments. Одні з них використали свої власні проекти чопів, інші - ліцензійні проекти своїх конкурентів. Успішніше за всіх в кінці 70-х працювала фірма Zilog. Вона створила чіп Z80.

У той час, коли комп'ютери, працюючі під управлінням СР/М, розповсюдилися в офісах, комп'ютери Apple II буквально увірвалися в школи. Фірма Apple як основний компонент свого комп'ютера вибрала чіп фірми MOS Technologies 6502. Це був ліцензійний чіп фірми Rockwell and Synertek. Apple почала використати процесори Motorola у всіх своїх комп'ютерах Macintosh. Розробки фірм Intel і Motorola з'явилися майже одночасно, але об'єднує їх не тільки це. Мікропроцесори Intel 80486 і Motorola 68040, наприклад, майже однакові по складності і мають схожі функціональні можливості. Проте, вони абсолютно несумісні. Саме тому на Macintosh і PC не можуть виконуватися одні і ті ж програми.

Існує принципова відмінність в еволюційному розвитку цих двох сімейств мікропроцесорів. Intel почала з досить незначного по наших сучасних мірках адресного простору в 1 Мбайт і постійно нарощувала його до нинішнього розміру в 4 Гбайт. Motorola в своїй серії 680x0 завжди мала адресний простір в 4 Гбайт. IBM вмістила чопи ROM в адресний простір своїх PC як можна вище. І не її помилка була в тому, що пізніше за Intel добудувала "другий поверх" і таким чином залишила ROM в конструкціях IBM десь посередині, відкривши дорогу використанню RAM, що саме по собі, можливо, і не погано. Розробники сімейства чопів 680х0 ніколи не випробовували подібних незручностей, і тому дуже багато програмістів вважають, що Mac краще.

Intel приклала значні зусилля, намагаючись стандартизувати виробництво її процесорів 8086 і 8088 на підприємствах-підрядчиках. Декілька підприємств прийняло такі угоди. Однак Haris випустив свої чопи - аналоги 8086 і 8088, які менш усього задовольняли цим прийнятим угодам. Він використав технологію CMOS, що значно скорочує споживання електроенергії, і ця властивість зробила його чопи дуже популярною, особливо серед виробників ПК з екранами на рідких кристалах.

Фірма NEC запропонувала свою так звану V-серію чопів і оголосила, що чіп V20 є конструктивно сумісним з чопом Intel 8088, але має вдосконалений набір інструкцій, включаючи при цьому і інструкції чопа 8080. Це означало, що він міг легко виконувати програми, написані для CP/M, без їх модифікації, використовуючи емулятор програм, і при цьому включати переваги інструкцій 8080, що містяться в чопі V20. Їх чіп V30 був аналогом 8086 з включеними додатковими можливостями.

Чопи V-серії фірми NEC також працювали небагато швидше аналогічних чопів фірми Intel. Ці чопи мали деякий успіх, чим була раздосадована Intel. Остання подала в суд на NEC за фактом порушення закону про захист авторських прав. NEC подала позов у відповідь. У результаті суперечка була улагоджена без визнання переможцем якої-небудь сторони. Цікавими були деталі цього судового розгляду. Було визнано, що NEC дійсно використала деяку микрокоди Intel, що було порушенням її авторського права, якби воно було належно оформлене. Але оскільки Intel проводила і продавала деякі чопи 8088 без знака авторського права, то їх претензії були визнані безпідставними. Компанія Chips and Technology, яка стала відома завдяки випуску аналогів BIOS, в цей час впровадила лінію по виробництву процесорних чопів. На ній випускаються аналоги 386. І оскільки ці чопи не є точними аналогами відомих раніше чопів, невідомо яким буде на них попит.

4.2. Процесори фірми AMD.

4.2.1. Судовий розгляд з Intel.

Фірма AMD була ліцензійним виробником Intel, виробляючої 80286. AMD оголосила, що її контракт з Intel дозволяє їм випускати легалізовані копії чопів 386. Intel категорично не погодилася з цим. AMD вдалося виграти цей судовий розгляд, і тепер вона випускає аналог чопа 386 з тактовою частотою 40 МГц. Цей чіп мав певний успіх, зокрема, через його більш високу швидкість в порівнянні з самим швидкодіючим чопом серії Intel 386. При випуску фірмою AMD аналогів 486 фірма Intel знов спробувала зупинити конкурента. Однак і в цьому випадку закон був на стороні AMD.

4.2.2. Процесори сімейства AMD5k86.

Налагодивши в 1994 році масове виробництво чопів 5-го покоління - мікропроцесорів Pentium, корпорація Intel могутньо пішла у відрив. Колосальна інтелектуальна потужність її інженерів, множена на найбагатші виробничі можливості, здавалося, не залишала ніяких шансів конкурентам. тим часом навздогін за лідером кинулося відразу трохи переслідувачів. Серед них, мабуть, саме компанія AMD мала саму "вдалу" стартову позицію. Компанія Advanced Micro Devices поміщалася другу в світі по виробництву мікропроцесорів. На сьогоднішній день загальне число чопів, випущених фірмою AMD, перевалило далеко за відмітку 85 мільйонів, що, погодьтеся, саме по собі говорить про величезний потенціал компанії.

Цифра "5" для фірми AMD була явно нещасливою. Intel Pentium все нарощував обороти: 66, 75, 90 Мгц... Тактова частота нових моделей збільшувалася навряд чи не кожний місяць. А розробникам компанії AMD, крім назви - "K5", представляти було рішуче чогось. Очікування ставало обтяжливим.

Гнітюче відчуття несбившихся надій скрасив випуск процесора Am5x86. Ні, чіп Am5x86 не був обіцяним К5. Мікропроцесор являв собою "четвірку" з великими можливостями, які однак, явно не дотягували до "чесного" Pentium. У пресі розповсюджувалися думки фахівців, на зразок: "Продуктивність, порівнянна з продуктивністю Pentium, дозволяє віднести мікропроцесор Am5x86 до пристроїв п'ятого покоління".

А тим часом, залишаючись по своїй суті (по внутрішній архітектурі) до болю знайомим 486-м, чіп Am5x86, що має тактову частоту 133 МГц, міг суперничати на рівних лише зі скромним по своїх можливостях процесором Pentium/75 МГц. Цікаво, якої повинна була б бути тактова частота Am5x86, щоб показати продуктивність, порівнянну з Pentium/166 МГц!

Тому створення чопа п'ятого покоління у компанії Advanced Micro Devices було ще попереду. При проектуванні своїх попередніх процесорів компанія спиралася на незмінну підтримку корпорації Intel. Але на початок розробки власного процесора п'ятого покоління термін дії ліцензійних угод з корпорацією Intel підійшов до кінця. Так що інженерам AMD довелося почати розробку, що називається, з чистого листа. Зокрема, вийшла промашка при проектуванні вбудованого кеша команд. Набори команд для процесорів різних поколінь істотно відрізняються. Інженери-розробники компанії AMD трохи прорахувалися в оцінці числа CISC-інструкцій, що мають різну довжину. У результаті, не вдавалося досягнути рівня продуктивності, що проектується при виконанні програм, оптимізованих під процесор Pentium. Але через деякий час і ця, і деякі інші помилки були усунені. І в кінці березня 1996 року компанія AMD гордо оголосила про появу на світло нового процесора п'ятого покоління - AMD5k86.

4.2.2.1 Екскурсія по внутрішній архітектурі.

Процесор AMD5k86, відомий на стадії розробки як AMD-K5 або Krypton, є першим членом суперскалярного сімейства (Superscalar family) K86. Він з'єднує в собі високу продуктивність і повну сумісність з операційною системою Microsoft Windows.

Суперскалярний RISC-процесор AMD5k86 виконаний по 0ю35-мікронній КМОП-технології (complimentary metal-oxid semiconductor process) і складається з 4.3 млн. транзисторів. Його дизайн базується на багатій історії і обширному досвіді архітектури RISC і х86.

На думку багатьох фахівців, розробники чопа AMD5k85 пішли значно далі первинного задуму: створити процесор, що має RISC-ядро, і при цьому сумісний з набором інструкцій х86 означає сумісність з операційними системами Microsoft Windows і всім ПО, написаним під архітектуру х86. Так щасливе поєднання найвищої продуктивності і повної сумісності з Microsoft Windows робить чіп AMD5k86 повноправним членом 5-го покоління мікропроцесорів.

Мікропроцесор AMD5k86 має 4-потоковое суперскалярное ядро і осуществялет повне переупорядочивание виконання інструкцій (full out-of-order execution). Чіп AMDk586 успадкував кращі риси від двох домінуючих на сьогоднішній день микропроцессорних гілок: сімейства х86 і суперскалярних RISC-процесорів. Від перших він успадкував так необхідну для успішного просування на комп'ютерному ринку сумісність з операційною системою WINDOWS. Від сімейства суперскалярних RISC-процесорів він успадкував найвищий рівень продуктивності, характерний для чопів, що застосовувалися в робочих станціях.

Розроблений інженерами компанії AMD процес попереднього декодування дозволяє подолати властиві архітектурі х86 обмеження (різна довжина інструкцій). У разі використання інструкцій різної довжини, чопи 4-го покоління можуть одночасно обробляти 1 команду, процесори 5-го покоління (Pentium) - 2 команди. І тільки мікропроцесор AMD5k86 здатний обробляти до 4 інструкцій за такт.

Використання роздільного кеша інструкцій і даних (об'єм кеша інструкцій в два рази перевершує об'єм кеша даних) виключає виникнення можливих внутрішніх конфліктів.

Зараз випускаються мікропроцесори AMD5k86-P75, AMD5k86-P90 і AMD5k86-P100 продуктивність яких (Р-рейтинг) відповідає процесору Pentium з тактовими частотами 75, 90 і 100 МГц.

Компанія Advanced Micro Devices планує випустити в цьому (1996) році 3 млн. процесорів сімейства AMD5k86 зі значеннями Р-рейтингу від 75 до 166. Ціни на нові процесори будуть порівнянні з цінами володіючих аналогічною продуктивністю процесорів Pentium, ймовірно, навіть декілька нижче. Середня ціна процесора AMD5k86-P75 складає біля $75, чопа AMD5k86-P90 - $99.

Характеристики мікропроцесора AMD5k86:

- 4-потоковое суперскалярное ядро з 6-ю паралельно працюючими виконавчими пристроями, що становлять 5-ступінчастий конвейєр;

- 4-потоковий асоціативний кеш команд з лінійною адресацією об'ємом 16 Кб;

- 4-потоковий асоціативний кеш даних із зворотним записом і лінійною адресацією об'ємом 8 Кб;

- повне переупорядочивание виконання інструкцій, попереднє (speculative) виконання;

- динамічний кеш прогнозу переходів об'ємом 1 Кб; у разі неправильного прогнозу затримка складає менше за 3 внутрішніх тактів;

- 80-розрядний інтегрований, високопродуктивний пристрій виконання операцій з плаваючою комою, що володіє невеликим часом затримки при виконанні операцій +/*;

- живильне напруження - 3 В, система SSM (System Management Mode) для зменшення споживаної потужності;

- 64-розрядна шина і системний інтерфейс вміщений и в 296-контакний корпус SPGA, сумісний по висновках з процесором Pentium (P54C) і процесорним гніздом Socket-7;

- повна сумісність з Microsoft Windows і інстальованою базою ПО для процесорів архітектури х86.

4.2.2.2. Приклад маркіровки мікропроцесора AMD5k86-P75.

- -

¦ #### ### ### ###### - ¦\

¦ ## ## ## ### ## ## ## '\- ¦ ¦\

¦ ###### ## # ## ## ## /¦ ¦ ¦ ¦\

¦ ## ## ## ## ###### ¦ -,¦ ¦ ¦\

¦ -/ \¦ ¦\

1 - ¦\

2 - AMD5k86тм ¦\

3 - ¦\

4 - AMD-SSA/5-75ABQ ¦\

¦ Е < datecode > ¦ Designed for ¦\

5 - /\/- ¦\

¦ (m) (з)1996AMD /\/- ¦\

¦ /\/- ¦\

¦ Microsoft ¦\

6 - HEAT SINK - ¦\

\ AND FAN REQ'D Windows 95тм ¦\

\ ¦\

'-\

\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \

Обозначения:

1. Р-рейтинг 5. Живильне напруження

2. Назва В=3.45 - 3.60 В

3. Температура корпусу З=3.30 - 3.465 В

W=55C R=70C F=3.135 - 3.465 В

Q=60C Y=75C Н=2.76 - 3.0 В

X=65C Z=85C J=2.57 - 2.84 В

4. Серійний номер K=2.38 - 2.63 В

6. Температурний режим

4.2.2.3. Тести.

Система Р-рейтингів вимірювання продуктивності процесорів була запропонована на початку 1996 року компаніями AMD, Cyrix, IBM і SGS-Thomson Microelectronics. Р-рейтинг складається, за результатами проведення еталонного тесту Winstone 96, розробленого видавництвом Ziff-Davis. Цей тест являє собою набір з 13 найчастіше вживаних додатків, таких як Microsoft Word і Exel.

Потрібно помітити, що на відміну від системи тестів iComp, якою користується корпорація intel для оцінки продуктивності своїх мікропроцесорів, тестовий набір Winstone 96 є загальнодоступним.

У своєму новому чопі AMD5k86 компанія AMD втілила справді новаторське поєднання набору інструкцій х86 і суперскалярной RISC-архітектури (reduced instruction set computing architecture). Як затверджують деякі фахівці AMD, завдяки такому рішенню мікропроцесор AMD5k86 забезпечує на 30% більшу продуктивність, ніж процесор Pentium з такою ж тактовою частотою. Проте, результати тестування з використанням пакету тестів Winstone 96 компанії Ziff-Davis показують, що перевага дещо скромніше.

Тестова конфігурація:

Материнська плата

Чипсет

ОЗУ

Кеш-пам'ять L2

Відеоплата (640х480х256)

Відеодрайвер

Жорсткий диск

FIC PA2002

VIA Apollo Master

EDO DRAM об'ємом 16 Мб

256 Кб

PCI Diamond Stealth64 3200

Diamond GT 4.02.00.218 for Windows 95 EIDE Quantum Fireball ємністю 1.2 Гб

AMD5k85-P75 CPU (index 48.8)

Pentium 75 (index 47.4)

AMD5k85-P90 CPU (index 56.7)

Pentium 90 (index 54.9)

4.2.2.4. Материнські плати для AMD5k86.

Список широко поширених системних плат, протестированних в лабораторіях компанії AMD і

рекомендованих для установки процесора AMD5k86.

Виробник

Модель

Чипсет

BIOS

Abit

PH5 1.3

SiS 551

Award Pentium PCI Sys BIOS (N35)

Abit

PH5 2.1

Intel Triton

Award Pentium PCI Sys BIOS (C4)

Atrend

ATC1000

Intel Triton

Award i430-2A59CA29C-00

Atrend

ATC1545 A1

OPTi Viper

Award OPTi Viper

ATS-1545 ver. 0.6.

Biostar

8500TAC A1

Intel Triton

AMI 1993

ECS

TR5510

Intel Triton

Award i430FX-2A59CE1NC-00

ECS

AIO

Intel Triton

Award i430FX-2A59CE1NC-00

FIC

PA2002 1.21

VIA 570

Award 4.052G800

Gigabyte

GA586ATS 1B

Intel Triton

Award Intel 430FX PCI-ISA v.1.26

Hsingtech

M507 1.1

Intel Triton

Award 2/1/1996x

Mycomp (TMC)

PCI54ITS 2.00

Intel Triton

Award i430FX-2A59CM29C-00

Зауваження: ранні версії вказаних системних плат потребують заміни BIOS на більш нову версію, що правильно розпізнає чіп AMD5k86

4.2.2.5. AMD планує випустити K5.

Репутація AMD сильно залежить від успішності тривалого проекту К5-першої самостійної проби архітектурних сил в області х86. Народження К5 небезпечно відкладається вже не перший раз. У першому кварталі наступного року AMD планує переклад K5 на технологічний процес з проектними нормами 0.35 мкм і з трехуровневой металізацією, розроблений при сприянні з НР і що запускається на новому заводі AMD Fab 25 в Остіне, штат Техас. Це дозволить зменшити К5 з

4.2 мільйонами транзисторів до 167 кв. мм і підняти відсоток виходу придатних, а також тактову частоту.

На думку керівництва AMD в 1996 році обсяг випуску К5 буде нарощуватися досить швидко, що дозволить відвантажити до кінця року більш п'яти мільйонів процесорів. Відповіддю на виклик Intel з її процесором Pentium Pro може стати тільки процесор К6, але вже ніхто не вірить, що його вдасться побачити раніше 1997 року. Незважаючи на всесвітній перехід на процесор Pentium, в наступному році ще можуть збережеться деякі ринки для 486-х. Експерти вважають, що потреба таких регіональних ринків, як Китай, Індія, Росія, Східна Європа і Африка, в 486-х чопах складе до 20 мільйонів процесорів в 1996 році. AMD розраховує, що саме їй вдасться поставити велику частину від цієї кількості. Тому компанія підвищує тактову частоту 486-х до 133 Мгц, щоб конкурувати з нижчими версіями процесора Pentium в настільних ПК початкового рівня. Однак, AMD буде посилено нарощувати випуск К5, оскільки 486-е швидко виходять з моди.

4.3. Процесори NexGen.

У той час: як компанія Intel готувала галузь до шокуючого виходу в життя серійних моделей серверів і настільних машин на Pentium Pro, фірма NexGen представляла форуму свої плани з розробки процесора Nx686. Цей суперскалярний х86-сумісний процесор, до розробки якого підключається ще і команда архітекторів з AMD, знятих з власного невдалого проекту К6, буде містити біля 6 млн. транзисторів, включаючи обчислювач з плаваючою точкою на одному кристалі з процесором (відмова від попереднього двухкристалльного підходу, що ослабив Nx586). Технологія КМОП з проектними нормами 0,35 мкм і пятислойной металізацією дозволила "упакувати" на одному кристалі сім виконавчих вузлів: два для цілочисельних, один для операцій з плаваючою точкою, по одному для обробки мультимедіа, команд переходів, команд завантаження і команд запису. Показники продуктивності представники NexGen назвати не змогли, але виразили припущення, що він перевершить Pentium Pro на 16-розрядних програмах вдвоє, а на 32-бітових - на 33 %.

Досі мало що відоме про Nx686, оскільки чіп ще не анонсувався і NexGen не хоче розкривати козирі перед конкурентами в особі AMD, Cyrix і Intel. Однак, NexGen не хоче розкривати козирі перед конкурентами в особі AMD, Cyrix і Intel. Однак, NexGen наполягає про те, що Nx686 по продуктивності зіставимо з интеловским Pentium Pro і AMD K5, і успадковує микроархитектуру Nx586, що з'явилася в 1994 році. NexGen називає її RISC86. Базова її ідея, як і у випадку з Pentium Pro і K5, складається в перетворенні складних CISC-команд програмного забезпечення x86 в RISC-подібні операції, що виконуються паралельно в процесорному ядрі RISC-типу. Цей підхід, відомий під назвою непов'язаної микроархитектури, дозволяє збагатити CISC-процесор новітніми досягненнями RISC-архітектури і зберегти сумісність з тим, що є ПО для х86.

У Nx686 ця філософія просунена на новий логічний рівень. Сьогодні в Nx586 є три виконавчих блоки, трехконвейерное суперскалярное ядро. Він здатний виконувати в кожному такті по одній команді х86. Можливості для вдосконалення очевидні: Nx586 буде містити п'ять виконавчих блоків, чотири конвейєри і декілька декодерів, здатних справитися з виконанням двох або навіть більше за команди х86 за один машинний такт. Для цього зажадається вбудувати додаткові регістри перейменування і черги команд.

Підхід до використання інтегрованого кеш-контроллера і інтерфейса для швидкісної кеш-пам'яті залишається незмінним. Представники NexGen говорять, що вони вивчають можливість використання кристала повторної кеш-пам'яті за зразком і подібністю Intel, тим більше що їх виробничий партнер IBM Microelectronics здатний робити статичну пам'ять і многокристалльние зборки (MCM - multichip modules).

Приклад практичної реалізації технології МСМ фірми IBM представляє нова версія процесора Nx586, запланована до випуску на кінець цього року і що включає кристал CPU і FPU в одному корпусі. Одночасне перепроектирование топології з масштабуванням до розміру лінії 0.35 мікрон дозволить компанії NexGen грунтовно зменшити розміри кристала ЦПУ - до 118 кв. мм - менше в цьому класі нічого немає.

NexGen, новак в групі виробників процесорів х86. Nx596 може паралельно обробляти на декількох виконавчих блоках до чотирьох найпростіших операцій, які названі командами RISC86. Процесор К5 має схожу четирехпоточний дешифратор, але результати його роботи компанія називає R-ops.

4.4. Процесори Cyrix.

Перша річ з грандіозного проекту М1 компанії Cyrix, нарешті обнародувана. Це процесор Сх 6х86-100, монстроподобний кристал якого складений і дуже дорогий для того, щоб претендувати на масовий випуск в течії тривалого терміну. Його проблеми зможе вирішити процесор, який поки має кодову назву M1rx і що спирається на техно процес з пятислойной металізацією, що йде на зміну трехслойной версії тієї ж 0.6-мкм технології. Якщо проект увінчається успіхом, то розмір кристала з 394 кв. мм поменшає до 225 кв. мм, тоді у Cyrix з'явиться шанс підняти тактову частоту до 120 МГц. У цьому випадку експерти передбачають йому продуктивність в межах 176-203 по тесту SPECint92, т. е. на рівні процесора Pentium 133 (SPECint92=190.9) або 150 МГц. Якщо всі обіцянки збудуться, то Cyrix зможе продати стільки процесорів, скільки зробить. Також компанія cyrix запропонувала компромісний варіант процесора - 5х86, заснованого на ядрі 486-го, посиленого елементами архітектури 6х86. Стартова версія цього гібрида буде сумісна по цоколевке з гніздом 486-го.

4.5. Процесори Sun Microsystems.

Sun Microsystems процесор UltraSparc-II. Уперше вводячи RISC-технологію, SUN в 1988 році оголосила SPARC як архітектура, що масштабується, із запасом на майбутнє. Однак, з 1993 року реалізація SuperSparc стала на крок відставати від своїх конкурентів.

З появою UltraSparc, четвертого покоління архітектури SPARC, компанія зв'язує надії на відновлення втрачених озиций. Він містить ні багато ні мало, але дев'ять виконавчих блоків: два цілочисельних АЛУ, п'ять блоків обчислень з плаваючою точкою (два для складання, два для множення і одне для ділення і видобування квадратного кореня), блок прогнозу адреси переходу і блок завантаження/запису. UltraSparc містить блок обробки переходів, вбудовану в первинну кеш команд, і умовно виконує передбачені переходи, але не може видавати команди з порушенням їх черговості. Ця функція перекладається на оптимізуючі компілятори.

Архітектура SPARC завжди мала регістрові вікна, т. е. вісім банків, що перекриваються по 24 двійчастих регістра, які можуть запобігти зупинкам процесора в моменти комплексного перемикання, пов'язані з інтенсивними записами в пам'ять. Розробники компіляторів схильні вважати ці вікна недостатнім рішенням, тому в UltraSparc використовується ієрархічна система непов'язаних шин. Шина даних розрядністю 128 біт працює на одній швидкості з ядром процесора. Вона сполучається через буферні мікросхеми з 128-розрядною системною шиною, працюючою на частоті, що становить половину, третину або чверть швидкості процесорного ядра. Для узгодження з більш "повільною" периферією служить шина введення-висновку Sbus.

Фірма Sun реалізовує цю схему на апаратному рівні за допомогою комутаційної мікросхеми, що є складовою частиною схемного комплекту оточення. Ця мікросхема може ізолювати шину пам'яті від шини введення-висновку, так що ЦПУ продовжує, наприклад, запис в графічну підсистему або в інакший пристрій введення-висновку, а не зупиняється під час читання ОЗУ. Така схема гарантує повне використання ресурсів шини і сталу пропускну спроможність

1.3 Гігабайт/з.

У процесорі UltraSparc-II використовується система команд Visual Instruction Set (VIS), що включає 30 нових команд для обробки даних мультимедіа, графіки, обробки зображень і інших цілочисельних алгоритмів. Команди VIS включають операції складання, віднімання і множення, які дозволяють виконувати до восьми операцій над цілим довгої байт паралельно з операцією завантаження або запису в пам'ять і з операцією переходу за один такт. Такий підхід може підвищити відеопродуктивність систем.

4.6. Процесори Digital Equipment.

Digital Equipment процесор Alpha найбільш тісно слідує в руслі RISC-філософії в порівнянні зі своїми конкурентами, "посрезав надлишки сала" з апаратури і системи команд з метою максимального випрямлення маршруту проходження даних. Розробники Alpha упевнені, що дуже висока частота чопа дасть вам більші переваги, ніж химерні апаратні надмірності. Їх принцип спрацював: кристал 21164 був самим швидким в світі процесором від дня своєї появи в 1995 році. Процесор 21164 в три рази швидше на цілочисельних обчисленнях, ніж Pentium-100, і перевершує на обробці числі з плаваючою точкою, чим суперкомпьютерний набір мікросхем R8000 фірми Mips. Топологія процесора наступного покоління 21164А не змінилася, але вона смаштабирована, крім того, модернизирован компілятор, що підвищило продуктивність на тестах SPECmarks. Передбачається, що готові зразки нового процесора, виготовлені по КМОП-технології з нормами 0.35 мікрон, при тактовій частоті понад 300 МГц будуть мати продуктивність 500 по SPECint92 і 700 по SPECfp92.

Процесори сімейства 21164 на вдаються до переваг виконання не в порядку черговості (out-of-order), більше покладаючись на інтелектуальні компілятори, які можуть генерувати коди, що зводять до мінімуму простої конвейєра. Це самий гігантський процесор в світі - на одному кристалі розміщене 9.3 мільйони транзисторів, велика частина яких пішла на осередки кеш-пам'яті. Alpha 21164 має на кристалі відносно невелику первинну кеш прямого відображення на 8 Кбайт і 96 Кбайт повторної. За рахунок роздуття площі кристала досягнута безпрецедентна продуктивність кеширования.

У 21164 працює чотири виконавчих блоки (два для цілого і два для чисел з плаваючою точкою) і може обробляти по дві команди кожного типу за такт. Він має чотириступінчатий конвейєр команд, який "живить" окремі конвейєри для цілих чисел, чисел з плаваючою точкою і конвейєр пам'яті. У порівнянні з іншими RISC-процесорами нового покоління чіп 21164 має відносно глибокі і прості конвейєри, що дозволяє запускати їх з більш високою тактовою частотою.

Конвейєр команд взагалі не піклується про їх залежність за даними (на відміну від pentium Pro, який є яскравим прикладом машини даних), він видає команди в порядку їх надходження на свій вхід (в порядку проходження по програмі). Якщо поточні чотири команди неможливо послати відразу все на різні виконавчі блоки, то конвейєр команд зупиняється доти, поки це не стане можливим. На відміну від конкурентів 21164 також не використовує техніку перейменування регістрів, замість неї він безпосередньо оновлює вміст своїх архітектурних регістрів, коли результат досягає фінального рівня конвейєра - write-back. Для боротьби із затримками і залежністю команд команд за даними в процесорі активно використовуються маршрути для обходу регістрів, тому операнди, що спільно використовуються стають доступними до стадії write-back.

Компанія Digital просуває Альфу як платформу для серверів Windows NT, а не як традиційний UNIX-сервер.

4.7. Процесори Mips.

Mips процесор R1000 успадкував свій суперскалярний дизайн від R8000, який призначався для ринку суперкомп'ютерів наукового призначення. Але R1000 орієнтований на масові задачі. Використання в R1000 динамічного планування команд, яке ослабляє залежність від перекомпіляції ПО, написаного для старіших процесорів, стало можливим завдяки тісним зв'язкам Mips зі своїм партнером Silicon Graphics, що має найбагатший тил у вигляді складних графічних додатків.

R1000 перший однокристалльний процесор від Mips. Для запобігання зупинкам конвейєра в ньому використаний динамічний прогноз переходів, з чотирма рівнями умовного виконання, з використанням перейменування регістрів, гаранитирующего що результати не будуть передаватися в реальні регістри доти, поки неясність по команді переходу не буде знята. Процесор підтримує "тіньову карту" відображення своїх регістрів перейменування. У разі невірного прогнозу адреси переходу він просто відновлює цю карту відображення, але не виконує фактичного очищення регістрів і "промивки" буферів, економлячи таким чином один такт.

R1000 відрізняється також радикальною схемою схемою позачергової обробки. Порядок проходження команд відповідно точному до програми зберігається на трьох перших рівнях конвейєра, але потім потік розгалужується на три черги (де команди чекають обробки на цілочисельному АЛУ, блоці обчислень з плаваючою точкою і блоці завантаження/запису). Ці черги вже обслуговуються по мірі звільнення того або інакшого ресурсу.

Передбачувана продуктивність R1000, виконаного по КМОП-технології з нормами 0.35 мікрон повинна досягнути 300 по SPECint92 і по SPECfp92.

Програмний порядок зрештою відновлюється так, що сама "стара" команда покидає обробку першої. Апаратна підтримка виконання в стилі out-of-order дає великі переваги кінцевому користувачу, оскільки коди, написані під старі скалярні процесори Mips (наприклад, R4000), починають працювати на повній швидкості і не вимагають перекомпіляції. Хоч потенційно процесор R1000 здатний видавати по п'ять команд на виконання в кожному такті, він вибирає і повертає тільки чотири, не устигаючи закінчити п'яту в тому ж такті.

Один з двох пристроїв для обчислення двійчастої точності з плаваючою точкою зайнятий складанням, а інше множенням/делениями і видобуванням квадратного кореня. На кристалі R1000 реалізований також інтерфейс зовнішньої шини, що дозволяє зв'язувати в кластер до чотирьох процесорів без додаткової логіки обрамлення.

4.8. Процесори Hewlett-Packard.

Hewlett-Packard процесор PA-8000. Компанія Hewlett-Packard однієї з перших освоїла RISC-технологію, вийшовши ще в 1986 році зі своїм першим 32-розрядним процесором PA-RISC. Практично всі процесори, що випускаються PA-RISC використовуються в робочих станціях HP серії 9000. У період з 1991 по 1993 (перед появою систем на базі PowerPC) HP відвантажила досить багато таких машин, ставши найбільшим продавцем RISC-чопів в доларовому вираженні.

З метою пропаганди своїх мікропроцесорів серед інших виробників систем компанія HP стала організатором організації Precision RISC Organization (PRO). А в 1994 році компанія висадила бомбу, об'єднавшись з Intel для створення нової архітектури. Це поставило під сумнів майбутнє PRO.

PA-8000 це 64-розрядний, четирехканальний суперскалярний процесор з радикальною схемою неврегульованого виконання програм. У складі кристала десять функціональних блоків, включаючи два цілочисельних АЛУ, два блоки для зсуву цілих чисел, два блоки multiply/accumulate (MAC) для чисел з плаваючою комою, два блоки ділення/видобування квадратного кореня для чисел з плаваючою комою і два блоки завантаження/запису. Блоки МАС мають трехтактовую затримку і при повному завантаженні конвейєра на обробці одинарної точності забезпечують продуктивність 4 FLOPS за такт. Блоки ділення дають 17-тактову затримку і не конвейеризировани, але вони можуть працювати одночасно з блоками МАС.

У PA-8000 використаний буфер переупорядочивания команд (IRB) глибиною 56 команд, що дозволяє "просматривать'программу на наступні 56 команд уперед в пошуках таких чотирьох команд, які можна виконати паралельно. IRB фактично складається з двох 28-слотових буферів. Буфер АЛУ містить команди для цілочисельного блоку і блоку плаваючої точки, а буфер пам'яті - команди завантаження/запису.

Як тільки команда попадає в слот IRB, апаратура переглядає всі команди, відправлені на функціональні блоки, щоб знайти серед них таку, яка є джерелом операндів для команди, що знаходиться в слоте. Команда в слоте запускається тільки після того, як буде розподілена на виконання остання команда, яка стримувала її. Кожний з буферів IRB може видавати по дві команди в кожному такті, і в будь-якому випадку видається сама "стара" команда в буфері. Оскільки PA-8000 використовує перейменування регістрів і повертає результати виконання команд з IRB в порядку їх проходження по програмі, тим самим підтримується точна модель обробки виняткових ситуацій.

HP проектувала РА-8000 спеціально для задач комерційної обробки даних і складних обчислень, типу генной інженерії, в яких об'єм даних настільки великий, що вони не уміщаються ні в один з мислимих внутрикристалльних кешей. Ось чому, РА-8000 покладається на зовнішню первинну кеши команд і даних. Слоти в третьому 28-слотовом буфері, який називається буфером переупорядочивания адрес (Adress-Recorder Buffer - ARB), один до одного асоційовані зі слотами в буфері пам'яті IRB. У АРВ містяться віртуальні і фізичні адреси всіх виданих команд завантаження/запису. Крім того, АРВ допускає виконання завантажень і записів в довільному порядку, але із збереженням узгодженості і згладжуванням впливу затримки, пов'язаної з адресацією зовнішніх кешей.

4.9. Процесори Motorola.

Motorola/IBM процесор PowerPC620 це перша 64-бітова реалізація архітектури PowerPC. Маючи 64-бітові регістри і внутрішні магістралі даних і сім мільйонів транзисторів, новому процесору потрібно майже вдвоє більший і складний кристал, чим у PowerPC 604. Модель 620 має четирехканальную суперконвейерную схему з шістьма виконавчими пристроями: три цілочисельних АЛУ, блок плаваючої точки, блок завантаження/запису і блок переходів. Останній здатний на четирехуровневое прогноз ветвлений в програмі і умовне виконання з використанням схеми перейменування регістрів.

ПО микроархитектуре RISC-ядра 620-й схожий на 604-й. Відмінності зводяться в основному до ширини регістрів і магістралей даних, а також до збільшеного числа станцій резервування для умовного виконання команд. Надбавка продуктивності досягнута за рахунок поліпшеного шинного інтерфейса. Тепер він має 128-бітовий інтерфейс до пам'яті, по якому за один цикл звертання можна вибрати два 64-бітових довгих слова, і 40-бітова шина адреси, по якій можна адресувати до одного терабайта фізичної пам'яті.

До складу шинного інтерфейса входити також підтримка кеш-пам'яті другого рівня об'ємом до 128 Мбайт, яка може працювати на чверті, половині або на повній швидкості ЦПУ.

5. Лабораторні випробування і тестування мікропроцесорів.

5.1. Лабораторні випробування процесорів i386DX.

У 1992 році на ринку з'явилося три нових МП, здатних замістити існуючі 386DX і забезпечити підвищення характеристик систем на основі i386. Це: Intel RapidCAD, Chips&Technologies 38600DX, і Cyrix 486DLC. У даний момент пропонуються тільки версії 33 МГц, хоч З&Т і Cyrix обіцяють випустити на початку 1993 року варіант 40 МГц. Звісно, на такій частоті можна примусити працювати і 33 МГц варіант, але мій досвід показує, що це ненадійне, в будь-який момент машина може зависнути. Intel RapidCAD розповсюджується, як продукт для кінцевих користувачів, т. е. в машину його встановлюють саме вони. Навпаки, З&Т і Cyrix постачають свої процесори і виробникам. Cyrix також проводить процесор 486SLC, замінюючий Intel/AMD 386SX. З&Т оголосив про створення процесора 38600SX, але в продажу він з'явиться тільки в 1993 році, якщо взагалі з'явиться.

RapidCAD, грубо говорячи, являє собою процесор 486DX без внутрішньої кеш-пам'яті і з цоколевкой процесора 386. Для програм він відповідає 386 з співпроцесором, оскільки всі специфічні команди i486 видалені з набору команд. Рекламується цей процесор, як "абсолютний співпроцесор" і, до чого і зобов'язує таке ім'я, він призначений для заміни процесора 386DX в існуючих системах і різкого підвищення продуктивності операцій з плаваючою точкою, таких, як CAD, електронні таблиці, математичні програмні пакети (SPSS, Mathematica і т. д.). RapidCAD складається з двох корпусів; RapidCAD-1, в корпусі PGA (132 висновки), що встановлюється в гніздо для i386, включає в себе ЦПУ і модуль операцій з плаваючою точкою, і RapidCAD-2, в корпусі PGA (68 висновків), що встановлюється в гніздо для співпроцесора i387, включає в себе ПЛМ, що подає сигнал на схеми системної плати для правильної обробки особливих ситуацій при операціях з плаваючою точкою. Більшість операцій виконується протягом одного циклу, як і в i486. Однак вузьким місцем є інтерфейс шини 386, оскільки кожний цикл шини рівний двом циклам процесора. Це означає, що команди виконуються швидше, ніж прочитуються з пам'яті. Оскільки операції з плаваючою точкою виконуються повільніше звичайних команд, то уповільнення на них не позначається, і вони виконуються з такою ж швидкістю, як і на i486DX. Саме тому RapidCAD дозволяє отримати більш високі характеристики з плаваючою точкою, чим будь-яка комбінація 386/387. Результати тесту SPEC, стандартного тесту для машин під UNIX, показують, що RapidCAD прискорює операції з плаваючою точкою на 85%, а з цілими числами - на 15% в порівнянні з будь-якою комбінацією 386/387 при однаковій тактовій частоті. Споживана потужність при 33 МГц становить 3500 мВт. Поточна ціна RapidCAD 33 МГц становить 300$.

Передбачається, що процесор фірми З&Т 38600DX повністю сумісний з i386DX. На відміну від процесора Am386 фірми AMD, який використовує микрокод, ідентичну микрокоду Intel 386, в процесорі 38600DX використаний патентно чистий микрокод, для забезпечення повної сумісності в набір команд навіть включена недокументована команда LOADALL386. Деякі команди виконуються швидше, ніж в i386. З&Т також випустила процесор 38605DX, що включає кеш-пам'ять команд на 512 байт, що ще більш підвищить його продуктивність. На жаль, 38605DX випускається в корпусі PGA (144 висновки) і не може бути встановлений безпосередньо в роз'єм i386DX. При проведенні випробувань я помітив, що у 38600DX є серйозні проблеми комунікації ЦПУ- співпроцесор, і через це швидкість виконання в більшості програм операцій з плаваючою точкою у нього падає нижче за рівень i386/i387. Ця проблема існує для всіх вироблюваних на даний момент 387- сумісних співпроцесорів (ULSI 83C87, IIT 3C87, Cyrix EMX87, Cyrix 83D87, Cyrix 387+, З&Т 38700, Intel 387DX). Мій знайомий по мережі також проводив такі тести з 38700DX і дійшов аналогічним висновків. Він зв'язався з З&Т, і йому відповіли, що знають про це. Середня споживана потужність 38600DX 40 МГц - 1650 мВт, що менше, ніж споживання i386 33 МГц. Поточна ціна 38600DX 33 МГц - 80$.

Процесор Cyrix 486DLC - остання новинка на ринку замінників i386DX. Набір його команд сумісний з i486SX, встановлена 1 КВ кешпамять і апаратно реалізований 16х16 біт помножувач. Виконавчий пристрій 486DLC, створений з використанням деяких принципів RISC, виконує більшість команд за один цикл. Апаратний помножувач перемножує 16-розрядні значення за 3 цикли, замість 12 - 25 циклів у i386DX. Це особливо зручне при обчисленні адрес (код, що генерується деякими неоптимизирующими компіляторами, може містити багато команд MUL для доступу до масивів) і для програмних обчислень з плаваючою точкою (напр., при емуляції співпроцесора). Внутрішня кешпамять являє собою обьединенную пам'ять команд і даних крізного запису, і може бути конфігурована, як пам'ять з прямим відображенням, або як 2-канальна асоціативна. Через необхідність забезпечення повної сумісності після перезавантаження процесора кешпамять відключається, і повинна бути включена за допомогою невеликої програми, що надається фірмою Cyrix. Якщо кеш-пам'ять включена при завантаженні, (напр., при "гарячому" перезавантаженні, Ctrl-Alt-Del), BIOS мого РС (пр-ва AMI) зависає при завантаженні, і мені доводиться або виконувати рестарт процесора, або відключати кеш перед перезавантаженням. Це одна з причин того, що після запуску процесора кеш-пам'ять відключається. Я упевнений, що в наступних версіях BIOS фірми AMI це буде враховане і вбудована кеш-пам'ять буде підтримуватися. Кеш-пам'ять допомагає процесору 486DLC подолати обмеження інтерфейса шини 386, хоч відсоток попаданий складає не більше за 50%. Фірма Cyrix передбачила деякі можливості управління кеш-пам'яттю процесора, що, звісно, поліпшить зв'язок зовнішньої і внутрішньої кеш-пам'яті. Сучасні системи 386 не сприймають ці керуючі сигнали, неважливі для i386DX, але надалі системи, розроблені з урахуванням цих можливостей 486DLC, можуть використати їх. Вбудований кеш 486DLC допускає до 4-х некешируемих областей пам'яті, що може бути дуже корисно в тому випадку, якщо ваша система використовує периферійні пристрої, що відображаються в пам'ять (напр., співпроцесор Weitek). У існуючих системах 386 пересилки DMA (напр., SCSI контроллера, плати звуку) можуть відключити внутрішню кеш, оскільки не існує інших способів забезпечити відповідність кеш-пам'яті і основної пам'яті, що, звісно, знижує характеристики 486DLC. Споживана потужність 486DLC 40 МГц - 2800 мВт. Німецький дистриб'ютор продає 486DLC 33 МГц по поточній ціні 115$. 486DLC працює далеко не з всіма співпроцесорами і не у всіх обставинах, особливо критичен в цьому відношенні багатозадачний захищений режим (поліпшений режим MS- Windows). При використанні 486DLC спільно з Cyrix EMC87, Cyrix 83D87 (випуск до серпня 1992) і IIT 3C87 машина зависає через проблеми синхронізації між ЦПУ і співпроцесором при виконанні команд FSAVE і FRSTOR, що зберігають і поновлюючих стан співпроцесора при перемиканні задач. Найкраще використати 486DLC з Cyrix 387+ (розповсюджується тільки в Європі) або Cyrix 83D87 випуску після липня 1992, що є найбільш могутнім співпроцесором серед сумісних співпроцесорів 486DLC. Якщо у вас вже є співпроцесор Cyrix 83D87, і ви хочете знати, чи сумістимо він з 486LCD, я рекомендую вам мою програму COMPTEST, поширювану як CTEST257.ZIP через анонімні ftp з garbo@uwasa.fi або інші ftp-сервери. Якщо програма повідомить про співпроцесор 387+, то у вас встановлений або 387+, або аналогічна нова версія 83D87 і проблем з сумісністю не буде.

При випробуваннях використовувалася система:

Апаратна конфігурація: 33,3/40 МГц системна плата, комплект мікросхем Forex, кеш 128 КВ з нульовим станом очікування, пряме відображення, крізний запис, один буфер запису, 4 байти на рядок, 4 цикли затримки при кеш-промаху. 8 МВ основних пам'яті, середній стан очікування 1,6 циклу. BIOS фірми AMI. Процесор Cyrix EMC87 в режимі сумісності 387, як матсопроцессор. Цей процесор разом з Cyrix 83D87/387+ є самими швидкими співпроцесорами для роботи з 386DX/486DLC/38600DX. Жорсткий диск Conner 3204F, ємність 203 МВ, інтерфейс IDE (пропускна спроможність по тесту CORETEST 1100 КВ/з, час пошуку 16 мс). Плата SVGA (ISA, Diamond SpeedSTAR HiColor), використовується ET4000, 1 МВ DRAM, як екранний буфер, графічний прискорювач відключений. Перемикачі на видеоплате встановлені для найбільш надійної з швидкої роботи, з пропускною спроможністю 6500 байт/мс при 40 МГц і 5400 байт/мс при 33 МГц.

Програмна конфігурація: MS-DOS 5.0, MS Windows 3.1, HyperDisk

4.32 в режимі зворотного запису, використовується 2 МВ розширених пам'яті, як менеджер пам'яті використовується 386MAX 6.01. Ця програма також забезпечує DPMI в деяких тестах.

Результати тестів

Для тестів Whetstone, Drhystone, WINTACH, DODUC, LINPACK, LLL і Savage більший показник означає велику продуктивність.

Для тестів MAKE RTL, MAKE TRANK і тесту String-Test менший показник означає велику продуктивність.

33,3 МГц Intel З&Т Intel Cyrix Cyrix

386DX 38600DX RapidCAD 486DLC 486DLC

кеш викл. кеш вкл. Тести з цілими числами

Whetstone (kWhet/s) 447 585 563 695 803

Drhystone(З) (Dhry./s) 11688 11819 12357 14150 15488

Drhystone(Pas) (Dhry./s) 10455 10877 10751 12154 13858

String-Test (ms) 459 453 441 347 327

MAKE RTL (s) 51,32 47,10 46,34 43,45 39,13

MAKE TRANCK (s) 62,42 55,47 55,37 53,64 46,12

WINTACH 4,85 4.90 5.49 5.53 6.14

Тести з плаваючою комою

DODUC (Індекс швидкості) 79.0 76.4 150.3 89.4 90.7

LINPACK (Mflops) 0.2808 0.2707 0.4578 0.3158 0.3438

LLL (Mflops) 0.3352 0.3537 0.6083 0.3816 0.4139

Whetstone (kWhet/s) 2540 2340 3990 2908 3061

Savage (рішень/з) 71685 53191 72464 88757 93897

40 МГц Intel З&Т Intel Cyrix Cyrix

386DX 38600DX RapidCAD 486DLC 486DLC

Тести з цілими числами кеш викл. кеш вкл.

Whetstone (kWhet/s) 536 702 676 835 963

Drhystone(З) (Dhry./s) 14128 14116 14836 16987 18750

Drhystone(Pas) (Dhry./s) 12490 13067 12890 14573 16624

String-Test (ms) 384 377 368 289 273

MAKE RTL (s) 43.46 40.11 39.84 37.25 33.54

MAKE TRANCK (s) 53.00 47.59 47.07 45.36 39.00

WINTACH 5.65 5.73 6.41 6.46 7.23

Тести з плаваючою комою

DODUC (Індекс швидкості) 94.9 77.5 180.3 105.1 106.6

LINPACK (Mflops) 0.3324 0.3260 0.5418 0.3789 0.4131

LLL (Mflops) 0.4025 0.4204 0.7260 0.4562 0.4956

Whetstone (kWhet/s) 3061 2632 4798 3505 3677

Savage (рішень/з) 86083 49587 86957 106762 112360

Серед перевірених процесорів Cyrix 486DLC володіє самої великою продуктивністю по цілих числах. З включеної внутрішньої кешпамятью продуктивність по цілих числах на однаковій тактовій частоті 486DLC на 80% перевищує 386DX, середнє збільшення швидкості роботи прикладних програм становить 35%. При роботі з прикладними програмами, що використовують операції як з цілими числами, так і з плаваючою точкою, включений кеш забезпечує на 5% - 15% більш високі показники в порівнянні з роботою без кеша. Швидкість операцій з плаваючою точкою в порівнянні з i386DX збільшується на 15% - 30%

Intel RapidCAD при роботі замість i386DX забезпечує самі високі характеристики при виконанні операцій з плаваючою точкою. Прикладні програми, що виконують інтенсивні операції з плаваючою точкою, працюють швидше на 60% - 90% в порівнянні з i386DX/387DX, відстаючи від i486DX при тій же тактовій частоті по швидкості операцій з плаваючою точкою всього на 25%. Швидкість операцій з цілими числами збільшується на 15% - 35% в порівнянні з i386DX/i387DX.

Процесор Chips&Technologies 38600DX володіє дещо більш високими характеристиками при роботі з цілими числами, ніж i386DX, даючи середнє збільшення швидкості порядку 10%.

5.2. Результати тестування мікропроцесорів за допомогою пакету The Speed Test.

Для тестування різних мікропроцесорів іноді застосовують спеціальні пакети програм processor benchmarks. Нижче приведені результати тестування процесорів за допомогою пакету програм Speed Test, ARA Copyright (З) 1994,95,96 Agababyan Robert Assotiation Used TMi0SDGL(tm)

Pentium iP5-200(3-200), 512K PB 1318841

Pentium iP5-200(2.5-200), 512K PB 1309353

Pentium iP5-200(2.5-200) 1290780

Pentium iP5-200(3-200) 1290780

Pentium iP5-180, 512K PB 1181818

Pentium iP5-180 1151899

Pentium iP55-166, Intel Triton, IWill TSW2 1109756

Pentium iP5-166, 512K PB 1096386

Pentium iP5-166 1076923

Pentium iP5-160, 512K PB 1052023

Pentium iP5-160 1040000

Pentium iP5-150, 512K PB 983784

Pentium iP5-150 968085

Pentium iP5-133, 512K PB 879227

Pentium iP5-133 866667

Pentium iP54-75(1.5-120), Intel Triton 812500

Pentium iP54-75(2-120), Intel Triton 812500

Pentium iP54-75(2-120), SiS 501/503 812500

Pentium iP5-100(2-120), Intel Triton, ASUS P55-TP4 798246

Pentium iP5-120(1.5-120), 512K PB 798246

Pentium iP5-120, 512K PB 787879

Pentium iP5-120(1.5-120) 781116

Pentium iP5-120 777778

Cx5x86-M1sc-100(3-150, Opt) 771186

Cx5x86-M1sc-100(3-150, Opt) 758333

Am5x86-133-X5-P75(4-200) 710938

Pentium iP5-100, ALR Revolution 679104

Pentium iP5-100, Intel Triton, ASUS Р/I-P55TP4XE 669118

Pentium iP5-100, Intel Triton 669118

Pentium iP54-75(100), Intel Triton 669118

Am5x86-133-X5-P75(3-180), UMC8886BF/8881F 640845

Cx5x86-M1sc-100(3-120, Opt) 614865

Pentium iP54-75(90), Intel Triton, ASUSTeK P54-TP4 606667

Cx5x86-M1sc-100(3-120, Opt), SiS 471, GMB-486SG 600660

Am5x86-133-X5-P75(4-160), SiS 471, BTC 4SLD5.1 568750

Am5x86-133-X5-P75(4-160), SiS 496/7, ASUS PVI-SP3 568750

Am5x86-133-X5-P75(4-160), SiS 471 561730

Am5x86-133-X5-P75(4-160), SiS 496 PCI 561728

Am5x86-133-X5-P75(4-160) 561128

Cx5x86-M1sc-100(3-120), SiS 496/7, ASUS PVI-SP3 548193

Cx5x86-M1sc-100(3-120, Opt), SiS 471, GMB-486SG 535294

i80486DX4-100(120), UMC 8498F 535294

Am5x86-133-X5-P75(3-150), SiS 471, BTC 4SLD5.1 529070

Cx5x86-M1sc-100(Opt) 511236

Nx586-90(100), NxVL System Logic, Alaris 505450

Cx5x86-M1sc-100(Opt), SiS 471, GMB-486SG 501377

Am5x86-133-X5-P75, SiS 471, BTC 4SLD5.1 469072

Am5x86-133-X5-P75, SiS 496/7, ASUS PVI-SP3 469072

Cx5x86-M1sc-100, SiS 496/7, ASUS PVI-SP3 455000

i80486DX4-100, UMC 881 455000

Nx586-90, NxVL System Logic, Alaris 455000

Pentium iP5-60(66), PCI58PL 450495

Pentium iP5-60(66), SiS 501/502/503, ASUS P5-SP 450495

Cx5x86-M1sc-100, SiS 471, GMB-486SG 446078

i80486DX2-66(4-100), PC Chips 18 446078

i80486DX4-100, SiS 82C471, SOYO 446078

OverDrive iDX4ODPR100 (486DX4-100) 437500

i80486DX4-100, Compaq ProLinea 4/100 433333

Am80486DX4-120SV8B, SiS 471, BTC 4SLD5.1 425234

Am80486DX4-120, SiS 471, SOYO 425234

Pentium iP5-60, Compaq DeskPro XL 560 406250

Pentium iP5-60, Compaq Proliant 406250

Pentium iP54-75(60), Intel Triton 406250

Pentium iP5-60, OPTi 596/546/82, Bison III v1.0 406250

Pentium iP5-60, SiS 501/502/503, ASUS P5-SP 406250

Am80486DX2-80(100), UMC 8498F 352713

Am80486DX4-100, PC Chips 18 350000

Am80486DX2-80(100), SiS 471 345351

Cx80486DX2-100, Opti VIP 344697

i80486DX4-100(75), UMC 881 337037

Pentium iP54-75(50), Intel Triton 334559

Pentium iP54-75(45), Intel Triton 303333

U5-S33(60), UMC 491F 301325

i80486SX2-50(80), SiS 471, S486G 282609

i80486DX2-S-80, PC Chips 18 280864

i80486DX2-80, Symphony Haydn II 280864

i80486DX2-S-80, UNICHIP U4800VLX, U486 WB 280864

Cx80486DX2-66(80), OPTi 495SLC 277560

U5-S33(50), SiS 471, AV7541 250000

U5-S33(50), SiS 471, SOYO 250000

U5-S33(50), UMC 491F 250000

U5-S33F(50), UMC 8498F 250000

U5-S33(50) 246612

U5-S33(50), CONTAQ 82C596A, G486VLI 245946

U5-S40(50) 245946

i80486DX2-66, DELL 238196

Am80486DX2-66, Forex 46C421 234964

Am80486DX2-66, Bioteq 82C3491 234536

Am80486DX2-66, OPTi 495SLC 234536

i80486DX2-66 &E5, AcerMate 466 234536

i80486DX2-66, ALI M1429/M1431 234536

i80486DX2-66, SiS 82C471 234536

i80486DX2-66, Symphony, Predator I 234536

i80486DX2-66, OPTi 82C682, ALR Evolution 4 233333

i80486DX2-66, PC Chips 11&13 233333

Am80486DX2-66, IMS 8849 232143

i80486DX2-66, Compaq ProLinea MT 4/66 232143

Am80486DX2-66, UNICHIP U4800VLX, U486 WB 230964

i80486DX2-66, Intel Champion 230964

Cx80486DX2-66, UMC 82C491F 230964

OverDrive iDX2ODPR66 (486DX2-66) 230964

Am80486DX2-66, SiS 82C471 229798

i80486DX2-66, Symphony Haydn II 229768

i80486DX2-66, SiS 82C471 228643

U5-S33(40), SiS 82C471 200441

U5-S33F(40), UMC 8498F 200441

U5-S33(40), Expert 4045 194861

i80486DX-50, UMC 82C480 176357

i80486DX2-50, Headland HT342/HT321 176357

i80486SX-50, SiS 82C471 176357

Am80486DX-50, UMC 82C491F 173004

i80486DX-50 173004

i80486DX2-50, OPTi 495SLC 171053

Cx486S-40(50), UMC 82C491F 171053

U5-S33, SiS 82C471 167279

U5-S33, Expert 4045 162645

IBM486SLC2-66, OPTi 495XLC 161922

i80486SX-33(40), SiS 82C471 140867

i80486SX-33(40), OPTi 82C495SLC 140867

Am80486DX-40, OPTi 82C495SLC 140432

i80486SX-33(40) &E5, Forex 521 140000

i80486SX-33(40), Forex 521 139571

Am80486DX-40, SiS 82C461 138931

Cx486DX-40 135821

Ti486DLC/Е-40BGA, PC Chips, M321 126389

Cx486DLC-40 126389

Tx486DLC-40, OPTi 495SLC 126039

Cx486DLC-40GP, SARC RC4018A4 123641

IBM 486SLC2-50, WD7600 122642

Cx486SLC-40, SARC RC2016A4, M396F 120053

i80486SX-33, SiS 82C471 117571

i80486DX-33, HP Vectra 486/33VL 116967

i80486DX-33, OPTi 82C498, Simens-Nixdorf PCD-4H 116967

i80486SX-20(33), Symphony 116967

i80486DX-33, Intel Champion 116667

i80486DX-33, Toshiba T9901C, LapTop 116667

i80486DX-33, UMC 82C481 114035

i80486SX-25, IBM PS/1 88694

i80486SX-25, SiS 87838

i80486SX-25, HiNT CS8005 87500

i80486SX-25, HP Vectra 486SX/25VL 86502

Am80386DX-40, ALI M1429/M1431 81835

Am80386DX-40, CD-COM, M326 81835

Am80386DX-40 WC, SARC 81835

Am80386DX-40, UMC 82C491F 81688

Am80386DX-40, OPTi 82C391 81531

Am80386DX-40, UNICHIP U4800VXL 81182

Am80386DX-40, PC Chips 5,6 80817

Am80386DX-40, UMC 80C481 80647

Am80386DX-40, OPTi 495XLC 80531

Am80386DX-40, Forex FRX46C402,411 80247

Am80386SX-40, P9 MXIC 73387

i80386DX-33 68114

Am80386SX-40, M396F 67407

Am80386SX-40, Acer M1217 63459

Am80386SX-40, ALI M1217 62329

Am80386SX-40, PC Chips 2 61905

i80386SX-33, Acer M1217 51066

i80386SX-33 49296

i80386DX-25 48925

i80386SX-33, HP Vectra 386SX/33N 48611

Am80386SX-33, Acer M1217 47744

80286-25 45867

80286-20 38625

Harris 80286-20, UMC 82C208L 37387

80286-16, HT12 29111

i80286-12.5 24125

i80286-12 22392

i80286-10, IBM PS/2 15545

i80286-10, IBM PS/2 60 15242

i8088-9.54, Commodore PC-20 5395

i8088-7.16, Commodore PC-20 4011

i8088-4.77, EC-1841 2968

i8088-4.77, Original XT 2697

i8088-4.77, Commodore PC-20 2658

6. Порівняльний аналіз.

У середини жовтня 1995 року в м. Сан-Хосе (Каліфорнія) відбувся черговий Мікропроцессорний Форум. У минулому році на ньому демонструвалися прототипи процесорів IBM Power PC 620, MIPS R10000, SUN UltraSPARC, HP PA-8000 і DEC Alpha 21164.

З торішніх процессоров-дебюторов до ринку дійшов тільки процесор Alpha 21164/300. Його продуктивність по тесту SPECint92 становила 341 одиницю. Перебуваючи з такою приголомшуючою продуктивністю в лідерах гонки на швидкодію процесорів, в листопаді Alpha пропустила уперед компанію Intel з процесором Pentium Pro. Пристрасті розжарилися неабиякі і ось на нинішньому форумі Digital повідомила, що в грудні приступить до випуску нового варіанту цього процесора - Alpha 21164A з тактової частої 333 МГц, виконаного по технології 0.35 мкм. Продуктивність, що Проектується 500 по SPECint92.

Hewlett-Packard анонсувала 32-розрядний процесор архітектури РА наступного покоління РА-7300LC з вбудованими функціями мультимедіа. Початок його випуску по 0.5 мкм технології можливий у другій половині наступного року. Цей перший процесор PA-RISC, оснащений внутрішніми 64 Кбайт кешами першого рівня для команд і для даних, переважно буде мати 200 SPECint92 і 275 SPECfp92.

Через рік після оголошення процесора UltraSPARC фірма SPARC Technology представила новий проект UltraSPARC-II. Новий процесор буде мати 5.4 млн. транзисторів, виготовлятися по технології

0.35 мікрон, працювати на частоті 250-300 МГц. Швидкодія 250 МГц версії, що Проектується - 350 SPECint92 і 550 SPEFfp92. Крім базової системи команд, процесор буде оснащений набором з 30 нових команд Visual Instruction Set, які призначені для швидкої обробки видеофайлов в форматі MPEG-2, рендеринга трьохмірних оболонок, відеоконференцзв'язку.

Народження Pentium Pro чудова новина, але воно незмінно підіймає декілька серйозних питань. Чи дійсно це повністю нове покоління процесора Pentium? Чи Побила Intel своїх конкурентів остаточно? Який процесор є самим безпечним вибором з точки зору надійності і сумісності? Який процесор найбільш вигідний з точки зору співвідношення ціни і продуктивності? Сьогодні з повною основою можна спитати, наскільки він порівняємо зі своїми RISC-опонентами? Чи Не застарів лозунг Apple про те, що Power Mac перспективніше, ніж лінія x86?

На всі питання можна відповісти в принципі ствердно. Конкуренти з табору х86 поки не можуть на ділі підтвердити свої претензії на рівність або перевагу. Нічого живого або пристойного (Cyrix) на руках поки немає. А ціновий орієнтир Intel відомий: настільний high-end комп'ютер на платформі Aurora, Pentium Pro 150 MHz, ОЗУ 16 Мб, жорсткий диск EIDE 1 Гб, 2 Мб SVGA, монітор 17" NI digital SVGA, Windows 95 в грудні обійдеться жадібним до потужності користувачам дешевше за$5000. Бажаючі можуть порівняти цю ціну з робочою станцією Sun або IBM і зробити свої висновки. Безперечний плюс - гарантована сумісність з самим поширеним програмним забезпеченням. Приємні звістки з області могутніх спеціалізованих додатків - скоро повинні з'явиться версії багатьох чудових пакетів для архітектури Intel, причому ціни на них можуть викликати приступ чорної заздрості у власників робочих станцій.

Якщо навіть виробники робочих станцій на RISC-процесорах зможуть в наступному році здійснити ривок в продуктивності, то розрив між Intel, виконуючим переважну частину ПО, і машинами RISC вистачить, щоб перевага робочих станцій була непереборною.

У першому номері Computer Week Moscow можна знайти пасаж цікавого характеру. Дослівно: "Досвідчені системи P6 здатні на більше, ніж просто витримувати конкуренцію з боку інших робочих станцій середнього класу. При безпосередньому зіставленні робочих станцій Intergraph на 200-МГц процесорі Pentium Pro і Silicon Graphics Indigo-2 Extreme з 200-МГц процесором Mips R4400, остання на тестах iSPEC показала порядку 160 одиниць, тоді як оцінки Intel для системи P6 повної конфігурації відповідають 366 одиницям."

При створенні процесора Pentium Pro робився упор на здатності цієї мікросхеми виконувати графічний рендеринг і працювати з 32-розрядним кодом.

Pentium Pro явно виламується з рамок процесора Pentium і належить шостому поколінню архітектури Intel x86. Раніше всі конкуренти, виготівники процессоров-клонов рухалися в форватере оригіналу, копіюючи його з деякими компромісами, тим самим прирікаючи себе на все більше відставання і замкненість на повторних ринках. Подібна тактика себе исчерапала, вона загрожує повною втратою конкурентноспособности, так до того ж Intel буквально крає конкурентів постійними скидами цін і розширенням номенклатури, що звужують нішу, в яку ще можна протиснуться.

Ось чому AMD, NexGen і Cyrix перейшли недавно на власний курс, відмовившись від безнадійного копіювання схем Intel.

Але принципової прорости між конкурентами немає. У деяких випадках Pentium Pro більш складений, ніж Nx586, K5 і M1, в інших менш. Загалом же схема P6 порівнянна з іншими процесорами; найбільш близький до неї дизайн К5, як вважають експерти.

Особливість підходу Intel до створення гібрида CISC/RISC полягає в формулі dynamic execution (динамічне виконання). Приблизно такі ж базові принципи ви виявите, якщо станете розбиратися детально з архітектурою останніх RISC-процесорів IBM/Motorola PowerPC 604 і Power PC 620, Sum UltraSparc, Mips R10000, Digital Alpha 21164 і HP PA-8000.

Разюча схожість підходу різних фірм до гибридизації підходів CISC і RISC. Зовні Pentim Pro виглядає традиційним CISC-процесором, сумісним з всім напрацьованим програмно-апаратним фондом. Знайомий "фасад" прикриває від користувача RISC-подібне ядро. Між "фасадом" і "задніми кімнатами" працює найрозумніший декодер, що розбиває складні і довгі команди х86 на більш прості операції, схожі на команди RISC - компанія Intel називає їх u-ops або micro - ops. Ці micro - ops поступають в ядро процесора, яке їх буквально перелопачивает. Елементарну микрооперації легше розподіляти і паралельно обробляти, чим породжуючі їх команди х86. Як би вони не називалися, мета переслідується одна: подолати обмеження системи команд х86, але зберегти сумісність з існуючим програмним забезпеченням х86. Зовні - на погляд програміста, пишушего програми - все ці ЦПУ виглядають як стандартні х86-сумісні CISC-процесори. А всередині вони працюють як найсучасніші моделі RISC-чопів.

Але сьогодні Pentium Pro "живіше" і швидше не тільки будь-якого з "живих" процесорів архітектури х86, включаючи Nx586 і Cyrix6x86, але і будь-якого з RISC-процесорів, що випускаються.

Як говориться, не дратуйте великого парубка, інакше будете з расквашенним носом. Саме таке значення послання Intel на адресу конкурентів: NexGen, Cyrix і AMD.

Список літератури:

Д-р Джон Гудмен "Управління пам'яттю для всіх",

Діалектика, Київ, 1996

В. Л. Грігорьев "Мікропроцесор i486. Архітектура і програмування", Гранал, Москва, 1993.

информационно-рекламмная газета "КМ-информ"

газета "Комп'ютер World/Київ"

газета "Комп'ютер Week/Moscow"

Ж. К. Голенкова і інш. "Керівництво по архітектурі IBM PC AT", Консул, Мінськ, 1993

Керівництво програміста по процесору Intel i386,

Технічна документація рівня 2, (З) Intel Corp.

Керівництво програміста по процесору Intel i486,

Технічна документація рівня 2, (З) Intel Corp.

Матеріали ехоконференції SU.HARDW.PC.CPU комп'ютерної мережі FidoNet

Зміст

1. Введення в персональний комп'ютер. ...2

2. Відмінності процесорів. ...4

2.1. Відмінності процесорів SX, DX, SX2, DX2 і DX4. ...4

2.2. Позначення "SL-Enhanced" у процесорів Intel 486. ...5

2.5. Ідентифікація чопів Intel і AMD. ...6

2.5.2. Версія процесора. ...6

2.5.4. Перемаркированние процесори. ...7

3. Процесори фірми Intel. ...8

3.1. Сучасна микропроцессорная технологія фірми Intel. 8

3.2. Перші процесори фірми Intel. ...8

3.3. Процесор 8086/88. ...9

3.4. Процесор 80186/88. ...9

3.5. Процесор 80286. ...10

3.6. Процесор 80386. ...10

3.7. Процесор 80486. ...12

3.8. Intel OverDrive процесор. ...13

3.9. Процесор Pentium. ...16

3.10. Процесор Pentium Pro. ...21

3.10.1. Загальний опис процесора. ...21

3.10.2. Два кристали в одному корпусі. ...22

3.10.3. Значення тестів для деяких чопів фірми Intel... 25

4. Процесори конкурентів Intel. ...26

4.1. Перші процесори конкурентів Intel. ...26

4.2. Процесори фірми AMD. ...27

4.2.1. Судовий розгляд з Intel. ...27

4.2.2. Процесори сімейства AMD5k86. ...28

4.2.2.1 Екскурсія по внутрішній архітектурі. ...29

4.2.2.2. Приклад маркіровки мікропроцесора AMD5k86-P75. ...31

4.2.2.5. AMD планує випустити K5. ...34

4.3. Процесори NexGen. ...34

4.4. Процесори Cyrix. ...36

4.5. Процесори Sun Microsystems. ...36

4.6. Процесори Digital Equipment. ...37

4.7. Процесори Mips. ...39

4.8. Процесори Hewlett-Packard. ...40

4.9. Процесори Motorola. ...41

5. Лабораторні випробування і тестування мікропроцесорів. 42

5.1. Лабораторні випробування процесорів i386DX. ...42

5.2. Результати тестування мікропроцесорів за допомогою пакету Speed Test...47

6. Порівняльний аналіз. ...52

Прім.

текст розбитий по 40 рядків на лист.