شرکت آمریکایی AMD با ساخت تراشهی EPYC، نبرد بر سر پردازندههای سِرور میان دو تراشهساز بزرگ آمریکایی، یعنی اینتل و AMD را شدیدتر کرد. درحالیکه بیشترین تمرکز رسانههای خبری بر تراشههای ساختهشده برای مصارف عام و گیمینگ است، این پردازندههای سِرور هستند که درآمدهای هنگفتی برای شرکتهای مادر بهبار میآورند. بهجای اظهارنظر دربارهی سطح عملکرد پردازندههای سِرور، با بیان نتایج عملی بنچمارکهایی که روی آنها در مرکز داده آمازون انجام شده، بهتر میتوان واقعیتها را بیان کرد.
مقایسهی سطح عملکرد سِرورهای رایانش ابری آمازون (Iaas) با پردازندههای اینتل و AMD
سرویس رایانش ابری آمازون AWS EC2 در نوامبر۲۰۱۸، Instanceهای مبتنیبر پردازندههای EPYC از AMD را معرفی کرد. Instance قسمتی از منابع سِرور اعم از پردازنده و حافظه مجازی است که دراختیار هر کلاینت قرار میگیرد. این Instanceها از همان تعداد پردازندهی مجازی و ظرفیت حافظهی مجازی نمونههای اینتل استفاده میکنند. Instanceهای EPYC میتوانند در تمام مدت پردازش از ۲ تا ۹۶ پردازندهی مجازی را بهرهبرداری کنند. بهطور کلی، آمازون خدمات Instanceهای AMD خود را ۱۰ درصد ارزانتر از Instanceهای اینتل دراختیار رایانش ابری قرار میدهد.
در این مطلب، قصد داریم نگاهی به گسترهی وسیع موارد کاربرد زیرساختهای ابری بیندازیم و Instanceهای اشارهشده را جزءبهجزء مقایسه کنیم. بهخاطر داشته باشید هرچند از نوع معماری پردازندههای AMD بهکاررفته در سِرورهای آمازون اطمینان داریم، از معماری Instanceهای اینتل اطلاع چندانی نداریم. آمازون در زمینهی معماری تراشههای این Instanceها اطلاعاتی منتشر نکرده؛ اما ازآنجاکه انجام برخی از این آزمایشها مستلزم اجرای کدهای AVX512 است، میتوان تصور کرد این Instanceها از آخرین معماری اینتل برخوردار باشند.
در زیر، فهرست کامل انواع آزمونهای بارکاری (workload) را ارائه میکنیم که در این بررسی، روی Instanceهای اینتل و AMD اعمال شده است:
بارکاری int/FP
- (SPEC*rate2017_int_base 1 copy (Estimated
- (SPEC*rate2017_fp_base 1 copy (Estimated
- (SPEC*rate2017_int_base (Estimated
- (SPEC*rate2017_fp_base (Estimated
بارکاری پهنای باند حافظه
- STREAM_OMP Triad
بارکاری web/java
- Server Side Java* 1 JVM
- WordPress* PHP/HHVM
بارکاری database
- HammerDB PostgreSQL
- MongoDB
بارکاری (High-Performance Compute (HPC
- (LAMMPS (Molecular Dynamics
- High Perf. Linpack
بیهیچ توضیح اضافهتری، بیایید نگاهی به نتایج بنچمارکهای انجامشده روی این Instanceها بیندازیم. اولین آزمایش بین Instanceهایی با ۱۶ پردازندهی مجازی بود. این آزمایش در محیط سیستم عامل Linux 7.5 و با بهکارگیری کامپایلر ICC اجرا شده است. Instanceهای اینتل برتری اندکی در بارکاری web/java و برتری کاملی در اجرای وظایف HPC (محاسبات سطح بالا) دارند. با درنظرگرفتن اینکه از پردازندهی EPYC دو واحد 128bit-FMA و پردازندههای Skylake و بالاتر دو واحد 512bit-FMA برخوردارند، این برتری اینتل چندان تعجببرانگیز نیست؛ چراکه دست بالا را در انجام وظایف HPC خواهد داشت.
در اینجا، ذکر دو نکته ضروری است: ۱. برخی از این Instanceها، بهویژه در سمت سِرور، NUMA-binded به دسترسی غیریکنواخت به حافظه مقید نشدهاند؛ چراکه انجام چنین کاری نیازمند تنظیمات زیادی است؛ ۲. استفاده از کامپایلرهای متفاوت، همچون GCC، ممکن است باعث بهبود نتایج عملکرد پردازنده شود.
این قابلیتها روشهای بهینهسازی گرانقیمتی محسوب میشوند و اگرچه شکاف میان دادههای سمت سِرور را کاهش میدهد، همچنان برای غلبه بر پردازندههای اینتل کافی نخواهد بود.
در تصویر زیر، ارقام بهدستآمدهی Instanceهایی با ۹۶ پردازندهی مجازی نشان داده شده که بازهم نسخههای سِرور اینتل بر نسخههای سِرور AMD برتری دارند. در این آزمایش هم اختلاف در اجرای وظایف HPC همچنان زیاد است؛ اما در بخش آزمایشهای پهنای باند از میزان این اختلاف کاسته میشود.
در آخرین بخش، عملکرد را برحسب بهای پرداختی خدمات سِرور با مدل قیمتگذاری رایانش ابری آمازون (در تاریخ ۱۲ژانویه۲۰۱۹) آزمودهایم. نتایج این آزمایش در شکل زیر آورده شده است. بهطور متوسط نسخههای اینتل در اجرای وظایف HPC از ارزش پرداخت بیشتری از ۱.۲۵ تا ۴.۱ برابر بیشتر از نسخههای AMD برخوردار هستند.
آنچه از برآیند این آزمایشها میخواهیم بگوییم، این است که Instanceهای اینتل چه ازنظر ارزش پرداخت و چه ازنظر سطح عملکرد در بین تمام موارد رایانش ابری، در جایگاه بالاتری ایستادهاند.
مجددا یادآوری میکنیم که ممکن است با بهکارگیری کامپایلرهای مختلف و انجام بهینهسازیهایی روی بارکاری تخصیصیافته در محل سِرور (مثل Numa-binding) نسخههای AMD به سطح عملکرد بهتری دست پیدا کنند؛ اما این میزان بهبود برای غلبه بر تفاوتهای سختافزاری نهفته در تراشههای اینتل کافی نخواهد بود. برخی از این تفاوتها استفاده از تراشههای یکپارچه در نسخهی اینتل بهجای ماژولهای چندتراشهای در نسخههای AMD و نیز اختلاف در FMAها است که در پردازش HPC بسیار مهم خواهد بود. برمبنای ارقام بهدستآمده، بهنظر میرسد اینتل همچنان بازار مراکز داده را در تصاحب خود داشته باشد. بااینحال در سمت دیگر ماجرا، بازارهای حرفهای و غیرحرفهای ویرایش ویدئو وجود دارد که پردازندههای EPYC با درنظرگرفتن هزینههای ارزانتر خدماتِ سِرورهای مجهز به آن، میتواند درخشش بیشتری داشته باشد.
.: Weblog Themes By Pichak :.