مقایسه عملکرد پردازنده‌های سرور اینتل و AMD در رایانش ابری

شرکت آمریکایی AMD با ساخت تراشه‌ی EPYC، نبرد بر سر پردازنده‌های سِرور میان دو تراشه‌ساز بزرگ آمریکایی، یعنی اینتل و AMD را شدیدتر کرد. درحالی‌‌که بیشترین تمرکز رسانه‌های خبری بر تراشه‌های ساخته‌شده برای مصارف عام و گیمینگ است، این پردازنده‌های سِرور هستند که درآمدهای هنگفتی برای شرکت‌های مادر به‌بار می‌آورند. به‌جای اظهارنظر درباره‌ی سطح عملکرد پردازنده‌های سِرور، با بیان نتایج عملی بنچمارک‌هایی که روی آن‌ها در مرکز داده آمازون انجام شده، بهتر می‌توان واقعیت‌ها را بیان کرد.

cloud services

 مقایسه‌ی سطح عملکرد سِرورهای رایانش ابری آمازون (Iaas) با پردازنده‌های اینتل و AMD

سرویس رایانش ابری آمازون AWS EC2 در نوامبر۲۰۱۸، Instanceهای مبتنی‌بر پردازنده‌های EPYC از AMD را معرفی کرد. Instance‌ قسمتی از منابع سِرور اعم از پردازنده و حافظه مجازی است که دراختیار هر کلاینت قرار می‌گیرد. این Instance‌ها از همان تعداد پردازنده‌ی مجازی و ظرفیت حافظه‌ی مجازی نمونه‌های اینتل استفاده می‌کنند. Instanceهای EPYC می‌توانند در تمام مدت پردازش از ۲ تا ۹۶ پردازنده‌ی مجازی را بهره‌برداری کنند. به‌طور کلی، آمازون خدمات Instance‌های AMD خود را ۱۰ درصد ارزان‌تر از Instance‌های اینتل دراختیار رایانش ابری قرار می‌دهد.

amazon web services

در این مطلب، قصد داریم نگاهی به گستره‌ی وسیع موارد کاربرد زیرساخت‌های ابری بیندازیم و Instance‌های اشاره‌شده را جزءبه‌جزء مقایسه کنیم. به‌خاطر داشته باشید هرچند از نوع معماری پردازنده‌های AMD به‌کاررفته در سِرورهای آمازون اطمینان داریم، از معماری Instance‌های اینتل اطلاع چندانی نداریم. آمازون در زمینه‌ی معماری تراشه‌های این Instance‌ها اطلاعاتی منتشر نکرده؛ اما ازآنجاکه انجام برخی از این آزمایش‌ها مستلزم اجرای کدهای AVX512 است، می‌توان تصور کرد این Instanceها از آخرین معماری اینتل برخوردار باشند.

در زیر، فهرست کامل انواع آزمون‌های بارکاری (workload) را ارائه می‌کنیم که در این بررسی، روی Instance‌های اینتل و AMD اعمال شده است:

بارکاری int/FP

  • (SPEC*rate2017_int_base 1 copy (Estimated
  • (SPEC*rate2017_fp_base 1 copy (Estimated
  • (SPEC*rate2017_int_base (Estimated
  • (SPEC*rate2017_fp_base (Estimated

 بارکاری پهنای باند حافظه

  •  STREAM_OMP Triad

بارکاری web/java

  • Server Side Java* 1 JVM
  • WordPress* PHP/HHVM

بارکاری database

  • HammerDB PostgreSQL
  • MongoDB

بارکاری (High-Performance Compute (HPC

  • (LAMMPS (Molecular Dynamics
  • High Perf. Linpack

بی‌هیچ توضیح اضافه‌تری، بیایید نگاهی به نتایج بنچمارک‌های انجام‌شده روی این Instance‌ها بیندازیم. اولین آزمایش بین Instance‌هایی با ۱۶ پردازنده‌ی مجازی بود. این آزمایش در محیط سیستم عامل Linux 7.5 و با به‌کارگیری کامپایلر ICC اجرا شده است. Instance‌های اینتل برتری اندکی در بارکاری web/java و برتری کاملی در اجرای وظایف HPC (محاسبات سطح بالا) دارند. با درنظرگرفتن اینکه از پردازنده‌ی EPYC دو واحد 128bit-FMA و پردازنده‌های Skylake و بالاتر دو واحد 512bit-FMA برخوردارند، این برتری اینتل چندان تعجب‌برانگیز نیست؛ چراکه دست بالا را در انجام وظایف HPC خواهد داشت.

server bench 16 cores

در اینجا، ذکر دو نکته ضروری است: ۱. برخی از این Instance‌ها، به‌ویژه در سمت سِرور، NUMA-binded به دسترسی غیریکنواخت به حافظه مقید نشده‌اند؛ چراکه انجام چنین کاری نیازمند تنظیمات زیادی است؛ ۲. استفاده از کامپایلرهای متفاوت، همچون GCC، ممکن است باعث بهبود نتایج عملکرد پردازنده شود.

این قابلیت‌ها روش‌های بهینه‌سازی گران‌قیمتی محسوب می‌شوند و اگرچه شکاف میان داده‌های سمت سِرور را کاهش می‌دهد، همچنان برای غلبه بر پردازنده‌های اینتل کافی نخواهد بود.

در تصویر زیر، ارقام به‌دست‌آمده‌ی Instanceهایی با ۹۶ پردازنده‌ی مجازی نشان داده شده که بازهم نسخه‌های سِرور اینتل بر نسخه‌های سِرور AMD برتری دارند. در این آزمایش هم اختلاف در اجرای وظایف HPC همچنان زیاد است؛ اما در بخش آزمایش‌های پهنای باند از میزان این اختلاف کاسته می‌شود.

server bench 96 cores

در آخرین بخش، عملکرد را برحسب بهای پرداختی خدمات سِرور با مدل قیمت‌گذاری رایانش ابری آمازون (در تاریخ ۱۲‌ژانویه۲۰۱۹) آزموده‌ایم. نتایج این آزمایش در شکل زیر آورده شده است. به‌طور متوسط نسخه‌های اینتل در اجرای وظایف HPC از ارزش پرداخت بیشتری از ۱.۲۵ تا ۴.۱ برابر بیشتر از نسخه‌های AMD برخوردار هستند.

server bench per $

آنچه از برآیند این آزمایش‌ها می‌خواهیم بگوییم، این است که Instance‌های اینتل چه ازنظر ارزش پرداخت و چه ازنظر سطح عملکرد در بین تمام موارد رایانش ابری، در جایگاه بالاتری ایستاده‌اند.

مجددا یادآوری می‌کنیم که ممکن است با به‌کارگیری کامپایلرهای مختلف و انجام بهینه‌سازی‌هایی روی بارکاری تخصیص‌یافته در محل سِرور (مثل Numa-binding) نسخه‌های AMD به سطح عملکرد بهتری دست پیدا کنند؛ اما این میزان بهبود برای غلبه بر تفاوت‌های سخت‌افزاری نهفته در تراشه‌های اینتل کافی نخواهد بود. برخی از این تفاوت‌ها استفاده از تراشه‌های یکپارچه در نسخه‌ی اینتل به‌جای ماژول‌های چند‌تراشه‌ای در نسخه‌های AMD و نیز اختلاف در FMA‌ها است که در پردازش HPC بسیار مهم خواهد بود. برمبنای ارقام به‌دست‌آمده، به‌نظر می‌رسد اینتل همچنان بازار مراکز داده را در تصاحب خود داشته باشد. بااین‌حال در سمت دیگر ماجرا، بازارهای حرفه‌ای و غیرحرفه‌ای ویرایش ویدئو وجود دارد که پردازنده‌های EPYC با درنظرگرفتن هزینه‌های ارزان‌تر خدماتِ سِرورهای مجهز به آن، می‌تواند درخشش بیشتری داشته باشد.





تاريخ : یک شنبه 21 بهمن 1397برچسب:, | | نویسنده : مقدم |