نماد اعتماد

انتخاب پردازنده های گرافیکی

 انتخاب سرورها و پردازنده های گرافیکی 

 انتخاب سرورها و پردازنده های گرافیکی 
  آموزش یادگیری عمیق عموماً به محاسبات زیادی نیاز دارد. در حال حاضر پردازنده‌های گرافیکی مقرون‌به‌صرفه‌ترین شتاب‌دهنده‌های سخت‌افزاری برای یادگیری عمیق هستند. به طور خاص، در مقایسه با پردازنده‌های مرکزی، پردازنده‌های گرافیکی ارزان‌تر هستند و عملکرد بالاتری را ارائه می‌دهند، که اغلب با یک مرتبه بزرگی بیشتر است. علاوه بر این، یک سرور منفرد می‌تواند از چندین GPU پشتیبانی کند، تا 8 تا برای سرورهای پیشرفته. اعداد معمولی تر تا 4 GPU برای یک ایستگاه کاری مهندسی هستند، زیرا نیاز به گرما، سرمایش و برق به سرعت فراتر از آنچه یک ساختمان اداری می تواند پشتیبانی کند افزایش می یابد. برای استقرارهای بزرگتر، رایانش ابری (به عنوان مثال، نمونه های P3 و G4 آمازون) راه حل بسیار عملی تری است.

معمولاً نیازی به خرید CPU های سطح بالا با رشته های زیاد نیست زیرا بیشتر محاسبات روی GPU ها انجام می شود. با توجه به قفل مفسر جهانی (GIL) در پایتون، عملکرد تک رشته‌ای یک CPU می‌تواند در شرایطی که 4 تا 8 GPU داریم مهم باشد. همه چیز برابر این نشان می دهد که CPU هایی با تعداد هسته کمتر اما فرکانس کلاک بالاتر ممکن است انتخاب اقتصادی تری باشد. به عنوان مثال، هنگام انتخاب بین یک CPU 6 هسته ای 4 گیگاهرتزی و یک پردازنده 8 هسته ای 3.5 گیگاهرتزی، اولی بسیار ارجح است، حتی اگر سرعت کل آن کمتر باشد. یک نکته مهم این است که GPU ها انرژی زیادی مصرف می کنند و در نتیجه گرمای زیادی را دفع می کنند. این نیاز به خنک کننده بسیار خوب و یک شاسی به اندازه کافی بزرگ برای استفاده از GPU دارد. در صورت امکان دستورالعمل های زیر را دنبال کنید:

منبع تغذیه. پردازنده‌های گرافیکی مقدار قابل توجهی انرژی مصرف می‌کنند. بودجه با حداکثر 350 وات برای هر دستگاه (به جای تقاضای معمولی، اوج تقاضای کارت گرافیک را بررسی کنید، زیرا کد کارآمد می تواند انرژی زیادی مصرف کند). اگر منبع تغذیه شما مطابق با تقاضا نباشد، متوجه خواهید شد که سیستم شما ناپایدار می شود.

اندازه شاسی. پردازنده‌های گرافیکی بزرگ هستند و کانکتورهای برق کمکی اغلب به فضای اضافی نیاز دارند. همچنین شاسی های بزرگ راحت تر خنک می شوند.

خنک کننده GPU. اگر تعداد پردازنده های گرافیکی زیادی دارید، ممکن است بخواهید روی خنک کننده آبی سرمایه گذاری کنید. همچنین، طراحی‌های مرجع را هدف قرار دهید، حتی اگر فن‌های کمتری داشته باشند، زیرا به اندازه کافی نازک هستند که اجازه ورود هوا بین دستگاه‌ها را می‌دهند. اگر یک پردازنده گرافیکی چند فن بخرید، ممکن است در هنگام نصب چندین پردازنده گرافیکی برای دریافت هوای کافی ضخیم تر از آن باشد و با دریچه گاز حرارتی مواجه شوید.

  1. اسلات های PCIe انتقال داده به و از GPU (و تبادل آن بین GPUها) به پهنای باند زیادی نیاز دارد. ما اسلات PCIe 3.0 را با 16 خط پیشنهاد می کنیم. اگر چندین پردازنده گرافیکی نصب می کنید، حتماً توضیحات مادربرد را به دقت بخوانید تا مطمئن شوید که 16
  2.   پهنای باند همچنان در دسترس است زمانی که چندین GPU به طور همزمان استفاده می شود و شما در حال دریافت PCIe 3.0 در مقابل PCIe 2.0 برای اسلات های اضافی هستید. برخی از مادربردها به 8 تنزل می دهند
  3.   یا حتی 4   پهنای باند با چندین پردازنده گرافیکی نصب شده این تا حدی به دلیل تعداد خطوط PCIe است که CPU ارائه می دهد.

به طور خلاصه، در اینجا چند توصیه برای ساخت یک سرور یادگیری عمیق وجود دارد:

مبتدی. یک پردازنده گرافیکی ارزان قیمت با مصرف انرژی پایین بخرید (GPU های ارزان قیمت بازی مناسب برای یادگیری عمیق از 150 تا 200 وات). اگر خوش شانس هستید رایانه فعلی شما از آن پشتیبانی می کند.

1 GPU. یک CPU پایین رده با 4 هسته کافی خواهد بود و اکثر مادربردها کافی هستند. حداقل 32 گیگابایت DRAM را هدف قرار دهید و برای دسترسی به داده های محلی روی یک SSD سرمایه گذاری کنید. یک منبع تغذیه با 600 وات باید کافی باشد. یک پردازنده گرافیکی با طرفداران زیاد بخرید.

2 پردازنده گرافیکی یک CPU پایین رده با 4-6 هسته کافی است. 64 گیگابایت DRAM را در نظر بگیرید و روی یک SSD سرمایه گذاری کنید. برای دو پردازنده گرافیکی سطح بالا به 1000 وات نیاز دارید. در مورد مین بردها، مطمئن شوید که دارای دو اسلات PCIe 3.0 x16 هستند. اگر می توانید، یک مین برد با دو فضای خالی (فاصله 60 میلی متر) بین اسلات PCIe 3.0 x16 برای هوای اضافی تهیه کنید. در این صورت، دو پردازنده گرافیکی با طرفداران زیاد خریداری کنید.

4 پردازنده گرافیکی مطمئن شوید که یک CPU با سرعت تک رشته ای نسبتاً سریع (یعنی فرکانس کلاک بالا) خریداری می کنید. احتمالاً به یک CPU با تعداد بیشتری از خطوط PCIe مانند AMD Threadripper نیاز خواهید داشت. احتمالاً برای دریافت 4 اسلات PCIe 3.0 x16 به مادربردهای نسبتاً گران قیمت نیاز خواهید داشت زیرا آنها احتمالاً به یک PLX برای مالتیپلکس کردن خطوط PCIe نیاز دارند. پردازنده‌های گرافیکی با طراحی مرجع خریداری کنید که باریک هستند و اجازه می‌دهند هوا بین پردازنده‌های گرافیکی وارد شود. شما به یک منبع تغذیه 1600-2000 وات نیاز دارید و ممکن است پریز در دفتر شما از آن پشتیبانی نکند. این سرور احتمالا با صدای بلند و داغ اجرا خواهد شد. شما نمی خواهید آن را زیر میز خود قرار دهید. 128 گیگابایت DRAM توصیه می شود. یک SSD (1-2 ترابایت NVMe) برای ذخیره سازی محلی و یک دسته هارد دیسک در پیکربندی RAID برای ذخیره داده های خود دریافت کنید.

8 پردازنده گرافیکی شما باید یک شاسی سرور اختصاصی چند GPU با چندین منبع تغذیه اضافی بخرید (به عنوان مثال، 2+1 برای 1600 وات در هر منبع تغذیه). این به پردازنده‌های سرور دو سوکت، 256 گیگابایت DRAM ECC، یک کارت شبکه سریع (10 GBE توصیه می‌شود) نیاز دارد و باید بررسی کنید که آیا سرورها از فاکتور فرم فیزیکی پردازنده‌های گرافیکی پشتیبانی می‌کنند یا خیر. جریان هوا و محل سیم‌کشی بین پردازنده‌های گرافیکی مصرف‌کننده و سرور به‌طور قابل‌توجهی متفاوت است (به عنوان مثال، RTX 2080 در مقابل Tesla V100). این بدان معناست که ممکن است نتوانید GPU مصرف کننده را در یک سرور به دلیل فاصله کافی برای کابل برق یا نداشتن دسته سیم مناسب (همانطور که یکی از نویسندگان همکار به طرز دردناکی کشف کرد) نصب کنید.

23.5.2. انتخاب پردازنده های گرافیکی
در حال حاضر AMD و NVIDIA دو سازنده اصلی پردازنده‌های گرافیکی اختصاصی هستند. NVIDIA اولین شرکتی بود که وارد حوزه یادگیری عمیق شد و از طریق CUDA پشتیبانی بهتری از چارچوب های یادگیری عمیق ارائه کرد. بنابراین، اکثر خریداران پردازنده های گرافیکی NVIDIA را انتخاب می کنند.

NVIDIA دو نوع GPU را ارائه می‌کند که کاربران فردی (به عنوان مثال، از طریق سری GTX و RTX) و کاربران سازمانی (از طریق سری Tesla خود) را هدف قرار می‌دهد. دو نوع GPU قدرت محاسباتی قابل مقایسه ای را ارائه می دهند. با این حال، GPUهای کاربر سازمانی معمولاً از خنک کننده اجباری (غیرفعال)، حافظه بیشتر و حافظه ECC (تصحیح خطا) استفاده می کنند. این پردازنده‌های گرافیکی برای مراکز داده مناسب‌تر هستند و معمولاً ده برابر بیشتر از پردازنده‌های گرافیکی مصرف‌کننده قیمت دارند.

اگر یک شرکت بزرگ با بیش از 100 سرور هستید، باید سری NVIDIA Tesla را در نظر بگیرید یا از سرورهای GPU در فضای ابری استفاده کنید. برای یک آزمایشگاه یا یک شرکت کوچک و متوسط با بیش از 10 سرور، سری NVIDIA RTX احتمالاً مقرون به صرفه ترین است. می‌توانید سرورهای از پیش پیکربندی‌شده با شاسی سوپرمیکرو یا ایسوس بخرید که 4 تا 8 پردازنده گرافیکی را به‌طور کارآمد نگه می‌دارند.

فروشندگان پردازنده گرافیکی معمولاً هر یک تا دو سال یک بار نسل جدیدی را عرضه می کنند، مانند سری GTX 1000 (پاسکال) که در سال 2017 منتشر شد و سری RTX 2000 (تورینگ) که در سال 2019 منتشر شد. هر سری چندین مدل مختلف ارائه می دهد که سطوح عملکرد متفاوتی را ارائه می دهند. عملکرد GPU در درجه اول ترکیبی از سه پارامتر زیر است:

توان محاسباتی به طور کلی ما به دنبال قدرت محاسباتی 32 بیتی ممیز شناور هستیم. آموزش ممیز شناور 16 بیتی (FP16) نیز در حال ورود به جریان اصلی است. اگر فقط به پیش بینی علاقه دارید، می توانید از عدد صحیح 8 بیتی نیز استفاده کنید. آخرین نسل از پردازنده های گرافیکی تورینگ شتاب 4 بیتی را ارائه می دهد. متأسفانه در زمان نگارش الگوریتم‌های آموزش شبکه‌های با دقت پایین هنوز فراگیر نشده‌اند.

اندازه حافظه همانطور که مدل های شما بزرگتر می شوند یا دسته های استفاده شده در طول آموزش بزرگتر می شوند، به حافظه GPU بیشتری نیاز خواهید داشت. حافظه HBM2 (حافظه با پهنای باند بالا) در مقابل حافظه GDDR6 (Graphics DDR) را بررسی کنید. HBM2 سریعتر اما بسیار گرانتر است.

پهنای باند حافظه. تنها زمانی می توانید بیشترین بهره را از توان محاسباتی خود ببرید که پهنای باند حافظه کافی داشته باشید. اگر از GDDR6 استفاده می کنید، به دنبال گذرگاه های حافظه گسترده باشید.

برای اکثر کاربران کافی است به توان محاسباتی نگاهی بیندازید. توجه داشته باشید که بسیاری از GPU ها انواع مختلفی از شتاب را ارائه می دهند. برای مثال، TensorCores های NVIDIA زیرمجموعه ای از اپراتورها را 5 شتاب می دهند
. اطمینان حاصل کنید که کتابخانه های شما از این پشتیبانی می کنند. حافظه GPU نباید کمتر از 4 گیگابایت باشد (8 گیگابایت بسیار بهتر است). سعی کنید از GPU برای نمایش رابط کاربری گرافیکی نیز استفاده نکنید (به جای آن از گرافیک داخلی استفاده کنید). اگر نمی توانید از آن اجتناب کنید، برای ایمنی 2 گیگابایت رم اضافی اضافه کنید.

شکل 23.5.1 قدرت محاسبه ممیز شناور 32 بیتی و قیمت مدل های مختلف سری GTX 900، GTX 1000 و RTX 2000 را مقایسه می کند. قیمت‌های پیشنهادی همان قیمت‌هایی هستند که در زمان نگارش مقاله در ویکی‌پدیا یافت می‌شوند.

برای خرید سرور hp اینجا کلیک کنید.