گردآورنده مهندس سیامک عیسی پور
کارت گرافیک قطعه ای در PC و یا لپتاپ است که وظیفه پردازش تصاویر را به عهده دارد. واحد پردازش گرافیکی یا همان (GPU(Graphics Processing Unitدادهها را پردازش کرده و آنها را برای نمایش در مانیتور آماده میکند. در انتخاب یک کارت گرافیک مناسب فاکتورهای زیادی پیش رو هستند که در ادامه به بررسی هر یک میپردازیم، پس با رایان اندیش همراه باشید.
فاکتورهای پایه در کارت گرافیک
گزینههای زیادی در انتخاب کارت گرافیک سهیم هستند و هر یک مرتبط با یک زمینه کاری هستند اما مهمترین مواردی که باید به آنها توجه کرد در زیر به صورت لیست آورده شدهاند که در ادامه به بررسی هر یک میپردازیم:
- فرکانس( کلاک) پردازنده گرافیکی GPU
- تعداد Shading Unit، TMU و ROP
- فرکانس( کلاک) حافظه کارت گرافیک
- نوع حافظه
- پهنای باند حافظه
- حجم حافظه
- نوع رابط PCIe
فرکانس( کلاک) پردازنده گرافیکی GPU
وظیفه اصلی پردازش اطلاعات به عهده پردازنده روی کارتگرافیک است که به آن GPU میگویند. GPUها عملکردی مشابه پردازندهها دارند و هر یک حاوی تعدادی هسته و واحدهای مختلف هستند. برای مثال در کارت GTX 960 از تولیدات انویدیا GTX 960 نام پلتفرم کارت گرافیک است که شامل پردازنده گرافیکی، نوع حافظه، پهنایباند و رابط PCIe میشود و پردازنده آن یا همان GPU، دارای معماری GM 107 است. پس زمانی که نوع پلتفرم کارت گرافیکی مشخص شود تا حدود زیادی میتوان عملکرد آن را برآورد کرد. برای درک بهتر این موضوع تصویر زیر را مشاهده کنید.
اما فرکانس GPU مفهومی مشابه با فرکانس در پردازنده ها یا همان CPUها دارد. سرعت کلاک GPUها معمولا با واحدهای MHz یا GHzz (مگاهرتز یا گیگاهرتز) بیان می شود که میزان چرخهها در واحد زمان را نشان میدهد. هر چه میزان این فرکانس بیشتر باشد بهتر است، اما باید توجه داشت که این موضوع تنها عامل مشخص کننده قدرت یک کارت گرافیک نیست. در واقع فرکانس مشخص میکند چه تعداد پردازش در واحد زمان انجام میشود. یکی از تفاوتهای پردازنده گرافیکی و پردازنده مرکزی سیستم به همین فرکانس مرتبط است و در کارتهای گرافیکی از فرکانس پایینتری استفاده میشود.
تعداد Shading Units, TMUs و ROPs
Shading Units یا واحدهای سایهزنی، پردازندههای استریم، هستههای کودا یا نامهای دیگری که به این بخش داده شده نشان دهنده تعداد هستههای GPU است که تعداد بیشتر این واحدها نشان از افزایش خطوط موازی پردازش تصویر میدهد. به عبارت سادهتر هر چه تعداد این واحدها بیشتر باشد پردازش تصاویر با سرعت بیشتری انجام میگیرد. دقیقا مانند پردازندهها که هر چه تعداد هستههای پردازشی افزایش می یابد قدرت پردازنده نیز بیشتر می شود. در پردازندههای مرکزی معمولا از دو یا چهار هسته استفاده میشود اما فرکانس آنها بالاتر است در پردازندههای گرافیکی تعداد هستهها بیشتر شده ولی در فرکانس پایینتری اجرا میشود. این ویژگی باعث میشود پردازنده گرافیکی بتواند در واحد زمان به دستورهایی زیادی که نیاز به توان پردازش بالا ندارند پاسخ دهد. به عنوان مثال یک تصویر سهبعدی را تجسم کنید که از میلیونها پیکسل تشکیل شده و هر یک از آنها دارای یک مختصات جغرافیایی، مشخصات نور و رنگ و بسیاری موارد دیگر هستند در فریم بعدی ممکن است این پیکسلها تغییر کنند تا تصویر جدیدی را نمایش دهند حال برای این کار لازم است تا پردازنده گرافیکی میلیونها محاسبه را در کسری از ثانیه انجام دهد. هر چقدر تعداد هستهها بیشتر باشد رشتههای پردازشی بیشتری بطور موازی بررسی میشوند و در نتیجه سرعت فریمها بالاتر میرود.
TMUs
تصاویر سهبعدی که ما در بازیها و سایر محتواهای نمایشی استفاده میکنیم دارای اجزای مختلفی هستند. برخی از این اجزا یا به عبارت دیگر برخی از این پیکسلها متحرک هستند و در تصویر دائما تغییر میکنند اما برخی دیگر از بافتهایی تشکیل شدهاند که از یک الگوی ثابت پیروی میکنند. به عنوان مثال سطح زمین، دیوارها، حتی بدنه اسلحه و لباس شخصیتهای داستان از یک سری بافت ثابت تشکیل شدهاند. واحدهای TMU در واقع وظیفه آدرسدهی به این بافتها را برعهده دارند. در نسخههای اولیه کارتهای گرافیکی این واحد در یک پردازنده مستقل قرار داشت اما اکنون به صورت قسمتی از GPU اجرا میشود.
graphics pipeline
پردازشهای سهبعدی گرافیکی مانند یک خط تولید است که در هر مرحله یک قسمت به خروجی مرحله قبل افزوده میشود. در یک پردازنده گرافیکی به دلیل ساختار پایپلاینها تمام مراحل بطور موازی کار میکنند و پردازندههای امروزی میتوانند میلیاردها محاسبه ژئومتری را در یک ثانیه انجام دهند. زمانی که یک محتوای سه بعدی پردازش میشود باید بتوان این تصویر سهبعدی را به یک تصویر دوبعدی تبدیل کرد تا با همان کیفیت در مانیتور قابل درک باشد و پایپلاینها سلسله مراتب این پردازش را مشخص میکنند. یک محتوای سهبعدی از تعداد بسیار زیادی خط و مثلثهای کوچک تشکیل شده است که در کنار هم قرار میگیرند و یک موضوع را تشکیل میدهند اما هر یک از راسها دارای ویژگیهای مانند مختصات روی تصویر، مقادیر RGB برای رنگها، اندازه شفافیت، بافت، سطح بازتاب و موارد دیگر هستند. پس بطور مختصر میتوان گفت پایپلاینها سلسله مراتب تبدیل اجزای یک تصویر سهبعدی برای نمایش در یک مانیتور دوبعدی را مشخص میکنند. در کارتهای گرافیک جدید خصوصا پردازندههای ساخت انویدیا، پایپلاینها فقط مختص پردازشهای گرافیکی نیستند و میتوانند در ترکیب با اجزای دیگر برای پردازشهای غیرگرافیکی نیز مورد استفاده قرار گیرند.
ROPs
(ROPs (Render Output Pipelines که معمولا تحت عنوان واحد های خروجی یا با عنوان raster operations pipelinee بیان می شوند آخرین موارد از پردازشهای نمایش تصاویر را انجام میدهند. وقتی که پیکسلها به وسیله واحدهای سایهزنی، محاسبه و پردازش شدند باید براساس عمق و توابعی دیگر مخلوط شوند و در کنار یکدیگر قرار گیرند. این کار توسط واحد ROP صورت میگیرد و جای پیکسل ها روی صفحه نمایش را تعیین می کند. در این مورد هم هر چه تعداد خطوط خروجی بشتر باشد تصاویر با سرعت بیشتری در صفحه نمایش داده می شوند و فرکانس نمایش تصاویر یا همان Pixel Rate بالا می رود.
فرکانس( کلاک) حافظه کارت گرافیک
تعریفی کاملا مشابه با کلاک GPU دارد با این تفاوت که اینبار چرخه ها در حافظه کارت گرافیک صورت میگیرد. کلاک (فرکانس) حافظه از این جهت اهمیت دارد که روی پهنای باند تاثیر میگذارد. هر چه فرکانس حافظه بالاتر باشد محتوای درون حافظه با سرعت بیشتری در اختیار سایر قسمتها قرار میگیرند. حافظه ها معمولا به صورت DDR هستند به این معنا که در یک چرخه می توانند دوبار عمل خواندن و نوشتن را انجام دهند برای مثال اگر کارت گرافیکی دارای ۵۰۰ مگاهرتز فرکانس حافظه باشد در حالت موثر مقدار آن در ۲ ضرب شده و به ۱۰۰۰ مگاهرتز می رسد. بنابراین هر چه فرکانس بالاتری در اختیار باشد پهنای باند نیز افزایش یافته و سرعت خواندن و نوشتن افزایش می یابد که در نتیجه رزولوشن بیشتری همراه با تصاویر شفاف تر و با نویز کمتر دریافت خواهیم کرد. در کارتهای گرافیک جدید که طی سالهای اخیر معرفی شدهاند این ضریب به چهار رسیده است و در واقع زمانی که فرکانس حافظه یک کارت با مقدار ۶ هزار مگاهرتز مطرح میشود میتوان دریافت که کلاک فیزیکی حافظه معادل ۱۵۰۰ مگاهرتز است.
نوع حافظه
حافظههای موجود در گرافیکهای موجود در بازار به دو نوع DDR3 و GDDR5 تقسیم بندی می شوند. نوع حافظه با سرعت کلاک موثر حافظه و پهنای باند آن رابطه مستقیم دارد. هنگامی که نوع حافظه DDR3 باشد با توجه به مقدار کلاک حافظه حداکثر ۳۰ گیگابایت برثانیه پهنای باند خواهیم داشت در حالی که در GDDR5 مقدار پهنای باند تا ۳۸۴ گیگابایت بر ثانیه نیز می رسد. پس در انتخاب کارت گرافیک خود باید به به این نکته توجه کرد که کارت انتخابی از نوع حافظه GDDR5 باشد زیرا در این نوع حافظه مقادیر کلاک در ۴ ضرب می شوند (در DDR3 مقادیر در ۲ ضرب می شدند). در واقع حافظههای DDR3 از فرکانس پایینتری استفاده میکنند لذا این مقدار روی عملکرد آنها موثر است اما در مقابل قیمت این حافظهها پایینتر از انواع GDDR5 است و معمولا در مدلهای ارزان و متوسط استفاده میشوند.
البته نوع جدیدی از حافظهها هم تحت عنوان HBM به تازگی توسط AMD در کارت گرافیگهای سری Fury استفاده شده که پهنای باند اسمی ۵۱۲ گیگابایت بر ثانیه را میتواند پشتیبانی کند.
پهنای باند حافظه
پهنای باند سرعت انتقال اطلاعات از GPU به حافظه گرافیک است. پهنای باند بیشتر باعث افزایش سرعت انتقال اطلاعات بین حافظه و GPU می شود و در نتیجه قدرت کارت افزایش می یابد.
حجم حافظه
باید توجه داشت که حافظه کارت گرافیک تاثیر زیادی در قدرت کارت گرافیک ندارد به این معنی که به عنوان یک انبار برای ارایه مواد مورد نیاز به پردازنده مورد استفاده قرار میگیرد. اگر محتوای گرافیکی حجیم نباشد، ظرفیت این انبار تاثیری بر عملکرد پردازنده نخواهد داشت اما اگر بازیهای سنگین با گرافیکهای فشرده و جزییات بالا را اجرا میکنید ظرفیت حافظه میتواند باعث کاهش سرعت شود زیرا در این شرایط فضای کافی برای ذخیره محتوا و انتقال آن به پردازنده وجود ندارد. حتما متوجه شدهاید که ظرفیت حافظه را میتوان با توان پردازش GPUمتناسب دانست. به این معنی که اگر پردازنده قدرت زیادی نداشته باشد ظرفیت حافظه به عملکرد آن کمک نمیکند و اگر ظرفیت حافظه پایین باشد پردازنده باید منتظر ورود اطلاعات جدید بماند. این موضوع گاهی مورد سواستفاده شرکتها قرار میگیرد به عنوان مثال برای یک پردازنده گرافیکی نسیتا ضعیف مثل جیفورس GT710 از ظرفیت حافظه ۴ گیگابایت استفاده میکنند. در این شرایط کاربر با توجه به ظرفیت ۴ گیگابایت فریب خواهد خورد در حالی که با این پردازنده نمیتوان بازیها را اجرا کرد. حجم حافظه میتواند مزایای زیر را در بر داشته باشد:
- بازی های جدید حافظه زیادی نیاز دارند. برای مثال اگر یک بازی در رزولوشن HD و سطح جزئیات Medium نیاز به ۱ گیگابایت حافظه داشته باشد در حالت FullHD و سطح جزئیات بالا این بازی نیاز به فضایی بیشتر از ۱ گیگابایت دارد تا به سادگی اجرا شود.
- در مواردی که از چند مانیتور استفاده شود حافظه بیشتر کارت گرافیک بسیار سودمند است و باعث میشود تا در نمایگشر ها افت فریم نداشته باشیم.
- اگر از کارت گرافیک برای پردازشهای سیستم مثل اجرای فتوشاپ یا اتوکد کمک میگیرید ظرفیت حافظه میتواند سرعت کار را افزایش دهد.
بنابراین میتوان گفت که بطور عمومی تفاوت چندانی بین کارتهایی مثل GeForce 840M که با ۴ گیگابایت و ۲ گیگابایت حافظه عرضه شدهاند وجود ندارد هر چند ممکن است در برخی کاربردها این موضوع اهمیت پیدا کند.
قابلیت SLI و CrossFire:
SLI (در انویدیا) و CrossFire (در AMD) دو قابلیت مشابه هستند که امکان استفاده از دو یا چند کارت گرافیک به صورت همزمان را فراهم میکنند. در این حالت برای افزایش توان گرافیکی میتوان دو کارت را در کنار هم قرار داد تا سرعت بیشتری در اجرای بازیها و پردازش محتوا داشته باشند. افرادی که کاربردهای گرافیکی سنگین و رندرگیری های طولانی در نرم افزارهای سهبعدی دارند از این قابلیتها بهره زیادی می توانند ببرند. بنابراین موقع خرید کارت گرافیک باید به این موضوع نیز توجه کرد که کارت مورد نظر از این قابلیت پشتیبانی کند. این قابلیت در PC ها قابل درسترستر است اما با این وجود لپ تاپ هایی با این قابلیت عرضه شده اند. برای مثال Y510 از لنوو که از گرافیک های GT 750M به صورت SLI استفاده می کرد.
چگونه قدرت دو کارت را با هم مقایسه کنیم؟
با یک مثال کار را آغاز می کنیم.
کارت گرافیک GeForce 840M را با کارت گرافیک GT 740M در نظر بگیرید.
GeForce 840M:
GPU clock: 1029 MHz, Memory: 1001 MHz and DDR3, Shaders / TMUs / ROPs: 384 / 16 / 8
GT 740M:
GPU clock: 980 MHz, Memory: 900 MHz and DDR3, Shaders / TMUs / ROPs: 384 / 16 / 8
حال محاسبه را آغاز می کنیم:
کارت GeForce 840M دارای ۱۰۰۱ مگاهرتز کلاک حافظه از نوع DDR3 است و این کارت دارای ۳۸۴ هسته پردازشی (واحد های سایه زنی) است که امتیاز این کارت می شود:
۱۰۰۱ × ۲(DDR3) = 2002 MHz
۲۰۰۲ MHz × ۳۸۴ = ۷۶۸,۷۶۸
در حالی که اگر همین محاسبات را برای کارت GT 740M انجام دهیم نتایج زیر بدست می آید:
۹۰۰ × ۲(DDR3) = 1800 MHz
۱۸۰۰ MHz × ۳۸۴ = ۶۹۱,۲۰۰
پس با این حساب نتیجه میگیریم که GeForce 840M قدرت بیشتری نسبت به GT 740M دارد.
به مثالی دیگر توجه کنید:
GTX 850M:
GPU clock: 902 MHz, Memory: 1001 MHz and DDR3, Shaders / TMUs / ROPs: 640 / 40 / 16
۱۰۰۱ × ۲(DDR3) = 2002 MHz
۲۰۰۲ MHz × ۶۴۰ = ۱,۲۸۱,۲۸۰
VS
GTX 860M:
GPU clock: 1020 MHz, Memory: 1253 MHz and GDDR5, Shaders / TMUs / ROPs: 640 / 40 / 16
۱۲۵۳ × ۴(GDDR5) = 5012 MHz
۵۰۱۲ MHz × ۶۴۰ = ۳,۲۰۷,۶۸۰
برای اینکه بتوانید اطلاعات کارت گرافیک خود را مشاهده کنید می توانید نرم افزار GPU-Z را دانلود کرده و آن را اجرا نمایید. برای مثال در زیر تصویر این نرم افزار را در لحظه نمایش اطلاعات کارت گرافیک مشاهده می کنید.