gpu computing
در نشریات گروه برق-
همواره زمان صرف شده برای حل مسایل سنگین محاسباتی، یکی از دغدغه های برنامه نویسان کامپیوتر بوده است. الگوریتم PSO، الگوریتمی فرا ابتکاری است که به دلیل ساد گی پیاده سازی، برای حل مسایل سنگین محاسباتی استفاده می شود ولی با وجود ساد گی، این الگوریتم برای حل مسایل سنگین واقعی ناکارآمد است. از طرفی، وجود ویژگی تعاملات محلی ذرات در الگوریتم PSO، این الگوریتم را برای موازی سازی مناسب کرده است؛ از طرف دیگر، NVIDIA با اختراع پردازنده گرافیکی و معرفی معماری CUDA، تحولات بنیادی را در حل این نوع مسایل، از طریق پیاده سازی آن بر روی پردازنده گرافیکی ایجاد کرده است. با وجود تمام تحقیقات انجام گرفته در زمینه پیاده سازی، برخی از جنبه های تکنیکی موازی سازی به منظور پیاده سازی الگوریتم به صورتی که تسریع و بازدهی مناسب بر روی تمام پردازنده های گرافیکی NVIDIA را داشته باشد، رعایت نشده است. در این مقاله سعی شده با انتخاب Geforce GT 525M که پردازنده گرافیکی نسبتا ضعیفی است، جنبه مقیاس پذیری روش پیشنهادی رعایت شود؛ به طوری که با رسیدن به بیشینه تسریع الگوریتم پیاده سازی شده بر روی این پردازنده، به بازدهی قابل قبول برای اجرا بر روی سایر پردازنده های گرافیکی رسید. برای نیل به این هدف، از مدل چند کرنلی ارایه شده استفاده شده است. نتایج حاصل از انجام آزمایش ها رسیدن به بیشینه تسریع 15/98 برای حل تابع Rastrigin را نشان می دهد.
کلید واژگان: موازی سازی الگوریتم، بهینه سازی اجتماع ذرات، Fermi، GPU Computing، HPC، CUDAThe time consumption in solving computationally heavy problems has always been a concern for computer programmers. Due to simplicity of its implementation, the PSO (Particle Swarm Optimization) is a suitable meta-heuristic algorithm for solving computationally heavy problems. However, despite the simplicity, the algorithm is inefficient for solving real computationally heavy problems but the presence of local interactions between particles has made this algorithm suitable for parallelization. On the other hand, by the invention of GPU (Graphical Processor Unit) and introducing the CUDA architecture as a GPU in the NVIDIA graphical processor, fundamental changes has been made in solving this type of problems. Despite all the research done in the field of implementing the algorithms through GPUs, some aspects of parallelization have not been addressed for suitable speedup and efficiency on NVIDIA GPUs. By considering the Geforce GT 525M, which is a relatively weak GPU, this paper tries to achieve the maximum speedup of the algorithm by implementing on this GPU. This experience led to reaching the acceptable efficiency on other GPUs. To reach the achievement, the multi-kernel model was used. The results show the speedup of 15.98 in solving the Rastrigin function.
Keywords: Parallel Algorithm, PSO, GPU Computing, CUDA, Fermi, HPC
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.