به جمع مشترکان مگیران بپیوندید!

تنها با پرداخت 70 هزارتومان حق اشتراک سالانه به متن مقالات دسترسی داشته باشید و 100 مقاله را بدون هزینه دیگری دریافت کنید.

برای پرداخت حق اشتراک اگر عضو هستید وارد شوید در غیر این صورت حساب کاربری جدید ایجاد کنید

عضویت
جستجوی مقالات مرتبط با کلیدواژه

gpu computing

در نشریات گروه برق
تکرار جستجوی کلیدواژه gpu computing در نشریات گروه فنی و مهندسی
تکرار جستجوی کلیدواژه gpu computing در مقالات مجلات علمی
  • محمدپویا اکبرپور*، کیهان خام فروش، وفا میهمی

    همواره زمان صرف شده برای حل مسایل سنگین محاسباتی، یکی از دغدغه های برنامه نویسان کامپیوتر بوده است. الگوریتم PSO، الگوریتمی فرا ابتکاری است که به دلیل ساد گی پیاده سازی، برای حل مسایل سنگین محاسباتی استفاده می شود ولی با وجود ساد گی، این الگوریتم برای حل مسایل سنگین واقعی ناکارآمد است. از طرفی، وجود ویژگی تعاملات محلی ذرات در الگوریتم PSO، این الگوریتم را برای موازی سازی مناسب کرده است؛ از طرف دیگر، NVIDIA با اختراع پردازنده گرافیکی و معرفی معماری CUDA، تحولات بنیادی را در حل این نوع مسایل، از طریق پیاده سازی آن بر روی پردازنده گرافیکی ایجاد کرده است. با وجود تمام تحقیقات انجام گرفته در زمینه پیاده سازی، برخی از جنبه های تکنیکی موازی سازی به منظور پیاده سازی الگوریتم به صورتی که تسریع و بازدهی مناسب بر روی تمام پردازنده های گرافیکی NVIDIA را داشته باشد، رعایت نشده است. در این مقاله سعی شده با انتخاب Geforce GT 525M که پردازنده گرافیکی نسبتا ضعیفی است، جنبه مقیاس پذیری روش پیشنهادی رعایت شود؛ به طوری که با رسیدن به بیشینه تسریع الگوریتم پیاده سازی شده بر روی این پردازنده، به بازدهی قابل قبول برای اجرا بر روی سایر پردازنده های گرافیکی رسید. برای نیل به این هدف، از مدل چند کرنلی ارایه شده استفاده شده است. نتایج حاصل از انجام آزمایش ها رسیدن به بیشینه تسریع 15/98 برای حل تابع Rastrigin را نشان می دهد.

    کلید واژگان: موازی سازی الگوریتم، بهینه سازی اجتماع ذرات، Fermi، GPU Computing، HPC، CUDA
    MohammadPouya Akbarpour*, Keyhan Khamforoosh, Vafa Maihami

    The time consumption in solving computationally heavy problems has always been a concern for computer programmers. Due to simplicity of its implementation, the PSO (Particle Swarm Optimization) is a suitable meta-heuristic algorithm for solving computationally heavy problems. However, despite the simplicity, the algorithm is inefficient for solving real computationally heavy problems but the presence of local interactions between particles has made this algorithm suitable for parallelization. On the other hand, by the invention of GPU (Graphical Processor Unit) and introducing the CUDA architecture as a GPU in the NVIDIA graphical processor, fundamental changes has been made in solving this type of problems. Despite all the research done in the field of implementing the algorithms through GPUs, some aspects of parallelization have not been addressed for suitable speedup and efficiency on NVIDIA GPUs. By considering the Geforce GT 525M, which is a relatively weak GPU, this paper tries to achieve the maximum speedup of the algorithm by implementing on this GPU. This experience led to reaching the acceptable efficiency on other GPUs. To reach the achievement, the multi-kernel model was used. The results show the speedup of 15.98 in solving the Rastrigin function.

    Keywords: Parallel Algorithm, PSO, GPU Computing, CUDA, Fermi, HPC
نکته
  • نتایج بر اساس تاریخ انتشار مرتب شده‌اند.
  • کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شده‌است. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
  • در صورتی که می‌خواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.
درخواست پشتیبانی - گزارش اشکال