به جمع مشترکان مگیران بپیوندید!

تنها با پرداخت 70 هزارتومان حق اشتراک سالانه به متن مقالات دسترسی داشته باشید و 100 مقاله را بدون هزینه دیگری دریافت کنید.

برای پرداخت حق اشتراک اگر عضو هستید وارد شوید در غیر این صورت حساب کاربری جدید ایجاد کنید

عضویت
جستجوی مقالات مرتبط با کلیدواژه

cyclic reduction algorithm

در نشریات گروه مکانیک
تکرار جستجوی کلیدواژه cyclic reduction algorithm در نشریات گروه فنی و مهندسی
تکرار جستجوی کلیدواژه cyclic reduction algorithm در مقالات مجلات علمی
  • پوریا اکبرزاده، حسین محمودی داریان، محسن نظری، میلاد سوری
    در این مقاله سه الگوریتم کاهش متناوب، کاهش متناوب موازی و رهیافت توماس موازی برای حل دستگاه معادلات سه قطری به کمک پردازنده های گرافیکی معرفی و اثر دسترسی هم مکان و غیرهم مکان به حافظه سراسری مورد بحث قرار گرفته است. برای ارزیابی توانایی این الگوریتم ها، نتایج شبیه سازی جریان درون حفره (یک مورد مطالعاتی) با نتایج الگوریتم توماس کلاسیک اجراشده روی پردازنده مرکزی مقایسه شده است. بیشینه افزایش سرعت مشاهده شده در سه الگوریتم مذکور (پردازنده گرافیکی) در برابر الگوریتم توماس کلاسیک (پردازنده مرکزی) به ترتیب حدود 4/4، 2/5 و 45/38 می باشد. هم چنین نشان داده شده است که با دسترسی هم مکان، افزایش سرعت حدودا دوبرابری برای پردازنده گرافیکی حاصل می شود.
    کلید واژگان: رهیافت توماس موازی، پردازش موازی، دستگاه معادلات سه قطری، پردازنده گرافیکی، الگوریتم کاهش متناوب
    Pooria Akbarzadeh, Hossein Mahmoodi Darian, Mohsen Nazari, Milad Souri
    In this paper three algorithms of Cyclic-Reduction, Parallel-Cyclic-Reduction and Parallel-Thomas are introduced to solve the Tridiagonal system of equations using GPUs and the effect of coalesced-memory-access and uncoalesced-memory-access to global memory are studied. To assess the ability of these algorithms, as a case-study the simulation of the lid-driven cavity flow have been compared to the results of Runtimes and physical parameters of the classical Thomas algorithm, executed on CPU. The maximum speed-up of these algorithms against CPU runtime is about 4.4x, 5.2x and 38.5x, respectively. Also, approximately a 2x speed-up achieved in coalesced-memory access on GPU.
    Keywords: Parallel Thomas approach, Parallel Processing, Tridiagonal system of equations, Graphic Processor, Cyclic Reduction algorithm
نکته
  • نتایج بر اساس تاریخ انتشار مرتب شده‌اند.
  • کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شده‌است. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
  • در صورتی که می‌خواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.
درخواست پشتیبانی - گزارش اشکال