به جمع مشترکان مگیران بپیوندید!

تنها با پرداخت 70 هزارتومان حق اشتراک سالانه به متن مقالات دسترسی داشته باشید و 100 مقاله را بدون هزینه دیگری دریافت کنید.

برای پرداخت حق اشتراک اگر عضو هستید وارد شوید در غیر این صورت حساب کاربری جدید ایجاد کنید

عضویت
جستجوی مقالات مرتبط با کلیدواژه

parallel processing

در نشریات گروه مکانیک
تکرار جستجوی کلیدواژه parallel processing در نشریات گروه فنی و مهندسی
  • حسین محمودی داریان*

    در مقاله حاضر یک بررسی بر موازی سازی چند حلگر تکراری دستگاه معادلات خطی حاصل از گسسته سازی معادله پواسون به روش تفاضل محدود انجام می شود. به طور خاص روش های تکراری فوق تخفیف گاوس سایدل نقطه ای و خطی و همچنین روش های گرادیان مزدوج و گرادیان دومزدوج پایدار شده بررسی می گردد. برای روش های فوق تخفیف از ضریب فوق تخفیف بهینه استفاده می شود. موازی سازی ابتدا برای یک پردازنده مرکزی چند هسته ای با زبان برنامه نویسی سی پلاس پلاس و کتابخانه اپن ام پی و سپس برای یک پردازنده گرافیکی با زبان برنامه نویسی کودا صورت می گیرد. نتایج حاصل از حل معادله دو بعدی و همچنین معادله سه بعدی نشان می دهد روش های گرادیان مزدوج در بیشتر موارد به علت تعداد تکرار کمتر زمان اجرای کمتری دارند. بررسی زمان اجرای روش های مختلف نشان می دهد در یک پردازش 8 هسته ای نسبت به حالت تک هسته ای، افزایش سرعتی تا حدود 10 و 5 برابر به ترتیب در حل معادلات دو بعدی و سه بعدی حاصل می گردد. علاوه بر آن، استفاده از پردازنده گرافیکی نسبت به حالت 8 هسته ای موجب افزایش سرعت بین 5 تا 10 برابر می شود.

    کلید واژگان: پردازش موازی، کودا، فوق تخفیف، روش گرادیان مزدوج، معادله پواسون
    Hossein Mahmoodi Darian *

    In the present article, a survey is carried out on the parallelization of several iterative solvers of the system of linear equations resulting from the discretization of the Poisson equation using the finite difference method. In particular, the point and line Gauss-Seidel successive over-relaxation methods, as well as the conjugate gradient and stabilized biconjugate gradient methods are investigated. For the over-relaxation methods, the optimum over-relaxation coefficient is used. The parallelization is first carried out on a multi-core central processor using C++ programming language and the OpenMP library, and then for a graphics processing unit using CUDA programming language. The results show, for both the two-dimensional and three-dimensional equations, the conjugate gradient methods due to a smaller number of iterations, have less computation time. Comparing the execution time of the different methods shows that for an 8-core processing, speedups of about 10 and 5 are achieved for the two- and three-dimensional equations, respectively. Furthermore, using a graphics processing unit leads to speedups between 5 and 10 in comparison to the 8-core processing.

    Keywords: Parallel Processing, CUDA, Underrelaxation, Conjugate Gradient Method, Poisson Equation
  • علی فوادالدینی، سید علیرضا ذوالفقاری*، حسین محمودی داریان

    در تحقیق حاضر، رویکرد جدید ADI-CEIDD با ترکیب روش ضمنی جهت متغیر و روش تقسیم دامنه صریح-ضمنی برای حل معادله انتقال حرارت هدایت دو بعدی روی پردازنده گرافیکی ارایه شده است. در این روش تخمین مقادیر مرزی با یک طرح عددی صریح صورت گرفته و برای حل درون زیردامنه ها از یک طرح ضمنی برمبنای روش ADI استفاده می شود. سپس از یک طرح ضمنی برای تصحیح مقادیر روی مرز استفاده می شود. در این روش تعداد دستگاه معادلات مستقل افزایش یافته و نخ های بیشتری برای پنهان کردن تاخیر حافظه فعال می شوند. همچنین، آزمایش عددی برای تحلیل دقت و سرعت روش به انجام رسیده است. نتایج تحقیق نشان می دهد که با تقسیم دامنه در روش ADI-CEIDD می توان سرعت حل را بین 3/1 تا 6/2 برابر در مقایسه با روش ADI افزایش داد. در روش ارایه شده با افزایش تعداد تقسیمات دامنه از 2 به 32 سرعت روش ارایه شده تا 6/1 برابر افزایش و دقت پاسخ کاهش می یابد. خطای روش ارایه شده از روش ADI بیشتر است با این حال آزمایش های عددی نشان دهنده پایداری بالای روش ارایه شده است. همچنین نتایج نشان می دهد که مزیت روش ADI-CEIDD در اندازه شبکه های کوچک بیشتر از اندازه شبکه های بزرگ است بگونه ای که با افزایش اندازه شبکه از 256*256 به 512*512 مقدار پارامتر افزایش سرعت از 4/2 به 7/1 کاهش می یابد.

    کلید واژگان: دینامیک سیالات محاسباتی، پردازش موازی، پردازنده گرافیکی، حلگر ضمنی جهت متغیر، تقسیم دامنه صریح-ضمنی
    Ali Foadaddini, Alireza Zolfaghari *, Hossein Mahmoodi Darian

    In the present study, the new ADI-CEIDD approach is proposed by combining the ADI method with the explicit-implicit domain decomposition method. The method is used for solving the two-dimensional conduction heat transfer equation on GPU .In this method, an explicit numerical scheme is used to predict values at inner boundaries and an implicit scheme based on the ADI method is used to solve the sub-domains. Then, an implicit scheme is used to correct the values on the inner boundary. The present method increases the number of independent sets of equations and enables more threads to occupy the device. Numerical experiments are done to investigate the accuracy and speed of the method. The results show that the ADI-CEIDD can achieve a speedup of 1.3 to 2.6 times compared to the ADI method. By increasing the number of subdomains from 2 to 32, the speed of the proposed method is increased up to 1.6 times and the accuracy decreases. Although the error of the presented method is higher than the ADI method, numerical experiments show high stability of the ADI-CEIDD. Furthermore, the results show that the ADI-CEIDD method is more advantageous to problems with coarse grid. By increasing the grid size from 256 * 256 to 512 * 512, the value of the Sp decreases from 2.4 to 1.7.

    Keywords: CFD, Parallel Processing, GPU, ADI Method, CEIDD
  • مهرنوش تارمیغ، مرتضی بهبهانی نژاد، عزیز عظیمی*
    یکی از مسائل مطرح و مورد توجه در صنعت گازرسانی، تحلیل جریان گذرای گاز طبیعی درون خطوط لوله انتقال می باشد. با وجود مطالعات صورت گرفته، هنوز دقت و زمان محاسبات به عنوان دو چالش مهم در این زمینه مطرح هستند. در این مقاله، طراحی یک الگوریتم موازی جهت شبیه سازی عددی جریان هم دما و غیرهم دمای گاز مطرح شده است. تحلیل عددی جریان با استفاده از روش اختلاف محدود ضمنی تجزیه بردار شار استیگر- وارمینگ صورت پذیرفته است. موازی سازی مسئله نیز به روش انتقال پیام با کتابخانه MPI انجام شده است. به منظور نشان دادن قابلیت های برنامه کامپیوتری توسعه داده شده، دو مسئله شامل جریان درون دو خط لوله با شرایط متفاوت تحلیل و صحت سنجی شده است. در انتها، پس از صحت سنجی نتایج، معیارهای عملکرد روش پیشنهادی مثل زمان محاسبات، کاهش زمان به دست آمده و میزان افزایش سرعت از نتایج شبیه سازی استخراج شده اند. بررسی نتایج به دست آمده نشان می دهد که با استفاده از پردازش موازی می توان تا حد زیادی زمان محاسبات جریان درون خطوط لوله انتقال گاز طویل را کاهش داد. علاوه بر این، با به کارگیری این روش در شبکه های محاسباتی ریز نسبت به شبکه های درشت، کارایی الگوریتم موازی افزایش می یابد.
    کلید واژگان: خط لوله گاز، جریان گذرا، پردازش موازی، کتابخانه ‏MPI
    M. Tarmigh, M. Behbahani, nejad, A. Azimi *
    Analysis of natural gas transient flow in transmission pipelines is one of the most important issues in the gas industry. Despite the previous studies, the accuracy and the computational time have yet considered as two important challenges in this field. In this paper, a parallel algorithm for numerical simulation of isothermal and non-isothermal gas flows is presented. Numerical analysis of the flow is performed using the implicit Steger-Warming flux vector splitting method. For parallelization, the computer program has been parallelized using Message Passing Interface library. In order to demonstrate the capabilities of the developed computer program, the flow inside two pipelines with different conditions is solved, and the results are validated. Then, some factors such as the computational time, reduction of the time, and the speed up criteria are obtained to demonstrate the computational efficiency of the proposed method. The results show that parallel processing method can significantly reduce computational time of natural gas flow in long transmission pipelines. Moreover, it is shown that application of this approach on the fine computational grids is more efficient than on the coarse grids.
    Keywords: Gas Pipeline, Transient Flow, Parallel Processing, Message Passing Interface Library
  • رامین کمالی مقدم
    هدف اصلی مقاله حاضر، توسعه مدلسازی جریان آشفته ناپایا با استفاده از رهیافت آشفتگی URANS در عین حفظ راندمان عددی و ارزیابی این روش نسبت به رویکرد RANS در شبیه سازی عددی یک جت صوتی در جریان جانبی مافوق صوت می باشد. مدل آشفتگی استفاده شده در هر دو رهیافت، مدل آشفتگی اسپالارت آلماراس می باشد. برای بهبود دقت محاسبات از شبکه بندی چندبلوکی باسازمان و برای تسریع محاسبات از روش پردازش موازی به روش OMP استفاده شده است. در این مقاله، ابتدا روابط حاکم بر هر دو رهیافت URANS و RANS تشریح می شود و سپس کد توسعه یافته، برای تحلیل جریان یک جت سه بعدی در جریان جانبی مورد استفاده قرار گرفته و نتایج آنها در تشکیل ساختار جریان و توزیع فشار و سرعت با نتایج تجربی مقایسه می گردد. نتایج بدست آمده، بیانگر دقت مناسبتر رهیافت URANS در مدلسازی پدیده جت صوتی در جریان عرضی نسبت به مدلسازی آشفته RANS می باشد.
    کلید واژگان: شبیه سازی عددی جریان ناپایا، مدل آشفتگی URANS و RANS، جت در جریان عرضی، روش چندبلوکی، پردازش موازی
    Ramin Kamali Mighadam
    The main goal of the present paper is development of the unsteady turbulence modeling using the URANS algorithm and preservation of numerical performance and assessment of this method respect to the RANS model in numerical simulation of a sonic jet in supersonic cross flow. The turbulence modeling used in both algorithms is the Spalart Almaras model. To improve accuracy of the computations, the structured multi block grid is used and to decrease the computational cost, the OMP parallel processing is applied. In this paper, firstly, the governing equations of both the RANS and URANS are described and then the developed code is used to analyze a 3D jet in cross flow. The results including flow structure, distribution of the pressure and velocity profile are compared with experimental data. The URANS method show more accurate results than the RANS model in numerical simulation of the sonic jet in supersonic cross flow.
    Keywords: Numerical simulation of turbulence flow, URANS, RANS turbulence models, Jet in cross flow, Multi block method, parallel processing
  • B. Khalili, M. Rahnama*, S. Jafari, F. Gharibi, E. Jahanshahi Javaran
    Three-dimensional particulate flow has been simulated using Lattice Boltzmann Method (LBM). Solid-fluid interaction was modeled based on Smoothed Profile Method (SPM) (Jafari et. al, Lattice Boltzmann method combined with smoothed-profile method for particulate suspensions, Phys. Rev. E, 2011). In this paper a GPU code based on three-dimensional lattice Boltzmann method and smoothed profile method has been prepared due to the ability of SPM-LBM to perform locally and in parallel mode. Results obtained for sedimentation of one and two spherical particles as well as their behavior in shear flow showed excellent correspondence with previous published works. Computations for a large number of particles sedimentation showed that combination of LBM and SPM on a GPU platform can be considered as an efficient and promising computational frame work in particulate flow simulations.
    Keywords: Particulate flow, Parallel processing, Lattice boltzmann method, Smoothed profile method, GPU programming
  • پوریا اکبرزاده، حسین محمودی داریان، محسن نظری، میلاد سوری
    در این مقاله سه الگوریتم کاهش متناوب، کاهش متناوب موازی و رهیافت توماس موازی برای حل دستگاه معادلات سه قطری به کمک پردازنده های گرافیکی معرفی و اثر دسترسی هم مکان و غیرهم مکان به حافظه سراسری مورد بحث قرار گرفته است. برای ارزیابی توانایی این الگوریتم ها، نتایج شبیه سازی جریان درون حفره (یک مورد مطالعاتی) با نتایج الگوریتم توماس کلاسیک اجراشده روی پردازنده مرکزی مقایسه شده است. بیشینه افزایش سرعت مشاهده شده در سه الگوریتم مذکور (پردازنده گرافیکی) در برابر الگوریتم توماس کلاسیک (پردازنده مرکزی) به ترتیب حدود 4/4، 2/5 و 45/38 می باشد. هم چنین نشان داده شده است که با دسترسی هم مکان، افزایش سرعت حدودا دوبرابری برای پردازنده گرافیکی حاصل می شود.
    کلید واژگان: رهیافت توماس موازی، پردازش موازی، دستگاه معادلات سه قطری، پردازنده گرافیکی، الگوریتم کاهش متناوب
    Pooria Akbarzadeh, Hossein Mahmoodi Darian, Mohsen Nazari, Milad Souri
    In this paper three algorithms of Cyclic-Reduction, Parallel-Cyclic-Reduction and Parallel-Thomas are introduced to solve the Tridiagonal system of equations using GPUs and the effect of coalesced-memory-access and uncoalesced-memory-access to global memory are studied. To assess the ability of these algorithms, as a case-study the simulation of the lid-driven cavity flow have been compared to the results of Runtimes and physical parameters of the classical Thomas algorithm, executed on CPU. The maximum speed-up of these algorithms against CPU runtime is about 4.4x, 5.2x and 38.5x, respectively. Also, approximately a 2x speed-up achieved in coalesced-memory access on GPU.
    Keywords: Parallel Thomas approach, Parallel Processing, Tridiagonal system of equations, Graphic Processor, Cyclic Reduction algorithm
  • بهنام خلیلی، محمد رهنما*، سعید جعفری، ابراهیم جهانشاهی جواران
    بررسی بر هم کنش میان ذرات جامد و سیال به عنوان مقدمه ای بر شبیه سازی بسیاری از مسائل مهندسی مانند بسترهای سیالی، ته نشینی ذرات و جوهر کاتالیست در سلول های سوختی مورد بررسی قرار گرفته است. یکی از روش های مناسب برای انجام این گونه شبیه سازی ها، ترکیب دو روش شبکه بولتزمن و نمایه هموار می باشد که دارای یک الگوریتم مناسب برای اجرا شدن به صورت موازی می باشند. روش نمایه هموار همانند روش شبکه بولتزمن از یک شبکه ثابت برای شبیه سازی ذرات جامد در سیال استفاده می کند و از این رو یک روش کارامد برای پردازش موازی به کمک کارت گرافیک می باشد. در کار حاضر، پیاده سازی یک الگوریتم مناسب برای موازی سازی ترکیب دو روش نمایه هموار و شبکه بولتزمن روی کارت گرافیک ارائه می شود. به منظور بررسی صحت نتایج، ابتدا جریان سیال درون کانال مورد بررسی قرار گرفت. نتایج زمانی حاکی از آن بود که زمان حل می تواند تا 80 برابر بوسیله کارت گرافیک کاهش یابد. در ادامه نیروی پسای وارد بر یک کره در جریان سیال و همچنین شبیه سازی سقوط یک ذره در سیال ساکن بر اثر نیروی وزن مورد بررسی قرار گرفت. نتایج بدست آمده بر روی کارت گرافیک، نشان دهنده افزایش توان محاسباتی تا 6.5 میلیون گره محاسباتی در واحد زمان را نشان می دهد.
    کلید واژگان: روش شبکه بولتزمن، روش نمایه هموار، پردازش موازی، برهم کنش جامد، سیال
    Behnam Khalili, Mohammad Rahnama *, Saeed Jafari, Ebrahim Jahanshahi Javaran
    Investigation of fluid-solid interaction has been studied as an introduction to simulate a wide range of engineering problems such as fluidized beds, sediment transportation and catalyst inks in fuel cells. An efficient method for performing such simulations is a combination of Lattice Boltzmann method (LBM) and Smoothed Profile Method (SPM). In addition, the operations in the SPM are local; it can be easily programmed for parallel processing. In this approach, the flow is computed on fixed Eulerian grids which are also used for the particles. Owing to the use of the same grids for simulation of fluid flow and particles, this method is highly efficient for purpose of parallel processing by means of GPU. In this study, a combination of Lattice Boltzmann method (LBM) and Smoothed Profile method has been implemented in parallel processing on GPU. For validation purpose, the fluid flow within a channel was investigated. Results suggest that computational time can be reduced up to 80 times by means of GPU.Then, drag force exerted on a sphere in fluid flow and the sedimentation of one sphere in a quiescent fluid were studied. Results show that performance of GPU can be increased up to 6.5 million fluid nods per second by using this method.
    Keywords: Lattice Boltzmann Method, Smoothed Profile method, Parallel processing, Fluid, solid interaction
  • قاسم حیدری نژاد، امیر محمد جدیدی
    پیش بینی الگوی جریان باد در اطراف ساختمانهای بلند، بدلیل مطرح شدن مسایلی چون آسایش پیاده رو، مشکل عدم تخلیه آلاینده های مضر در سرعتهای پایین باد و... امروزه جایگاه ویژه ای پیدا کرده است. جریان آشفته باد در اطراف ساختمان بدلیل پیچیدگی های فیزیکی از جمله وجود گوشه های تیز، اثر زمین، وجود گردابه های مختلف و سایر عوامل یکی از بهترین گزینه ها برای ارزیابی دقت و کارآیی مدلهای توربولانسی می باشد. در یک مجموعه ساختمانی علاوه بر دشواری های ذکر شده، تاثیر ساختمانها بر یکدیگر و بوجود آمدن نواحی بسیار پرسرعت در بین ساختمانها باعث می گردد تا برای حصول جوابهای مورد اعتماد از یک شبکه ریز به همراه یک مدل توربولانسی دقیق استفاده شود که موجب افزایش هزینه محاسباتی خواهد شد. مدل DES از روش های نسبتا جدید RANS-LES برای شبیه سازی جریان آشفته است که زمان اجرای شبیه-سازی در آنها نسبت به روش های رایج LES کمتر می باشد. در این مقاله جریان آشفته باد در سرعتهای مختلف بر روی پردیس دانشگاه تربیت مدرس با استفاده از مدل DES شبیه سازی شده و بدلیل تعداد زیاد نقاط شبکه از یک کلاستر به منظور پردازش موازی استفاده شده است. به منظور صحت سنجی، نتایج حاصله از روش DES با مدلهای متداول توربولانسی مانند اسماگورینسکی مقایسه شده اند. نتایج حاکی از آن است که دقت روش DES مطلوب می باشد.
    کلید واژگان: جریان باد، دانشگاه تربیت مدرس، مدل DES، آسایش پیاده رو، پردازش موازی
    Ghassem Heidarinejad, Amir Mohammad Jadidi
    Predicting wind flow pattern around high rise building, because of pedestrian comfort, air pollution in weak wind region and etc. has important position in wind engineering. Turbulent wind flow over buildings due to the complexity like sharp corners, ground effect and different vortexes, is one of the best choices to evaluate turbulence methods. Moreover in a campus due to high velocity region between buildings, simulating wind flow is more complex. Therefore reaching acceptable result needs a fine grid with an accurate turbulence model that increases computational cost. DES is hybrid RANS-LES models for simulating turbulent flow which for their characteristic, treat near wall as RANS and farther the wall act as LES model. Consequently in this hybrid model, computational time will decrease compared to traditional LES models. In this article turbulent 3 dimensional wind flow over Tarbiat Modares University with DES method in different wind velocities is simulated. Because cells number is great, parallel processing has been used. For verification, DES results are compared with traditional LES models such as smagorinsky. The results show good agreement with other traditional methods.
    Keywords: wind flow, Tarbiat Modares University, DES Model, Pedestrian comfort, Parallel Processing
  • امیر محمد جدیدی، قاسم حیدری نژاد
    جریان آشفته باد بر روی ساختمان بدلیل دارا بودن پیچیدگی های فیزیکی از جمله وجود گوشه های تیز، اثر زمین، وجود گردابه های مختلف و... یکی از بهترین گزینه ها برای ارزیابی روش های توربولانسی می باشد. روش DES و DDES از روش های نسبتا جدید ترکیبی RANS-LES برای شبیه سازی جریان آشفته می باشند که بدلیل ذات ترکیبی آن در نزدیکی مرز از روش RANS و در نواحی دورتر از آن از روش LES استفاده می کنند و متعاقبا زمان اجرای شبیه سازی در آنها نسبت به روش های رایج LES کمتر می باشد. در این مقاله برای ارزیابی روش های DES و DDES، جریان باد بر روی ساختمان در رینولدز 22000 بصورت 3 بعدی و با استفاده از پردازش موازی شبیه سازی شده است و برای صحت سنجی از نتایج تجربی سایر محققین استفاده شده است. همچنین روش مذکور با روش های متداول توربولانسی εk- و اسماگورینسکی نیز مقایسه شده است تا کارآیی آن نسبت به سایر روش های توربولانسی آشکار گردد. نتایج حاکی از آن است که روش DES با شبکه ریز در عین کاهش 26% زمان محاسبات نسبت به مدل اسماگورینسکی، از دقت خوبی به منظور شبیه سازی جریان آشفته غیرقابل تراکم باد بر روی ساختمان برخوردار است.
    کلید واژگان: جریان باد، جریان آشفته حول ساختمان، مدل DES، روش های RANS، LES، پردازش موازی
    Ghassem Heidarinejad
    Turbulent wind flow over buildings occurs due to the complexity like sharp corners، ground effect and different vortexes is one of the best choices to evaluate turbulence methods. DES and DDES are hybrid RANS-LES models for simulating turbulent flow which for their characteristic treat near wall as RANS and farther the wall act as LES model. Consequently computational time will decrease compared to traditional LES models. In this article to evaluate DES and DDES models، turbulent incompressible flow in Re = 22000 over 3D building is simulated using parallel processing facilities. For verification purpose other investigators experiment results are used. Also the mentioned models are compared with classic RANS and LES models، like k-ε and LES-Smagorinsky to depict their performance. Our results illustrate DES model with fine grid has good precision for simulating turbulent incompressible wind flow over building and decline of 26 percentage of computational time compared to LES-Smagorinsky model.
    Keywords: wind flow, turbulent flow around building, DES Model, RANS, LES Models, Parallel Processing
نکته
  • نتایج بر اساس تاریخ انتشار مرتب شده‌اند.
  • کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شده‌است. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
  • در صورتی که می‌خواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.
درخواست پشتیبانی - گزارش اشکال