فهرست مطالب

مجله کنترل
سال چهاردهم شماره 4 (زمستان 1399)

  • تاریخ انتشار: 1399/10/12
  • تعداد عناوین: 12
|
  • علیرضا جلالی پور، ریحانه کاردهی مقدم* صفحات 1-12

    ردیابی هدف فقط با اندازه گیری زاویه سمت، یک مسئله چالش برانگیز با کاربردهای فراوان در حوزه های نظامی و تجاری می باشد. در ردیابی سمت به تنهایی بصورت چندهدفی چندسنسوری توزیع شده، سنسورها از یکدیگر فاصله داشته اما با استفاده از تجهیزات مخابراتی با هم تبادل داده می نمایند. این سیستم، علاوه بر مزایای عمومی سیستم های توزیع شده، شامل این ویژگی کاربردی است که در صورت وجود فاصله مناسب بین سنسورها، حالت اهداف رویت پذیر بوده و انجام مانور توسط حسگرها ضرورت نخواهد داشت. با توجه به اهمیت و کاربرد این مسیله، در این مقاله برای اولین بار ردیابی سمت به تنهایی چندهدفی چندسنسوری با معماری غیرمتمرکز و با اندازه گیری های ناهمزمان ارایه شده است. در این تحقیق، با کمک گرفتن از ایده اندازه گیری مرکب و با لحاظ نمودن زمان اندازه گیری ها در محاسبات، ضمن غلبه بر ناهمزمانی اندازه گیری ها، اثرات غیرخطی در معادله اندازه گیری حذف شده است. همچنین از فیلترینگ مبتنی بر استراتژی پخش به منظور بهره برداری از اطلاعات عامل های سنسوری همسایه جهت بهبود تخمین ها استفاده شده است. شبیه سازی های انجام شده نشان می دهد که سیستم طراحی شده، می تواند به خوبی اهداف را تشخیص داده و با دقت قابل قبولی ردیابی نماید.

    کلیدواژگان: ردیابی هدف با اندازه گیری سمت به تنهایی، سیستم های چندعامله، سیستم های غیرمتمرکز، کنترل همکارانه، فیلترهای مبتنی بر استراتژی های پخش
  • سید علی خوشرو، سید حسین خواسته* صفحات 13-23

    برای سرعت بخشیدن به فرآیند یادگیری در مسایل یادگیری تقویتی با ابعاد بالا، معمولا از ترکیب روش های TD، مانند یادگیری Q یا سارسا، با مکانیزم آثار شایستگی، استفاده می شود. در الگوریتم شبکه عمیق Q (DQN)، که به تازگی معرفی شده، تلاش شده است که با استفاده از شبکه های عصبی عمیق در یادگیری Q، الگوریتم های یادگیری تقویتی را قادر سازد که به درک بالاتری از دنیای بصری رسیده و به مسایلی گسترش یابند که در گذشته رام نشدنی تلقی می شدند. DQN که یک الگوریتم یادگیری تقویتی عمیق خوانده می شود، از سرعت یادگیری پایینی برخوردار است. در این مقاله سعی می شود که از مکانیزم آثار شایستگی که یکی از روش های پایه ای در یادگیری تقویتی به حساب می آید، در یادگیری تقویتی در ترکیب با شبکه های عصبی عمیق استفاده شود تا سرعت فرایند یادگیری بهبود بخشیده شود. همچنین برای مقایسه کارایی با الگوریتم DQN، روی تعدادی از بازی های آتاری 2600، آزمایش انجام شد و نتایج تجربی به دست آمده در آنها نشان می دهند که روش ارایه شده، زمان یادگیری را در مقایسه با الگوریتم DQN، به طرز قابل توجهی کاهش داده و سریعتر به مدل مطلوب همگرا می شود

    کلیدواژگان: شبکه های عصبی عمیق، Deep Q Network (DQN)، آثار شایستگی، یادگیری تقویتی عمیق
  • ساناز سبزواری، احمدرضا ولی*، محمدرضا عاروان، سید محمد مهدی دهقان، محمدحسین فردوسی صفحات 25-41

    طراحی تخمین گر وضعیت نانوماهواره ها با تک حسگر مغناطیس سنج، به دلیل محدودیت در وزن و حجم، محدود بودن طول عمر ژیروسکوپ های مکانیکی در بلند مدت و پدیده کسوف، امری ضروری است. رویکرد این مقاله برای جبران این کمبود داده، فیلتر دو مرحله ای است. بدین صورت که وضعیت در فیلتر مرحله ی دوم با استفاده از داده ی حسگر و مشتق میدان مغناطیسی ناشی از تخمین فیلتر مرحله ی اول با فیلتر کالمن توسعه یافته، تعیین می گردد. به منظور دسترسی به دقت مناسب برای تعیین وضعیت نانوماهواره با تک حسگر سه محوره، دو الگوریتم  تصادفی فیلتر کالمن توسعه یافته ضربی و تخمین گر جذر مربعی چهارگان بی رد با رویت گر غیرخطی حفظ تقارن پیشنهادی مقایسه شده است. رویت گر ارایه شده، بر مبنای رویت گرهای غیرمتغیر تحت عملکرد گروه لی است. برای این منظور در روند طراحی از رویکرد چارچوب متحرک استفاده شده است تا با استفاده از معادلات دینامیک خطای غیرمتغیر بتوان پارامترهای رویت گر را تنظیم کرد. نتایج شبیه سازی در هر دو حوزه زمان و پاسخ فرکانسی، دقت قابل قبول را در هرسه الگوریتم تایید می کند. اما درصورتی که خطای تخمین اولیه ی وضعیت بزرگتر شود، خطای میانگین جذر مربعی رویت گر غیرخطی، بسیار کمتر از دو الگوریتم تصادفی است. همچنین در این روش به دلیل تنظیم پارامترها با معادلات ریکاتی دیفرانسیلی متناوب، از طریق پایداری لیاپانوف همگرایی را نیز تضمین می کند.

    کلیدواژگان: تعیین وضعیت نانوماهواره، تک حسگر مغناطیس سنج، تخمین گرهای چهارگان تصادفی، رویت گر غیرخطی حفظ تقارن
  • رباب ابراهیمی باویلی، احمد اکبری*، رضا محبوبی اسفنجانی صفحات 43-54

    این مقاله به  مساله  پایدارسازی مجانبی و ردیابی موقعیت و نیرو در سیستم عمل از دور دوطرفه غیرخطی در حضور نیروهای تماسی غیرمنفعل، تاخیرزمانی متغیردر کانال ارتباطی و رخداد عیب در عملگرها می پردازد. به این منظور، یک قانون کنترل تحمل پذیر عیب با رویکرد غیرفعال ارایه می شودکه با استفاده از موقعیت و سرعت زاویه ای بازوهای ربات های محلی و دور اهداف کنترلی را برآورده می کند. با استفاده از قضییه لیاپانف-کرازوفسکی شرایط کافی پایداری مجانبی و ردیابی موقعیت در سیستم حلقه بسته به صورت یک سری ناتساوی های ماتریسی خطی برای تنظیم پارامترهای کنترل کننده استخراج می شود. از مزایای مهم روش ارایه شده این است که توانایی جبران همزمان عیب بایاس و افت کارایی عملگرها را برای سیستم عمل از دور غیرخطی فراهم می کند. همچنین پایداری مجانبی خطای ردیابی موقعیت در حضور نیروهای تماسی غیرمنفعل بواسطه کنترل انتگرال تضمین می شود. نتایج شبیه سازی روش مورد نظر روی سیستم عمل از دور با ربات های 2 و 3 درجه آزادی و مقایسه آن با روش رقیب، کارایی و مزایای روش را نشان می دهد.

    کلیدواژگان: سیستم عمل از دور دوطرفه، نیروهای تماسی غیرمنفعل، عیب عملگر، پایداری مجانبی و ردیابی موقعیت و نیرو
  • امین نیک انجام*، منیره عبدوس، ماهنوش مهدوی مقدم صفحات 55-66

    امروزه، برای حل بسیاری از مسایل، از سیستم های چندعاملی مشارکتی استفاده می شود که در آن گروهی از عامل ها برای رسیدن به یک هدف مشترک همکاری می کنند. همکاری میان عامل ها، فوایدی همچون کاهش هزینه های عملیاتی، مقیاس پذیری بالا و سازگاری قابل توجه را به ارمغان خواهد آورد. برای آموزش این عامل ها در رسیدن به یک سیاست بهینه، از یادگیری تقویتی بهره می جویند. یادگیری در محیط های چندعاملی مشارکتی پویا، غیرقطعی و با اندازه فضای حالت بزرگ به یک چالش بسیار مهم در برنامه های کاربردی تبدیل شده است. ازجمله این چالش ها می توان به تاثیر اندازه فضای حالت بر مدت زمان یادگیری و همچنین همکاری ناکارآمد میان عامل ها و عدم وجود هماهنگی مناسب در تصمیم گیری عامل ها اشاره کرد. همچنین هنگام استفاده از الگوریتم های یادگیری تقویتی نیز با چالش هایی نظیر دشواری تعیین هدف یادگیری مناسب و زمان طولانی همگرایی ناشی از یادگیری مبتنی بر آزمایش و خطا مواجه خواهیم بود. در این مقاله، با معرفی یک چارچوب ارتباطی برای سیستم های چندعاملی مشارکتی، تلاش شده چالش های فوق تا حدی برطرف شود. در راستای حل مشکلات مربوط به همگرایی، انتقال دانش به کار برده شده است که می تواند به شکل قابل توجهی در افزایش کارایی الگوریتم های یادگیری تقویتی موثر واقع شود. همکاری میان عامل ها با استفاده از عامل سرگروه و هماهنگی میان آنان توسط یک عامل هماهنگ کننده صورت می پذیرد. چارچوب پیشنهادی برای حل مساله گله داری به کار رفته است و نتایج تجربی افزایش کارایی عامل ها را نشان می دهند.

    کلیدواژگان: سیستم های چندعامله مشارکتی، یادگیری تقویتی، انتقال دانش، مساله گله داری
  • مهرداد روحانی، حسن فرسی*، سید حمید ظهیری ممقانی صفحات 67-79

    امروزه یکی از اساسی‎ترین فرآیندها به منظور ادراک محتوای ویدیو، ردیابی اشیا متحرک است که در آن فرآیند مکان‎یابی شی متحرک، در هر فریم از ویدیو صورت می‎گیرد. در یک فرآیند ردیابی لازم است، هدف توسط یک ویژگی توصیف شود. در این مقاله به‎منظور توصیف شی متحرک و رفع حساسیت به ظاهر هدف، از هیستوگرام وزن‎دار رنگ به‎عنوان ویژگی هدف متحرک استفاده شده است تا اثر پیکسل‎های لبه‎ی شی هدف در ویژگی آن کاهش داده شود. این کار حساسیت الگوریتم را به تغییر حالت، تغییر مقیاس و چرخش کاهش داده و اثر انسداد جزیی بر توصیف ویژگی‎ هدف متحرک نیز کاهش می‎یابد. در روش پیشنهادی ، از الگوریتم بهینه سازی ازدحام ذرات به صورت فازی شده در فرآیند جستجوی هدف استفاده می‎شود. نحوه تعیین موقعیت هدف براساس بیشینه شدن تابع شباهت و محاسبه کمترین فاصله باتاچاریا است. پارامترهای کنترلی فازی شده برای الگوریتم بهینه‎سازی ازدحام ذرات استفاده شده است که یک روش نوین را ارایه می‎کند، این کار می‎تواند هر پارامتر کنترلی را به موقع و طبق حالات مختلف هر ذره در هر نسل تنظیم و به روزرسانی کند. الگوریتم ازدحام ذرات اصلاح شده توسط 11 تابع محک مورد ارزیابی قرار گرفته است. آزمایش‎ها نشان می‎دهند که الگوریتم اصلاح شده در تعداد تکرار پایین همگرایی بسیار مطلوبی را نتیجه می‎دهد. روش پیشنهادی در مقایسه با روش‎های پیشرفته و جدید به عملکرد خوبی در معیارهای دقت و نرخ موفقیت روی پایگاه داده OTB50 دست یافته است.

    کلیدواژگان: ردیابی شی متحرک، الگوریتم بهینه‎سازی ازدحام ذرات اصلاح شده، ویژگی هیستوگرام رنگی وزن‎دار
  • امیر پرویز ولدبیگی، علی خاکی صدیق*، فرانک لوییس، علی معرفیان پور صفحات 81-92

    این مقاله به مساله اجماع خروجی مشارکتی [1] مقاوم در سیستم های چند عاملی ناهمگن پیوسته با گراف ارتباطی جهت دار می پردازد. حل استاندارد مساله اجماع خروجی مشارکتی مقاوم با استفاده از روش - کپی مدل داخلی [2] است، که در این روش دانستن معادلات دینامیکی عوامل و عامل رهبر [3] ضروری است. در این مقاله با استفاده از ایده سیستم کمکی معادل [4] ، یک سیستم کمکی جدید برای حل مساله به دست می آید. سپس مساله اجماع خروجی مشارکتی مقاوم با محدودیت  به صورت یک مساله کنترل  تبدیل می شود. با استفاده از روش یادگیری تقویتی انتگرالی (IRL) [5] یک الگوریتم بدون مدل[6] برای حل معادلات جبری ریکاتی مقاوم (RARE) [7] بدون نیاز به مدل عوامل ارایه می شود. ثابت می شود که این روش معادلات تنظیم خروجی را نیز برآورده می سازد. نتایج شبیه سازی توانایی این روش در حل مساله تنظیم خروجی مشارکتی مقاوم با محدودیت  را نشان می دهند.

    کلیدواژگان: اجماع خروجی مشارکتی مقاوم، سیستم کمکی معادل، کنترل، یادگیری تقویتی
  • جعفر طاهری کلانی*، غلامرضا لطیف شبگاهی، مهدی علیاری شوره دلی صفحات 93-105

    سیستم های هشدار برای حفظ ایمنی و کارایی فرآیندها بسیار مهم هستند. ازآنجاکه بسیاری از متغیرهای فرآیند به یکدیگر وابسته هستند، در این مقاله رفتار یک سیستم هشدار چندمتغیره با استفاده از مدل مارکوف مدلسازی و روشی برای طراحی سیستم های هشدار چندمتغیره معرفی می گردد. در این روش طراحی بر اساس شاخص های هشدار مشترک انجام می شود. در این مقاله با استفاده از مدل مارکوف چندمتغیره، یک روش تقریبی برای محاسبه شاخص های مشترک Joint FAR و Joint MAR برای یک سیستم هشدار m متغیره معرفی شده و این شاخص ها برای یک سیستم هشدار دومتغیره محاسبه می گردد. در این روش، از حل یک مسئله بهینه سازی خطی و تشکیل ماتریس گذار مدل مارکوف چندمتغیره، شاخص های عملکردی مشترک تعریف می گردد. با تعریف شاخص های مشترک، تنظیم پارامترهای سیستم هشدار مانند آستانه و سایر پارامترها (بسته به نوع سناریوی تولید هشدار، متفاوت است) را می توان بر اساس این شاخص ها انجام داد. در این مقاله در یکی از موردهای مطالعاتی، از سناریوی پنالتی در فرآیند Tennessee استفاده شده و با استفاده از الگوریتم ژنتیک پارامترهای بهینه سیستم هشدار طراحی و با روش های دیگر موجود مقایسه شده است.

    کلیدواژگان: سیستم هشدار چندمتغیره، مارکوف چندمتغیره، شاخص Joint FAR، شاخص Joint MAR
  • علیرضا نصیری، احمد باران زاده، فرزان رشیدی* صفحات 107-118

    در این مقاله با استفاده از نامساوی ماتریسی خطی1 (LMI)، روشی برای پایدارسازی کنترل مقاوم  فیدبک خروجی سیستم ها‏‏ی فازی تاکاگی- سوگنو دارای عدم قطعیت، ارایه شده است. به منظور کاهش ماهیت محافظه کارانه2 سیستم ها‏‏ی تاکاگی-سوگنو، فرم جدیدی از توابع لیاپانوف غیر یکنوا مورد استفاده قرار گرفته است. در روش های غیر یکنوا، علیرغم اینکه تابع لیاپانوف می تواند بصورت محلی افزایش یابد، اما در نهایت مقدار آن به صفر می رسد. با استفاده از تابع لیاپانوف غیر یکنوا شرایط کافی برای وجود پایداری کنترل مقاوم  فیدبک خروجی محاسبه، و نشان داده شده است که روش پیشنهادی در مقایسه با سایر روش های غیر یکنوا، معروف به روش تغییرات  نمونه ای محافظه کاری کمتری خواهد داشت. کارایی عملکرد کنترل کننده پیشنهادی از طریق نتایج شبیه سازی عددی نشان شده است.

    کلیدواژگان: سیستم های غیرخطی، مدل فازی T-S، فیدبک خروجی، تابع لیاپانوف غیر یکنوا، فیلتر H، ∞‎
  • توحید رحیمی*، غلامعلی علیزاده، محسن حسن بابایی صفحات 119-131

    ریز شبکه ها به دلیل توسعه بسترهای مخابراتی و تجهیزات تولید و ذخیره توان و بهره مندی بالا از انرژی های تجدیدپذیر مورد توجه هستند. ولی ریزشبکه ها به دلیل نوسانات بالای تولید توان منابع تجدیدپذیر با مشکل نوسانات فرکانس در حالت جدا از شبکه روبرو هستند. در این مقاله، جهت غلبه بر چالش یاد شده، از ابرخازن برای افزایش اینرسی مجازی شبکه  به همراه سیستم  کنترلی برای سیستم های تولید و ذخیره ساز انرژی استفاده شده است. در ضمن مقدار بهینه تاخیر سیستم های مخابراتی نیز در تنظیم فرکانس ریز شبکه نیز در نظر گرفته شده است.  جهت ارزیابی عملکرد  استراتژی پیشنهادی، رفتار فرکانسی سیستم در برابر تغییرات  بار و تولید مورد شبیه سازی واقع شده است. با توجه به افزایش هزینه سیستم به دلیل افزایش ظرفیت ابرخازن و کاهش تاخیر سیستم های مخابراتی در مقابل بهبود نوسانات فرکانس ریزشبکه، دو روش بهینه سازی چندهدفه به منظور کنترل فرکانس بار (LFC) در کنار حداقل افزایش هزینه استفاده شده است. شبیه سازی های شبکه مورد مطالعه در نرم افزار متلب/سیمولینک انجام پذیرفته است. در این مقاله، توجه به کاهش هزینه های سیستم ناشی از پایین بودن ظرفیت واحد ابرخازن نصب شده و سیستم های مخابراتی با تاخیر قابل قبول، از مهم ترین ابعاد نوآوری پژوهش صورت گرفته می باشد. در این مقاله، به دلیل حضور ابرخازن،  دیگر نیازی به واحد های باتری نیست. باتری ها به دلیل عمر پایین و هزینه نگه داری بالا برای شبکه مشکلاتی را ممکن است ایجاد کنند. نتایج شبیه سازی نشان داده است که سیستم با مقادیر بهینه پارامترهای کنترلی، ظرفیت ابرخازن و تاخیر سیستم مخابراتی به خوبی توانسته است بر اغتشاشات بار و تولید غلبه کند و رفتار فرکانسی سیستم بهبود قابل توجهی نسبت به وضعیت غیر بهینه دارد.

    کلیدواژگان: ریزشبکه، بهینه سازی چند هدفه، تاخیر سیستم مخابراتی، اینرسی مجازی، کنترل فرکانس بار
  • آرش جدائی*، جمال صفار اردبیلی صفحات 133-141

    در این مقاله، طراحی کنترلگر برای مسئله مهار یک سیستم چندعامله با دینامیک های یکسان، مستقل از زمان،  پیوسته از زمان ، غیرخطی وگراف ارتباطی جهت دار ثابت مطالعه می شود. در اثبات این مسئله از قضیه پایداری لیاپانوف و نظریه گراف و نامساوی خطی ماتریسی استفاده می شود. عامل ها به دو گروه پیشروها و دنباله روها تقسیم می شوند. در مسئله مهار، عوامل دنباله رو طوری کنترل می شوند که به پوش محدب تولید شده به وسیله عامل های پیشرو بصورت مجانبی همگرا شوند لذا بردار های کنترلی توزیع شده (پروتکل) زمان تاخیری با تاخیر ثابت جهت حل آن پیشنهاد می شود. الگوریتم چهار مرحله ای جهت طراحی پارامتر ها و ماتریس بهره بردارهای کنترلی ارایه شده و موارد ذکر شده  بصورت شرایط کافی تحت قضیه اثبات می شود. به منظور نشان دادن قابلیت وکارایی روش پیشنهادی، مثال عددی همراه با چند شبیه سازی ارایه شده است.

    کلیدواژگان: سیستم های چند عامله، مهار، پیشرو، دنباله رو
  • محمدجواد شکاری، محمد فرخی*، داوود عرب خابوری صفحات 143-154

    گسترش روزافزون اتوماسیون، سبب ورود موتورهای الکتریکی به صنایع شده استبه گونه ای که نیروی محرکه بسیاری از ابزارها از موتورهای الکتریکی دریافت می شود. موتور سویچ رلوکتانس، به عنوان نوعی از موتورهای سنکرون، با مزیت های فراوان خود، توانایی جایگزین شدن با موتورهای قدیمی را دارد و مشکلات آن ها را برطرف می کند. کنترل این موتور به دلیل ذات غیرخطی و متغیر با زمانش، و همچنین وجود عدم قطعیت های آن، امری بسیار دشوار است. در این مقاله با استفاده از کنترل کننده مد لغزشی بهینه، کنترل سرعت این موتور انجام گرفته است. با استفاده از ساختار آبشاری، بزرگترین عیب این موتور یعنی ریپل گشتاور کاهش پیداکرده است. کنترل کننده پیشنهادی، با تبدیل مساله کنترل مد لغزشی مرتبه اول به مساله بهینه سازی و با حل بی درنگ آن با شبکه عصبی بازگشتی تصویر، سیگنال کنترلی بهینه ای تولیدکرده که چترینگ نداشته و در عین حال شرط لغزش را برآورده می کند. عملکرد کنترل کننده پیشنهادی درمقایسه با سایر کنترل کننده ها در قالب شبیه سازی صورت گرفته و اثربخشی آن نشان داده شده است.

    کلیدواژگان: موتور سویچ رلوکتانس، شبکه عصبی بازگشتی تصویر، کنترل کننده بهینه لغزشی
|
  • Alireza Jalalipoor, Reihaneh Kardehi Moghaddam* Pages 1-12

    Bearings only tracking is a challenging issue with many applications in military and commercial areas. In distributed multi-sensor multi-target bearings only tracking, sensors are far from each other, but are exchanging data using telecommunication equipment. In addition to the general benefits of distributed systems, this tracking system has another important advantage: if the sensors are sufficiently spaced apart, the target state is observable and the maneuver is not necessary by sensors. In this work, Multi-sensor multi-target bearings only tracking with decentralized architecture and asynchronous measurements is newly proposed. In this study, with the help of the idea of ​​composite measurements and taking into account the time of measurements in the calculations, while overcoming the asynchronous of the measurements, the nonlinear effects in the measurement equation are also eliminated. Also, diffusive filtering is used to exploit the information of neighboring sensor agents to improve the estimates. The simulations show that the system designed in this research can well detect targets and track them with acceptable accuracy.

    Keywords: Bearings-only Tracking, Multi-Agent Systems, Decentralized Systems, Cooperative Control, Diffusive Filters
  • Seyed Ali Khoshroo, Seyed Hossein Khasteh* Pages 13-23

    To accelerate the learning process in high-dimensional learning problems, the combination of TD techniques, such as Q-learning or SARSA, is usually used with the mechanism of Eligibility Traces. In the newly introduced DQN algorithm, it has been attempted to using deep neural networks in Q learning, to enable reinforcement learning algorithms to reach a greater understanding of the visual world and to address issues Spread in the past that was considered unbreakable. DQN, which is called a deep reinforcement learning algorithm, has a low learning speed. In this paper, we try to use the mechanism of Eligibility Traces, which is one of the basic methods in reinforcement learning, in combination with deep neural networks to improve the learning process speed. Also, for comparing the efficiency with the DQN algorithm, a number of Atari 2600 games were tested and the experimental results obtained showed that the proposed method significantly reduced learning time compared to the DQN algorithm and converges faster to the optimal model.

    Keywords: Deep Neural Networks, Deep Q Networks (DQN), Eligibility Traces, Deep Reinforcement Learning
  • Sanaz Sabzevari, AhmadReza Vali*, MohammadReza Arvan, Seyyed Mohammadmehdi Dehghan, MohammadHossein Ferdowsi Pages 25-41

    Designing the estimator that can determine the attitude with a single sensor is vital due to the limited weight and volume in the nano-satellite, the problems caused by the limited lifetime of the mechanical gyroscope in the long term and the eclipse phenomenon. To compensate for data deficiency, a two-nested filter has been utilized in this paper. To this end, the attitude in the second filter is estimated using the sensor data and the magnetic field derivative estimation from the first filter by the extended Kalman filter. Two stochastic algorithms named as multiplicative extended Kalman filter and square-root unscented quaternion estimator are compared with the proposed symmetry-preserving nonlinear observer in order to obtain an appropriate accuracy for determining the attitude of the nano-satellite, which has only a three-axis magnetometer. The proposed method is based on invariant observers under the action of the Lie group. The moving frame approach has been used so that the observerchr('39')s parameters can be adjusted through the invariant error dynamic equations. Simulation results confirm an acceptable accuracy in all three algorithms for both time and frequency response analyses. However, the root mean square error of the attitude error with a nonlinear observer is much less than the stochastic algorithm in case of a larger initial estimation error. Furthermore, this approach guarantees convergence by the Lyapunov stability proof owing to setting the parameters with periodic differential Riccati equations.

    Keywords: Nano-satellite attitude determination, only magnetometer data, stochastic quaternion estimators, symmetry preserving nonlinear observer
  • Robab Ebrahimi Bavili, Ahmad Akbari*, Reza Mahboobi Esfanjani Pages 43-54

    This paper addresses the asymptotic stability, position and force tracking problem in the nonlinear bilateral teleoperation system in the presence of non-passive interaction forces, varying time-delay in communication channel and actuators fault occurrence. For this aim, a passive Fault Tolerant Control (FTC) law is presented which uses the joint positions and velocities of local and remote manipulators to reach control ends. Using the Lyapunov-Krasovskii theorem, sufficient conditions for asymptotic stability and position tracking are derived in terms of Linear Matrix Inequalities (LMIs), to tune controller parameters. The main contribution of the proposed method is that can compensate the bias fault and loss of effectiveness of actuators in nonlinear teleoperation system. Also the asymptotic stability of positions errors in the system with non-passive interaction forces is assured using the integral control. Simulation results of teleoperation system with 2 and 3 degrees of freedom manipulators with proposed method and comparison to some rival methods show the effectiveness and advantages of the proposed method.

    Keywords: Bilateral Teleoperation system, Non-passive Interaction Forces, Actuator Fault, Asymptotic Stability, Position, Force Tracking
  • Amin Nikanjam*, Monireh Abdoos, Mahnoosh Mahdavi Moghadam Pages 55-66

    Nowadays, collaborative multi-agent systems in which a group of agents work together to reach a common goal, are used to solve a wide range of problems. Cooperation between agents will bring benefits such as reduced operational costs, high scalability and significant adaptability. Usually, reinforcement learning is employed to achieve an optimal policy for these agents. Learning in collaborative multi-agent dynamic environments with large and stochastic state spaces has become a major challenge in many applications. These challenges include the effect of size of state space on learning time, ineffective collaboration between agents and the lack of appropriate coordination between decisions of agents. On the other hand, using reinforcement learning has challenges such as the difficulty of determination the appropriate learning goal or reward and the longtime of convergence due to the trial and error in learning. This paper, by introducing a communication framework for collaborative multi-agent systems, attempts to address some of these challenges in herding problem. To handle the problems of convergence, knowledge transfer has been utilized that can significantly increase the efficiency of reinforcement learning algorithms. Cooperation and Coordination and between the agents is carried out through the existence of a head agent in each group of agents and a coordinator agent respectively. This framework has been successfully applied to herding problem instances and experimental results have revealed a significant improvement in the performance of agents.

    Keywords: Collaborative multi-agent system, Reinforcement learning, Knowledge transfer, Herding problem
  • Mehrdad Rohani, Hassan Farsi*, Seyyed Hamid Zahiri Mamghani Pages 67-79

    Nowadays, one of the most fundamental processes for realization video of contents is the object tracking, in which the process of location the moving object is performed in each video frame. In tracking process, the target must be described by a feature. In this paper, for the purpose of describing the target and removing the appearance sensitivity, the weighted color histogram is used as a target feature in order to reduce the effect of edge pixels on the target feature. This reduces the sensitivity of the algorithm to change deformation, scale variation and rotation, as well as the occlusion on the description of target feature. In the proposed method, particle swarm optimization algorithm has been used for search process. Maximization of the similarity function and calculating the minimum Bhattacharyya distance are used to determine target location. The fuzzy control parameters are used for the particle swarm optimization algorithm, which provides a novel method, which can regulate each control parameter and update according to the different states of each particle in each generation. The improved particle swarm algorithm is evaluated with 11 benchmark functions. The obtained results by improved algorithm show that appropriate convergence in a low number of iterations. The proposed method compared to state-of-the-art methods provides high performance in the success and precision rate on the OTB50 dataset.

    Keywords: Object tracking, Improved particle swarm optimization algorithm, Weighted color histogram feature
  • Amir Parviz Valadbeigi, Ali Khaki Sedigh*, Frank.L Lewis, Ali Moarefian Poor Pages 81-92

    : The Robust Cooperative Output Consensus (RCOC) in continuous time Heterogeneous Multi-Agent Systems with the directed graph is addressed. In the standard solution of the RCOC, the p-copy internal model method is used. This method requires dynamical equations of the agents and the leader. In the present paper, based on the equivalent auxiliary system method, a new auxiliary system is obtained. Then, the RCOC is transformed to a control problem. Moreover, a model-free algorithm is proposed to solve the Robust Algebraic Riccati Equation using the Integral Reinforcement Learning (IRL) method. It is shown that the proposed method satisfies the output regulation equations. A simulation example verifies the effectiveness of the proposed method.

    Keywords: Robust Cooperative Output Consensus, Equivalent Auxiliary System, Control, Reinforcement Learning
  • Jafar Taheri Kalani*, Gholamreza Latif Shabgahi, Mahdi Alyari Shooredeli Pages 93-105

    Alarm systems are essential in safe operation of industrial plants. Since many process variables are interacting with each other, so in this paper, a new method are introduced to design and analysis of a multivariate alarm system. In this method, the alarm system is designed base on joint indices. The Joint FAR and Joint MAR are defined for a m-variable alarm system thanks to multivariate Markov scheme. In proposed method, the alarm joint indices are defined by solving a Linear Programing (LP) optimization problem. By defining joint indices, tuning of the alarm parameters (like, threshold and etc.) can be done by these indices instead of correlation analysis. In this paper, penalty scenario and Genetic algorithm are used for alarm generation, and parameter optimization in Tennessee Eastman (TE) Process. The results of proposed method are compared with other methods.

    Keywords: multivariate alarm system, multivariate markov, joint FAR, joint MAR
  • Alireza Nasiri, Ahmad Baranzadeh, Farzan Rashidi* Pages 107-118

    This paper proposes robust  output feedback control stabilization for uncertain Takagi–Sugeno (T-S) fuzzy systems via linear matrix inequalities (LMIs). In order to reduce the conservatism associated with T-S fuzzy system, a new form of non-monotonic Lyapunov functions is used. In the non-monotonic approach, the monotonic decrease of the Lyapunov function is relaxed which enables it to increase locally but vanish eventually. Based on the non-monotonic Lyapunov function approach, sufficient conditions for the existence of robust  output feedback control stabilization are derived. The proposed design technique is shown to be less conservative than the existing non-monotonic approach, namely, -samples variations of Lyapunov function. The effectiveness of the proposed approach is further illustrated via numerical example.

    Keywords: nonlinear system, T-S fuzzy model, output feedback, non-monotonic Lyapunov function, H, ∞ ‎
  • Tohid Rahimi*, GholamAli Alizadeh, MOHSEN Hasan Babayi Nozadia Pages 119-131

    Micro grids are regarded to be crucial due to the development of communication facilities, production equipment, power storage and high utilization of renewable energy. However, micro grids are faced with the problem of frequency fluctuations in island mode because of high fluctuations in the production power of renewable sources. In this paper, the super capacitor has been used to increase the virtual inertia of the network along with the control system for energy storage and production systems in order to overcome the challenge mentioned earlier. Meanwhile, the optimal value of communication systems delay is also considered in the frequency settings of the micro grid.The system frequency behavior is simulated against load and power generation variations to evaluate the performance of the proposed strategy. Given the increased cost of the system due to increased super capacitor capacity and the reduction of communication  delay against the improvement of micro grid frequency fluctuations, a multi-objective optimization method is used to regulate the load frequency (LFC) controllers parameters and  achieve minimum cost. The simulations of the network in question have been carried out in MATLAB / SIMULINK software. In this article, the cost reduction of operation of the microgrid due to the low capacity of the installed supercapacitor unit and communication systems with acceptable delay achievement are the most important innovational aspects of the current research. Furthermore, no battery units are required in the current paper thanks due to the presence of the supercapacitor. Batteries may cause problems for the network due to their low life and high maintenance costs. Simulation results have demonstrated that the system with optimal control parameters values, super capacitor capacity and communication s system delay has been able to overcome load and power generation disturbances, and the system frequency behavior is significantly improved in comparison with the non-optimal state

    Keywords: Micro grid, Multi-objective Optimization, Telecom System Delay, Virtual Inertia, Load Frequency Control
  • Arash Jodaei*, Jamal Saffar Ardabili Pages 133-141

    This paper, studies the controller design for containment problem for a class of multi-agent systems with identical time-invariant continuous-time nonlinear dynamics and fixed directed communication graph. In this problem, the lyapunov stability theorem, the graph theory and matrix linear inequality are used. The agents are divided into two groups of leaders and followers. In containment problem, all the followers are controlled under which will asymptotically converge to the convex hull spanned by the leaders so distributed communication protocol with fixed time delay is considered and four-step algorithm is proposed for obtaining parameters and gain matrix. The above case is proved to be sufficient condition under theorem. To illustrate the reliability and efficiency of the proposed method, numerical example with simulations are presented.

    Keywords: Multi-Agent Systems, Containment, Leader, Follower
  • MohammadJavad Shekari, Mohammad Farrokhi*, Davood Arad Khaburi Pages 143-154

    The increasing expansion of automation has led to increasing the use of electric motors. that makes the main power of many instruments. The Switched Reluctance Motor, as a kind of synchronous motors, has many advantages and can be used instead of other motors to eliminate their problems. speed control of this motor is very difficult due to nonlinearities, time variant, and uncertainties. In this article, the speed control of SRM is considered by using an optimal sliding mode controller. Using the cascade structure, the biggest defect in SRM, the torque ripple, is reduced. The proposed controller, by converting the first-order sliding mode control problem to the optimization problem, and with its real-time solution by projection recurrent neural network, produces an optimal control signal that does not have chattering, but satisfies the sliding condition. evaluation of The proposed controller with other controller is carried out by simulation and its effectiveness is shown.

    Keywords: Switched Reluctance Motor, Projection Recurrent Neural Network, Optimal Sliding Mode Controller