فهرست مطالب

پردازش سیگنال پیشرفته - سال چهارم شماره 2 (پیاپی 6، پاییز و زمستان 1399)

مجله پردازش سیگنال پیشرفته
سال چهارم شماره 2 (پیاپی 6، پاییز و زمستان 1399)

  • تاریخ انتشار: 1400/11/16
  • تعداد عناوین: 12
|
  • میتر ا پیروحسینی نژاد، اعظم کرمی* صفحات 159-170
    در سال های اخیر تشخیص اشیاء کوچک با استفاده از تکنیک های یادگیری عمیق در بسیاری از کاربردهای عملی مورد توجه خاص قرار گرفته است و امری چالش برانگیز می باشد، زیرا اشیاء کوچک در تصاویر وضوح کمی دارند و حاوی اطلاعات دقیق نیستند. در این مقاله یک آشکارساز دومرحله ای جدید مبتنی بر تشخیص اشیاء با هرم ویژگی بازگشتی و نرخ  Atrousبا استفاده از آشکارساز (DetectoRS) جهت تشخیص هوشمند عیوب کوچک و مهم خطوط انتقال برق معرفی شده و معماری DetectoRS در این راستا به طور کامل اصلاح شده است. در روش پیشنهادی DRSPTL از Cascade R-CNN  با  ResNext-101جهت افزایش دقت در تشخیص عیوب کوچک استفاده شده است. در این مقاله تصاویر RGB با وضوح بالا توسط پهپاد از خطوط انتقال شرکت های برق منطقه ای تهران، کرمان، شیراز، اصفهان و اهواز تهیه شده، و مجموعه داده های آموزش و تست مربوط به عیوب توسط گروهی از متخصصین آماده شده است. برای ساخت داده های آموزش، تقریبا 80% از کل مجموعه تصاویر حاوی عیوب کوچک، انتخاب و برچسب گذاری شدند. DRSPTL بالاترین دقت را در مقایسه با دو روش معتبر در زمینه تشخیص اشیاء RetinaNet و RepPoints دارا می باشد. قابل ذکر است که با توجه به نتایج بدست آمده می توان با شناسایی اتوماتیک عیوب و جلوگیری از وقوع بسیاری از قطعی های برق، باعث کاهش چشمگیر زمان و هزینه شرکت های برق منطقه ای شد.
    کلیدواژگان: یادگیری عمیق، تشخیص هوشمند عیوب کوچک، خطوط انتقال برق، تصاویر پهپادی
  • ندا دهقان، پدرام پیوندی* صفحات 171-183
    اهمیت درک خواص پارچه های سه بعدی اسپیسر، با توجه به کاربردهای بی شمار آن ها در صنایع مختلف، دلیلی بر توسعه روش های سریع و دقیق تعیین خواص است. پارچه های اسپیسر در کاربردهای متعدد، تحت تاثیر نیرو قرار دارند؛ بنابراین شناخت رفتار و تغییر خواص آن ها در مواجه با نیرو دارای اهمیت است. هدف از مقاله حاضر، بررسی تغییر شکل پارچه اسپیسر و تعیین جابجایی های محلی در پارچه، تحت نیروی کششی است. ازاین رو، از روش همبستگی تصاویر دیجیتال که یک روش مرسوم در تعیین جابه جایی ها و تغییر شکل یک سازه تحت بارگذاری خارجی است، استفاده شد. رفتار تغییر شکل ساختار پارچه اسپیسر با طرح واحد لوزی در دو جهت رج و ردیف، با استفاده از روش تجربی و در روش تیوری با استفاده از پردازش ویدیو و روش همبستگی تصاویر دیجیتال بررسی شد. با استفاده از پردازش ویدیو، تغییر شکل واحد در پارچه، توزیع جابجایی های محلی و میزان کرنش طولی و عرضی پارچه، تعیین و با روش تجربی مقایسه گردید. مقایسه نتایج حاصل از پردازش با نتایج تجربی نشان داد که روش پردازش ویدیو قادر به محاسبه جابه جایی محلی در تمام قسمت های پارچه و پیش بینی میزان کرنش طولی و عرضی در کشش های مختلف با خطای کمتر از 10% است.
    کلیدواژگان: همبستگی تصاویر دیجیتال، پارچه اسپیسر، جابه جایی محلی، خواص کششی
  • مصطفی رعیتی فرد، مهدی محرابی*، محمد قنبری صفحات 185-196
    رشد سریع تعداد و حجم ویدیوها باعث شده که ویدیوها به صورت فایل فشرده ذخیره و ردوبدل شوند. امروزه، نمایه گذاری، جستجو و بازیابی فایل فشرده ویدیو از اهمیت بالایی برخوردار است. اولین گام در تحلیل، جستجو و بازیابی ویدیو، قطعه بندی زمانی ویدیوها، به مجموعه های معنادار و قطعه های قابل مدیریت یا همان شات است. در سال های اخیر استاندارد جدید فشرده سازی ویدیو H.265 به وجود آمده است که نیاز به گسترش و تولید روش هایی جهت تحلیل و بازیابی ویدیو در این استاندارد شدیدا احساس می گردد. در این مقاله روشی برای قطعه بندی زمانی و تشخیص شات در ویدیو فشرده شده با استاندارد H.265 بدون غیر فشرده سازی کامل با استفاده از نوع خاصی از اطلاعات کدگذاری یعنی پرچم های تبدیل که تا کنون استفاده نشده ارایه شده است. در این روش مقادیر ضرایب غیر صفر پرچم های ماکرو بلوک های تبدیل قاب ها، که در سرایند رشته بیت فشرده وجود دارد محاسبه و در نهایت با یک آستانه مناسب، مرز شات تشخیص داده می شود. آزمایش ها نشان می دهد روش ارایه شده با دقت 80% و فراخوانی 3/84 % بدون غیر فشرده سازی ویدیو، شات ها را تشخیص دهد.
    کلیدواژگان: استاندارد ویدیویی HEVC، H.265، حوزه فشرده، تشخیص شات، قطعه بندی ویدیو
  • دلاور زارعی، محمدعلی بالافر*، محمدرضا فیضی درخشی صفحات 197-211

    رمزگذاری یکی از قدرتمندترین ابزارهایی است که امنیت اطلاعات را در حوزه ارتباطات و فناوری اطلاعات تضمین می کند. رمزگذاری تصویر از سایر رمزگذاری ها متفاوت است. این تفاوت به دلیل ویژگی های ذاتی تصاویر است. آخرین تلاش ها در زمینه ی رمزگذاری تصاویر بر پایه ی آشوب بوده است. در این مقاله، یک الگوریتم جدید رمزگذاری مبتنی برآشوب برای رمزگذاری تصویر ارایه شده است. در روش پیشنهادی به جای رمزگذاری یک تصویر در هر مرحله، چهار تصویر به صورت هم زمان رمزگذاری می شود. به این ترتیب که چهار تصویر استاندارد با همدیگر ترکیب شده و یک تصویر واحد از ترکیب آن ها به وجود می آید. رمزگذاری هم زمان چهار تصویر باعث پیچیده تر شدن الگوریتم رمزگذاری پیشنهادی، افزایش امنیت و همچنین گستردگی تغییر مقدار سطح خاکستری هر پیکسل خواهد شد. از نگاشت لجستیک آشوب برای تولید کلید و همچنین جابجایی بلوک های تصویر و تغییر مکان آن ها استفاده می شود. در نهایت تصویر حاصل با کلید رمزگذاری، XOR شده و تصویر رمزگذاری شده تولید می گردد. با توجه به ترکیب چهار تصویر و رمزگذاری هم زمان آن ها و بررسی تعداد زیادی از معیارهای ارزیابی تصویر ازجمله معیار آنتروپی اطلاعات که مقدار آن در الگوریتم پیشنهادی ما عدد9994/7 به دست آمده است و به مقدار ایده آل 8 بسیار نزدیک است، نشان می دهد که الگوریتم پیشنهادی ما از عملکرد خوبی برخوردار است.

    کلیدواژگان: امنیت اطلاعات، رمزگذاری تصویر، نگاشت لجستیک آشوب، بلوک بندی تصویر
  • علی فهمی جعفرقلخانلو، موسی شمسی* صفحات 213-224
    بخش بندی تصویر چهره یک مولفه ی ضروری در کاربردهای پردازش تصویر و بینایی کامپیوتر نظیر شناسایی چهره، شناسایی هویت و آنالیز جراحی پلاستیک چهره است. یکی از مهم ترین روش های بخش بندی تصاویر چهره،  روش های مبتنی بر خوشه بندی هستند. نگاشت خودسازمان ده (SOM) جزء پرکاربردترین روش مبتنی برشبکه های عصبی در داده کاوی است. عیب مهمی که الگوریتم SOM استاندارد دارد این است که ضریب یادگیری در آن وفقی نیست. وفقی بودن ضریب یادگیری در به روزرسانی وزن های نگاشت خودسازمان ده منجر به بهتر شدن عمل کرد این الگوریتم خواهد شد. شبکه ی عصبی گازی (NGN) یک یادگیری بدون ناظر بوده که ساختار همسایگی در آن وفقی بوده و وزن سیناپسی مستقل از هر گونه تنظیم توپولوژیکی به روزرسانی می شود. هدف اصلی این پژوهش، ارایه ی روش هیبریدی جدید SOMNGN است که در آن بتوان ضریب یادگیری در فاز تطبیق الگوریتم SOM استاندارد را با استفاده از الگوریتم NGN وفقی کرد. همچنین، دو فضای رنگی شامل YCbCr و فضای نگاشت چهره به عنوان مرحله ی پیش پردازش جهت مدل کردن پوست چهره به کار گرفته شده است. نتایج به دست آمده در فضاهای رنگی ذکر شده نشان می دهند که الگوریتم پیشنهادی نسبت به SOM استاندارد دقت بالاتری در آشکارسازی صحیح پیکسل های پوست چهره دارد.
    کلیدواژگان: فضای رنگی، خوشه بندی، تصاویر رنگی چهره، بخش بندی پوست چهره، شبکه ی عصبی گازی، نگاشت خودسازمان ده
  • علی کارساز*، صبورا محمدیان روشن صفحات 225-237
    دیابت چشمی به عنوان یکی از عوارض مهم دیابت، باعث آسیب به شبکیه چشم بیمار شده و تشخیص دیرهنگام آن حتی می تواند موجب نابینایی گردد. برخی از روش های دسته بندی مبتنی بر یادگیری ماشین بر اساس استخراج داده های تصاویر شبکیه به صورت دستی بوده و توسط متخصصین پردازش تصویر صورت می پذیرد. در سال های اخیر روشی جدید برای تشخیص و طبقه بندی تصاویر شبکیه چشم بدون نیاز به استخراج ویژگی های آن به صورت دستی مبتنی بر شبکه های عصبی کانولوشنال (CNN) ارایه شده است. در زمینه تشخیص و تصویربرداری پزشکی، به علت کمبود داده های طبقه بندی شده و زمان بر بودن فرآیند آموزش تا یک همگرایی مناسب، آموزش یک شبکه CNN از ابتدا دشوار بوده بنابراین یک روش متداول برای آموزش شبکه های CNN در حوزه پزشکی، بر اساس تنظیم مجدد شبکه های از پیش آموزش یافته، می باشد. برای این منظور در این مقاله، شبکه از پیش آموزش داده شده گوگل نت (GoogLeNet) به عنوان یکی از قوی ترین شبکه های عصبی کانولوشنال بر روی تصاویر شبکیه چشم بانک اطلاعات چشم پزشکی کگل (Kaggle Database) جهت تشخیص رتینوپاتی دیابتی اعمال می شود. همچنین جهت ارزیابی کلینیکی ساختار پیشنهادی، شبکه آموزش دیده جهت تشخیص دیابت چشمی بر روی 101 تصویر شبکیه از کلینیک تخصصی چشم پزشکی نوید دیدگان با موفقیت اعمال گردید.
    کلیدواژگان: دیابت شبکیه، شبکه های عصبی کانولوشنال، شبکه گوگل نت، بانک اطلاعات چشم پزشکی کگل
  • محمد لاری*، محمدحسین مختاری صفحات 239-249

    بهبود عملکرد سیستم های رله با استفاده از الگوهایی همانند تخصیص توان نیازمند دسترسی به ضرایب لحظه ای کانال است. استخراج این اطلاعات از کانال مخابراتی همواره با خطا مواجه می شود و این خطا علاوه بر اینکه الگوی بهینه سازی سیستم های رله را برهم می زند، بخش های نامطلوب در سیگنال دریافتی را در گیرنده افزایش می دهد. رله های بهره ثابت و متغیر هرکدام با توجه به نوع عملکرد، تاثیرپذیری متفاوتی نسبت به خطای تخمین ضرایب کانال دارند. در این مقاله با بررسی دقیق تاثیر خطای تخمین ضرایب کانال با توجه به الگوی تخمین و الگوی ارسال سمبل های آموزشی، تخصیص توان مناسبی برای کاهش اثرات بخش های نامطلوب در رله های بهره ثابت و بهره متغیر ارایه خواهد شد. مقالات مرجع در این موضوع برای تخصیص توان همواره از اطلاعات آماری مرتبه دوم استفاده کردند اما در این مقاله از ضرایب تخمینی استفاده خواهد شد. با توجه به پیچیدگی بیشتر عملکرد رله بهره متغیر در کنترل تاثیر کانال تداخلی در رله تمام دوطرفه، فرم بسته برای تخصیص توان ارایه می شود.

    کلیدواژگان: خطای تخمین، رله تمام دوطرفه، رله بهره ثابت، رله بهره متغیر
  • آذر محمودزاده*، حامد آگاهی صفحات 251-262

    مساله بازشناسی خودکار محتوای دست نوشته ها، همواره مورد توجه بسیاری از محققان بوده است. در این مقاله، یک سیستم ترکیبی برای افزایش دقت تشخیص ارقام دستنویس فارسی ارایه شده است. روش پیشنهادی شامل یک فرایند آمادهسازی و دو مرحله اصلی است. در فرایند آماده سازی، چندین عملیات پیش پردازش بر روی تصاویر انجام شده و پس از استخراج ویژگی ها، از الگوریتم بهینه سازی اجتماع ذرات چندهدفه برای انتخاب ویژگیهای موثر استفاده شده است. آنگاه متناظر هر تصویر، این ویژگیهای بهینه به عنوان داده ورودی به طبقه بندها داده میشود. در مرحله اصلی اول، به کمک مجموعه داده های یادگیری، سه ماشین بردار پشتیبان مختلف ساخته میشود. برای دستیابی به نتایج بهتر، الگوریتم جستجوی گرانشی بهترین جرم تطبیقی، برای تنظیم پارامترهای این ماشینها به کار گرفته شده است. در مرحله اصلی دوم، یک سیستم استنتاج فازی نوع دو بازهای، خروجیهای سه ماشین بردار پشتیبان را دریافت میکند و با ترکیب آنها، تخمین دقیقتری از عدد موجود در تصویر ارایه میدهد. نتایج اعمال روش پیشنهادی به مساله بازشناسی ارقام دستنویس فارسی اسکن شده در پایگاه داده استاندارد HODA نشان داده است که این الگوریتم در مقایسه با سایر روش های موجود، دارای مقادیر بالای دقت، صحت و فراخوان می باشد.

    کلیدواژگان: ارقام دستنویس فارسی، انتخاب ویژگی، ترکیب طبقه بندها، سیستم استنتاج فازی نوع دو بازه ای، طبقه بندی
  • سلیمه مرادی، هادی گرایلو* صفحات 263-278
    در این مقاله یک روش فشرده سازی بااتلاف با قابلیت کنترل نسبی کیفیت سیگنال بازسازی شده برای سیگنال صوتی قلب یا فونوکاردیوگرام (PCG) پیشنهاد شده است که مبتنی بر دو ایده مهم یکی نمونه کاهی و دیگری دوبعدی سازی و تشکیل تصویر PCG است. در فشرده سازی تصویر PCG از تبدیل موجک و یک کدگذار ماتریس ضرایب موجک به نام «موجک درخت فضاگرا» (STW) استفاده شده است. در روش پیشنهادی، قابلیت نسبی کنترل کیفیت سیگنال بازسازی شده به کمک یک آستانه از جنس معیار ارزیابی «ریشه درصدی میانگین مجذور تفاضلات» (PRD) وجود دارد. نتایج شبیه سازی روش پیشنهادی روی چند پایگاه داده قابل دسترس برای همگان نشان می دهد که مرحله نمونه کاهی سهم زیادی در افزایش میزان فشرده سازی به ویژه در مورد پایگاه های داده با فرکانس نمونه برداری بالا دارد. عامل مهم بعدی در بهبود کارایی فشرده سازی روش پیشنهادی، استفاده از دوبعدی سازی سیگنال PCG به منظور استفاده از تزایدهای بین دوره ای موجود در این نوع سیگنال های تکرارشونده، و استفاده از روش های موثر امروزی برای فشرده سازی تصویر است.  کارایی روش پیشنهادی بر طبق معیارهای متوسط PRD و متوسط «نسبت فشرده سازی» (CR) ارزیابی و با نتایج چند روش موجود مقایسه شده است. در این ارزیابی، به ازاء مقدار تقریبی PRD≤5% پایین ترین مقدار متوسط میزان فشرده سازی مربوط به دسته آرتیفکت از پایگاه داده پاسکال (با فرکانس نمونه برداری 2000 هرتز) و بیشترین مقدار متوسط میزان فشرده سازی مربوط به پایگاه داده دانشگاه واشنگتن (با فرکانس نمونه برداری 44100 هرتز) حاصل شده است.
    کلیدواژگان: سیگنال صوتی قلب (PCG)، فشرده سازی سیگنال، نمونه کاهی، قطعه بندی سیگنال PCG، کنترل کیفیت سیگنال
  • مجید مقدری، مینا زلفی لیقوان*، سبلان دانشور صفحات 279-289

    درک صحبت های افراد بدون نیاز به بیان و تنها با استفاده از رمزگشایی سیگنالهای مغزی در هنگام تصور گفتار، یکی از بروزترین تحقیقات در زمینه هوش مصنوعی می باشد. سومین مسابقه ملی واسط مغز و رایانه که توسط مرکز ملی نقشه برداری مغز ایران در سال 1399 برگزار گردید به دسته بندی تصور گفتار برای سه کلمه سنگ، کاغذ و قیچی اختصاص یافت. در این مسابقه نویسندگان این مقاله با استفاده از تجزیه بسته های موجک و الگوی مکانی مشترک و بکارگیری دسته بندهای مختلف توانستند مقام دوم را کسب نمایند. دسته بندهای ماشین بردار پشتیبان،   k-نزدیک ترین همسایه، جنگل تصادفی، رگرسیون لجستیک ، XGBoost و مدل یادگیری عمیق Dense را بصورت جداگانه برای هر فرد و همچنین بصورت همزمان برای تمامی افراد ارزیابی نمودیم و بهترین دقت میانگین 7/51% حاصل شد. در ادامه این مدل را با استفاده از روش اسپکتروگرام و شبکه عصبی کانولوشنی توسعه دادیم و توانستیم به دقت میانگین 5/76% دست یابیم. این دقت از بهترین دقت گزارش شده بر روی این مجموعه داده بسیار بهتر بوده است. همچنین عملکرد این مدل در مقایسه با پژوهش های اخیر در این زمینه بر روی مجموعه داده های مختلف، برتری دارد.

    کلیدواژگان: تصور گفتار، صحبت ذهنی، سیگنال های مغزی، واسط مغز-رایانه، EEG
  • سید سعید موسوی، موسی یوسفی*، خلیل منفردی صفحات 291-301
    این مقاله یک مبدل ترنری به باینری چند رقمی بهینه شده مبتنی بر ترانزیستورهای اثر میدان نانو لوله کربنی ارایه می دهد. با توجه به ویژگیهای منحصر بفرد ترانزیستورهای اثر میدان نانو لوله کربنی همانند امکان طراحی با ولتاژ آستانه های مختلف برای ترانزیستور، طراحی سیستم های منطقی چند ارزشی به مراتب ساده تر و کم هزینه تر می باشد. لذا با توجه به اینکه سیستم های پردازشی موجود با مبنای دو کار می کنند طراحی مبدل های باینری به ترنری و برعکس، سیستم های پردازشی بسیار مهم و اساسی است. در این مقاله  با اصلاح در بخشی از ساختار مداری مبدل ترنری به باینری سه رقمی کارایی سیستم افزایش یافته است. اصلاح مدار باعث کاهش سطح اشغالی تراشه، کاهش توان مصرفی و کاهش تاخیر مدار شده است. عملکرد مناسب و کارایی بهینه مبدل پیشنهادی با استفاده از شبیه سازی توسط نرم-افزار HSPICE و بر مبنای ترانزیستورCNTFET   32 نانومتر تایید شده است. نتایج شبیه سازی نشان می دهد که مبدل ترنری به باینری 3 به 5 بهینه دارای توان مصرفی 665/0 و تاخیر انتشار 3/27 پیکو ثانیه است. این نتایج نشان می دهد به طور کلی شاخص PDP به میزان 4/14درصد بهبود یافته است.
    کلیدواژگان: مبدل ترنری به باینری، منطق چند ارزشی، ترانزیستورهای اثر میدانی نانو لوله کربنی
  • آرش آراوند، قادر کریمیان، جعفر صبحی* صفحات 303-309
    امروزه استفاده از دستگاه های نظارت نوری خودکار در تولید بردهای مدار چاپی برای کنترل کردن لحیم کاری ها، وجود المان ها مقدار صحیح و جهت آن ها به یک ابزار ضروری برای شرکت های الکترونیکی تبدیل شده است. برد مدار چاپی در این دستگاه توسط چندین منبع نوری پرتوافکنی می شود و یک یا چند دوربین با مشخصات بالا برای تصویر برداری استفاده می شود. دستگاه نظارت نوری خودکار، با استفاده از تصویر ثبت شده و مقایسه اطلاعات تصویر با اطلاعات ماشین، هر نوع خطا (نقص) یا نواحی مشکوک را شناسایی و مشخص می کند. در این مقاله با استفاده از یک دوربین نصب شده بالای یک نوار نقاله سعی شده است اغلب خطاهای رایج که بر روی بردهای مدار چاپی در هر مرحله از خط تولید اتفاق می افتد پوشش داده شود. برای کنترل مسیر حرکت دوربین روی نوار نقاله از الگوریتم فروشنده دوره گرد استفاده شده است. برای معرفی برد مدار چاپی به دستگاه، یک نرم افزار طراحی شده است که به کمک یک فایل CAD مکان و نوع المان ها را بر روی برد بدست می آورد و با انتخاب مسیر بهینه حرکت دوربین، خطاهای ناشی از عدم وجود المان ها، جهت المان ها، عدم لحیم کاری، لحیم کاری سرد، لحیم کاری اضافی و غیره را در سه مرحله استخراج ویژگی، انتخاب ویژگی و تصمیم گیری تشخیص می دهد. نتایج نشان می دهد که دستگاه در تشخیص خطای چسب قبل از نصب المان ها و تشخیص خطاهای بعد از حمام قلع کارآمد است
    کلیدواژگان: دستگاه نظارت نوری خودکار، برد مدار چاپی، بینایی ماشین، دسته بندی بر اساس قوانین فازی، دسته بند LVQ و SVM
|
  • Mitra Peyrohoseini Nejad, Azam Karami * Pages 159-170
    Recently, small object recognition based on deep learning techniques has gained particular attention in many practical applications and is challenging because small objects have low resolution and do not contain detailed information.  In this article, a new two-stage detector based on detecting objects with recursive feature pyramid and switchable atrous convolution (DetectoRS) has been introduced to find small and important defects such as loose nut-bolts and missing-nut in power transmission lines (PTL). The architecture of DetectoRS was necessarily modified. The proposed technique which is called DRSPTL, the Cascade R-CNN with ResNext-101 is used to increase the accuracy of small defect detection. In this work, high-resolution RGB images are captured by unmanned aerial vehicles (UAVs) imaging PTL from Tehran, Kerman, Shiraz, Isfahan, and Ahwaz regional electric companies, Iran. The training and test datasets from the captured faulty images are created from annotation by experts. To construct the training dataset, nearly eighty percent of the whole set of faulty images were selected and labeled. The performance of the proposed method with two state-of-the-art object detection techniques RetinaNet and RepPoints has been compared. DRSPTL has the highest small defect detection accuracy. It is noteworthy that the obtained results could significantly reduce the time and cost of electric power companies by detecting the defects automatically and preventing the occurrence of many power outages.
    Keywords: Deep learning, Small Defect Detection, Power Transmission Lines, UAV Images
  • Neda Dehghan, Pedram Payvandy * Pages 171-183
    The importance of understanding three-dimensional spacer fabrics properties, is a reason to the development of rapid and accurate methods for determining properties, due to their numerous applications in various industries. In most applications, spacer fabrics are affected by tension; therefore, knowing their behaviour in the encounter with tension is important. The purpose of this paper is to investigate on deformation of the spacer fabric and determine the local displacements in this fabric under tension. So, the digital image correlation method was used, that is a usual method of determining the displacements and deformation of a structure under external loading. Deformation behaviour of the diamond shape unit the of spacer fabrics structure at different tensile strains, based on experimental observations and theoretical analysis using video processing and digital image correlation method was investigated in the course and wale direction. The fabric unit deformation, the distribution of the local displacements and longitudinal and transverse strain of fabric were determined using video processing and compared with experimental method. Comparison of results showed that video processing method is able to calculate the local displacement in fabric and predict the longitudinal and transverse strain at different tensile strains with an error coefficient less than 10%.
    Keywords: Digital image correlation (DIC), Spacer fabric, Local displacement, Tensile properties
  • Mostafa Rayati Fard, Mahdi Mehrabi *, Mohammad Ghanbaei Pages 185-196
    The huge number and volume of video and video usage have caused most of them saved and transferred as compressed video. Nowadays, indexing, searching and retrieving video directly in compressed domain has been taken great attention. The first step in video indexing and retrieval is segmenting a video into chronological sets and manageable pieces or shots. In recent years, a new video coding standard say H.265 has been introduced and it is needed to develop the methods and algorithms for analyzing, indexing and retrieving H.265 compressed video. In this paper, a novel method has been proposed for shot detection in H.265 compressed video without full decompression. In the proposed method, macro block coding information which is in headers of compressed H.265 bit-stream by a threshold is used for shot detection of compressed video. The results indicate that the proposed method detect video shots in H.265 video by 80% accuracy and 84/3% recall.
    Keywords: HEVC, H.265, compressed domain, shot detection, video segmentation
  • Delavar Zareai, MohammadAli Balafar *, MohammadReza Feizi Derakhshi Pages 197-211

    Encryption is one of the most powerful tools that ensures information security in the field of communication and information technology. Image encryption is different from other encryptions. This difference is due to the inherent characteristics of the images. Recent attempts to encrypt images have been based on chaos. In this paper, a new chaos-based encryption algorithm for image encryption is presented. In the proposed method, instead of encryption one image in each step, four images are encrypted simultaneously. In this way, four standard images are combined and a single image of their combination is created. Simultaneous encoding of four images will cause to complicate the proposed encryption algorithm, increase security, and extend the amount of gray area per pixel. Finally, the resulting image is XORed with encryption key and the encrypted image is generated. Considering the combination of four images and their simultaneous encoding, as well as examining a large number of image evaluation criteria, specifically the information entropy, that has achieved a value equal to 7/9994 in our proposed algorithm, which is really close to the ideal value of 8, shows that the proposed algorithm performs appropriately.

    Keywords: Information security, image encryption, Chaotic logistics map, image blocking
  • Ali Fahmi Jafargholkhanloo, Mousa Shamsi * Pages 213-224
    Facial image segmentation is an essential component in applications of image processing and computer vision such as face recognition, identity recognition and analysis of facial plastic surgery. The clustering based methods are one of the important methods in the facial image segmentation. Self-Organizing Map (SOM) is a powerful method in the data mining. A main disadvantage of the SOM algorithm is that learning coefficient is not adaptive in this algorithm. Adaptability of learning coefficient in the adaptation phase can improve the performance of the SOM clustering. Neural Gas Network (NGN) is an unsupervised learning that its neighborhood structure is adaptive and synaptic weight is updated without any topological adjustment. The main purpose of this study is to present a new hybrid SOMNGN method in which the learning coefficient is adapted in the adaptation phase of the SOM algorithm using the NGN algorithm. Also, two color spaces, including YCbCr and Face Mapping are used for facial skin modelling as a pre-processing step. Obtained results in the mentioned color spaces show that presented method have the higher accuracy than the standard SOM method.
    Keywords: Color Space, Clustering, Facial Color Images, Facial Skin Segmentation, Neural Gas Network, Self-organizing map
  • Ali Karsaz *, Sabora Mohammadian Roshan Pages 225-237
    Diabetic Retinopathy (DR) is one of the major complications of Diabetes, which is the injury to the retina of the diabetic patient and causes blindness if not diagnosed in early stages. Various machine learning classification and clustering approaches have been studied in literature with the purpose of improving the accuracy of the screening methods. Some of machine learning classification and clustering approaches are based on manually feature extraction of fundus images by image processing experts. In recent years, a new approach for image classification and diagnosis without using any manual feature extraction is proposed based on convolutional neural network (CNN). In medical imaging and diagnosis, training a deep CNN from scratch is difficult because it requires a large amount of labeled training data and the training procedure is a time consuming task to ensure proper convergence. Therefore, a very common method to train CNNs for medical diagnosis is fine-tuning a pre-trained CNN. In this paper, the pre-trained GoogleNet as a powerful CNN is employed on the Kaggle database for DR diagnosis from retinal images. To assess the efficacy of the clinical results, the proposed CNN algorithm is performed to diagnose DR from the images that are gathered from the the Navid-Didegan ophthalmology clinic.
    Keywords: diabetic retinopathy, Convolutional neural network (CNN), GoogleNet, Kaggle retinopathy database
  • Mohammad Lari *, MohammadHossein Mokhtari Pages 239-249

    Improving the performance of relay systems using patterns such as power allocation requires access to instantaneous channel coefficients . extraction of this information is always prone to errors and this error increases the undesirable portions of the received signal in the receiver , in addition to disrupting the relay system optimization pattern . the Fixed and variable Gain relays , according to the type of operation , have different effect on the estimation error of channel coefficients . in this paper , with a detailed examination of the effect of the estimation error of channel coefficients according to the pattern of estimation , suitable power allocation is proposed to reduce the effects of undesirable segments in the Fixed and variable Gain operation. Reference papers in this matter for power allocation always use second - order statistical data but in this paper , the estimated coefficients will be used . due to the complexity of the performance of the variable gain relay in control of the interference channel effect in two-way relay , the closed form for power allocation is presented.

    Keywords: Error estimation, Full-Duplex relay, Fixed Gain relay, Variable gain relay
  • Azar Mahmoodzadeh *, Hamed Agahi Pages 251-262

    The problem of automatic handwritten context recognition has received considerable attention of many researchers. In this paper, a fusion system is proposed to enhance the recognition accuracy of Farsi handwritten digits. The proposed approach consists of a prepration process and two main phases. In the prepration process, some pre-processing operations are performed on the image. Then some features are extracted, among which a multi-objective particle swarm optimization selects more effective ones. For every image, these optimal features are given as the input data to the classifiers. In the first main phase, training datasets are used to construct three different SVMs. In order to achieve better results, the adaptive best-mass gravitational search algorithm is utilized to adjust the SVMs parameters. In the second main phase, an interval type–II fuzzy inference system receives the SVMs outputs and by combining them, it presents a more accurate estimation of the digit in the image. The results of applying the proposed approach to the problem of scanned Farsi handwritten digits in the standard HODA database demonstrated that this algorithm attains high accuracy, precision and recall performance indices, comparing to other existing methods.

    Keywords: classification, classifiers ensemble, Farsi handwritten digits, feature selection, interval type–II fuzzy inference system
  • Salimeh Moradi, Hadi Grailu * Pages 263-278
    In this paper, a lossy compression method with the ability to control the quality of the reconstructed signal is proposed for phonocardiography (PCG) signals. It is based on two main ideas: down-sampling and two-dimensionalization. For PCG image compression, wavelet transform and Spatial-oriented Tree Wavelet (STW) encoder are used. In the proposed method, there is the ability to control the quality of the reconstructed signal using a Percent Root-mean-square Difference (PRD)-related threshold. The simulation results of the proposed method on some public databases indicates that the down-sampling stage has a significant effect on increasing the compression ratio especially in the case of databases with high sampling frequency. The next important factor in improving the compression efficiency of the proposed method is the use of two-dimensional PCG signal in order to take advantage of the inter-period redundancy in this type of repetitive signals, and using modern effective methods for image compression. The efficiency of the proposed method was evaluated according to the average PRD and Compression Ratio (CR) criteria and compared with the results of several existing methods. In this evaluation, while limiting PRD≤5%, the lowest average compression ratio was related to the Artifacts dataset from the Pascal database (with a sampling frequency of 2000 Hz) and the highest average compression ratio was related to the database of the University of Washington (with a sampling frequency of 44100 Hz).
    Keywords: Heart sound (PCG), Signal Compression, Down-sampling, PCG Segmentation, Quality control
  • Majid Moghaddari, Mina Zolfy Lighvan *, Sebelan Danishvar Pages 279-289

    Recognition of silent speech only by decoding brain signals is one of the latest research in the field of artificial intelligence. The 3rd Iranian national brain-computer interface competition, which was held by the National Brain Mapping Center of Iran in 2020, was dedicated to the classification of imagined speech for the three words of rock-paper-scissors game. In this contest, the authors introduced an approach based on wavelet packets decomposition and common spatial pattern and could win the second place. We evaluated some of the most famous classifiers including support vector machine, k-nearest neighbor, random forest, logistic regression, XGBoost and dense deep learning model separately for each subject and simultaneously for all subjects. The best average accuracy was 51.7%. Then we developed the model using spectrogram and convolutional neural network and achieved average accuracy of 76.5%. The accuracy was much better than the accuracy reported by other researchers on this dataset. Also, the performance of our model is superior to recent research in this field on different datasets.

    Keywords: Speech imagination, Mental speech, Brain signals, Brain-computer interface, EEG
  • Seyed Saeed Moosavy, Mousa Yousefi *, Khalil Monfaredi Pages 291-301
    This paper presents an optimized multi-digit Ternary to Binary converter based on nano-carbone tubes field-effect transistors. By modifying a part of the circuit structure of the ternary-to-binary converter, the efficiency of the system has increased. Due to the unique features nanotubes carbon tubes feild effect transistors, as well as the possibility of designing different threshold voltages for transistors, designing multi-level logic systems is much simpler and less costly. Therefore, considering that the existing processing systems work on a dual basis, the design of binary to bernary converters and vice versa is very important and basic processing systems. Therefore, considering that the existing processing systems work on a binary, the design of binary to turner and turner to binary converters is very important and fundamental in processing systems. The circuit modification has reduced chip occupancy, reduced power consumption, and reduced circuit latency. The proper and optimal performance of the proposed converter have been confirmed by simulation by HSPICE software based on 32 nm CNTFET transistor. The simulation results show that the optimal terbnary to binary converter has a power consumption of 0.665 μW and a propagation delay of 27.3 ps. These results show that overall PDP index has improved by 14.4%.
    Keywords: Ternary to Binary Converter, Multi level Logic, carbon nanotube field effect transistors
  • Arash Aravand, Ghader Karimian, Jafar Sobhi * Pages 303-309
    Today, the use of automated optical inspection systems in the production of printed circuit boards to control solders, the presence of the right elements and their direction has become an essential tool for electronic companies. The printed circuit board in this system is irradiated by several light sources and one or more high-definition cameras are used for imaging. Automated optical inspection system, using the recorded image and comparing the image information with the machine information, detects and specifies any type of error (defect) or suspicious areas. In this paper, using a camera mounted on a conveyor, we try to cover most of the common errors that occur on printed circuit boards at any stage of the production line. The traveling salesman algorithm is used to control the movement of the camera on the conveyor. To introduce the printed circuit board to the system, a software has been designed that uses a CAD file to obtain the location and type of elements on the board. By selecting the optimal camera movement path, it detects errors due to the absence of elements, direction of elements, lack of soldering, cold soldering, excessive soldering, etc. in three stages of feature extraction, feature selection and decision making. The results show that the device is efficient in detecting glue error before installing the elements and detecting errors after tin bath
    Keywords: automated optical inspection, printed circuit board, Machine vision, fuzzy rule-based classification, LVQ, SVM classifier