فهرست مطالب

  • سال ششم شماره 2 (پاییز و زمستان 1398)
  • تاریخ انتشار: 1398/12/01
  • تعداد عناوین: 12
|
  • مریم تقی زاده، عبدالله چاله چاله* صفحات 1-13

    یکی از روش های  موثر برای شناسایی دیداری  (شامل طبقه بندی، شناسایی اشیاء و برچسب گذاری معنایی تصویر)، تعیین ناحیه های محتمل بر وجود شیء بنام نامزدهای شیء (Object proposals) است. در این مقاله یک روش کارآمد با تکیه بر تعیین ناحیه های موثر مبتنی بر قطعه بندی ناحیه ای به نام بسط دو گانه سوپرپیکسل SDE (Superpixel Dual Extension)  به منظور بهبود کیفیت ناحیه بندی پیشنهاد شده است. روش پیشنهادی شامل دو مرحله است. در مرحله ی ابتدایی با اعمال الگوریتم قطعه بندی پایین به بالا تصویر با تعدادی ناحیه به عنوان سوپرپیکسل نمایش داده می شود. سپس هر سوپرپیکسل با توجه به هشت همسایگی و بر اساس مجموعه ای از شرایط تعریف شده به ناحیه های مجاور خود بسط داده میشود. از امتیازات این بسط ایجاد ناحیه هایی است که به خوبی می تواند کل یک شیء را در برگیرد. سپس با اعمال توصیفگرهایی نظیر رنگ، بافت و نقاط کلیدی و استخراج ویژگی از هر ناحیه، این ناحیه ها می توانند برای حل مسائل مختلف پردازش تصویر و بهبود کارایی آنها بکار گرفته شوند. در این مقاله، برای بررسی دقیق کیفیت ناحیه های به دست آمده، مجموعه ای از معیارهای شناخته شده قطعه بندی ناحیه ای شامل میزان همپوشانی ناحیه، مقدار فراخوانی، مساحت زیر نمودار پارامتر فراخوانی و همبستگی جفت پیکسل ها اندازه گیری شده اند. همچنین برای ارزیابی روش پیشنهادی، تاثیر این روش در دقت طبقه بندی اشیاء بر روی مجموعه داده MSRC بررسی شده است. نتایج، افزایش کیفیت و دقت را هم برای ناحیه های به دست آمده به میزان 7% برای الگوریتم قطعه بندی مبتنی بر گراف و 14 % برای الگوریتم قطعه بندی مبتنی بر خوشه بندی و همچنین مقدار 11 % افزایش دقت را برای طبقه بندی تصویر تایید می کند.

    کلیدواژگان: بسط، سوپرپیکسل، قطعه بندی ناحیه ای، طبقه بندی
  • لیلا الله یاری، سعید سهرابی*، اسماعیل نجفی صفحات 15-26
    هدف اصلی این مقاله ارائه‎ی یک الگوریتم نهان نگاری در حوزه کانتورلت است که در آن نهان نگاره از طریق الگوریتم آشوبناک در ‏ضرایب کانتورلت انتخابی درج می شود. ایده‎ی اصلی این روش درج داده در زیر باندهایی است که مقاومت بالا به همراه گسترش ‏طیفی بهتر نسبت به سایر زیر باندها داشته باشد. روش پیشنهادی در این مقاله که مبتنی بر تبدیل کانتورلت است، روشی سریع و مقاوم ‏در برابر انواع حملات متداول نهان نگاری از قبیل فشرده سازی، افزودن نویز، عبور از فیلتر و تغییر اندازه تصویر ارائه ‏می‎دهد.‏‎ ‎نتایج تجربی، برتری عملکرد آن نسبت به روش مشابه در حوزه‎ی موجک و برخی نتایج حاصله از کارهای انجام شده در ‏حوزه کانتورلت را نشان می‎دهد
    کلیدواژگان: نهان‏نگاری، کانتورلت، نگاشت آشوبناک، مقادیر تکین
  • حسن علی کرمی، فرزین یغمایی*، محمدجواد فدایی اسلام صفحات 27-41
    در زمینه تخمین و ساخت اسکلت حالت سه بعدی بدن انسان از طریق بندهای بدن (body joints) بوسیله یک تصویر دوبعدی، چالش های عمق و خودانسدادی وجود دارد که مانع از تخمین دقیق می گردد. در این مقاله به تخمین حالت سه بعدی بدن انسان با دو رویکرد مختلف پرداخته شده است. بدین منظور، رویکرد اول پیشنهادی با تمرکز بر عمق حالت دوبعدی حقیقت اصلی بوسیله کدگذاری و بازنمایی تنک و تصحیح گر مبتنی بر مدل، حالت سه بعدی بدن انسان استخراج می شود. در رویکرد دوم پیشنهادی به کمک روش مبتنی بر یادگیری شبکه های عصبی کانولوشن، تخمین حالت دوبعدی بدن انسان بدست می آید، سپس بوسیله کدگذاری و بازنمایی تنک و تصحیح گر مبتنی بر مدل، تخمین عمق حالت استخراج می شود. نتایج حاصل از این روش، برتری تخمین حالت و عمق سه بعدی بدن انسان را نسبت به رویکردهای پیشین نشان می دهد. تخمین حالت های سه بعدی انجام شده در روش پیشنهادی نشان می دهد میانگین خطای بازسازی نسبت به کارهای  مشابه کاهش قابل توجهی داشته است
    کلیدواژگان: شبکه های عصبی کانولوشنی، کدگذاری و بازنمایی تنک، اسکلت حالت سه بعدی بدن انسان، تخمین حالت سه بعدی
  • علی قنبری سرخی*، حمید حسن پور، منصور فاتح صفحات 43-59
    امروزه آشکارسازی و برچسب‎زنی اشیاء در تصاویر یکی از چالش‎های اساسی در برخی از کاربردهای بینایی‎ماشین می‎باشد. در سال‎های اخیر استفاده از یادگیری عمیق مورد توجه محققان قرار گرفته است. در همین راستا، در این مقاله ابتدا جدیدترین شبکه‎های عمیق موجود معرفی، سپس نقاط قوت و ضعف آنها تحلیل می شود. در ادامه شبکه‎ای بهبود یافته از شبکه R-FCN ارائه می‎شود. روش پیشنهادی بر پایه معماری ResNet و شبکه تمام کانولوشن است. در این روش، معماری جدیدی مبتنی بر شبکه عمیق برای پیشنهاد ناحیه کاندید و روشی ترکیبی مبتنی بر SVMفازی دوکلاسه و SVR برای آشکارسازی و برچسب‎زنی اشیاء ارائه شده است. در این روش از تابع زیان جدید با عنوان اختلاف کوشی-شوارتز استفاده شده است. این تابع زیان از لحاظ سرعت و دقت، عملکرد بهتری از خود نشان داده است. روش پیشنهادی با معماری 101-ResNet بر روی مجموعه داده SUN برای آشکارسازی و برچسب‎زنی 36 شی مورد آزمایش قرار گرفت و نتایج بدست آمده نشان دهنده بهبود عملکرد این روش نسبت به روش پایه شبکه R-FCN است. روش پیشنهادی از لحاظ معیار mAP، عملکرد 48/38% و مدت زمان متوسط برای هر تصویر 0/13 را دارد، و نسبت به بهترین روش در این حوزه تقریبا 2% در عملکرد و 0/4 ثانیه در زمان بهتر عمل کرده است.
    کلیدواژگان: آشکارسازی و شناسایی اشیاء، یادگیری عمیق، R-FCN، ماشین بردار پشتیبان دودویی فازی، اختلاف کوشی-شوارتز
  • هادی یعقوبی، حمید منصوری*، محمد علی ابراهیمی، حسین نظام آبادی پور صفحات 61-77
    توزیع ابعادی توده سنگ خرد شده، از مهم‏ترین پارامترها در انفجار معادن روباز است که می تواند بر بازدهی عملیات استخراج و فرآوری تاثیر گذار باشد. به منظور ارزیابی نتایج حاصل از انفجار، روش پردازش تصویری دیجیتال یک روش غیر مستقیم سریع و قابل اعتماد است. در این تحقیق بر پایه روش های استخراج ویژگی های دیداری و استفاده از شبکه های عصبی، الگوریتمی جهت تعیین توزیع دانه بندی توده سنگ خرد شده ناشی از انفجار ارائه شده است. تعداد 26 تصویر آزمایشی توده سنگ خرد شده، برای تعیین توزیع اندازه استفاده شده و نتایج حاصله با نتایج روش لبه یابی دستی و خودکار قطعات سنگ در نرم افزار Split- Desktop  مقایسه شد. نتایج به دست آمده یک بهبود کلی را در ارزیابی توزیع اندازه قطعات سنگ نشان داد. کاهش خطای 67%، 57% و 28% به ترتیب با استفاده از روش های فوریه، فیلترهای گابور و موجک حاصل شد. همچنین در ارزیابی اندازه های 10F تا 50F، روش های فوریه، گابور و موجک به ترتیب بهبود 52%، 40% و 21% را نشان داد.
    کلیدواژگان: توزیع دانه بندی، توده سنگ خرد شده، استخراج ویژگی های دیداری تصویر، ارزیابی خردایش
  • مجتبی کردآبادی، محرم منصوری زاده*، حسن ختن لو صفحات 79-88
    روش های یادگیری نیمه نظارتی مبتنی بر گراف اغلب بر روی مسائل تک برچسبی متمرکز و پیاده سازی شده اند، درصورتی که بسیاری از مسائل دنیای واقعی به صورت چندبرچسبی هستند. در این مقاله یک روش نیمه نظارتی ترکیبی بنام LGC+ML-KNN برای برچسب زنی تصاویر به صورت چندبرچسبی ارائه داده ایم که از ترکیب روش یادگیری نیمه نظارتی مبتنی بر گراف (LGC) و یادگیری چندبرچسبی (ML-KNN) تشکیل شده است . روش ارائه شده به دلیل استفاده از یادگیری نیمه نظارتی و مشارکت دادن تمام نمونه ها و پیش بینی برچسب های اولیه و آموزش یادگیر ML-KNN با تعداد نمونه برچسب خورده بیشتر، دارای دقت بهتری نسبت به روش های موجود است. روش ارائه شده روی چندین مجموعه داده استاندارد آزمون شده است. نتایج آزمایش ها نشان می دهد که عملکرد روش ارائه شده بخصوص در مواردی که تعداد نمونه برچسب دار بسیار کم است، به نحو قابل ملاحظه ای بهتر است.
    کلیدواژگان: بازیابی تصاویر، برچسب زنی خودکار تصاویر، یادگیری نیمه نظارتی
  • الهام معین الدینی* صفحات 89-104

    ته نقش گذاری روشی برای جاسازی ته نقش درون یک تصویر دیجیتال به منظور حفاظت از حق طبع و نشر آن است. ته نقش می بایستی دارای دو خاصیت متضاد شفافیت و مقاومت باشد. دو عامل عمده بهبود این دو پارامتر مکان جاسازی ته نقش و تعیین حدود آستانه بهینه برای جاسازی ته نقش در تصاویرمی باشند. در این مقاله یک روش ته نقش گذاری جدید و مقاوم در دامنه تبدیل هادامارد ارائه شده است که جهت انتخاب بلوک ها و حدود آستانه مناسب از  الگوریتم کرم شب تاب ترکیبی(HFA) استفاده می کند.HFA نسخه تغییر یافته الگوریتم کرم شب تاب برای تولید هم زمان  مقادیر گسسته و غیر تکراری جهت انتخاب بلوک ها و مقادیر پیوسته برای انتخاب حدود آستانه است که در این مقاله برای اولین بار ارائه شده و بکار رفته است.در هر بلوک انتخاب شده از تصویر میزبان، پس از انجام تبدیل هادامارد چهار بیت ته نقش با استفاده از حدود آستانه بهینه جاسازی می شوند. بازیابی ته نقش بصورت نیمه کور انجام می شود و تابع هدف الگوریتم بهینه ساز، ترکیبی از میزان شفافیت و مقاومت ته نقش است. این روش هم برای تصاویر خاکستری و هم برای تصاویر رنگی قابل اجرا است. نتایج تجربی نشان دادند که روش ارائه شده نه تنها دارای مقاومت بالایی در برابر حملات گوناگون است بلکه از نظر شفافیت نیز نتایجی بهتر از سایر روش های مشابه موجود تولید می کند.

    کلیدواژگان: ته نقش گذاری، الگوریتم کرم شب تاب، تبدیل هادامارد، حد آستانه
  • الهه علی پور، حمید حسن پور*، منصور فاتح صفحات 105-118
    تاری یکی از خرابی های متداول در تصاویر است. این خرابی به دلیل سرریز اطلاعات یک پیکسل در پیکسل های همجوار آن ایجاد می شود. تاری انواع مختلفی دارد وعدم آگاهی از نوع آن، روش های رفع تاری را در بهسازی تصویر با مشکل مواجه می سازد. در این مقاله، روشی در حوزه مکان ارائه شده است که قادر به تشخیص چهار نوع تاری سراسری شامل تاری گوسین، تاری مستطیلی، تاری ناشی از حرکت دوربین و تاری ناشی از عدم تنظیم لنز است. روش پیشنهادی در این مقاله، از مفهوم همبستگی در تصویر برای شناسایی انواع مختلف تاری استفاده می کند. همبستگی، میزان وابستگی و ارتباط پیکسل های همجوار را نشان می دهد. در تاری های مختلف، نحوه اثرگذاری هر پیکسل روی پیکسل های همجوار آن متفاوت است. بر اساس نحوه اثرگذاری، ویژگی های لازم برای تشخیص هر تاری استخراج می شوند. صحت کلی روش پیشنهادی برای تشخیص وجود تاری و همچنین انواع مختلف آن، 90/4 درصد است. مقایسه این کار با روش های موجود، برتری روش پیشنهادی را نشان می دهد.
    کلیدواژگان: دسته بندی انواع تاری، حوزه مکان، ضریب همبستگی، تاری سراسری
  • بهناز پروانه، عبدالله چاله چاله* صفحات 119-132

    بازیابی محتوا محور تصاویر روشی است که به جستجوی تصاویر رقمی در بانک تصاویر بزرگ می پردازد و در این جستجو از محتوای دیداری تصاویر به جای فوق داده ها استفاده می کند. این فناوری دارای کاربردهای فراوان در حوزه های امنیتی برای بررسی دسترسی های قانونی مانند تشخیص هویت از طریق اسکن عنبیه چشم، اثر انگشت و یا تصویر چروکیدگی بند انگشت دارد. در این مقاله روش ترکیبی نوینی در شناسایی تصاویر به منظور تشخیص هویت ارائه داده ایم که در آن از الگوی باینری محلی و ناحیه بندی تصویر استفاده خواهد شد. از طرفی قابلیت های علم کوانتوم موجب گشته است تا از مزایای آن در حوزه های متفاوت پرازش تصویر استفاده شود. ایده اصلی ویژگی پیشنهادی از تئوری تخمین کوانتومی الهام گرفته شده، همچنین مدار کوانتومی ویژگی مورد استفاده نیز طراحی گردیده است. جهت سنجش کارایی و دقت روش پیشنهادی پارامتر استاندارد EER(Equal Error Rate) به کار گرفته شده و پس از پیاده سازی الگوریتم پیشنهادی روی بانک تصاویر POLYU که شامل 7920 تصویر است مقدار EER= 0.67  و دقت 99% به دست می آید که نشان می دهد این روش نسبت به روش های مشابه کارایی و دقت بالاتری دارد.

    کلیدواژگان: پردازش تصویر، تشخیص هویت، الگوی باینری محلی، تخمین کوانتومی
  • امیررضا امیرفتحیان، حسین ابراهیم نژاد* صفحات 133-146
    سنتز طرح چهره از عکس نمونه در سرگرمی های دیجیتالی و تحقیقات پزشکی قانونی نقش مهمی دارد. در این مقاله، سنتز طرح چهره دو فرآیند اصلی دارد. در فرآیند اول انتخاب همسایه ها و در فرآیند دوم بازسازی ضرایب نمایش انجام می شود. مدت زمان اجرا و پیچیدگی محاسبات به فرآیند انتخاب تکه های همسایه بستگی دارد. تولید طرح چهره با روش های state of the art، فرآیند انتخاب همسایگی برای داده های موثر را با جستجوی k نزدیکترین همسایگی اجرا می کند. از این رو، مدت زمان اجرای سنتز را افزایش می دهند. همچنین برای انتخاب تکه های همسایه به بررسی تمام داده های آموزشی نیاز دارند. در نتیجه، پیچیدگی محاسباتی با تعداد داده های آموزشی افزایش یافته و باعث محدودیت مقیاس پذیری می شود. در این مقاله، ما یک روش موثر را با کدگذاری دودویی محلی و نمونه برداری در محل اجرا می کنیم. سپس با استخراج شکل از بافت های حاصل و تعیین وضعیت سطوح، طرح چهره را نمایش می دهیم. آزمایش های ما روی جفت تصاویر پایگاه داده CUHK نشان می دهد که روش ارایه شده در مقایسه با روش های state of the art از نظر کیفیت طرح های تولید شده و مدت زمان اجرای محاسبات برتری دارد. همچنین روش پیشنهادی در برابر مشکلات خطاهای حسی چهره که باعث تغییرشکل ناهمگون در طرح چهره می شود، مقاوم می باشد.
    کلیدواژگان: تولید طرح چهره، سنتز عکس چهره به طرح، نگاشت عکس چهره به طرح، کدگذاری با الگوی دودویی محلی
  • هادی هادی زاده* صفحات 147-158
    رنگ و بافت دو مولفه بسیار مهم در تشخیص و تمایز بین اشیاء مختلف در دنیای واقعی می باشند. اخیرا، نمایش چهارگانی (کواترنیونی) تصاویر تبدیل به یک شیوه کارآمد برای توصیف تصاویر رنگی شده است. با استفاده از نمایش چهارگانی تصاویر رنگی، امکان پردازش و در نظر گرفتن اطلاعات متقابل بین کانال های رنگی تصاویر به صورت توامان فراهم می شود. تاکنون عملگرهای چهارگانی ساده ای همچون عملگرهای چرخش، انعکاس و انتقال کلیفورد برای تصاویر رنگی توسعه یافته اند. با اعمال این عملگرهای ساده بر تصاویر رنگی، می توان اطلاعات کم عمقی در خصوص رابطه بین کانال های رنگی یک تصویر به دست آورد. در این مقاله، ابتدا عملگرهای چهارگانی جدیدی موسوم به عملگرهای چهارگانی ترکیبی را پیشنهاد می دهیم که از ترکیب متوالی و دلخواه عملگرهای چهارگانی ساده تشکیل می شوند. با استفاده از عملگرهای پیشنهادی می توان اطلاعات عمیق تری از تصاویر رنگی را استخراج نمود. سپس، روشی مبتنی بر مفهوم کدگذاری تنک را برای دسته بندی تصاویر بافتی رنگی توصیف شده توسط عملگرهای چهارگانی ترکیبی پیشنهاد می دهیم. نتایج تجربی نشان می دهند که روش پیشنهادی برای دسته بندی تصاویر بافتی رنگی از دقت بالاتری در مقایسه با سایر روش های موجود بر روی سه پایگاه مشهور از تصاویر بافتی رنگی برخوردار است
    کلیدواژگان: بافت، کدگذاری تنک، چهارگان، اتم، عملگرهای چهارگانی، رنگ
  • مهناز رضوی، امیرحسین طاهری نیا*، هادی صدوقی یزدی صفحات 159-174
    در این مقاله روش جدیدی برای شناسایی خودکار مکان های مورد توجه افراد با استفاده از دوربین های نظارتی در فروشگاه های بزرگ ارائه شده است. منظور از مکان مورد توجه، ناحیه ای در تصویر است که افراد بیشتری رفت و آمد داشته اند.بدین منظور ابتدا با استفاده از روش تشخیص افراد مبتنی بر توصیف گرهای HOG، انسان از دیگر اشیاء موجود در تصویر متمایز می شود و هر فرد تشخیص داده شده به عنوان یک رخداد در تصویر تلقی می شود. سپس مورد توجه ترین مکان با استفاده از توزیع غیر پارامتری مبتنی بر ریسک بیزی بر روی موقعیت مکانی افراد تشخیص داده شده، بدست می آید. در توزیع پیشنهادی هسته جدیدی تعریف شده است که از کارایی بالایی برخوردار است. در ریسک پیشنهادی نیز تابع ضرر جدیدی تعریف شده است که صحت بالاتری نسبت به تابع ضرر مربعی در محاسبه مراکز توجه دارد و  در توزیع های مختلف در محاسبه قله های توزیع بهتر عمل می کند. برای ارزیابی روش از فریم های ویدئویی که از دوربین های زنده نظارتی در فروشگاه های مختلف گرفته شده، استفاده شده است. در ارزیابی هسته پیشنهادی کارایی آن 85% بدست آمده است و در ارزیابی صحت تابع ضرر پیشنهادی به طور میانگین بر روی داده های مصنوعی 93.5% و بر روی داده های واقعی 90% بدست آمده است که در مقایسه با روش های موجود  بهتر است.
    کلیدواژگان: مکان مورد توجه، رخداد، تابع توزیع غیر پارامتری، ریسک بیزی، دوربین های زنده نظارتی
|
  • Maryam Taghizadeh, Abdolah Chalechale * Pages 1-13

    One of the effective methods for visual recognition (including classification, object recognition and image semantic labeling) is to identify probable regions including an object that is known as object proposals. In this paper, an effective approach is proposed relying on identifying appropriate regions based on image segmentation which is called SDE (superpixel dual extension). The proposed approach comprises of two phases. In the first phase, using a bottom-up segmentation algorithm, an image is presented by some regions as superpixels.  In the second phase each superpixel is then extended to adjacent regions, according to a set of predefined states and the 8-connectivity. The most important advantage of this extension is to generate regions that are able to completely surround an object. Using descriptors such as color, texture and keypoints for feature extraction resolves computer vision problems and enhances the performance. Here, a set of well-known metrics of image segmentation including overlap, recall, area under curve, and pair of pixels’ coherency are measured in order to precisely assess the proposed method. Furthermore, to more evaluate the effectiveness of the method a classification problem on MSRC dataset is carried out. The results are shown quality enhancement around 7% for graph-based segmentation and 14% for clustering-based segmentation. Moreover, 11% improvement in accuracy of image classification is also achieved.

    Keywords: Extension, Superpixel, region-based segmentation, Classification
  • Leila Allahyari, Saeed Sohrabi *, Esmaeil Najafi Pages 15-26
    This paper presents a new image watermarking method in Contourlet domain, ‎where watermark is embedded through quantum chaotic map‎ in the selected Contourlet coefficients ‎of the cover image. The main idea of this method is data embedding in selected sub bands, providing ‎higher resiliency through better spectrum spreading compared to other sub bands. The proposed ‎method leads to higher imperceptibility and robustness against several common watermarking attacks ‎such as compression, adding noise, filtering and scaling. It has been observed that, in comparison with ‎other Contourlet based and wavelet based methods, the proposed method is thanks to its capability ‎in directional selectivity.‎
    Keywords: watermarking, Contourlet, Chaotic map‎, Singular values
  • Hassan Alikarami, Farzin Yaghmaee *, Mohammad Javad Fadaiee Eslam Pages 27-41
    There are challenges such as depth perception and self-occlusion, in the field of 3D human pose estimation and reconstruction which obstructs precise estimation of body joints. In this paper, we first extract human pose by focusing on 2D ground-truth using sparse coding and. In the second approach, we use a learning-based Convolutional Neural Networks using sparse coding and a model based rectifier to extract the estimated pose. Pose estimation by proposedmethod has reduced the mean error of the reconstruction in comparison with the state of the artworks.
    Keywords: Convolutional Neural Networks, Sparse Coding, Representation, 3D Pose Skeleton, 3D Pose Estimation
  • Ali Ghanbari Sorkhi *, Hamid Hassanpour, Mansoor Fateh Pages 43-59
    Today, the detection and annotation of objects in images is one of the major challenges in some applications of machine vision. In recent years, the use of deep learning has attracted the attention of researchers. In this regard, this paper first introduces the newest deep networks and analyzes the strengths and weaknesses of these methods. An improved network of R-FCN network has been presented. The proposed method is based on the ResNet architecture and the fully- convolutional network. In this method, a new architecture is proposed based on region proposal deep network and a combined method based on the binary fuzzy SVM and the SVR for final detection and categorization of objects. Also, a new loss function called Cauchy-Schwartz Divergence loss, has been used. This function has shown better performance in terms of speed and accuracy. The proposed ResNet-101 architecture was tested on the SUN dataset for the detection and annotation of 36 objects, and the results indicate improved performance of this method compared to the basic R-FCN network method. The proposed method, In terms of Mean Average Precision, has 48.38% performance and average duration for each image is 0.13 Compared to the best method in this area, it performed about 2% in performance and 0.04 seconds in better time.
    Keywords: objects detection, annotation, Deep Learning, R-FCN network, binary fuzzy SVM, Cauchy-Schwarz Divergence
  • Hadi Yaghoobi, Hamid Mansouri *, Mohammad Ali Ebrahimi, Hossein Nezamabadi, Pour Pages 61-77
    Muck-pile size distribution is one of the most important parameters in open pit blasting that can affect mining and mineral processing efficiency. For evaluating fragmentation by blasting, digital image analysis is a fast and reliable indirect technique. In this study, based on neural network and visual feature extractions, an algorithm was developed to determine muck-piles size distribution using digital images.26 test images of fragmented rockwere used to determine size distribution and the results were compared with the results of automatic and manual aged detection of Split-Desktop software.The results showeda general improvement in evaluating rockparticles size distribution. We obtained an improvement of 67%, 57% and 28%, respectively using Fourier transform, Gabor and wavelet methods. Fourier transform, Gabor and wavelet methods showed also an improvement of 52%, 40% and 21 %, respectively in evaluating of F10 to F50.
    Keywords: Size distribution, muck-pile, visual feature extraction, fragmentation evaluation
  • Mojtaba Kordabadi, Muharram Mansoorizadeh *, Hassan Khotanlou Pages 79-88
    Graph based semi-supervised methods for automatic image annotation are mainly focused on single-label problems. However, most of the real world problems require multiple labels per image. As a hybrid semi-supervised approach, LGC+ML-KNN is proposed for multi-label image annotation. LGC is a graph based semi-supervised learning algorithm that annotates unlabeled samples. Subsequently, ML-KNN learns from many more labeled samples, as compared to the initial training set. Experiments on several datasets confirm that the proposed approach has better accuracy than available methods, especially when a very small portion of the training set are the labeled samples.
    Keywords: Image Retrieval, Automatic Image Annotation, semi-supervised learning
  • *Elham Moeinaddini Pages 89-104

    Watermarking is a method for embedding a watermark in a digital image to preserve its copyright. Watermark should have two contradictory properties of transparency and robustness. Locations of embedding watermark in the image and threshold values play an important role in improving these two properties. In this paper, a novel robust image watermarking scheme in hadamard transform domain is proposed which uses Hybrid Firefly Algorithm (HFA) for selecting suitable blocks and threshold values to balance transparency and robustness. HFA is the modified version of firefly algorithm which is proposed and used in this paper for first time.This algorithmgenerates distinct and discrete values for selecting blocks and simultaneously continues values for selecting threshold values. Hadamard transform applies on each selected block of the cover image and four watermark bits are embedded in one block using selected threshold values. Watermark detection is done blindly and objective function of the optimization algorithm is a combination of transparency and robustness. This scheme is applicable to color and gray scale images. Experimental results show that the proposed scheme is highly robust against different attacks and gives better results in terms of transparency compared to other similar methods.

    Keywords: watermarking, Firefly Algorithm, Hadamard transform, threshold values
  • Elahe Alipour, Hamid Hassanpour *, Mansoor Fateh Pages 105-118
    Blurriness is one of the common distortions in images. This distortion is caused by spilling the pixel information overthe adjacent pixels. Blurriness has different types. The knowledge about the type of image blurriness is one of the important parameters which directly affects performance of de-blurring methods.In this paper, a method has been proposed to classify the fourtypes of global blurrinessin digital imagesin the spatial domain. These blurriness include the Gaussian blur, rectangular blur, motion blur and defocus blur. In the proposed method, the correlation concept is used to classify the type of image blurriness. The correlation concept depicts the relations between the image pixels. Also, the model and correlation of adjacent pixels are proportional to the type of blurriness.Appropriate features are extracted to detect the type of blurriness. The accuracy of the proposed method for detecting the type of blurriness is 90.4%. This method has a better performance compared to other existing methods in terms of accuracy and computational cost.
    Keywords: Blur classification, spatial domain, Correlation coefficient, Global Blurriness
  • Behnaz Parvaneh, Abdolah Chalechale * Pages 119-132

    The content based image retrieval searches digital images in a large image database and uses visual content of images instead of metadata. This approach has many usages in security and authentication for example scanning the iris, fingerprint or finger knuckle print. This paper contributes a new method for personal authentication using finger knuckle print based on a new local binary pattern and image segmentation. The capabilities of quantum science lead to take its advantage in different areas of image processing. The main idea is inspired by the theory of quantum estimation and is applied to the feature extraction phase, in addition, the quantum circuit of the proposed feature is also designed. In order to measure the efficiency and accuracy of the proposed method, the EER (Equal Error Rate) is calculated. After implementing the proposed algorithm on the POLYU dataset, which contains 7920 images, the EER = 0.67 and accuracy =99% are obtained which indicate that the new method has more efficiency and accuracy than the similar approaches.

    Keywords: image processing, Authentication, Local binary pattern, Quantum estimation
  • Amirreza Amirfathiyan, Hossein Ebrahimnezhad * Pages 133-146
    Facesketchsynthesis of example image plays an important role in both digital entertainment and law enforcement. In this paper, face sketch synthesis has two main processes. In the first process, neighbors are selected and in the second process, reconstruction weight representation is done.Running time and computation complexity depends on neighbor patches selection process.Face sketchgeneration with state-of-the-art methods perform neighbor selection process in a data-driven manner by K nearest neighbor searching. Hence, the running time for synthesisincreases.Also, for neighbor selection need to check the whole training dataset. As a result, the computational complexity increases with the scale of the training database and is limited scalability. In this paper, we proposed a simple but effective with encoding local binary pattern and random sampling in place of pixels. Then by extracting shape from resulting textures and determining state of surfaces, we represent facial sketch. Our experiments onpair of CUHK database imagesdemonstrate the proposed method in comparison to state-of-the-art methods has superiorityof view generated sketch quality and running time. Also, the proposed methodin front of face hallucinationproblemswhich cause heterogeneous transformation on facial sketch is resistant.
    Keywords: face sketch generation, photo to sketch synthesis, face sketch synthesis, photo to sketch mapping, encoding local binary pattern
  • Hadi Hadizadeh * Pages 147-158
    Texture and color are two important attributes for object recognition. Recently, quaternionic representation of color images have been used as an effective method for color image processing. Using such a representation, it is possible to consider the mutual interaction between different color channels. In the last decade, several quaternion operations like rotation, reflection, and Clifford translation have been developed. Such operators are able to extract shallow information from the color images. In this paper, we first propose a set of new quaternion operators called hybrid quaternionic operators, which can be produced by a cascade of several simple quaternionic operators. Such operators can extract deeper information from the color images. We then use such operators, and present a novel color texture classification method using the concept of sparse coding. Experimental results indicate that the proposed method outperforms several existing and popular methods.
    Keywords: Texture, Quaternion, Sparse Coding
  • Mahnaz Razavi, Amir Hossein Taherinia *, Hadi Sadoghi Yazdi Pages 159-174
    In this paper, a new method for automated detection of a human region of interest is provided that makes use of camera surveillance in department stores. In this work, a region of interest is an area in the image where more people commute. For this purpose, first humans are distinguished from other objects in the image utilizing a histogram of oriented gradients (HOG) descriptors. Every detected individual is considered as an event in the image. Then, a non-parametric distribution based on Bayesian risk is applied to obtain the most interested regions from the position of detected humans. In the proposed distribution, a new high-efficiency kernel is provided. In Bayesian risk, a novel loss function is proposed that has a higher accuracy in compared with square loss function and performs better in finding peaks of a distribution function. For the evaluation, data from live surveillance cameras located in different parts of some stores are used. For the proposed kernel, on average, an accuracy of 85% and for the loss function, an accuracy of 93.5% on artificial data and 90% on real data are acquired which are better results in compared with other similar works.
    Keywords: Region of interest, Event, non-parametric distribution function, Bayesian risk, live surveillance cameras