convolutional autoencoder
در نشریات گروه برق-
In video prediction it is expected to predict next frame of video by providing a sequence of input frames. Whereas numerous studies exist that tackle frame prediction, suitable performance is not still achieved and therefore the application is an open problem. In this article multiscale processing is studied for video prediction and a new network architecture for multiscale processing is presented. This architecture is in the broad family of autoencoders. It is comprised of an encoder and decoder. A pretrained VGG is used as an encoder that processes a pyramid of input frames at multiple scales simultaneously. The decoder is based on 3D convolutional neurons. The presented architecture is studied by using three different datasets with varying degree of difficulty. In addition, the proposed approach is compared to two conventional autoencoders. It is observed that by using the pretrained network and multiscale processing results in a performant approach.
Keywords: deep learning, Convolutional autoencoder, Video prediction, multiscale processing -
: با افزایش علاقه مندی به فشرده نمودن تصاویر با فرمت فرمت گروه مشترک متخصصان عکاسی (JPEG)، یکی از مهم ترین مباحث در دست کاری تصاویر دیجیتال، یافتن روشی مناسب جهت آشکارسازی فشرده سازی JPEG مضاعف است. در این مقاله با معرفی یک فیلتر تطبیقی آموزش دیده بر پایه خودرمزگذار پیچشی (CAE) و در حوزه مکان، به این موضوع پرداخته می شود تا با حذف اطلاعات تداخلی ناشی از محتوای تصویر، آشکارسازی دقیق تری داشته باشیم. از آنجایی که شبکه عصبی پیچشی (CNN) توانسته عملکرد موفقی در طبقه بندی تصاویر داشته باشد، از این شبکه ها در قسمت طبقه بندی استفاده می شود. مدل پیشنهادی بر اساس CAE متوالی شده با CNN است که توانسته دقت آشکارسازی و حساسیت به ضرایب کیفیت (QFs) قابل قبولی را در دو سناریوی هم تراز و ناهم تراز ارایه نماید. این مدل توانسته در برخی از حالت ها، حساسیت نسبت به ضرایب کیفیت را تا 86 در صد در مقدار کاهش خطای نسبی (RER) بهبود دهد. آزمایش های دیگری از جمله مکان یابی محل دست کاری بر روی مجموعه داده RAISE برای ارزیابی روش پیشنهادی انجام شده است. این نتایج نشان دهنده عملکرد بسیار خوب این روش نسبت به الگوریتم های مشابه در شرایطی است که ضریب کیفیت فشرده سازی دوم بزرگ تر از ضریب کیفیت فشرده سازی اول باشد.کلید واژگان: شبکه عصبی پیچشی، خودرمزگذار پیچشی، فیلتر تطبیقی، صحت آشکارسازی، مکان یابی محل دست کاریWith the increasing interest in Joint Photographic Experts Group (JPEG) image compression, one of the most important issues in digital image manipulation is finding a proper method to detect double JPEG compression. This paper introduces a trained adaptive filter based on spatial-domain convolutional autoencoder (CAE). This filter can remove interference information caused by image content to have a more accurate detection. The convolutional neural network (CNN) has been widely employed for accurate image classification; therefore, a CNN is used in the classification part of the proposed algorithm. The proposed model is based on consecutive CAE with CNN, which is able to provide acceptable detection accuracy and sensitivity to quality factors (QFs) in two scenarios, i.e. aligned and non-aligned forgeries. This model improves the sensitivity to quality factors by up to 86% in the relative error reduction (RER) rate in some cases. Other experiments such as manipulation localization on the RAISE dataset have been performed to evaluate the proposed method. These results show the superior performance of this method compared to similar algorithms in the situations that the quality factor of the second compression is greater the quality factor of the first compression.Keywords: adaptive filter, convolutional neural network, convolutional autoencoder, detection accuracy, manipulation localization
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.