content-based image retrieval
در نشریات گروه برق-
نشریه دستاوردهای نوین در برق،کامپیوتر و فناوری، سال چهارم شماره 4 (پیاپی 13، زمستان 1403)، صص 89 -135
سامانه های توصیه گر با توانایی شناخت کاربر و پیش بینی اولویت های او ، اطلاعاتی که احتمال می رود مورد توجه کاربر باشد را از بین حجم بالای داده ها غربال کرده و با توصیه آنها به کاربر در وقت و انرژی او صرفه جویی می کنند. از طرف دیگر این سامانه ها با توانایی تحلیل و ذخیره رفتارهای گذشته کاربر، خدمات و اطلاعات موجودی را که وی توجهی به آن نداشته ولی احتمالا علاقه مند به آن است نیز استنتاج کرده و نتایج جالب توجهی به کاربران به شکل توصیه ارائه می کند. در حالی که در اکثریت قریب به اتفاق کارهای انجام شده در زمینه سیستمهای پیشنهاد دهنده، هر آیتم تنها با ویژگی هایی عددی یا رشته ای نمایش داده شده است، اما یکی از ویژگیهایی که تاثیر بسزایی در تعیین میزان مطلوبیت آیتم ها از نظر کاربران دارد، تصاویر آنها میباشد. این مسئله در مورد محصولاتی همچون پوشاک، جواهرات و غیره که بیشتر به علت ظاهر فیزیکی خود مورد قبول مشتریان واقع می شوند، از اهمیت بیشتری برخوردار می باشد. به همین منظور این مقاله درصدد ارائه روشی ترکیبی جهت افزایش کارایی این سیستم ها با استفاده از تکنیک های فیلترینگ مشارکتی و محتوای تصاویر آیتم ها می باشد. در این مقاله ابتدا با استفاده از تکنیک های پردازش تصویر، ویژگی های بصری مربوط به آیتم ها استخراج شده، سپس با انتخاب معیار شباهت مناسب و استفاده از مشخصات فنی آیتم ها و ویژگی های فردی کاربران، اقدام به بخش بندی کاربران و آیتم های مشابه خواهد شد. پس از آن با استفاده از این اطلاعات و بهره گرفتن از تکنیک فیلترینگ مشارکتی سعی خواهد شد بهترین پیشنهادات که بیشترین قرابت را با سلایق کاربران دارد، ارائه شود. نتایج تجربی نشان می دهند که روش پیشنهادی توانسته کارآیی مناسبی را از خود نشان دهد.
کلید واژگان: سیستم پیشنهاددهنده، فیلترینگ مشارکتی، بازیابی تصاویر مبتنی بر محتوا، تجارت الکترونیکJournal of New Achievements in Electrical, Computer and Technology, Volume:4 Issue: 4, 2025, PP 89 -135Recommender systems, with the ability to recognize the user and predict his priorities, sift through the information that is likely to be of interest to the user from the large volume of data and save the user's time and energy by recommending them to the user. On the other hand, these systems, with the ability to analyze and store the user's past behaviors, also infer existing services and information that the user has not paid attention to but is probably interested in and provide interesting results to users in the form of recommendations. While in the vast majority of works done in the field of recommender systems, each item is displayed only with numerical or string features, one of the features that has a significant impact on determining the level of desirability of items from the users' point of view is their images. This is more important for products such as clothing, jewelry, etc., which are mostly accepted by customers due to their physical appearance. For this purpose, this paper aims to present a combined method to increase the efficiency of these systems using collaborative filtering techniques and the content of the images of the items. In this paper, first, using image processing techniques, the visual features of the items are extracted, then by selecting the appropriate similarity criterion and using the technical specifications of the items and the individual characteristics of the users, the users and similar items will be segmented. After that, using this information and utilizing the collaborative filtering technique, the best suggestions that are most similar to the users' tastes will be presented. Experimental results show that the proposed method has been able to demonstrate appropriate efficiency.
Keywords: Recommender System, Collaborative Filtering, Content-Based Image Retrieval, E-Commerce -
با توجه به پیشرفت دنیای تصاویر دیجیتال و افزایش تعداد آنها، ارایه سیستمی جهت بازیابی تصویر، از اهمیت زیادی برخوردار است. یک سیستم بازیابی تصویر مبتنی بر محتوا باید بر اساس محتوای تصویر جستجو شده توسط کاربر، تصاویر مشابه را بیابد. لذا در این مقاله یک روش جدید به منظور بازیابی تصویر مبتنی بر محتوا ارایه شده است. برای این منظور، با توجه به اهمیت بافت اشیاء در یک تصویر، ویژگی جدیدی تحت عنوان هیستوگرام اختلاف بافت در جهت لبه برابر معرفی شده است. در روش پیشنهادی، ابتدا ویژگی هایی شامل ویژگی جدید معرفی شده، از تصاویر آموزشی استخراج شده و سپس تعدادی از این ویژگی ها انتخاب می شوند. در ادامه، با استفاده از این ویژگی ها و کلاس هر تصویر و همچنین روش یادگیری ماشین بردار پشتیبان، تصاویر در کلاس های مختلف به سیستم آموزش داده می شوند. ارزیابی روش پیشنهادی با استفاده از پایگاه داده استاندارد Wang انجام شده است و نتایج به دست آمده، توانایی روش پیشنهادی را در بازیابی تصاویر مبتنی بر محتوا نسبت به روش های مشابه نشان می دهد.کلید واژگان: بازیابی تصویر مبتنی بر محتوا، بافت، جهت لبه، هیستوگرام اختلاف بافت، ماشین بردار پشتیبانContent-based image retrieval using support vector machine and texture difference histogram featuresDue to the progress of the digital image world and increasing numbers, preparing a system for image retrieval is essential. A content-based image retrieval system should find similar images to the image search by a user. In this paper, a novel content-based image retrieval system is proposed. Considering the importance of texture in an image, we introduce a new feature as the histogram of the texture difference in the equal edge orientation. Then, the expressed features are extracted from training images in the proposed system. Then these features are learned using a support vector machine. The proposed system is examined using the standard WANG database. The results show the efficiency of the proposed system in retrieving images compared to similar methods.Keywords: Content-based image retrieval, Texture, Edge orientation, Texture difference histogram, Support Vector Machine
-
The rapid increase in the number of medical image repositories nowadays has led to problems in managing and retrieving medical visual data. This has proved the necessity of Content-Based Image Retrieval (CBIR) with the aim of facilitating the investigation of such medical imagery. One of the most serious challenges that require special attention is the representational quality of the embeddings generated by the retrieval pipelines. These embeddings should include global and local features to obtain more useful information from the input data. To fill this gap, in this paper, we propose a CBIR framework that utilizes the power of deep neural networks to efficiently classify and fetch the most related medical images with respect to a query image. Our proposed model is based on combining Vision Transformers (ViTs) and Convolutional Neural Networks (CNNs) and learns to capture both the locality and also the globality of high-level feature maps. Our method is trained to encode the images in the database and outputs a ranking list containing the most similar image to the least similar one to the query. To conduct our experiments, an intermodal dataset containing ten classes with five different modalities is used to train and assess the proposed framework. The results show an average classification accuracy of 95.32 % and a mean average precision of 0.61. Our proposed framework can be very effective in retrieving multimodal medical images with the images of different organs in the body.
Keywords: content-based image retrieval, medical image retrieval, ensemble learning, convolutional neural networks, vision transformers, deep learning, similarity-based visual search -
E-commerce plays an important role in the world economy. A wide variety of websites have been designed to provide the ability of searching different types of products. Carpet is such a product which cannot be addressed easily with a special code in markets due to the huge variety in its specifications such as layout, color, and texture. This paper introduces a content-based image retrieval system for carpet e-commerce application. This system helps development of the carpet e-commerce where an image can be used instead of any tags including codes or models. An image database containing various Persian carpet images is also made for this application. Furthermore, several content-based image retrieval methods are studied and applied on the carpet database and inspiring by the evaluation results, two methods, QCLD and DCDIP are proposed for carpet e-commerce application. Simulation results show 3.1% and 2.3% decrease on the ANMRR value for the proposed QCLD and DCDIP methods respectively. Retrieval running times also are reported 2.84 and 8.15 seconds for the QCLD and DCDIP methods. In overall, these results reflect higher retrieval performance for the proposed methods.
Keywords: Content-based image retrieval, Tag-based image retrieval, Carpet e-commerce, Image partitioning, Feature extraction -
بازیابی تصویر مبتنی بر محتوا استفاده از روش های بینایی ماشین برای بازیابی تصاویری از یک مجموعه است که به تصویر پرس وجو شبیه باشند. چالش اصلی این سیستم ها کاهش شکاف معنایی بین ویژگی های سطح پایین مستخرج از پیکسل و قطعه تصویر و مفاهیم سطح بالای موجود در آن است. یکی از روش های کاهش این فاصله استفاده از ویژگی های سطح بالای مستخرج از نواحی و اشیا برای بازیابی است. از طرفی ویژگی های سطح پایین نیز تمایز خوبی بین خود تصاویر اعمال می کنند. بر این اساس انتظار می رود استفاده از هر دو دسته ویژگی به نتایج بهتری منجر شود. در این پژوهش بازیابی تصویر در چهار سطح پیکسل، ناحیه، شیء و مفهوم انجام شده است و از همجوشی نتایج این سطوح به منظور کاهش شکاف معنایی استفاده شده است. در سطح پیکسل، از ویژگی های SIFT و LBP استفاده شده است. در سطح ناحیه، ابتدا تصویر به چند ناحیه افراز و سپس ویژگی های رنگ و بافت با استفاده از توصیفگر Hue و فیلتر گابور از هر یک از نواحی تصویر استخراج شده است. در سطح شیء از شبکه عصبی کانولوشنی AlexNet برای بازشناسی اشیاء و صحنه های درون تصویر و در سطح مفهوم از شبکه عصبی Word2vec برای سنجش شباهت معنایی تصاویر استفاده شده است. نتایج بازیابی روی دو پایگاه داده Wang و GHIM نشان دهنده بهبود دقت و فراخوانی در بازیابی تصویر است.
کلید واژگان: بازیابی تصویر مبتنی بر محتوا، همجوشی اطلاعات، ترکیب طبقه بندها، AlexNet، Word2vecContent based image retrieval (CBIR) applies machine vision techniques to extract similar images for a given query image. The main challenge of CBIR is the semantic gap between low level pixel and segment based features and high-level concepts in the image. An approach towards reducing this gaps is to use high level region and object based features. However, the low-level features describe image details and enforce between image discriminations. Accordingly, it is expected that the use of both feature types will lead to better results. This paper tries to reduce the mentioned gap by combining decision results at four granularities, namely pixel, region, object, and concept levels. Pixel level retrieval adopts SIFT features and local binary patterns. Region level subsystem partitions the image into a set of segments and extracts their color and texture features using hue descriptor and Gabor filters for subsequent processing. AlexNet convolutional neural network is employed for object based retrieval. Word2vec embedding is used for concept level retrieval that exploits conceptual relations between objects to enhance the retrieval results. Experiments over Wang and GHIM datasets confirm the feasibility of the proposed combination and conclude that it improves overall performance of the retrieval system.
Keywords: Content based Image Retrieval, Information Fusion, Classifier Combination, AlexNet, Word2vec -
In the modern world a huge amount of data is being produced every second and a considerable percentage of them are images that need to be processed and analyzed. One of the critical challenges in this aspect is image recovery. The process of image recovery should be done automatically by the machines which is the process of recognition of images concepts and assigning homological labels to them. In order to discover the hidden concepts in the images, one should achieve high level concepts using the low-level features, which is a difficult task. A variety of techniques are proposed to solve this problem that usually use combination of different algorithms. In this paper we review and compare various popular and modern image annotation techniques.Keywords: Image Annotation, Content Based Image Retrieval, Semantic Gap
-
بازیابی تصویر یکی از موضوعات مهم و چالش برانگیز در حوزه بینایی ماشین و پردازش تصویر است. تاکنون تحقیقات زیادی در زمینه بازیابی بر روی روش های مختلف انجام شده است. از دهه 70 میلادی بازیابی مبتنی بر کلمه معرفی شد و پس از گذشت دو دهه با توجه به افزایش حجم داده ذخیره شده و ناکارآمدی این روش ها، بازیابی مبتنی بر محتوا پایه گذاری شد. دراین روش محققان با توجه به استخراج ویژگی از تصاویر، به نتیجه بهتری دست یافتند. اما وجود فاصله معنایی میان ادراک انسان و ویژگی های سطح پایین استخراج شده از تصاویر از یک سو و از سوی دیگر افزایش بی رویه حجم داده پیرو پیشرفت فناوری، باعث شد تا روش های ابداع شده ناکارآمد شوند و پژوهش ها به سمت الگوریتم های جدیدتر معطوف شوند. با توجه به موفقیت و رشد چشم گیر الگوریتم های یادگیری عمیق، برآن شدیم تا روشی جدید مبتنی بر یادگیری عمیق به منظور بازیابی تصویر پیاده سازی کنیم. در این مقاله پس از معرفی شبکه های عصبی کانولوشن به عنوان زیرمجموعه ای از روش های یادگیری عمیق، سیستم بازیابی مبتنی بر شبکه عصبی کانولوشن پیشنهاد می دهیم و با اجرای این سیستم بر روی سه پایگاه داده ALOI، Corel و Mpeg7 و محاسبه سه معیار (P(0.5) ،P(1 و ANMRR و مقایسه آن ها با روش های دیگر، نشان می دهیم که این مدل از دقت خیلی بالاتری نسبت به سایر الگوریتم های مرسوم، برخوردار است.کلید واژگان: بازیابی تصویر، روش مبتنی بر کلمه، روش مبتنی بر محتوا، یادگیری عمیق، شبکه های عصبی کانولوشنImage retrieval is an important issue of machine vision and image processing. Many researches have been done in image retrieval. In 70’s, Text-Based image retrieval had been created before Content-Based image retrieval have been introduced since 90’s cause of large amount of data stored and inefficient previous methods. On this way, researcher reached better conclusion by extracting features from pictures. Semantic gap between these features and human concept, and burst increase in amount of images which were saved, caused researchers to think about new algorithms. Excellent successes on deep learning algorithms encourage us to implant a new method for image retrieval based on deep learning. In this paper, after reviewing deep convolutional neural networks as a kind of deep learning methods, we introduce a new retrieval system based on deep convolutional neural networks and by testing it on three famous databases, ALOI, Corel and MPEG7, computing P(0.5), P(1) and ANMRR and comparing them with other methods which have been used since recent years, we show the superior accuracy of this method in comparison to the other methods.Keywords: Image Retrieval, Text-Based image retrieval, Content-Based image retrieval, Deep learning, convolutional neural networks
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.