فهرست مطالب محمدرضاکرمی ملایی
-
در سال های اخیر شبکه های عصبی کانولوشنال به طور فزاینده ای در کاربردهای مختلف بینایی ماشین و به ویژه در شناسایی و طبقه بندی خودکار تصاویر مورد استفاده قرار گرفته اند. این نوع از شبکه های عصبی مصنوعی با شبیه سازی عملکرد قشر بینایی مغز قدرتمندترین ساختار را در تجزیه و تحلیل داده های بصری دارند. اما تنوع تصاویر دیجیتال و گوناگونی محتوی و ویژگی های آن ها ایجاب می کند تا برای دستیابی به کارایی بالاتر در هر مسیله ی طبقه بندی، شبکه های کانولوشنال به صورت اختصاصی طراحی و پارامترهای آن ها به دقت تنظیم شوند. در این راستا، در پژوهش حاضر ضرایبی بهینه برای فیلترهای لایه ی کانولوشن در شروع آموزش شبکه بکار رفته تا از این طریق دقت طبقه بندی در شبکه افزایش و زمان آموزش کاهش یابد. این کار با طراحی و بکارگیری مجموعه ای از فیلترهای تخصصی برای لایه ی کانولوشن در قالب یک بانک فیلتر و جایگذاری آن ها به جای فیلترهای تصادفی انجام پذیرفته و بر روی پایگاه داده ی تصاویر اعداد دست نویس MNIST ارزیابی شده است. آزمایشات ما بر روی شبکه ی کانولوشنال تک لایه با سه نوع فیلترگذاری (فیلترهای عدد ثابت، عدد تصادفی و بانک فیلتر) میانگین دقت طبقه بندی تصاویر اعداد دست نویس MNIST را در 50 بار آموزش شبکه به ترتیب 94/74، 47/86 و 89/91 درصد و برای شبکه ی کانولوشنال سه لایه به ترتیب 82/88، 16/96 و 14/99 درصد نشان دادند. این نتایج نشان می دهند که فیلترهای بکار رفته در مدل پیشنهادی در مقایسه با فیلترهای تصادفی ویژگی های موثرتری از تصاویر را استخراج نموده و با شروع آموزش شبکه از نقطه ی مناسبتر، بدون افزایش هزینه ی محاسباتی دقت طبقه بندی را افزایش داده اند. بنابراین می توان نتیجه گرفت که ضرایب اولیه ی فیلترهای لایه ی کانولوشن بر دقت طبقه بندی شبکه های کانولوشنال موثر است و با بکارگیری فیلترهای موثرتر در لایه ی کانولوشن می توان این شبکه ها را خاص مسیله ساخته و از این طریق کارآیی شبکه را افزایش داد.
کلید واژگان: شبکه های عصبی کانولوشنال, یادگیری عمیق, طبقه بندی تصاویر, اعداد دست نویس}BackgroundIn recent years, convolutional neural networks (CNNs) have been increasingly used in various applications of machine vision. CNNs simulate the function of the brain's visual cortex and have a powerful structure for analyzing visual images. However, the diversity of digital images, their content, and their features necessitate that CNN networks are specially designed, and their parameters are carefully adjusted to achieve higher efficiency in any classification problem. In this regard, in many previous studies, researchers have attempted to increase the efficiency of the CNNs by setting their adjustable parameters more accurately.
New methodNew method In this study, we presented a novel initializing method for the kernels of the first convolutional layer of the CNN networks. We designed a filter bank with specialized kernels and used them in the first convolution layer of the proposed models. These kernels, compared to the random kernels in traditional CNNs, extract more effective features from the input images without increasing the computational cost of the network, and improve the classification accuracy by covering all the important characteristics.
ResultsThe dataset used in this paper was the MNIST database of handwritten digits. We examined the performance of CNN networks when three different types of kernels were used in their first convolution layer. The first group of kernels had constant coefficients; the second group had random coefficients, and finally, the kernels of the third group were specially designed to extract a wide range of image features. Our experiments on a single-layer CNN network with three types of kernels (constant numbers, random numbers, and filter-bank) showed the average classification accuracy of MNIST images in 50 times of network training to be 74.94%, 86.47%, and 91.89%, respectively, and for a three-layer CNN network, 88.82%, 96.16%, and 99.14%, respectively. Comparison with existing methods Compared to the kernels with randomized coefficients, the use of specialized kernels in the first convolution layer of the CNN networks has several important advantages: 1) They can be designed to extract all important features of the input images, 2) They can be designed more effectively based on the problem in hand, 3) They cause the training to start from a more appropriate point, and in this way, the speed of training and the classification accuracy of the network increase.
ConclusionThis study provides a novel method for initializing kernels in convolution layers of CNN networks to enhance their performance in image classification works. Our results show that compared to random kernels, the kernels used in the proposed models extract more effective features from the images at different frequencies and increase the classification accuracy by starting the training algorithm from a more appropriate point, without increasing the computational cost. Therefore, it can be concluded that the initial coefficients of the convolution layer kernels are effective on the classification accuracy of CNN networks, and by using more effective kernels in the convolution layers, these networks can be made specific to the problem and, in this way, increase the efficiency of the network.
Keywords: convolutional neural network, deep learning, image classification, handwritten digit} -
در این مقاله، سه روش جدید برای غنی سازی سیگنال های صوتی ارائه شده است. در این روش ها که مبتنی بر روش تفریق طیفی، روش تفریق معکوس تبدیل فوریه و تفریق طیفی چند بانده می باشند، از ضرایب پیشگویی خطی (LPC) و آنالیز VAD و نیز تشخیص گر حروف صدادار و بی صدا (detector V/UV) برای تخمین و استخراج نویز استفاده شده است. سپس به مقایسه روش های پیشنهادی و روش های موجود پرداخته شده و مشاهده شده است که روش های پیشنهادی به میزان چشمگیری، نسبت سیگنال به نویز در سیگنال های صوتی آغشته به نویز را بهبود بخشیده اند. نتیجه آزمایش شنوایی نیز بیان گر این نتایج هستند.
کلید واژگان: غنی سازی سیگنال های صوتی, تفریق طیفی, آنالیز, V, UV detector, VAD, LPC}In this paper 3 new methods for the speech Signal enhancement were proposed, which are based on spectral subtraction, inverse Fourier transform subtraction and multi-band spectral subtraction methods. We use linear predicative coding (LPC), VAD analysis, and voice/unvoiced (V/UV) detector for noise estimation and extraction, then we compare the proposed methods with the previous ones. Our proposed method have improved signal to noise ratio and, also, good results have been achieved in the auditory tests. -
در این مقاله، روشی جدید برای غنی سازی سیگنال های صوتی ارائه شده است. در این روش که مبتنی بر روش تفریق طیفی موجک می باشند، از ضرایب پیش گویی خطی (LPC) برای تخمین و استخراج نویز استفاده شده است. سپس به مقایسه روش پیشنهادی با روش تفریق طیفی موجک پرداخته ایم و مشاهده شده است که روش پیشنهادی به میزان چشم گیری، نسبت سیگنال به نویز در سیگنال های صوتی آغشته به نویز را در مقایسه با روش تفریق طیفی موجک، بهبود بخشیده است. ضمن اینکه از نظر تست شنوایی نیز وضع به همین گونه بوده است.
کلید واژگان: آنالیز LPC, تبدیل موجک, تفریق طیفی, غنی سازی سیگنال صوتی, نویز}In this paper, we proposed a new method for speech enhancement. The method is based on wavelet spectral subtraction. We use linear predictive coding (LPC) for noise estimation and extraction. The proposed method was compared with the wavelet spectral subtraction method. The new method increased signal to noise ratio of the noise contaminated speech signal more than wavelet spectral subtraction method. Also, good results have been achieved in auditory test (Mean Opinion Score).
- در این صفحه نام مورد نظر در اسامی نویسندگان مقالات جستجو میشود. ممکن است نتایج شامل مطالب نویسندگان هم نام و حتی در رشتههای مختلف باشد.
- همه مقالات ترجمه فارسی یا انگلیسی ندارند پس ممکن است مقالاتی باشند که نام نویسنده مورد نظر شما به صورت معادل فارسی یا انگلیسی آن درج شده باشد. در صفحه جستجوی پیشرفته میتوانید همزمان نام فارسی و انگلیسی نویسنده را درج نمایید.
- در صورتی که میخواهید جستجو را با شرایط متفاوت تکرار کنید به صفحه جستجوی پیشرفته مطالب نشریات مراجعه کنید.