فهرست مطالب

فصلنامه پردازش علائم و داده ها
سال پنجم شماره 2 (پیاپی 10، پاییز و زمستان 1387)

  • تاریخ انتشار: 1387/12/21
  • تعداد عناوین: 7
|
  • وحید صادقی * صفحه 3
    در این مقاله مدلی برای درک و بازشناسی کلمات زبان فارسی ارائه شده است. مدل پیشنهادی مبتنی بر نظریه ی صوت شناختی درک گفتار است. اساس این نظریه، در بازنمود آوایی هر واحد زبانی، مجموعه ای از الگوهای صوت شناختی به عنوان الگوهای آوایی مرجع، ذخیره می شوند و درک آن واحد از طریق انطباق الگوهای صوت شناختی درون داد با الگوهای آوایی مرجع در بازنمایی آوایی صورت می گیرد. انگاره ی پیشنهادی برای درک و بازشناسی بازنمود آوایی و واجی کلمات از ترکیب مدل المان و مک کللند (1) تحت عنوان «اثر» و مدل بورسما (2) تحت عنوان «دستور ادراکی و دستور بازشناسی» است.=
    کلیدواژگان: بهینگی، دستور ادراکی و بازشناسی، الگوهای آوایی مرجع، محدودیت های صوت شناختی و واجی
  • ساجده رضانیا *، علی مطیع نصر آبادی، وحید ابوطالبی، مجید قشونی صفحه 17
    هدف از این تحقیق طراحی یک سیستم ارزیاب حافظه با استفاده از پتانسیل های وابسته به رخداد مغزی است. به این منظور، از دادگان پتانسیل های وابسته به رخداد ثبت شده روی سه کانال Pz، Czو Fz استفاده شده است که در آن طی آزمایشی از افراد خواسته شده، تصاویر بی معنایی را که در فاز آموزش مشاهده کرده اند، از تصاویری که تاکنون ندیده اند تفکیک نمایند. جهت تحقق این امر، از ویژگی های مرتبط با فعالیت حافظه در حوزه زمان-فرکانس استفاده گردید. ضرایب تبدیل موجک گسسته پتانسیل های وابسته به رخداد، محاسبه شد و سپس با استفاده از میانگین، واریانس و انرژی ضرایب برخی باندها، مجموعا 36 ویژگی روی سه کانال به دست آمد. پس از انتخاب ویژگی های مناسب روی تک کانال ها و مجموع سه کانال، آنالیز تفکیک خطی، جهت به دست آوردن درصد تفکیک دو گروه توسط ویژگی های منتخب انجام گرفت. سرانجام با ترکیب ویژگی های سه کانال، دادگان دو گروه با درصد درستی 3/89% در مرحله آزمون تفکیک شدند.
    کلیدواژگان: پتانسیل های وابسته به رخداد، تبدیل موجک گسسته، آنالیز تفکیک خطی
  • رضا عارفی شیروان *، محمد علی خلیل زاده، سید احسان تهامی، وحید سعادتیان صفحه 29
    سیستم اعصاب خودکار توسط دو شاخه سمپاتیک و پاراسمپاتیک، سیستم قلبی- عروقی را در شرایط مختلف کنترل می کند. دینامیک این سیستم متناسب با حالات روانی مختلف از جمله استرس دستخوش تغییرات شده و از این رو می توان به وسیله تحلیل سیگنال های خروجی آن، فعالیت سیستم اعصاب خودکار را آشکار کرد. در این تحقیق با طراحی آزمایشی مطمئن و ایجاد سطوح مختلف استرس در فرد به دنبال کمی سازی سطح استرس با استفاده از سیگنال HRV بوده ایم. با توجه به اینکه سیستم قلب ماهیت آشوبگونه دارد، لذا در این تحقیق دیدگاه غیرخطی نیز برای تحلیل این سیگنال به کار گرفته شده است. به این ترتیب علاوه بر ویژگی های معمول در حوزه زمان، فرکانس و زمان-فرکانس، ویژگی های غیرخطی نظیر آنتروپی، معیار پوآنکاره و بعد فرکتال از سیگنال HRV استخراج شده است. سپس با استفاده از ترکیب الگوریتم تکاملی و شبکه عصبی، ویژگی های بهینه که بیشترین درصد تفکیک بین سطوح مختلف استرس را مهیا می سازند، مشخص شده است و در نهایت با استفاده از شبکه عصبی و ویژگی های بهینه، تفکیک بین سطوح انجام شد. همچنین مقایسه ویژگی های خطی و غیرخطی سیگنال HRV انجام شد. نتایج بدست آمده نشان می دهد که با استفاده از ترکیب ویژگی های خطی و غیرخطی می توان به درصد تفکیک بیشتری دست یافت، در حالی که ویژگی های غیرخطی نسبت به تغییرات نمونه های ورودی مقاوم تر می باشند.
    کلیدواژگان: تغییرات نرخ ضربان قلب، استرس، بعد فرکتال، معیار پوآنکاره، آنتروپی، الگوریتم تکاملی، شبکه عصبی
  • محسن رحمانی *، بابک ناصرشریف، روح الله عبدی پور، احمد اکبری صفحه 41
    دسته ی مهمی از روش های بهبود کیفیت گفتار، طیف فرکانسی دوره کوتاه سیگنال نویزی را تغییر داده و اصلاح مینمایند اصلاحات طیفی این روش ها به صورت یک فیلتر در حوزه فرکانسی بیان می شود و بهره فیلتر میتواند به صورت تابعی از سیگنال به نویز نمایش داده شود. در این مقاله روش های حذف نویر از سیگنال گفتار مورد بررسی و ارزیابی قرار میگیرد و بهره فیلتر برای برخی از روش های حذف نویز شناخته شده به صورت تابعی از سیگنال به نویز نمایش داده می شود. روش های تخمین سیگنال به نویز بررسی می شود و یک تکنیک جدید برای تخمین سیگنال به نویزپیشنهاد شده و ارزیابی میگردد و برتری آن بر روش های قبلی نشان داده میشود. در این مقاله اصلاح روش های حذف نویز به منظور کم کردن اعوجاج سیگنال گفتار مطرح شده است. در این روش ها اثرات اصلاح فرکانسی طوری تنظیم می گردد که با باقی گذاشتن مقداری از نویز اولیه، بهبود مشخصی در نسبت سیگنال به نویز بدست آید و در عوض اعوجاج سیگنال گفتار حداقل گردد. برای این کار با اعمال یک پارامتر، بهره چند روش حذف نویز برای دستیابی به سطح مشخصی از حذف نویز تنظیم میگردد. همچنین برای خوشایند کردن نویز باقی مانده از شکل دادن نویز باقی مانده استفاده شده است. به منظور ارزیابی این روش ها تستهای شنوایی برای بررسی جنبه های مختلف گفتار از جمله نویز موسیقی، نویز باقیمانده، اکو و آثار غیر طبیعی نویز یاقیمانده طراحی و اجرا شده است. نتایج این تستها در مقاله حاضر برای چند روش حذف نویز گزارش شده است و روش های حذف نویز با یکدیگر مقایسه شده اند.
    کلیدواژگان: بهبود گفتار، کاهش نویز، نویز موسیقی، اعوجاج و نویز باقی مانده، سیگنال به نویز پیشین و سیگنال به نویز پسین
  • سید زهره سید صالحی *، علی مطیع نصر آبادی، وحید ابوطالبی صفحه 57
    در این مطالعه، به بررسی ضرایب استخراج شده توسط تبدیل موجک Quadratic B-Spline، به عنوان یک تحلیل زمان- فرکانس در مقایسه با دسته ویژگی های حوزه ی زمان (ضرایب AR و ویژگی های شکلی- زمانی) و فرکانس (فرکانس های میانگین، نما و میانه) بر روی پتانسیل وابسته به رخداد مغزی پرداخته شده است. بررسی ها روی دادگان II مسابقه BCI2005 انجام شده است. مجموعه ویژگی ها با سه معیار مقایسه شده اند: معیار تفکیک پذیری دیویس بولدین، روش مبتنی برهمبستگی و معیار درصد صحت طبقه بندی. با هر سه معیار بهترین نتیجه مربوط به مجموعه ضرایب تبدیل موجک بود. سپس با طبقه بندی با یک ماشین همیار مبتنی برLDA-SVM-MLP و ضرایب تبدیل موجک در مورد سوژه ی A در تشخیص سیگنال هدف و غیرهدف به طور میانگین برای دادگان آموزش، درصد صحت تشخیص 97.6% و برای آزمون 94.2% به دست آمد. هم چنین در مورد سوژه ی B نیز نتایج عبارتند از: 98.2% در آموزش و 92.8% در آزمون.
    کلیدواژگان: مولفه ی P300، تبدیل موجک، BCI Speller 2005 و ماشین همیار
  • سعیده راحتی قوچانی *، محمود رضا آذر پژوه، آزاده معلمی دمنه صفحه 71
    آمبولی، توده های مجتمع از گلبول های قرمز، چربی و یا حباب های گاز می باشند که آزادانه در سیستم گردش خون در جریان هستند و وجود آن ها نشانه ی خطر اسکیمی می باشد. در بررسی جریان خون در زمان واقعی به روش داپلر ترانس کرانیال (TCD) با عبور میکرو آمبولی جامد و یا گاز از منطقه ی تحت بررسی با داپلر، سیگنالی کوتاه مدت با دامنه ی زیاد ایجاد می گردد. در هنگام ثبت، عواملی مانند حرکت پروب و یا سرفه، باعث ایجاد آرتیفکت با دامنه ی زیاد در سیگنال داپلر می شود که شناسائی آن را از آمبولی را دشوار می کند. صرف وقت زیاد و همچنین احتمال خطای فرد متخصص در تشخیص آمبولی از آرتیفکت، انگیزه ی اصلی طراحی سیستم های تشخیص خودکار می باشد. پیاده سازی این گونه سیستم ها همواره با دو چالش عمده ی استخراج ویژگی های مناسب و طراحی دسته بند مطلوب روبرو می باشد. در این تحقیق هر دو موضوع مورد مطالعه قرار گرفت. در بخش ویژگی، ضرایب موجک، آنتروپی موجک، بعد فرکتالی و ویژگی Besov از سیگنال استخراج شد و به کمک تحلیل آماری ویژگی های با بالاترین میزان تفکیک معرفی شد. در بخش دسته بند، شیوه ی جدیدی برای شناسایی آمبولی و تفکیک آن از آرتیفکت به وسیله مدل مارکف پنهان (HMM) ارائه شد و نتایج آن با نتایج دسته بند شبکه ی عصبی فازی تطبیقی (ANFIS) مقایسه شد. در مجموع با استفاده از ضرایب موجک و مدل مارکف پنهان طراحی شده، توانستیم به صحت 3/95% و وضوح 7/92% در شناسایی آمبولی برسیم.
    کلیدواژگان: MES، شبکه عصبی فازی تطبیقی، مدل مارکف پنهان، آنتروپی، ضرایب موجک
  • رحیم سعیدی *، حمیدرضا صادق محمدی صفحه 85
    در این مقاله، روش مدل آمیزهی گوسی ساختار یافته1 (SGMM) که به منظور سرعت بخشی الگوریتم2 GMM-UBM در سیستم تصدیق هویت گوینده، پیشنهاد شده است، مورد بررسی قرار می گیرد. تاثیر برخی پارامترها در ساخت مدل پس زمینه ی ساختاری 3 (SBM) به تفصیل مورد بررسی و مقادیر بهینه در ساخت مدل مورد استفاده قرار می گیرد. همچنین برای پردازش امتیازهای خروجی ساختار SBM-SGMM ساختاری با عنوان شناسایی کننده GMM پیشنهاد می شود. شبیه سازی های انجام یافته نشان می دهد ساختار بهینه ی SBM در ترکیب با پردازنده ی امتیازهای پیشنهاد شده، عملکرد بهتری نسبت به سیستم پایه در ترکیب با شبکه ی عصبی دارد و این در حالتی است که پیچیدگی سیستم پیشنهاد شده، پائین تر از شبکه ی عصبی می باشد. با استفاده از سیستم پیشنهادی، نرخ سرعت بخشی برابر با 7/2 حاصل گردید و در عین حال عملکرد سیستم نیز نسبت به سیستم GMM-UBM بهبود نشان می دهد. در بهترین حالت می توان به نرخ خطای برابر معادل %35/0دست یافت که نسبت به عملکرد سیستم GMM-UBM با نرخ خطای برابر %71/1 بهبود قابل ملاحظه ای حاصل می شود.
    کلیدواژگان: تصدیق هویت مستقل از متن گوینده، GMM، UBM، SBM، SGMM
|
  • V. Sadeghi * Page 3
    of spoken word recognition is proposed. This model is particularly concerned with extraction of cues from the signal leading to a specification of a word in terms of bundles of distinctive features, which are assumed to be the building blocks of words. In the model proposed, auditory input is chunked into a set of successive time slices. It is assumed that the derivation of the underlying word pattern proceeds in three layers: Features, phonemes, words. The feature layer has a complete set of feature detectors at every time slice. In this layer, the detection of the underlying pattern of distinctive features from the speech signal proceeds in three steps. In the first step, numerical values for features are obtained measuring acoustic attributes in each time slice. The acoustic attributes are either acoustic landmarks corresponding to articulator-free features which are identified, based on amplitude changes in various energy bands, or acoustic cues in the vicinity of the landmarks corresponding to articulator-bound features. Continuous perceptual feature values are, then processed into a much more structured representation, namely phonological surface structure. This is carried out in Perception Grammar as suggested by Boersma (1998). In the third step, a further processing is carried out to turn the discrete representation into an abstract one yielding the underlying pattern of distinctive features. The next layer of the model has a complete set of phoneme detectors for every three time slices, but each set spans six time slices so the sets overlap. This means that the detection of adjacent phonemes will also overlap; this is supposed to simulate coarticulation. The top layer has a complete set of word detectors centered on every three time slices; again, the sets overlap, the number of time slices per word detector is variable because it depends on the length of each individual word.
    Keywords: Optimality- Perception Grammar- Recognition Grammar- Acoustic constrai
  • S. Rezania *, A. Moti Nasrabadi, V. Abotalebi, M. Ghoshouni Page 17
    The object of this research is development of memory assessment system, using Event Related Potentials. Our approach is using ERPs recorded on Fz, Cz and Pz electrodes. Subjects made old/new recognition judgments on new unstudied unmeaning pictures and old pictures which had been presented at study phase. Features related with memory activity in time-frequency domain were used to achieve this purpose. So that discrete wavelet transform coefficients of Event Related Potentials computed, then using mean, variance and power of specific frequency bands, 36 features on 3 channels were obtained entirely. After appropriate feature selection on single and three channels Linear discriminant analysis was done to get classification results using selected features. Finally we discriminated groups with 89.3% accuracy in test group by combination of three channels features.
    Keywords: Memory, Event Related Potentials, discrete wavelet transform, Linear Discriminant Analysis, Feature selection
  • S. Z. Seyed Salehi *, A. Moti Nasrabadi, V. Aboutalebi Page 57
    In this study we propose a new approach to analyze data from the P300 speller paradigm using the quadratic B-Spline wavelet coefficients in comparing to time and frequency features sets on the event related potentials. Data set II from the BCI competition 2005 was used. Mode frequency, Mean frequency, Median frequency and some morphologic parameters ware extracted as features. Three methods were used for comparing three feature subsets, first Davies Bouldin criteria, correlation based method and classification accuracy criteria. For all criteria, best result was extracted from wavelet coefficients, at the final wavelet coefficients were used as inputs into committee machines (CM) based on LDA, MLP and SVM. This algorithm achieved an accuracy of 97.6% for train data and 94.2% for test data of subject A in target and non target detection also accuracy of 98.2% for train data and 92.8% for test data of subject B.
    Keywords: P300 Component, Wavelet Transform, BCI Speller 2005, Committee Machines
  • S. Rahati Ghouchani *, Mr. Azarpajoh, A. Moalemi Page 71
    An embolus is a blood clot, a fat globule or gas bubbles that may be freely circulating in bloodstream can stop the blood flow and lead to ischemia. In real time assessment of blood flow by Trans Cranial Doppler (TCD) method, travelling solid or gaseous micro emboli in the bloodstream by passing across the assessment area, causes a short time signal with high intensity. While TCD recording including movement of the probe, coughing, sneezing, and head rotation generate high intensity artifacts that make it difficult to make differentiate from embolus. Time consuming and also human mistakes in differentiating emboli from artifact are the main motivations of design of the automatic detection systems. Implementing such systems is nowadays faced with two main challengeous problems: extracting suitable features and designing the proper classifier. In this research, we studied two issues together. In feature extraction part, wavelet coeffiecient, wavelet entropy, fractal dimention and Besov property of signal is extracted, and using by statistical methods we introduced the feature with highest separability rate. In classifier part, a novel method based on hidden markov models for detecting emboli from artifact is proposed, and the results is compared with the results of Adaptive Neuro Fuzzy Inference System classifier. In total, using wavelet coefficients and hidden markov model, we achieved an accuracy rate of 95.3% and specificity of 92.7%.
    Keywords: MES, Adaptive Neuro Fuzzy Inference System (ANFIS), Hidden Markov Model (HMM), Entropy, Wavelet coefficients