یک مدل موضوعی احتمالاتی مبتنی بر روابط محلی واژگان در پنجره های هم پوشان

پیام:
چکیده:
بسیاری از مدل های موضوعی مانند LDA که مبتنی بر هم رخدادی واژگان در سطح یک سند هستند قادر به بهره گیری از روابط محلی واژگان نیستند. برخی از مدل های موضوعی مانند BTM سعی کرده اند با ترکیب موضوعات و مدل های زبانی n-gram، این مشکل را حل کنند. اما BTM مبتنی بر ترتیب دقیق واژگان است؛ بنابراین با مشکل تنکی روبه روست. در این مقاله یک مدل موضوعی احتمالاتی جدید معرفی شده که قادر به مدل کردن روابط محلی واژگان با استفاده از پنجره های هم پوشان است. بر اساس فرضیه هم رخدادی، رخداد هم زمان واژگان در پنجره های کوتاه تر، گواه محکم تری بر ارتباط معنایی آنهاست. در مدل پیشنهادی، هر سند، مجموعه ای از پنجره های هم پوشان فرض می شود، که هریک متناظر با یکی از واژگان متن است. موضوعات بر مبنای هم رخدادی واژگان در این پنجره های هم پوشان استخراج می شوند. به عبارت دیگر، مدل پیشنهادی، روابط محلی واژگان را بدون وابستگی به ترتیب دقیق آنها مدل می کند. آزمایش های ما نشان می دهد که روش پیشنهادی، موضوعات منسجم تری را تولید و در کاربرد خوشه بندی اسناد، دقیق تر از دو مدل LDA و BTM   عمل می کند.
زبان:
فارسی
صفحات:
57 تا 70
لینک کوتاه:
magiran.com/p1971513 
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!