تشخیص جنسیت نویسندگان از روی متون با استفاده از جنگل تصادفی بیز

پیام:
نوع مقاله:
مقاله پژوهشی/اصیل (دارای رتبه معتبر)
چکیده:
امروزه استفاده زیاد کاربران از محیط های مجازی و ارتباط آنها از طریق شبکه های اجتماعی مانند فیسبوک و توییتر لزوم بررسی مطالب موجود را در فضای مجازی بیشتر از گذشته کرده است. از آنجا که بالاترین میزان تبادل اطلاعات در فضای مجازی از طریق متن صورت می گیرد؛ لذا تشخیص هویت کاربران از نظر سن، جنس، عقاید مذهبی و سیاسی از روی متن های اینترنت، پراهمیت خواهد بود. مساله تشخیص جنسیت در حوزه های امنیت و بازاریابی، می تواند موثر واقع شود. در مقاله حاضر به تشخیص جنسیت نویسندگان مطالب بلاگ ها پرداخته می شود و جهت تشخیص جنسیت نویسنده، ویژگی های نحوی، مبتنی بر واژه، مبتنی بر حروف و واژگان گرامری مورد استفاده قرار می گیرند. به علاوه نتایج نشان می دهد که استفاده از ویژگی های -nگرمی حروف در بهبود عملکرد، بسیار موثر است. جهت انجام عمل دسته بندی روش جدیدی با عنوان جنگل تصادفی بیز ارائه می شود. نتایج آزمایش ها نشان می دهد که این روش در مقایسه با الگوریتم هایی مانند الگوریتم بیز ساده، درخت بیز ساده و جنگل تصادفی، نتایج بهتری ارائه داده و دقت دسته بندی را تا 5/89 % افزایش داده است.
زبان:
فارسی
صفحات:
143 تا 157
لینک کوتاه:
magiran.com/p2003601 
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!