مکان مرجع سازی منابع محل مبنای نیمه ساختاریافته در وب با استفاده از یادگیری ماشین
در سال های اخیر محتوای منتشرشده بر روی وب به طور چشمگیری افزایش یافته است. بخش عمده ای از این اطلاعات به صورت نیمه ساختاریافته در اختیار عموم قرار دارند. علاوه بر این، حجم عظیمی از اطلاعات مرتبط با محل هستند. این گونه اطلاعات به یک مکان بر روی زمین اشاره دارند، اما دارای مختصات صریح آن محل نیستند. در این مقاله به مکان مرجع سازی منابع نیمه ساختاریافته در وب با استفاده از یادگیری ماشین پرداخته شده است. مزیت این روش عدم نیاز به استفاده از روش های پیچیده متن کاوی جهت مکان مرجع سازی است. بدین منظور، از آگهی های تبلیغاتی تارنمای دیوار مرتبط با املاک و مستغلات در شهر تهران استفاده شده است. به منظور جمع آوری داده از روش خزیدن در وب بهره برده شده است. همچنین، جهت دستیابی به هدف تحقیق، الگوریتم جنگل های تصادفی به عنوان یک روش یادگیری ماشین مناسب بکار گرفته شده است. نتایج تحقیق نشان می دهد که با استفاده از این روش، آگهی های تبلیغاتی تارنمای دیوار با دقت مناطق تهران قابل مکان مرجع سازی است. به طور کمی، دقت بدست آمده در این تحقیق حدود 6 کیلومتر در راستای طول جغرافیایی و حدود 2 کیلومتر در راستای عرض جغرافیایی است. همچنین، نتایج این تحقیق نشان می دهد که متغیر قیمت ملک نسبت به دیگر متغیرها از اهمیت و تاثیر بیشتری در تعیین مکان آگهی برخوردار است. علاوه بر این، از نتایج این تحقیق می توان نتیجه گرفت که قیمت املاک در شهر تهران در راستای شمالی - جنوبی دارای الگوی مکانی بیشتری نسبت به راستای شرقی - غربی هستند.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.