غنی سازی جاینامه با استفاده از آگهی های املاک
با توجه به افزایش روزافزون کاربردهای بازیابی اطلاعات مکانی، جاینامه ها به عنوان بخش مهمی از فرآیند بازیابی اطلاعات مکانی، نیازمند غنی سازی هستند. یکی از جنبه های غنی سازی شناسایی و افزودن نام های جغرافیایی جدید به جاینامه و به هنگام سازی آن می باشد. از جمله چالش های مهم در غنی سازی جاینامه ها، در نظر گرفته شدن دیدگاه رسمی و اغلب نادیده گرفته شدن جاینام های محلی و همچنین پرهزینه و زمانبر بودن به هنگام سازی جاینامه ها است. در این تحقیق، با تمرکز بر گردآوری جاینام های شهری، روشی داده محور جهت شناسایی نام های جغرافیایی از نوع همسایگی و خیابان با استفاده از آگهی های املاک ارایه شده است. آگهی های املاک برای چهار کلانشهر تهران، مشهد، اصفهان و شیراز از وبسایت دیوار وبکاوی شده و پس از استخراج ان-گرم ها و اعمال پیش پردازش های لازم، ان-گرم ها برچسب گذاری شدند. بر مبنای 24 معیار مکانی و تحت مدل جنگل تصادفی برای هر کدام از این چهار شهر مدل تولید شده و روی داده سایر شهرها آزموده شد. نتایج نشان دهنده ی این است که هم در شناسایی خیابان و هم همسایگی، عملکرد مدل آموزش یافته براساس داده شهر اول و آزمون روی داده سایر شهرها قابل قبول است. برای مثال، مدل آموزش یافته براساس داده شهر تهران در آزمون روی شهر مشهد، مقادیر 61% و 74% را برای F_score به ترتیب در شناسایی خیابان و همسایگی کسب کرده است. لذا بر این اساس می توان گفت که گردآوری نام های جغرافیایی در شرایطی که ابزارهای پردازش متن از کارایی کافی برخوردار نباشند، می تواند با تکیه بر رفتار مکانی آن ها به خوبی انجام پذیرد.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.