اجتماع‏ یابی صفحات وب در شبکه‏ های اینترنتی دارای ویژگی‏ با استفاده از رویکرد برنامه ‏ریزی ریاضی

پیام:
نوع مقاله:
مقاله پژوهشی/اصیل (دارای رتبه معتبر)
چکیده:

اجتماع‏یابی (کشف اجتماعات) یکی از شاخه‏های نوظهور و پرطرف‏دار در علم داده کاوی و تحلیل شبکه‏های اجتماعی است که کاربردهای فراوانی در کشف و تحلیل اجتماع ها در سایت های اینترنتی، شبکه های زیستی، علمی و پژوهشی و غیره دارد. اجتماع‏یابی صفحات اینترنتی می‏تواند به طور ویژه به مدیران سایت‏های اینترنتی در تخصیص پهنای بهینه به شبکه‏ صفحات وب تحت نظارتشان کمک کند. در اکثر روش های اجتماع‏یابی موجود فقط از توپولوژی شبکه (ارتباطات، یال‏ها) برای گروه‏بندی گره‏ها (صفحات وب) استفاده می‏شود؛ درحالی که نتایج پژوهش‏های اخیر نشان داده ‏است که این‏گونه روش‏ها باید به گونه ای تغییر کند که در آن ها علاوه بر توپولوژی، ویژگی های ذاتی گره‏ها نیز در فرآیند اجتماع‏یابی لحاظ شود. ازاین رو در این مقاله برای اولین بار با لحاظ کردن هم زمان ویژگی های ذاتی صفحات وب و ارتباطات میان آن ها، یک مدل ریاضی برای کشف اجتماعات در شبکه‏های اینترنتی توسعه داده شده است. روش پیشنهادی این پژوهش بدین صورت است که برای لحاظ کردن ویژگی‏ها در فرآیند اجتماع‏یابی، ابتدا با استفاده از یک رویکرد ریاضی، میزان شباهت صفحات وب به کمک یک سنجه شباهت (مانند جاکارد یا ضریب انطباق) و بردار ویژگی‏ها محاسبه و به عنوان وزن به یال های موجود بین آن ها در شبکه اینترنتی موردنظر افزوده می‏شود. با این کار عملا یک شبکه اینترنتی ویژگی‏دار با یال های غیر موزون به یک شبکه بدون ویژگی با یالهای موزون تبدیل می‏شود. سپس با استفاده از یک مدل ریاضی (که مختص شبکه‏هایی با یال های موزون است)، اجتماعات موجود در این شبکه موزون کشف می‏شود. برای اعتبارسنجی و اثبات کارایی، در قالب آزمون‏های فرض آماری ادعاشده است که کیفیت اجتماعات کشف‏شده توسط رویکرد ریاضی پیشنهادی (که ویژگی‏های صفحات وب را لحاظ می‏کند) به طور آماری بهتر از مدل‏های ریاضی پیشین (که از ویژگی‏ها چشم‏پوشی می‏کند) است. نتایج آزمون‏های‏ آماری روی شبکه اینترنتی واقعی نشان می‏دهد که مدل پیشنهادی این پژوهش در حالتی که از معیار جاکارد برای محاسبه میزان شباهت صفحات وب استفاده می‏کند به طور معنی داری (با P-value=0.01) باعث کشف اجتماعاتی بهتر در قیاس با مدل‏های ریاضی پیشین شده است. همچنین نتایج دیگر آزمون‏‏های آماری نیز نشان می‏دهد که انتخاب سنجه شباهت متناسب با ماهیت شبکه، تاثیر بسزایی در میزان کیفیت رویکرد پیشنهادی دارد.

زبان:
فارسی
صفحات:
1 تا 20
لینک کوتاه:
magiran.com/p2050083 
دانلود و مطالعه متن این مقاله با یکی از روشهای زیر امکان پذیر است:
اشتراک شخصی
با عضویت و پرداخت آنلاین حق اشتراک یک‌ساله به مبلغ 1,390,000ريال می‌توانید 70 عنوان مطلب دانلود کنید!
اشتراک سازمانی
به کتابخانه دانشگاه یا محل کار خود پیشنهاد کنید تا اشتراک سازمانی این پایگاه را برای دسترسی نامحدود همه کاربران به متن مطالب تهیه نمایند!
توجه!
  • حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران می‌شود.
  • پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانه‌های چاپی و دیجیتال را به کاربر نمی‌دهد.
In order to view content subscription is required

Personal subscription
Subscribe magiran.com for 70 € euros via PayPal and download 70 articles during a year.
Organization subscription
Please contact us to subscribe your university or library for unlimited access!