اجتماع‏ یابی صفحات وب در شبکه‏ های اینترنتی دارای ویژگی‏ با استفاده از رویکرد برنامه ‏ریزی ریاضی

پیام:
نوع مقاله:
مقاله پژوهشی/اصیل (دارای رتبه معتبر)
چکیده:

اجتماع‏یابی (کشف اجتماعات) یکی از شاخه‏های نوظهور و پرطرف‏دار در علم داده کاوی و تحلیل شبکه‏های اجتماعی است که کاربردهای فراوانی در کشف و تحلیل اجتماع ها در سایت های اینترنتی، شبکه های زیستی، علمی و پژوهشی و غیره دارد. اجتماع‏یابی صفحات اینترنتی می‏تواند به طور ویژه به مدیران سایت‏های اینترنتی در تخصیص پهنای بهینه به شبکه‏ صفحات وب تحت نظارتشان کمک کند. در اکثر روش های اجتماع‏یابی موجود فقط از توپولوژی شبکه (ارتباطات، یال‏ها) برای گروه‏بندی گره‏ها (صفحات وب) استفاده می‏شود؛ درحالی که نتایج پژوهش‏های اخیر نشان داده ‏است که این‏گونه روش‏ها باید به گونه ای تغییر کند که در آن ها علاوه بر توپولوژی، ویژگی های ذاتی گره‏ها نیز در فرآیند اجتماع‏یابی لحاظ شود. ازاین رو در این مقاله برای اولین بار با لحاظ کردن هم زمان ویژگی های ذاتی صفحات وب و ارتباطات میان آن ها، یک مدل ریاضی برای کشف اجتماعات در شبکه‏های اینترنتی توسعه داده شده است. روش پیشنهادی این پژوهش بدین صورت است که برای لحاظ کردن ویژگی‏ها در فرآیند اجتماع‏یابی، ابتدا با استفاده از یک رویکرد ریاضی، میزان شباهت صفحات وب به کمک یک سنجه شباهت (مانند جاکارد یا ضریب انطباق) و بردار ویژگی‏ها محاسبه و به عنوان وزن به یال های موجود بین آن ها در شبکه اینترنتی موردنظر افزوده می‏شود. با این کار عملا یک شبکه اینترنتی ویژگی‏دار با یال های غیر موزون به یک شبکه بدون ویژگی با یالهای موزون تبدیل می‏شود. سپس با استفاده از یک مدل ریاضی (که مختص شبکه‏هایی با یال های موزون است)، اجتماعات موجود در این شبکه موزون کشف می‏شود. برای اعتبارسنجی و اثبات کارایی، در قالب آزمون‏های فرض آماری ادعاشده است که کیفیت اجتماعات کشف‏شده توسط رویکرد ریاضی پیشنهادی (که ویژگی‏های صفحات وب را لحاظ می‏کند) به طور آماری بهتر از مدل‏های ریاضی پیشین (که از ویژگی‏ها چشم‏پوشی می‏کند) است. نتایج آزمون‏های‏ آماری روی شبکه اینترنتی واقعی نشان می‏دهد که مدل پیشنهادی این پژوهش در حالتی که از معیار جاکارد برای محاسبه میزان شباهت صفحات وب استفاده می‏کند به طور معنی داری (با P-value=0.01) باعث کشف اجتماعاتی بهتر در قیاس با مدل‏های ریاضی پیشین شده است. همچنین نتایج دیگر آزمون‏‏های آماری نیز نشان می‏دهد که انتخاب سنجه شباهت متناسب با ماهیت شبکه، تاثیر بسزایی در میزان کیفیت رویکرد پیشنهادی دارد.

زبان:
فارسی
صفحات:
1 تا 20
لینک کوتاه:
https://www.magiran.com/p2050083