تشخیص تغییر مفهوم در جریان داده با کمک رده بند نیمه نظارتی
جریان داده به دنباله ای از داده ها گفته می شود که از منابع اطلاعاتی مختلف با سرعت زیاد و حجم بالا تولید می شوند. از مهم ترین چالش های موجود در تحلیل جریان داده وجود تغییر مفهوم در آن ها است. تغییر مفهوم به معنای تغییر ویژگی های آماری داده هاست. در بسیاری از پژوهش های موجود برای مقابله با چالش نامحدود بودن طول جریان داده و یا چالش تغییر مفهوم، از رویکردهایی با فرض موجود بودن برچسب درست برای همه داده ها استفاده می کنند؛ در حالی که با توجه به هزینه بر بودن فرآیند برچسب دهی جریان داده، به طورعمومی فرض می شود تنها بخشی از داده ها دارای برچسب هستند. در این مقاله یک روش یادگیری گروهی نیمه نظارتی ارایه شده که از تغییر آنتروپی برای تشخیص تغییر مفاهیم در رده بندی جریان داده استفاده می کند. مدل یادگیری گروهی پیشنهادی با تعداد محدودی داده برچسب دار اولیه آموزش می بیند؛ سپس در صورت مشاهده تغییر مفهوم، از داده های بدون برچسب برای به روزرسانی مدل رده بند گروهی استفاده می کند. روش پیشنهادی قادر است تغییرات موجود در مجموعه داده را تشخیص داده و با به روزرسانی مدل یادگیری، در بهبود دقت الگوریتم موثر باشد. نتایج آزمایش ها نشان می دهد که روش پیشنهادی از جنبه های مختلف نسبت به سایر روش ها کارایی بالاتری دارد.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.