به کارگیری نظریه ساختار بلاغی برای بهبود بازنمایی متن با شبکه های عصبی عمیق
یافتن یک بازنمایی معنایی غنی با ابعاد کم برای متون طولانی یکی از چالش های اساسی در فعالیت های مختلف پردازش زبان طبیعی به شمار می رود. این بازنمایی باید اطلاعات معنایی و نحوی متن را در برگرفته و همچنین بر حسب وظیفه مد نظر ارتباط و تشابه متون را در ابعاد کم مدل سازی کند. در این مقاله تلاش بر آن است تا با بهره گیری از نظریه ساختار بلاغی و شبکه های عصبی عمیق چالش های مطرح شده مرتفع گردد. نظریه ساختار بلاغی با ارایه یک ساختار سلسله مراتبی به توصیف اهمیت عبارات موجود در متن و روابط بین آن ها می پردازد. در اینجا تاثیر به کارگیری این ساختار درختی بر دو وظیفه بازیابی اطلاعات و تحلیل احساسات بررسی شده است. در وظیفه بازیابی اطلاعات، جهت مدلسازی وابستگی معنایی بین مستندات، یادگیری بازنمایی سند توسط شبکه های عصبی بازگشتی عمیق دوقلو صورت پذیرفت. بطوریکه ذخیره و بازیابی مستندات متنی تسهیل گردد. این شبکه از دو زیرشبکه بازگشتی عمیق تشکیل شده است. این شبکه های بازگشتی، مبتنی بر ساختار درختی حاصل از تجزیه متن توسط نظریه ساختار بلاغی می باشند. این متدلوژی بر روی دو مجموعه داده خبری شامل اخبار بی بی سی و همچنین زیرمجموعه ای از دادگان رویترز مورد ارزیابی قرار گرفت. نتایج نشان می دهد بازنمایی ارایه شده توسط این ساختار، کارآیی بالاتری از بازنمایی های سنتی مبتنی بر سبد کلمه دارد. این رویکرد کارایی را به میزان 6٪ بر روی مجموعه داده بی بی سی و 3٪ بر روی مجموعه داده رویترز نسبت به بهترین روش کلاسیک بهبود داده است. در وظیفه تحلیل احساسات، در ابتدا به کمک شبکه عصبی بازگشتی عمیق مبتنی بر درخت ساختار بلاغی به ایجاد بازنمایی و در نهایت دسته بندی احساسات نظرات افراد پرداخته شد. سپس سایر اطلاعات موجود در درخت جهت بهبود مدل مورد استفاده قرار گرفت. این اطلاعات شامل آگاهی از اهمیت هر بخش از متن با استفاده از درخت ساختار بلاغی می باشد. با تشخیص بخش های مرکزی متن و اعمال مکانیزم توجه بر آن در شبکه عمیق بازگشتی بازنمایی غنی تری برای متن ایجاد می گردد. این بازنمایی کارایی مدل تحلیل احساسات را بر روی دادگان اینترنتی نظرات بینندگان فیلم در مقایسه با روش های پایه به میزان 3٪ افزایش داده است. نتایج حاصل از این بررسی، بهبود بازنمایی متن با استفاده از شبکه های عمیق مبتنی بر نظریه ساختار بلاغی را نشان می دهد. بهبود بازنمایی به کمک ساختاردهی متن غیر ساختار یافته بر روی زبان های دیگر از جمله زبان فارسی می تواند مورد راستی آزمایی قرار بگیرد.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.