استفاده از رگرسیون غیرخطی و ویژگی های آماری جهت ارزیابی سیستم های (Interactive Question Answering (IQA
مشکل اصلی در طراحی سیستم های پرسش و پاسخ تعاملی، عدم امکان پیش گویی بخش تعاملی این سیستم ها است. به همین منظور، باید انسان در فرآیند ارزیابی شرکت داشته باشد. در این مقاله با معرفی مجموعه ای از ویژگی های ایجاد شده بر اساس n-گرم ها و بزرگترین رشته مشترک، یک مدل آماری مناسب برای ارزیابی سیستم های پرسش و پاسخ تعاملی ارائه شده است. در ابتدا با استفاده از چهار سیستم پرسش و پاسخ تعاملی موجود، پایگاه داده ای از مکالمات رد و بدل شده بین کاربران و سیستم ها ایجاد گردید. از بین مکالمات تولید شده، تعداد 540 نمونه به عنوان داده مناسب در نظر گرفته شد تا مجموعه تست و آموزش بر اساس آن ایجاد گردد. سپس بر روی مکالمات، پیش پردازش صورت پذیرفت و بر اساس روابط تعریف شده، تعدادی ویژگی آماری جدید از متن مکالمه ها استخراج و بر اساس آن ماتریس ویژگی تشکیل گردید. با توجه به تعداد بالای ویژگی های پیشنهادی و برای جلوگیری از برازش خطا، بهترین ویژگی ها با استفاده از روش حذف ویژگی به روش بازگشتی انتخاب گردید تا مدل پیشنهادی بر اساس ویژگی های باقیمانده شکل گیرد. در نهایت با استفاده از رگرسیون به پیش بینی نظرات انسانی پرداخته شد که رگرسیون غیرخطی توانی بر اساس معیار مجذور کمترین مربع خطا به میزان 15/0 بهترین مدل را ارائه نمود
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.