شباهت معنایی جملات فارسی با استفاده از تطبیق فضای برداری و یادگیری عمیق
امروزه، شناسایی متون مشابه، موضوعی با کاربردهای فراوان می باشد که با توجه به اهمیت آن، توسط پژوهشگران زبان های مختلف مورد تحلیل و بررسی قرارگرفته است. در گذشته اغلب برای درک جملات توسط سیستم های کامپیوتری، جملات به صورت مجموعه کلمات مورد بررسی قرار می گرفتند. اما امروزه، با گسترش فناوری و استفاده از شبکه های عصبی عمیق، می توان از خود جملات، مفهوم اصلی را استخراج نمود. بنابراین، رسیدن به مدلی که بتواند جملات را کدگذاری کرده و مفهوم اصلی جمله را با دقت هرچه بیشتر استخراج نماید، یکی از نیازهای ضروری برای این هدف به شمار می رود.این مقاله قصد دارد تا میزان شباهت جملات را از نقطه نظر معنایی بدست آورد که از روش های یادگیری عمیق استفاده می کند. از آنجایی که روش های یادگیری عمیق نیاز به داده آموزشی زیادی دارند، این مقاله از ایده نگاشت بین زبانی بهره می برد. روش پیشنهادی، فضای برداری تعبیه کلمات انگلیسی را به فارسی نگاشت کرده و با کمک مدل آموزش داده شده در زبان انگلیسی، شباهت جملات فارسی به دست می آید. در نهایت، نتایج نهایی با امتیازات انسانی مورد مقایسه قرارگرفته است. نتایج حاصل از روش پیشنهادی، میزان دقت این سیستم پیشنهادی را 89 درصد ارایه می دهد که نسبت به سایر مدل های یادگیری عمیق برتری دارد.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.