معرفی یک پیکره متنی تخصصی: پیکره پژوهش نامه
بسیاری از پژوهش های زبان شناسی و برنامه ریزی های زبانی با استفاده از پیکره های زبانی انجام می شود. در این پژوهش پیکره ای با استفاده از متون مقاله های پژوهش نامه پردازش و مدیریت اطلاعات ساخته شده است. این پیکره شامل بیش از 600 مقاله (بیش از چهار میلیون واژه) است. موضوع این مقاله ها کتابداری و اطلاع رسانی، علم اطلاعات و دانش شناسی، فناوری اطلاعات، زبان شناسی، زبان شناسی رایانشی، اصطلاح شناسی، هستان شناسی و سایر حوزه های پردازش اطلاعات است. متون مقاله ها تخصصی و میان رشته ای است و برای پردازش هایی که مستلزم بهره گیری از متون تخصصی است، ارزشمند است. برای ساخت پیکره پس از نمونه گیری و وارد کردن داده ها در پیکره، فراداده مقاله ها وارد پیکره شد. سپس نرمال سازی ماشینی و به دنبال آن برچسب گذاری ماشینی (نوعا برچسب گذاری اجزای واژگانی کلام) انجام شد. در نهایت تعداد قابل توجهی از فایل های برچسب خورده در پیکره به صورت رندوم انتخاب شد و الگوهای زبانی برای اصلاح ماشینی و دستی برچسب ها استخراج و در پیکره به کار برده شد.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.