فهرست مطالب

زبان و زبان شناسی - پیاپی 35 (بهار و تابستان 1401)

نشریه زبان و زبان شناسی
پیاپی 35 (بهار و تابستان 1401)

 • تاریخ انتشار: 1402/05/12
 • تعداد عناوین: 14
|
 • فرزانه گشتاسب*، نادیا حاجی پور صفحات 1-19
  ساخت فعل در فارسی میانه بر پایه دو ماده ماضی و مضارع بوده است. ماده مضارع برای ساختن فعل های مضارع و امر به کار می رود و ماده ماضی که برابر اسم مفعول است برای ساخت فعل های ماضی به کار می رود. در دستور زبان فارسی به این گونه افعال، اصلی گفته می شود. در فارسی میانه نوع دیگری از ساخت فعل وجود دارد که به آن جعلی گفته می شود. ساخت این افعال طبق قاعده ای معین انجام می شود و ساختمانی زایا و رایج در زبان پهلوی است. هدف این پژوهش بررسی آماری کاربرد هر یک از مقوله های دستوری اسم، صفت، حرف اضافه، قید، ضمیر و پیشوند برای ساخت فعل جعلی است. پرسشی که این پژوهش قصد دارد به آن پاسخ دهد این است که برای ساخت افعال جعلی کدامیک از مقوله های دستوری بیشتر به کار رفته است؛ کدام ساخت و صرف فعلی بسامد بیشتری دارد و این نوع فعل در کدامیک از متون فارسی میانه بیشتر دیده می شود. داده های این پژوهش از پیکره ای مشتمل بر 12 متن پهلوی و 46570 واژه گرداوری شده است. نتایج به دست آمده از تحلیل داده ها نشان داد، مقوله دستوری اسم و صفت بیشترین کاربرد را در ساخت این نوع از فعل داشتند، اگر چه از مقوله های دیگر مانند قید، حرف اضافه و ضمیر نیز فعل جعلی ساخته شده است. ساخت ماضی متعدی بیشترین ساختی است که در متن ها به کار رفته است و نیز این نوع افعال در متون تالیفی بر اساس زند اوستا مانند گزیده های زادسپرم بیشتر به کار رفته اند.
  کلیدواژگان: افعال جعلی، افعال تبدیلی، متون فارسی میانه، زبان پهلوی، تحلیل پیکره بنیان
 • مسعود قیومی* صفحات 21-45
  گفتمان خبری گونه ای تحلیل گفتمان است که به تحلیل ساختار گفتمان خبری می پردازد. باتوجه به این که در قالب بندی اخبار دو ویژگی انتخاب و برجستگی در نمود ارتباطی خبر نهفته است، از ساختار هرم وارونه خبر برای درجه بندی اهمیت بخش های گفتمانی خبر استفاده می شود. اگرچه رعایت ساختار هرم وارونه خبر مطلوب است، گاهی ممکن است در گفتمان خبری این ساختار دچار تغییر شود که در این مقاله تلاش می شود با کمک تحلیل آماری، به تحلیل ساختار گفتمان وبگاه های خبری فارسی پرداخته شود. برای رسیدن به هدف می توان از علم داده استفاده کرد. این بین رشته ای از جنبه علمی به تحلیل داده، یافتن مفاهیم ضمنی به دست آمده از تحلیل داده ها و استخراج دانش از داده ها می پردازد. در چارچوب علم داده به بررسی پیکره ای متون خبری فارسی پرداخته شده و وجود رابطه همبستگی معنایی میان عنوان خبر و محتوای خبر در ساختار هرم وارونه خبر مورد مطالعه قرار می گیرد. برای دستیابی به این هدف، با استفاده از روش خزش، یک پیکره خبری نسبتا بزرگ با حجمی بالغ بر 14میلیارد واژه از 24 وبگاه خبری به دست آمده است. پس از پیش پردازش و اعمال یکدستی نسبی در این پیکره، در چارچوب معناشناسی توزیعی، بردار عنوان خبر و متن خبر با استفاده از مدل بردارسازی واژه ورد2وک به دست آمده و براساس آن بردار هر خبر ساخته شده است. پس از بخش بندی محتوای هر خبر براساس هرم وارونه خبر به سه قسمت سرنخ (لید)، بدنه و ارایه توضیحات بیشتر درمورد سرنخ، با استفاده از ضریب همبستگی پیرسون، میزان همبستگی میان عنوان و هر یک از سه بخش خبر محاسبه شده است. اگرچه ضریب همبستگی پیرسون برای حجم زیادی از خبرها مثبت بود، ارزش صفر و عدم وجود همبستگی برای خبرها یافت شد. به طور متوسط، همبستگی میان عنوان و بدنه خبر بیش از همبستگی میان عنوان و توسعه سرنخ بود. این پژوهش می تواند به عنوان روشی برای دقت در انتخاب عنوان و محتوا و پالایش خبری منطبق بر هرم وارونه استفاده گردد.
  کلیدواژگان: پیکره خبری، ضریب همبستگی پیرسون، معناشناسی توزیعی، ورد2وک، هرم وارونه خبر
 • مجید ادیبیان، سعیده ممتازی* صفحات 47-69
  در دنیای امروز شاهد رشد تولید داده ‎های مختلف از جمله داده های متنی هستیم و همواره حجم زیادی از داده‎ های متنی به روش های مختلف به خصوص در شبکه ‎های اجتماعی تولید می‎ شود. ولی این متن ‎ها غالبا غیررسمی و دارای خطاهای بسیاری هستند که باعث می ‎شود امکان استفاده از آن‏ها در بسیاری از پردازش‎ های زبان طبیعی وجود نداشته باشد. در این مقاله به تبدیل متن محاوره ای به متن رسمی در زبان فارسی پرداخته شده است. برای این منظور دو مدل مختلف براساس مدل کدگذار-کدگشا و مدل مبدل که از به روزترین مدل های دنباله-به-دنباله هستند پیاده سازی شده اند. در کنار استفاده از مدل های شبکه عصبی، مجموعه ای از قواعد در تبدیل متن محاوره ای به رسمی فراهم شده اند و تاثیر استفاده از این قواعد در کنار هر یک از دو مدل بررسی شده است. در انتها نتایج مدل های گفته شده مقایسه شده اند که در بهترین حالت این نتایج به دست آمده به دقت 70.7 درصد در معیار بلوی ارتقاء یافته رسیده اند.
  کلیدواژگان: پردازش زبان طبیعی، تبدیل محاوره ای به رسمی، مدل کدگذار-کدگشا، مدل مبدل
 • محمد حسین جعفری هرندی*، فاطمه آزادی، سپهر رفیعی، هشام فیلی، محمد جواد دوستی صفحات 71-86
  امروزه، ارزیابی ترجمه ماشینی بدون داشتن ترجمه مرجع، به عنوان یکی از حوزه های پژوهشی ترجمه ماشینی از اهمیت بالایی برخوردار است. یکی از چالش های موجود در این زمینه، مخصوصا برای زبان های کم منبع، عدم وجود داده های آموزشی مناسب است. برای این منظور میتوان از روش های مبتنی بر شبکه عصبی که قبلا روی مدلهای زبانی چند زبانه آموزش دیده شده استفاده کرده و با استفاده از یادگیری انتقالی کیفیت ترجمه برای یک جفت زبان جدید را تخمین زد. در این مقاله کیفیت یک مجموعه تست انگلیسی - فارسی به این صورت تخمین زده شده است. همچنین مجموعه ای از داده های آموزشی برای جفت زبان انگلیسی - فارسی تهیه شده و روی آن پیش پردازش های مناسب انجام گرفته مدل چند زبانه موجود با آن دادگان تنظیم دقیق شده است. استفاده از این داده های آموزشی، همبستگی پیرسون با مجموعه تست را به میزان 29 درصد بهبود داده است.
  کلیدواژگان: تخمین کیفیت، ترجمه ماشینی، شبکه عصبی، یادگیری انتقالی، تنظیم دقیق
 • محمدعلی صدرایی، احسان الدین عسگری*، حمیدرضا ربیعی صفحات 87-103
  زبان تاجیکی، یا به شکل درست تر گویش تاجیکی زبان فارسی، از گونه های زنده زبان فارسی است که در کشور تاجیکستان رواج دارد. مهم ترین تفاوت فارسی رایج در ایران با فارسی تاجیکی در سیستم نوشتار است که این تفاوت سبب ایجاد گسست فرهنگی میان دو ملتی که گفتار هم را متوجه می شوند، شده است. ساخت سامانه ای برای تبدیل این دو نوشتار می تواند به نزدیکتر کردن این دو ملت کمک شایان ذکری کند. در گذشته تلاش هایی برای ساخت نویسه گردان رایانشی بین این دو گونه نوشتار صورت گرفته است. این سامانه ها با استفاده از روش های سنتی و قانون محور این کار را انجام می دادند و برای همین خطاهای قابل توجهی در خروجی خود دارند. در این پژوهش تلاش شده است که با کمک روش های یادگیری ژرف این نویسه گردانی انجام شود. در دهه گذشته این روش ها تحول عظیمی در زبانشناسی رایانشی ایجاد کرده اند. در این پژوهش ابتدا پیکره موازی میان فارسی و تاجیکی جمع آوری شده است. سپس با کمک مدل های رشته به رشته یک سامانه نویسه گردانی با عملکرد بهتر نسبت به سامانه های گذشته ایجاد شده است.
  کلیدواژگان: یادگیری ژرف، مدل کدگذار-کدگشا، نویسه گردانی، فارسی تاجیکی
 • حسین رضویان*، الهه رضایی، علی اصغر سلطانی صفحات 105-126
  در رویکردهای مختلف تحلیل گفتمان، روند بسته بندی و انتقال پیام از نویسنده یا گوینده به مخاطب، دارای ساختار منحصر به فرد است. برای شناسایی این ساختار، پژوهش حاضر، با بررسی عناوین روزنامه های «ایران» و «ایران ورزشی» انجام گرفته است. توصیف و تحلیل پیکره در چارچوب نظری «بسته بندی اطلاعات» ولدووی (1990) انجام شده است تا مشخص شود که روزنامه نگاران فارسی زبان برای انتقال پیام خود از چه ساختاری استفاده می کنند و هدف آنان از استفاده ی این ساختهای ویژه چیست. برای رسیدن به هدف مذکور و پاسخ به پرسش های پژوهش، هزار عنوان از روزنامه های مذکور انتخاب و بررسی شده است. شناسایی عناوین پر بسامد و تفاوت موجود در آنها از اهداف دیگر این پژوهش بوده است. یافته های پژوهش، نشان داد که الگوی رابط/ تاکید/ انتها، به عنوان صورت بی نشان در پیکره تظاهر یافته است. الگوی رابط/ تاکید/ انتها به عنوان پر بسامد ترین الگو در روزنامه ی ایران و نیز الگوی رابط/ تاکید به عنوان پر بسامد ترین الگو در روزنامه ایران ورزشی شناخته شده است. گویا روزنامه نگاران فارسی زبان، به منظور انتقال صحیح پیام خود، مخاطب را به سمت اطلاع از پیش موجود در ذهنش سوق داده تا هم مخاطب استنباط بهتری از خبر داشته باشد و هم بر جذابیت و روانی متن و پیام خود بیفزایند. در عناوین هر دو روزنامه از ساختار رابط/ تاکید استفاده شده و تنها تفاوت دو روزنامه، منوط به وجود انتها در روزنامه ی ایران است که در اکثر عناوین، با الگوی رابط/ تاکید/ انتها مشهود گشته است.
  کلیدواژگان: ساخت اطلاعی، بسته بندی اطلاعات، اطلاع کهنه و اطلاع نو، روزنامه های فارسی
 • آزاده میرزائی*، فاطمه صدقی صفحات 127-145
  این مقاله از نحوه شکل گیری پیکره «چکیده های مقالات و پایان نامه های دانشگاهی دانشگاه علامه طباطبایی» و همچنین از ویژگی ها و امکانات آن می گوید. داده های این پیکره شامل ده هزار چکیده پایان نامه و 9538 چکیده مقاله (برگرفته از نشریات علمی دانشگاه علامه طباطبایی) با حجمی در حدود سه و نیم میلیون موردواژه است که در قالب طرح پژوهشی گردآوری شده اند. اهمیت داده های این پیکره یعنی چکیده های دانشگاهی از آن جهت است که این نوع داده ها به عنوان متون تالیفی فشرده و با محتوای علمی می توانند تصویرگر ویژگی های خاص زبان علم به عنوان گونه ای از زبان باشند. در این نوشتار برای بیان اهمیت دسترسی به چنین داده هایی و به جهت بررسی امکانات پیکره، محتوای واژه ای بخشی از داده با توجه به مفهوم کلیدی بودگی و فهرست چندپشته ها مورد بررسی قرار گرفت. بررسی ها نشان داد محتوای واژگانی این پیکره می تواند پژوهشگران را به سوی طرح برخی فرضیه ها سوق دهد. همچنین بررسی چندپشته های داده های علمی نشان داد که زبان علم دارای توالی های واژه ای مشخصی است که می تواند تصویرگر نوع خاصی از زبان باشد.
  کلیدواژگان: پیکره، زبان علم، کلیدی بودگی، چندپشته، زبان فارسی
 • نورالرحمن ناصح*، محمد دبیرمقدم صفحات 147-167
  چکیده تمام زبانهای جهان ساخت جملات شرطی دارند، که درفرایند شرطیسازی به گونهی مختلف رفتار میکنند. یعنی طبقه بندی ساخت شرطی در زبانها به صورت مختلف شکل گرفته است، ساخت شرطی عبارتهای زبانی متشکل از بند وابسته و بند پایه هستند که یکی را بند شرط و دیگری را بند نتیجه مینامند. موضوع این مقاله با توجه به رویکرد رده شناختی، به بررسی ویژگیهای ساختاری بندشرط و پیوندواژه های شرط در زبان پشهای پرداخته است، درزبان پشهای الگوی رایج شرطیسازی آمدن پیوندواژهی /Ɂæɟæ / "اگر" است، اما پیوند واژه های دیگر هم وجود داردکه جملات شرطی را در زبان پشهای شکل میدهند. بخش اول مقاله ساخت بینشان جملات شرطی در زبان پشهای را مورد بررسی قرار میدهد. دربخش دوم به جملات شرطی نشاندار یعنی واژگانی و معنایی پرداخته خواهدشد. شیوهی ارایهی داده ها اینگونه است، متن زبان پشهای آوانویسی شده، مثالها به زبان فارسی نیز برگردان شده اند تا درتحلیل داده ها مشکل ایجاد نگردد. در پژوهش حاضر از نشانه های الفبای آوایی بین-المللی استفاده شده است.
  کلیدواژگان: زبانهای افغانستان، جملات مرکب، ساخت شرطی، زبان پشهای، پیوندواژه
 • یوسف آرام*، شهلا توکلی یکتا صفحات 169-188
  گفتمان نماها، به عنوان هدایت کنندگان و یکپارچه کنندگان گفتمان، از عناصر مهم زبانی در نظام زبان به شمار رفته و مطالعه آنها از مباحث مهم و جدید در زبان شناسی است. این واحدهای زبانی به کلمات و گروه هایی اشاره دارد که به تنهایی بدون معنی و فاقد نقش نحوی می باشند و نقش شان در جمله معمولا ایجاد ترابط در میان پاره گفتارها بوده و نشان دهنده وجود یک رابطه کلامی اند. این کلمات که معمولا از نظر نحوی، قید یا حرف ربط می باشند، نقش های متفاوتی را در نظام زبان ایفا می کنند. از آنجا که نقش اصلی گفتمان نماها در سطح گفتمان، یعنی در توالی پاره گفتارها است نه در سطح پاره گفتارها یا جملات، بر همین اساس، مستقل از نحو محسوب می شوند. در این بررسی، نقش های تقابلی، تاکیدی و تاییدی گفتمان ها مطمح نظر قرار گرفته اند. از این رو، در این پژوهش، بررسی سیر تحول درزمانی نقش های واژه فارسی «راستی» از قرون متقدم تا قرن معاصر در کانون توجه قرار گرفته است. ازآنجایی که این پژوهش ماهیتا پیکره بنیاد و اسنادی است، پیکره ای متشکل از 22 اثر نوشتاری مربوط به دوره متقدم و 58 اثر نوشتاری مربوط به دوره متاخر برگزیده شده است. بر بنیاد یافته های پژوهش حاضر، واژه «راستی» در قرون متقدم عموما به صورت اسم، اسم مصدر، صفت و قید به کار رفته است، اما با گذشت زمان از رهگذر کاربردی شدگی، این عنصر زبانی به جایگاه آغازین منتقل شده و به گفتمان نما تبدیل شده است. در بررسی تطبیقی با مشخصه های گفتمان نمایی اسکوراپ (1999) و هاینه (2013) اثبات شد که در زبان فارسی، واژه «راستی» یک گفتمان نما محسوب می شود. همچنین مشخص شد که نقش هایی که گفتمان نمای «راستی» در زبان فارسی می پذیرد، با سبک های تقابلی نورویکوا آنودرا (2004) و نقش های معنایی تراگوت (1982) مطابقت داشته است. از سوی دیگر، مشخص شد که با نقش های تاکیدی و تاییدی برینتون (1996) همسانی دارد. بر اساس یافته-های این پژوهش، گفتمان نمای «راستی» در نقش تاکیدی بسامد بیشتری داشت.
  کلیدواژگان: گفتمان نما، تقابلی، تاکیدی، تاییدی، کاربردی شدگی
 • زهرا اسدیان اصفهانی*، یسرا شادمان صفحات 189-212
  این مطالعه به تجزیه و تحلیل شناختی-انتقادی کاربرد عبارت های استعاری در عناوین خبری جنگ یمن در سه روزنامه فارسی زبان کیهان، عرب زبان الحیات و انگلیسی زبان نیویورک تایمز می پردازد. در این راستا، پژوهش حاضر در پی یافتن پاسخ برای این پرسش است که آیا در ساخت تعبیرات استعاری مربوط به جنگ یمن، این سه روزنامه از حوزه های مفهومی مشابهی استفاده می کنند. آیا استعاره هایی که از سوی این سه روزنامه به کاررفته ، منجر به تثبیت گزاره ها و مفاهیم مشترکی شده است و آیا مفاهیم انتزاعی که از ورای استعاره ها ساخته شده ، ایدیولوژی خاص هر روزنامه را بازنمایی می کند. به این منظور، عناوین خبری مربوط به جنگ یمن منتشر شده از دی ماه 1394 تا اردیبهشت 1399 در روزنامه کیهان، الحیات و نیویورک تایمز با جستجو در پایگاه اینترنتی این سه روزنامه جمع آوری شد. با استفاده از نظریه استعاره مفهومی، عبارت های استعاری شناسایی شده، به تفکیک زبان و براساس حوزه مفهومی دسته بندی گردید. با بهره گیری از نظریه آمیختگی مفهومی، صورت انتزاعی هر یک از حوزه های مفهومی، بر شبکه های آمیختگی مفهومی نمایش داده شد تا ساختارهای پیدایشی این شبکه ها که در فضای آمیخته شکل گرفته اند، یک گفتمان انتزاعی را به منظور تجزیه و تحلیل انتقادی کلام شکل دهند. در پایان هیچ ساختار پیدایشی که در گفتمان استعاری هر سه روزنامه مشترک باشد، مشاهده نگردید. اما مفاهیم «جنگ ویرانگر» و «جنگ رعب آور» به عنوان گزاره های مشترک در گفتمان انتزاعی روزنامه کیهان و روزنامه نیویورک تایمز شناسایی گردید. تنها گزاره مشترک مابین کیهان و الحیات «راه حل» است. همچنین، گزاره «تغییرپذیری» مابین گفتمان انتزاعی روزنامه الحیات و نیویورک تایمز مشترک است. این شباهت ها و تفاوت ها مبین آن است که می توان بازتاب ایدیولوژی هر روزنامه را در ساختارهای استعاری مربوط به عناوین خبری جنگ یمن مشاهده کرد.
  کلیدواژگان: استعاره های جنگ، تحلیل انتقادی استعاره، نظریه استعاره مفهومی، نظریه آمیختگی مفهومی، گفتمان انتزاعی
 • مژگان همایونفر* صفحات 213-234
  در خصوص ارجاع متقابل در زبان فارسی، آراء مختلفی وجود دارد. برخی آن را مطابقه مفعولی در نظر گرفته اند (راسخ مهند 1384) و برخی از آن با عنوان نمایه سازی مفعول نام برده اند (بهرامی و رضایی1392). حتی در مطالعات صورت گرفته در سطح جهانی نیز مرز مشخصی میان مطابقه و ارجاع متقابل تعریف نشده است؛ برای مثال سیویرسکا (1999) هر دو را مطابقه و هسپلمث (2015) هر دو را نمایه سازی موضوع می نامد. طبق نظر مطرح در سیویرسکا (1999) در زبان های دارای مطابقه فاعلی و مفعولی، حتی نشانگرهای مطابقه فاعلی نیز مسیر دستوری شدگی خود را به طور کامل طی نمی کنند و واژه بست باقی می مانند. در این جا تلاش می شود تا با بررسی داده های فارسی نشان دهیم اولا شناسه های فارسی وندند در نتیجه زبان فارسی دارای مطابقه فاعلی دستوری است و پی بست های ضمیری به کار ارجاع متقابل می آیند و ثانیا ارجاع متقابل و مطابقه، دو سازوکار متفاوت در فارسی هستند؛ ارجاع متقابل، برخلاف مطابقه، اختیاری است و با انگیزه های گفتمانی صورت می گیرد و از اصول و محدودیت های نحوی ناظر بر مطابقه پیروی نمی کند. در مقابل، مطابقه رابطه ای است نحوی و تابع شرط نفوذناپذیری فاز (چامسکی، 2001). تامین نشدن این محدودیت، موجب برهم خوردن رابطه مطابقه و بدساختی جمله می شود.
  کلیدواژگان: ارجاع متقابل، مطابقه مفعولی، شناسه، پی بست ضمیری، شرط نفوذناپذیری فاز
 • مریم رحمانی*، ابراهیم شیخ مرند، حیدر نصرت زاده صفحات 235-259
  در واژه شناسی، واژه عنصری است که در ساخت گروه استفاده می شود و به پدیده ای خیالی، واقعی، مادی یا انتزاعی در جهان خارج دلالت می کند. در ایران، وظیفه ی واژه سازی، تثبیت واژه ها، واژه یابی و معادل-سازی، بر عهده ی فرهنگستان است. بر این اساس، هدف این پژوهش بررسی فرآیندهای واژه سازی وام واژه های مصوب فرهنگستان زبان و ادبیات فارسی است، که با استناد بر نظریه ی لایه ای کیپارسکی که در حیطه ی واژه سازی مورد استفاده قرار میگیرد، به انجام رسیده است. در راستای هدف ذکر شده، روش توصیفی-تحلیلی، ابزار جمع آوری داده به شکل کتابخانه ای و رویکرد منطقی حاکم استقرایی- قیاسی بکار رفته است. نیز حیطه ی وام واژه های غیرتخصصی در زبان فارسی نو، درصد سال اخیر صورت گرفته است. با توجه به هدف و روش یاد شده، جهت بررسی انگاره ی صرف واژگانی کیپارسکی در معادل یابی های مصوب فرهنگستان، 5000 معادل یابی بررسی شده است، که از میان آنها 600 واژه بر اساس ترکیب و اشتقاق برگزیده شده است، از این میان، تعداد 397 واژه، یا 66 درصد از کل پیکره، بر اساس نظریه ی لایه ای کیپارسکی، قابلیت تجزیه و تحلیل را یافتند. تعداد 203 واژه، برابر با 34 درصد از کل پیکره غیرقابل تحلیل ارزیابی گردیدند.
  کلیدواژگان: اشتقاق، ترکیب، ترتیب لایه ای و تغییر مقوله، صرف واژگانی، کیپارسکی
 • نیره جودی* صفحات 261-275

  علاقه به بررسی بنیان های عصبی زبان در مغز به پیدایش علوم اعصاب نوین در قرن نوزدهم برمی گردد. امروزه ابزارهایی مانند تصویربرداری تشدید مغناطیسی کاربردی (اف. ام. آر. آی.)[1] و ثبت سیگنال های مغزی با تکنیک انسفالوگرافی (ای. ای. جی.)[2] و دیگر تکنیک های مشابه به ما این امکان را می دهند که فعالیت مغز در هنگام انجام تکالیف شناختی پیچیده مانند صحبت کردن یا خواندن را به صورت غیرتهاجمی مطالعه کنیم. کتاب زبان و مغز: راهنمای مختصر عصب شناسی زبان را انتشارات دانشگاه آکسفورد در سال 2022 منتشر کرده است تا خوانندگان را با تازه ترین پیشرفت های علوم اعصاب مرتبط به درک ما از بنیان های عصبی زبان آشنا کند. نویسنده کتاب، جاناتان آر. برنن[3]، چگونگی ارتباط سیگنال های مغزی با ساختار شناختی زیربنایی زبان انسان را با مرور پژوهش های انجام شده در زمینه عصب شناسی زبان بررسی می کند.کتاب در 10 فصل و 225 صفحه به مسایل مرتبط با چگونگی پردازش زبان در مغز می پردازد. توالی فصل های این کتاب مسیری را دنبال می کند که درون داد صوت شناختی[4] طی می کند تا به صورت جمله معنادار درک شود. عنوان فصل های کتاب به ترتیب زیر است: 1) مقدمه، 2) جعبه ابزار، 3) آواها در مغز، 4) کدی عصبی برای گفتار، 5) فعال سازی واژه ها، 6) بازنمایی معنی، 7) ساختار و پیش بینی، 8) ترکیب جمله ها، 9) ساختن وابستگی ها10)جمع بندی.در فصل 1 تاریخچه ای از آن معرفی شده است. فصل 2 ابزارها و روش های مربوط به علوم اعصاب را مروری سریع می کند که دانستن درباره آنها برای فهم ادامه مطالب کتاب مهم است. فصل 3و 4 بر آوا تمرکز دارد: مغز چطور معنی را بر اساس موج صوتی منتشرشده در هوا خلق می کند؟ دستیابی و بازنمایی آن معانی توسط مغز موضوع بحث فصل 5 و 6 است. انسان (معمولا) با واژه های منفرد ارتباط برقرار نمی کند. زبان فوق العاده است و به صورت قابل توجهی در چگونگی ترکیب واژه ها باهم برای خلق گفته یا فکر کردن به چیزهایی که تاکنون کسی آن ها بیان نکرده، یکتا است. فصل های 7-9 به این موارد می پردازند. ایده هایی که در این فصل ها به آنها پرداخته شده است بر یکدیگر تاثیر متقابل دارند. هرچند نویسنده تلاش می کند آنها را با ترتیبی منطقی بنویسد ایده های مرتبط به هم را در فصل های مختلف به وسیله هایپرلینک به یکدیگر متصل و مرتبط کرده تا به این صورت خوانندگانی که می خواهند از برخی مسایل بگذرند به راحتی بتوانند مطالب مرتبط در فصل ها را دنبال کنند.این کتاب که به زبانی ساده و با اهداف آموزشی برای پژوهشگران و دانشجویان تازه وارد به حوزه عصب شناسی زبان نوشته شده است توجه خواننده را به موضوع های گسترده تر و مهم تری جلب می کند. در واقع چگونگی ارتباط بین مفاهیم انتزاعی مانند «دانستن یک زبان» با سیگنال های مغزی مشخصی که در آزمایشگاه مشاهده و اندازه گیری می شوند از محورهای اصلی کتاب است. نویسنده با توجه به موضوع هر فصل و پژوهش های انجام شده در آن زمینه شرح می دهد که داده های به ظاهر متفاوت و حاصل از آزمایش های مختلف چگونه بر یکدیگر انطباق می یابند. در ادامه به مرور مختصر فصل های این کتاب پرداخته می شود. [1]. functional magnetic resonance imaging (fMRI)[2]. electroencephalography (EEG)[3]. J. R. Brennan, Associate Professor of Linguistics & Psychology. University of Michigan

 • امید طبیب زاده* صفحات 277-295

  روزی به ابوالفضل خطیبی گفتم شاید بتوان از ویژگی های وزنی در مقام کلیدی سبک شناختی برای روشن کردن صحت یا عدم صحت بعضی انتساب های ادبی بهره جست، و او گفت چنین هنری از عهده عروض پرتفصیل سنتی ما برنمی آید! توضیح دادم که عروض جدید و مخصوصا عروض نجفی (1395)، با گنجاندن قواعد تقطیع ذیل 11 ویژگی، این امکان را به ما می دهد که به سادگی و براساس آن ویژگی ها و برخی فرعیات برآمده از آنها، تفاوت های وزنی بین شعر های گوناگون را بررسی کنیم، و وقتی بیشتر از شیوه کار و برنامه ام برایش سخن گفتم، او علاقمند شد و مرا به انجام پژوهشی در این زمینه تشویق کرد. کار را شروع کردم اما پس از چندی رهایش کردم تا این که خود خطیبی سراغش را گرفت و من گفتم می ترسم زحمت زیادی متقبل شوم بی آن که به نتیجه مشخصی برسم. او در پاسخ گفت حتی همین هم خودش نتیجه مشخصی است، زیرا اولا تکلیف وزن را در کار بررسی های سبک شناختی و تحولات تاریخی شعر فارسی روشن می کند، و ثانیا اگر کوچک ترین فایده ای داشته باشد، بابی را می گشاید که شاید مورد توجه قرار گیرد و به تدریج منشاء دست آوردهای بیشتری شود. باری حال به یاد او دو باره به این بحث که بارها سراغش را از من گرفته بود پرداختم و امیدوارم که محققان، برای رد یا اثبات ادعاهای تحقیق حاضر، این شیوه را با پیکره های انبوه تر و البته وزن های دیگر بیازمایند، و یقین دارم فواید بسیاری از چنین مطالعاتی در حوزه سبک شناسی شعر فارسی عاید خواهد شد.

  کلیدواژگان: وزن شعر، مقام کلیدی، سبک شناختی
|
 • Farzaneh Goshtasb *, Nadia Hajipour Pages 1-19
  The construction of the verbs is based on two stems, past and present. The present stem is used to make present and imperative verbs, and the past stem, which is the ancient Iranian past participle, is used to make past tense verbs. In Persian grammar, such verbs are called main verbs. In Middle Persian, there is another type of verb construction, which is called denominative verbs. These verbs are constructed according to a certain rule and are common constructions in Pahlavi language. This research is aimed at statistical investigating of the use of different grammatical categories such as noun, adjective, preposition, adverb, pronoun, and prefix to create a denominative verb. This research tries to answer the following questions: which grammatical categories are used more frequently in the construction of denominative verbs; which conjugation has more frequency and in which Middle Persian texts occurs more often. The data is gathered from a corpus of 12 Pahlavi texts with 46,570 words. The results of the data analysis showed that most of the denominative verbs were constructed using noun and adjective, although these verbs were also made from other categories such as adverbs, prepositions, and pronouns. The transitive past tense is the most used construction in the texts, and is more frequent in the texts based on the Zend of Avesta, such as the Wizīdagīhā ī Zādsparam.
  Keywords: Denominative verbs, Middle Persian texts. Pahlavi language, Corpus-based Analysis
 • Masood Ghayoomi * Pages 21-45
  News discourse is a type of discourse analysis that deals with the analysis of news discourse. Due to the fact that in the formatting of news there are two hidden features of selection and prominence in the communication representation of news, the inverted pyramid of news is used to grade the importance of the discourse parts of the news. Although it is desirable to meet the structure of the inverted pyramid of news, sometimes this structure may change. In this article, we put an effort to analyse the discourse analysis of Persian news websites with the help of statistical analysis. To research the goal, data science can be used. This inter-discipline deals with data analysis from a scientific aspect, finding implicit concepts to be obtained from data analysis and extracting knowledge from the data. In the framework of data science, we examined the Persian news corpus and studied the existence of semantic correlation between the news title and the news content based on the structure of the news inverted pyramid. To achieve the goal, by using the crawling method, a relatively large news corpus with a volume of 14 billion words has been obtained from 24 news websites. After pre-processing and normalizing the corpus, in the framework of distributional semantics, the vector of title news and content have been created by using the Word2Vec tool for creating the vector model to have the vector representation of each news. After segmenting news content into three parts (lead, body and further explanation about the lead) according to the inverted pyramid, the Pearson correlation coefficient has been used to calculate the correlation between the title and each part of the news. Although Pearson's correlation coefficient was positive for a large number of news, zero value and no correlation was found for the news. On average, the correlation between the headline and the news lead and body was higher than the correlation between the headline and the lead development. This research can be used as a method to carefully select the title and content and filter the news according to the inverted pyramid structure.
  Keywords: news corpus, Pearson correlation coefficient, distributional semantics, Word2Wok, news inverted pyramid
 • Majid Adibian, Saeedeh Momtazi * Pages 47-69
 • Mohammad Hossein Jafari Harandi *, Fateme Azadi, Sepehr Rafiei, Hesham Faili, Mohammad Javad Dousti Pages 71-86
  Nowadays the evaluation of machine translation without reference translation is of great importance as one of the research areas of machine translation . One of the challenges in this field, especially for languages with few sources, is the lack of suitable training data . For this purpose, it is possible to use neural network based methods that have been previously trained on multilingual language models and estimate the translation quality for a pair of new languages using transfer learning . In this article, the quality of an English Persian test set is estimated in this way. Also, a set of educational data for the English Persian language pair has been prepared, and appropriate pre processing has been done on it, and the existing multilingual model has been fine tuned with that data . The use of these training data has improved the Pearson correlation with the test set by 29
  Keywords: Quality estimation, machine translation, neural network, transfer learning, fine tuning
 • Mohammad Ali Sadraei Javaheri, Ehsan Asgari *, Hamid Reza Rabiee Pages 87-103
  The Tajik language, also known as Tajiki Persian, is a variation of Persian (Farsi) spoken in Tajikistan. One of the main distinctions between Iranian Persian and Tajiki Persian is the writing script. Since the early 1900s, Tajiki has been written in the Cyrillic script. Although the difference between spoken Tajiki and spoken Persian is not significant, the script difference caused a culturalbreak between these two nations making many cultural resources (e.g., poems, stories, etc.) unavailable for the newer generations. An automatic and accurate transliterator model can again fill the gap between Persians and Tajiks and facilitate transfer learning between these two language variations. The efforts on Persian-Tajiki transliteration have primarily been rule-based and context-independent, causing many errors. Deep learning methods, particularly neural language models, revolutionized computational linguistics in the last decade by providing language understanding through contextualized representations. In this work, we create a Persian-Tajiki transliteration dataset for training and evaluation purposes. We also train an accurate neural sequence-to-sequence model transliterating between Tajiki-Persian and Persian-Tajiki.
  Keywords: Deep Learning, Encoder-decoder model, transliteration, Tajiki Persian
 • Hossein Razavian *, Elahe Rezaei, Ali Asgar Soltani Pages 105-126
  In different approaches of discourse analysis, the process of packaging and transferring the message from the author or speaker to the audience has a unique structure. In order to identify this structure, the current research has been conducted by examining the titles of "Iran" and "Iran-e varzeshi” newspapers. The description and analysis of the corpus has been carried out in the theoretical framework of "information packaging" by Vallduvi (1990) in order to determine what structure Persian language journalists use to convey their message and what is their purpose in using these special constructions. In order to achieve the mentioned goal and answer the research questions, a thousand titles of the mentioned newspapers have been selected and reviewed. Another goal of this research was to identify the high-frequency titles and the differences in them. The findings of the research showed that the link/ focus/ tail pattern was manifested as an unmarked face in the body. The link/ focus/ tail pattern is known as the most frequent pattern in Iran newspaper, and the link/ focus pattern is known as the most frequent pattern in Iran Sports newspaper. It seems that the Persian language journalists, in order to convey their message correctly, have led the audience to the pre-existing information in their minds so that the audience has a better inference from the news and also increases the attractiveness and fluency of their text and message. In the titles of both newspapers, the link/emphasis structure is used, and the only difference between the two newspapers is due to the presence of the end in the Iranian newspaper, which is evident in most of the titles with the link/ focus/ tail pattern.
  Keywords: Information structure, Information packaging, Old, new information, Persian newspapers
 • Azadeh Mirzaei *, Fatemeh Sedghi Pages 127-145
  This study explains how to develop the corpus of “ATU Papers, Theses and Dissertations Abstracts” and introduces the different characteristics and features of the corpus. The corpus contains ten thousand thesis abstracts and 9538 article abstracts from the scientific journals of Allameh Tabatabai University with a volume of more than three and a half million tokens. Academic abstracts as brief authored texts with scientific content can depict special linguistic features and therefore, they are valuable documents. In this article, to express the importance of access to such data and to examine some features of the corpus, the word content of a part of the data has been examined and presented according to the concept of keyness and n-grams. The results showed that the lexical content of this corpus could lead researchers to propose some hypotheses. Also, the exploring n-grams of this corpus showed that the language of science has specific word clusters that can depict a particular type of language.
  Keywords: corpus, Language of Science, keyness, N-gram, Persian language
 • Noorahman Naseh *, Mohammad Dabir Moghaddam Pages 147-167
  Abstract All languages in the world have conditional sentences that behave differently in the conditioning process. That is, the classification of conditional construction has been done in different ways in languages. Conditional construction are linguistic expressions consisting of dependent clause and base clause, one of which is called condition clause and the other is result clause. The subject of this article, according on the typological approach, examines the structural features of condition clauses and linkers of condition in the language of Pashai in the Pashai language, the common pattern conditioning is coming/Ɂæɟæ/linker namely//Ɂæɟær /in Persian, but there is other linker words that form conditional sentences in the language of the Pashai. The first part of the article examines the unmarked construction of conditional sentences in Pashai language And in the second part, will be discussed the about the marked conditional sentences, it means lexical and semantic, The data presented in this article is like this, the text of Pashai language become phonetic, the examples has also been translated.
  Keywords: languages of Afghanistasn, compound sentences, conditional construction, Pashai language, word linker
 • Yousef Aram *, Shahla Tavakoli Yekta Pages 169-188
  Discourse markers, as guides and integrators of discourse, are considered as important linguistic elements in the language system and their study is one of the important and new topics in linguistics. These linguistic units refer to words and phrases that alone have no meaning and no syntactic role, and their role in the sentence is usually to create a connection between the parts of speech and indicate the existence of a verbal relationship. These words, which are usually syntactically adverbs or connectors, play different roles in the language system. Since their main function is at the level of discourse (sequences of utterances) rather than at the level of utterances or sentences, discourse markers are relatively syntax-independent. In this study, contrastive, emphasizing and confirming functions of discourse markers have been considered. Therefore, The aim of this paper is the diachronic study of emergence of different functions of Persian word “Râsti”(truth), from old era to recent era. Since this research is inherently a documental and a corpus-based study, a corpus consisting of 22 written works related to the early period and 58 written works related to the late period has been selected. Based on the findings of the present study, the word “Râsti” in the earlier centuries was generally used as a noun, infinitive, adjective and adverb, but over time, through the pragmaticalization, it was transferred to initial place and changes to discourse marker. According to Schourup (1999) and Heine’s (2013) discourse marker’s features, the word “Râsti” has been proved to be a discourse marker. It was also found that the functions that the discourse marker “Râsti” accepts in Persian corresponded to the contrastive function presented by Noriko O Onodera (2004)) and to the semantic functions presented by Tragot (1982). On the other hand, it was found that the word “Râsti” is consistent with the emphasizing and confirming functions presented by Brinton (1996). Based on the findings of this study, the discourse marker “Râsti” had a higher frequency in its emphasizing role.
  Keywords: discourse marker, Contrastive, Emphasizing, Confirming, Pragmaticalization
 • Zahra Asadian Esfahani *, Yosra Shadman Pages 189-212
  This study provides a cognitive-critical analysis of the use of metaphorical expressions in the headlines of the Yemeni war in the Persian-language newspaper Kayhan, Arabic-language newspaper Al-Hayat and the English-language newspaper New York Times. To do this, news items related to the Yemeni war published from January 2016 to May 2020 were collected from Kayhan, Al-Hayat and the New York Times by searching the websites of the three newspapers. Metaphorical applications in these headlines were identified using Conceptual Metaphor Theory (CMT) and the identified metaphorical expressions were categorized by language and conceptual domain. Using the Conceptual Blending Theory (BT), the abstract form of each of the conceptual domains was projected on the conceptual blending networks, so that the emergent structures of these networks, formed in the blended space, could form an abstract discourse for critical analysis of speech (Hart Model). It was found that there is no common emergent structure between the metaphorical discourse of the three newspapers. Nevertheless, the concepts of “the ruinous war” and “the scary war” is common between Kayhan and the New York Times, and the concept of “solution” is common between Kayah and Al-Hayat. Also, the emergent structure of "variability" is common between Al-Hayat and the New York Times. These similarities and differences indicate that the specific ideological perspective of each of the newspapers is reflected in the metaphorical structures of the news headlines related to Yemeni war.
  Keywords: War Metaphors, Critical Metaphor Analysis, conceptual metaphor theory, conceptual blending theory, Abstract Discourse
 • Pages 213-234
  This paper claims different status for two rather similar sets of pronominal bound morphemes attach to verbs in Persian: first, subject agreement markers as affixes used to reflect grammatical subject agreement and second, bound person forms which are actually pronominal clitics also attach to verbs in an optional manner with optional conominal indicating cross-referencing. Siewierska (1999) believes that grammatical agreement is limited only to subject agreement thus subject agreement markers could be affixes meanwhile object agreement markers are always clitics. But it is not the case for languages with both subject and object agreement and subject agreement markers in these languages are also clitics. This paper discusses that since subject agreement markers in Persian are affixes indeed, so firstly Persian lacks object agreement and secondly pronominal clitics are cross-referencing elements. Agreement and cross-referencing are two separate strategies in Persian, agreement is a syntactic relation, constrained by Phase Impenetrability Condition (Chomsky, 2001) while cross-referencing is a discoursal, speaker-oriented phenomenon.
  Keywords: Cross-referencing, Agreement Markers, Pronominal Clitics, Phase Impenetrability Condition
 • Maryam Rahmani *, Ibrahim Sheikhzadeh Marand, Heydar Nosratzadeh _ Pages 235-259
  In lexicology, a word is an element that is used in the construction of a group and refers to an imaginary, real, material or abstract phenomenon in the outside world. In Iran, the task of creating words, consolidating words, finding words and making equivalents is the responsibility of Academy of Persian Language and Literature. Based on this, the aim of this research is to investigate the word formation processes of loanwords approved by the Persian Language and Literature Academy, which has been done based on Kiparski layered theory, which is used in the field of word formation. Due to the research aim, the descriptive-analytical method, the data collection tool in the form of a library and the inductive-deductive logical approach have been used. Also, the area of non-specialized loanwords in New Persian language has increased in recent years. According to the mentioned Aim and method, in order to investigate Kiparski lexical concept in the equivalences approved by the Academy, 5000 equivalences have been checked, among which 600 words have been selected based on composition and derivation, among them, 397 words, or 66% of the whole body was able to be analyzed based on Kiparski layered theory. The number of 203 words, equal to 34% of the entire words, was evaluated as unanalyzable.
 • Pages 277-295