نوع مقاله : علمی پژوهشی

نویسندگان

1 بخش زبانشناسی و زبانهای خارجی،دانشگاه پیام نور، تهران، ایران

2 گروه علم اطلاعات و دانش شناسی، دانشگاه پیام نور، تهران، ایران

چکیده

هدف: در این پژوهش، بااستفاده از تکنیک علم سنجی بنام طیف سنجی سال انتشار مآخذ، مهم‌ترین آثار تاریخی حوزه‌ی ترجمه‌ی ماشینی شناسایی و تحلیل شده‌اند.

روش: این پژوهش از نوع مطالعات علم سنجی میباشد که با استفاده از تکنیک RPYS انجام شده است. جامعۀ پژوهش را 7899 مقاله در حوز‌ه‌ی ترجمه‌ی ماشینی تشکیل می دهد که بین سالهای 1945 تا 2021 در وب آو ساینس نمایه شده اند. در راستای هدف پژوهش، ارجاعات استفاده‌شده در کلیه مقالاتی که در حوزه ترجمه‌ی ماشینی به چاپ رسیده‌اند مورد بررسی قرار گرفت (193912 ارجاع). پس از استخراج کلیۀ آثاری که در قسمت فهرست منابع این مقالات درج شده بودند، با استفاده از برنامه نرم افزاری CRExplorer نتایج تحلیل شد.

یافته‌ها: نتایج نشان داد که شانن در سال 1948 نخستین کسی بود که با معرفی مفهوم آنتروپی در فناوری اطلاعات مقدمات ترجمه‌ی ماشینی را فراهم ساخت. پس از ایشان ، ویور در سال 1949 با طرح ترجمه‌ی کلمه به کلمه در ترجمه‌ی ماشینی آماری، این حوزه را متحول ساخت. اما در سال 1966، این لونشتاین بود که با معرفی انقلابی "کدهای باینری" باعث گردید ترجمه‌ی ماشینی قادر به تصحیح، حذف و بازنگری در ترجمه شود. همچنین در سال 1977، دمپستر و همکارانش الگوریتم آماری جدیدی را جهت دستیابی به احتمال حداکثر در داده های ناقص ارائه کردند. در خاتمه، آثار دانشمندانی همچون براون (1993)، هوکرایتر (1997)، پاپیننی (2002) و کوهن (2007) در شکل‌دهی و توسعه‌ی ترجمه‌ی ماشینی از تاثیرگذاری بسزایی برخوردار بودند.

نتیجه گیری: بر اساس بررسی آثارتاثیرگذار در حوزه ترجمه‌ی ماشینی، نقش علم ریاضیات و آمار در شکل گیری این حوزه مشهود است.

کلیدواژه‌ها

موضوعات

عنوان مقاله [English]

Tracing the Historical Origins of Machine Translation: A bibliometric analysis via RPYS

نویسندگان [English]

  • Ebrahim Ezzati Larsari 1
  • Ali Akbar Khasseh 2

1 ,Department of linguistics and foreign languages, Payame Noor University, Tehran, Iran

2 Department of Knowledge and Information Science, Payame Noor University, Tehran,, Iran

چکیده [English]

This study tries to uncover the historical roots and influential publications in Machine Translation (MT) via a bibliometric analysis technique called RPYS. Preliminary data of study has been extracted from Web of Science concerning papers related to the MT from 1900 to 2021. Results exposed that the supreme enterprise of MT was initiated by Shannon in 1948; the one who illuminated the notion of entropy in information technology. After that, Weaver contributed to the appearance of statistical word by word MT in 1949. Moreover, it was Levenshtein(1966) who introduced the revolutionary notion of binary codes capable of correcting deletions, insertions, and reversals in MT. In addition, Dempster et al. (1977) presented a novel statistical EM algorithm concerning maximum likelihood from incomplete data. Later, the works of scholars Brown et al. (1993), Hochreiter (1997), Papineni et al. (2002), and Koehn et al. (2007) have been instrumental in shaping and developing MT.In overall, MT has been developed tremendously during the recent years. More precisely, it seems to be fair to say that it was the language of mathematics (0&1), as well as statistics (optimal estimation) that could feed any linguistic information into machines and computers to be processed naturally. Furthermore, it should be noted that the first attempts for MT began with introducing the way of feeding linguistic information into machine-compatible language by the help of mathematical coding systems. As it has been fulfilled, researchers intended to present a model based on statistical procedures in which word by word translation could be directed more accurately and precisely. Slowly but surely, the idea of word by word translation was developed into phrase-based and syntax-based translation. Meanwhile, there were lots of attempts towards the logicality, as well as the reasonability of automated translations. In view of that, researchers tried to improve the quality of translations by incorporating the context role in achieving a well-matched MT from source to the target language, especially in retrieving the semantic and pragmatic information of elliptic sentences .

کلیدواژه‌ها [English]

  • Citation Analysis
  • Machine Translation
  • Scientomerics
  • Referenced Publication Years Spectroscopy (RPYS)