TY - JOUR T1 - Analytical Comparison of Iranian Scientific Documents in Text Mining TT - مقایسه تحلیلی مدارک علمی ایران در حوزه موضوعی متن‌کاوی JF - babol-csj JO - babol-csj VL - 9 IS - 1 UR - http://cjs.mubabol.ac.ir/article-1-210-fa.html Y1 - 2022 SP - 104 EP - 116 KW - Data mining KW - Text mining KW - Evaluating science KW - Bibliometrics KW - Natural language processing N2 - سابقه و هدف: سیاست‌گذاران تلاش می‌کنند تا عملکرد علمی کشور خود را مورد ارزیابی قرار داده و آن را از نظر اثربخشی و حل مشکلات مورد سنجش قرار دهند. این مقاله به مقایسه تحلیلی مدارک علمی ایران در حوزه موضوعی متن‌کاوی بر اساس پایگاه‌های داخلی و خارجی می‌پردازد. مواد و روش‌ها: پژوهش حاضر از نوع توصیفی- پیمایشی و با رویکرد کتاب‌سنجی انجام شده است. برای بازیابی مدارک علمی مرتبط با متن‌کاوی در پایگاه اسکوپوس عبارات مرتبط با آن جستجو و سپس نتایج به ایران محدود شد. برای بازیابی مدارک علمی مجلات داخلی از پایگاه مرکز اطلاعات علمی جهاد دانشگاهی به شیوه مشابه استفاده شد. برای تجزیه و تحلیل داده‌ها از نرم‌افزارهای Bibexcel، Vosviewer، زبان برنامه‌نویسی Python و Excel استفاده شد. یافته‌ها: تعداد کل مدارک علمی ایران در حوزه موضوعی متن‌کاوی در پایگاه استنادی اسکوپوس، برابر با ۱۰۸۲ است. ۲۸۴ مدرک علمی (۲۶/۲۵%) از مدارک علمی نمایه‌­شده در اسکوپوس، بر زبان فارسی متمرکز هستند. همچنین بر اساس داده‌های پایگاه مرکز اطلاعات علمی، تعداد مدارک علمی این حوزه موضوعی برابر با ۸۹ و مدارک علمی متمرکز بر زبان فارسی برابر با ۵۱ (۵۷/۳۰%) است. مجله Lecture notes in computer science بیشترین تعداد مدارک علمی بین‌المللی ایران و مجله پردازش علایم و داده‌ها، بیشترین تعداد مدارک علمی داخلی ایران را در حوزه موضوعی متن‌کاوی منتشر کرده‌اند. با استفاده از آزمون تی مستقل مشخص شد بین تعداد مدارک علمی متمرکز بر زبان فارسی پایگاه اسکوپوس و مرکز اطلاعات علمی جهاد دانشگاهی، تفاوت معناداری وجود دارد (۰/۰۰۰۱>p). نتیجه‌گیری: میانگین نرخ رشد مدارک علمی ایران در حوزه متن‌کاوی بالاتر از حوزه‌های موضوعی دیگر است. کشورهای آمریکا، انگلیس و استرالیا بیشترین میزان مشارکت را با محققان ایرانی در این حوزه موضوعی داشته‌اند. همچنین مشخص شد مدارک علمی بین‌المللی که بر زبان انگلیسی متمرکز هستند، استناد بیشتری نسبت به مدارک علمی متمرکز بر زبان فارسی دریافت می‌کنند. M3 10.22088/cjs.9.1.104 ER -