سامانه مشابهتیاب جهاد دانشگاهی از حقوق پژوهشگران صیانت میکند
رئیس ستاد توسعه ICT و میکروالکترونیک معاونت علمی ریاست جمهوری، مشخصات سامانه تشخیص سرقت علمی جهاد دانشگاهی تحت عنوان سامانه مشابهتیاب «همتاجو» را تشریح کرد.
به گزارش گروه اجتماعی باشگاه خبرنگاران تسنیم «پویا»؛ سید مجتبی هاشمی در کنفرانس ملی بررسی راهکارهای پیشگیری از سرقت علمی با اشاره به سامانه مشابهتیاب متنی در مقالات فارسی تحت نام «همتاجو» اظهار کرد: این سامانه حاصل یک طرح پژوهشی است که توسط جهاد دانشگاهی و با حمایت معاونت علمی و فناوری ریاست جمهوری طراحی و پیادهسازی شده است.
رئیس ستاد توسعه فناوری اطلاعات، ارتباطات و میکروالکترونیک معاونت علمی و فناوری ریاست جمهوری افزود: از ضرورتهای انجام این طرح، لزوم صیانت از حقوق مؤلفان و محققان و تضمین فضای درستکاری علمی در چارچوب اخلاق علمی بوده است که در این زمینه مسلماً حاکمیت نیز میتواند نقشی مهم و سازنده ایفا کند که همان آگاهسازی، آموزش، ترویج اخلاق علمی و پیشگیری از وقوع سرقت علمی خواهد بود.
وی به مشخصات سامانه همتاجو اشاره و تصریح کرد: نرمافزار تشخیص سرقت علمی همتاجو، سامانهای تحت وب است که با استفاده از الگوریتمهای هوش مصنوعی میتواند شباهتهای متنی موجود میان مقاله علمی مشکوک را با مجموعه مقالات علمی پژوهشی کشور در پایگاه SID استخراج کرده و با استفاده از روشی هوشمند نتایج را براساس میزان مشابهت نمایش دهد؛ قاعدتاً این خروجی نیازمند بررسی نهایی توسط یک انسان خبره به عنوان داور یا ارزیاب است تا با توجه به بافتار جمله و اهمیت آن در نوشتار، نسبت به سرقت یا عدم سرقت علمی آن نظر نهایی کارشناسی را ارائه دهد.
هاشمی خاطرنشان کرد: از ویژگیهای این سامانه، امکان تشخیص جابهجایی کلمات، قابلیت شناسایی عبارات جایگزین شده و کشف سرقت علمی بازنویسی شده بر مبنای شبکه معنایی (Semantic Network) و روشهای مشابهتیابی معنایی است؛ به این ترتیب از نقاط قوت این سامانه، تشخیص سرقت معنایی حاصل از بازآرایی معنایی جملات است.
وی افزود: براین اساس ادغام دو جمله در یک جمله یا شکستن یک جمله به دو جمله قابل تشخیص است؛ ویژگی دیگر این این سامانه، اهمیت دادن به بخشهای خاص مقاله بر اساس اهمیت آن بخش در امر سرقت علمی است.
رئیس ستاد توسعه فناوری اطلاعات، ارتباطات و میکروالکترونیک معاونت علمی و فناوری ریاست جمهوری ادامه داد: سامانه همتاجو، تمامی مقالات و نشریات علمی منتشر شده در پایگاه نشریات جهاد دانشگاهی (SID) را تحت پوشش قرار داده است؛ این سامانه مرتباً پایگاه دادههای خود را بروز میکند.
هاشمی گفت: فاز بعدی این سامانه، توسعه سیستم تشخیص مشابهت بین زبانی است تا سرقت ترجمه را نیز پوشش دهد.
رئیس ستاد توسعه فناوری اطلاعات، ارتباطات و میکروالکترونیک معاونت علمی و فناوری ریاست جمهوری تولید پیکره ارزیابی برای بررسی صحت عملکرد سامانه را از ویژگیهای این سامانه عنوان کرد و افزود: نکته دیگر در این طرح، تولید و ایجاد پیکرههای زبانی به منظور ارزیابی سیستمهای مشابهتیاب و برای استفاده محققان حوزه پردازش زبان طبیعی است که جهاد دانشگاهی با حمایت معاونت علمی ریاست جمهوری آنها را تحت عنوان «پیکرههای همتا» معرفی و به جامعه دانشگاهی ارائه کرده است.
وی افزود: این پیکره با بیش از 5 هزار سند فارسی، در بخشی از آن موارد سرقت علمی مبتنی بر فرآیند ابهامافزایی مصنوعی شامل عملیاتی چون جابهجایی کلمات، حذف و اضافه کردن کلمات و جایگزین کردن کلمات با کلمات هممعنا، و ابهامافزایی با کمک عامل انسانی (بازنویسی عبارات) تولید شده است.
وی ابراز کرد: پیکره مشابهتیابی همتا-2 با بیش از 2 هزار و 500 سند انگلیسی است که در آن برای تولید موارد تقلب از دو فرآیند ابهامافزایی مصنوعی و ابهامافزایی شبیهسازی شده یا انسانی استفاده شده است همچنین پیکره مشابهتیابی همتا-1 نیز مشتمل بر بیش از 20 هزار سند فارسی و انگلیسی است.
هاشمی یادآور شد: اسناد انگلیسی به عنوان اسناد مرجع و اسناد فارسی به عنوان اسناد مشکوک به تقلب در نظر گرفته شده و موارد سرقت علمی در آنها درج شده است.
انتهای پیام/