Evidence – Telegram
Evidence
5.81K subscribers
120 photos
75 videos
20 files
401 links
مرور سیستماتیک، جستجوی پیشرفته، آمار و روش تحقیق، مدیریت رفرنس و تولید محتوا
ادمین: رسول معصومی

@rasoul911

https://evidence.ir
Download Telegram
▫️تفاوت‌های بین تئوری، چارچوب نظری و چارچوب مفهومی

در سال 2020 و در مجله Academic Medicine خانم Lara Varpio و سه همکارش مقاله‌ای با عنوان زیر منتشر کرده‌اند که تاکنون 1143 بار استناد دریافت کرده است.

The Distinctions Between Theory, Theoretical Framework, and Conceptual Framework

نویسندگان ابتدا به تعریف دو رویکرد کلی پژوهش پرداخته‌اند: رویکرد قیاسی عینی‌گرا (Objectivist Deductive) و رویکرد استقرایی ذهنی‌گرا (Subjectivist Inductive) و سپس سه اصطلاح تئوری (Theory)، چارچوب نظری (Theoretical Framework) و چارچوب مفهومی (Conceptual Framework) را تعریف و شرح داده‌اند.

رویکرد قیاسی عینی‌گرا

در رویکرد قیاسی، پژوهشگر از یک تئوری یا چارچوب نظریِ کلی آغاز می‌کند و با استخراج فرضیه‌ها یا پیش‌بینی‌هایی بر اساس آن تئوری، به جمع‌آوری داده‌های تجربی می‌پردازد تا این فرضیه‌ها را آزمون کند. این مسیر از کل به جزء است و هدف آن تأیید، رد یا اصلاح تئوری‌های موجود است. پژوهش‌های قیاسی اغلب در قالب آزمایش‌ها و مطالعاتی هستند که به بررسی رابطه علت و معلولی بین متغیرها می‌پردازند. چارچوب نظری یا مفهومی، قبل از شروع پژوهش تعیین می‌شوند و معمولاً در طول مطالعه ثابت باقی می‌مانند.

رویکرد استقرایی ذهنی‌گرا

در رویکرد استقرایی، پژوهشگر بدون فرضیه یا تئوری اولیۀ مشخص، با جمع‌آوری داده‌های تجربی درباره یک پدیده خاص آغاز می‌کند و تلاش می‌کند از دل داده‌ها، الگوها و مفاهیم جدید را کشف و تئوری‌سازی کند. این رویکرد از جزء به کل حرکت می‌کند و تأکید آن بر فهم عمیق پدیده و ایجاد یا توسعه تئوری‌های نوین بر اساس داده‌های گردآوری‌شده است. چارچوب مفهومی و حتی چارچوب نظری می‌توانند در طول پژوهش تکمیل و اصلاح شوند.

بیشتر پژوهش‌های کیفی، استقرایی و بیشتر پژوهش‌های کمی، قیاسی هستند. اما همیشه این‌طور نیست و نوع رویکرد (قیاسی یا استقرایی) بستگی به هدف، سؤال و طراحی پژوهش دارد و نه صرفاً روش (کیفی یا کمی) آن.

تئوری

تئوری مجموعه‌ای از گزاره‌ها و مفاهیم است که رابطه بین چندین مفهوم را به صورت منطقی بیان می‌کند و هدف آن کمک به درک جهان پیرامون است. تئوری‌ها می‌توانند توصیفی باشند (یعنی پدیده‌ای را نام‌گذاری و توصیف می‌کنند)، تبیینی باشند (روابط بین پدیده‌ها را روشن می‌سازند)، رهایی‌بخش باشند (ظلم و ستم وارده به یک گروه را بیان می‌کنند)، مخرب یا انتقادی باشند (دانش موجود را گسترش داده یا به چالش می‌کشند) یا پیش‌بینی‌کننده باشند (بر اساس داده‌ها یا ورودی‌های خاص، یک نتیجه را پیش‌بینی می‌کنند) و ممکن است دامنه آنها از تئوری‌های کلان تا خرد متفاوت باشد. قدرت یک تئوری به میزان داده‌ها و شواهدی که از آن حمایت می‌کنند وابسته است.

در رویکرد قیاسی، تئوری نقطه شروع تحقیق است و فرضیه‌ها از دل آن استخراج می‌شود و آزمون می‌گردد. در رویکرد استقرایی، تئوری می‌تواند محصول تحقیق باشد یا در مراحل مختلف تحقیق شکل بگیرد یا اصلاح شود.

چارچوب نظری

چارچوب نظری، مجموعه‌ای منطقی از مفاهیم و پیش‌فرض‌هاست که از یک یا چند تئوری استخراج می‌شود و پژوهشگر آن را برای ساختاردهی به مطالعه خود توسعه می‌دهد. در واقع، چارچوب نظری، ترجمه و تبدیلِ تئوری به عمل است؛ به این معنا که تئوری انتخاب شده را به شکل عملیاتی و کاربردی وارد پژوهش می‌کند، متغیرهای مورد مطالعه را تعریف می‌کند و جهت‌گیری تحلیل داده‌ها را مشخص می‌سازد.

در مطالعات قیاسی، چارچوب نظری قبل از جمع‌آوری داده‌ها شکل می‌گیرد و معمولاً ثابت باقی می‌ماند. اما در پژوهش‌های استقرایی، بسته به نوع طراحی مطالعه، ممکن است چارچوب نظری از ابتدا تعیین شود یا در طول فرآیند تحلیل داده‌ها شکل بگیرد یا تغییر کند.

چارچوب مفهومی

چارچوب مفهومی، توجیه و دلیل انجام یک مطالعه را فراهم می‌کند. این چارچوب معمولاً شامل مروری بر دانش موجود، شناسایی شکاف‌های پژوهشی، و توضیح بنیان‌های روش‌شناختی مطالعه است. چارچوب مفهومی به دو سوال کلیدی پاسخ می‌دهد: "چرا این پژوهش اهمیت دارد؟" و "این پژوهش چه کمکی به دانش موجود خواهد کرد؟"

در مطالعات قیاسی، چارچوب مفهومی اغلب قبل از آغاز پژوهش، نهایی می‌شود و تغییر نمی‌کند. اما در پژوهش‌های استقرایی، ممکن است در طول پژوهش و با کسب اطلاعات جدید، اصلاح یا تکمیل شود.

بطور کلی:

تئوری، یک نظام مفهومی انتزاعی است که روابط بین پدیده‌ها را بیان می‌کند.

چارچوب نظری، کاربرد و عملی‌سازی یک یا چند تئوری منتخب برای یک مطالعه مشخص است.

چارچوب مفهومی، منطق و ضرورت انجام پژوهش، مرور متون، و بیان شکاف‌ها و سؤالات پژوهش را در بر می‌گیرد.

در رویکرد قیاسی، تئوری و چارچوب نظری نقطه شروع‌اند؛ اما در رویکرد استقرایی، تئوری می‌تواند محصول نهایی پژوهش باشد و چارچوب‌ها قابل تغییر و تکمیل هستند.

#methodology
#research

🆔 @irevidence
🙏179👍5👏2👌2
سایت‌اسکور 2024 منتشر شد

✍️ رسول معصومی

ویرایش سال 2024 سنجه CiteScore منتشر و برای مجلات نمایه‌شده در پایگاه Scopus اعمال شد. برخی نکات کلیدی این نسخه عبارتند از:

▫️در گزارش سال 2024، تعداد 31138 مجله و پیایند موفق به دریافت سایت‌اسکور شده‌اند که از این بین، 1973 عنوان برای اولین بار صاحب این شاخص شده‌اند.

▫️ بر اساس CiteScore 2024، مجلات و پیایندها به این صورت در چارک‌های استنادی توزیع شده‌اند:

‏ Q1 (چارک اول): 9655 عنوان
‏ Q2 (چارک دوم): 8056 عنوان
‏ Q3 (چارک سوم): 7101 عنوان
‏ Q4 (چارک چهارم): 6326 عنوان

▫️از بین نشریات دارای سایت‌اسکور، 7961 عنوان با دسترسی آزاد (Open Access) منتشر می‌شوند که 55 مورد از آن‌ها در طبقه‌بندی موضوعی خود، رتبه اول را دارند.

▫️در اسکوپوس، 11826 مجله و پیایند دارای CiteScore 2024 هستند، در حالی که فاقد Impact Factor براساس گزارش JCR 2023 می‌باشند. جالب آن‌که 424 مورد از این نشریات در طبقه‌بندی‌های موضوعی خود، در میان 10 درصد برتر قرار دارند.

▫️24 درصد از نشریات به زبان‌هایی غیر از انگلیسی منتشر می‌شوند (معادل 7339 نشریه). به‌طور کلی، نشریات منتشرشده به بیش از 50 زبان مختلف - از جمله زبان فارسی - تحت پوشش پایگاه اسکوپوس قرار دارند.

▫️نسبت به گزارش سال 2023، 649 نشریه با افزایش 100 درصدی یا بیشتر در سایت‌اسکور خود مواجه بوده‌اند.

▫️مجله Ca-A Cancer Journal for Clinicians با سایت‌اسکور 1154.2، رتبه نخست را در بین تمامی نشریات کسب کرده است. این مقدار نسبت به نسخه قبلی، بیش از 281 واحد افزایش داشته است. این مجله نخستین نشریه‌ای است که سایت‌اسکوری بالاتر از 1000 به دست آورده است. دلایل بالا بودن CiteScore و IF این مجله قبلاً توضیح داده شده است (اینجا)

▫️رتبه‌های دوم تا پنجم بالاترین CiteScore نیز به ترتیب متعلق‌اند به:

Foundations and Trends in Machine Learning (202.9)

Nature Reviews Drug Discovery (181.8)

Nature Reviews Molecular Cell Biology (150.9)

MMWR Recommendations and Reports (129.9)

▫️برخی از نشریات معتبر کاهش قابل توجهی در سایت‌اسکور خود داشته‌اند؛ برای مثال:

The Lancet از 148.1 به 87.6 کاهش یافته (کاهش 60.5 واحدی)

New England Journal of Medicine از 145.4 به 96.4 رسیده (کاهش 49 واحدی)

⚠️ لازم به یادآوری است که CiteScore یک سنجه استانداردشدۀ بین‌رشته‌ای نیست؛ بنابراین، مقایسه و رتبه‌بندی نشریات حوزه‌های موضوعیِ متفاوت بر پایه این شاخص، نادرست است. این شاخص صرفاً برای مقایسه نشریاتِ درون یک طبقه موضوعی خاص کاربرد دارد.

🔗 دسترسی رایگان به مجلات نمایه شده در اسکوپوس به همراه CiteScore آنها:

https://www.scopus.com/sources

#citescore
#research_metrics
#scopus
#journal

🆔 @irevidence
9👍6
▫️بررسی مجلات ایرانی نمایه‌شده در اسکوپوس

متأسفانه در بخش Sources پایگاه اسکوپوس، فیلتری برای محدود کردن مجلات به یک کشور خاص وجود ندارد. بنابراین، لیست مجلات ایرانی نمایه‌شده در اسکوپوس را از سایت Scimago استخراج کرده و شماره ISSN آنها را جدا نمودم. سپس این مجلات را در دسته‌های ۲۷تایی قرار دادم تا بتوان در اسکوپوس جست‌وجو کرد. در مجموع، ۳۷۶ مجله بازیابی شد.

توزیع مجلات ایرانی در چارک‌های استنادی:

چارک اول: ۳۰ مجله (۷.۹۷ درصد)
چارک دوم: ۵۴ مجله (۱۴.۳۶ درصد)
چارک سوم: ۱۵۳ مجله (۴۰.۶۹ درصد)
چارک چهارم: ۱۳۶ مجله (۳۶.۱۷ درصد)
بدون چارک: ۳ مجله (توقف نمایه‌سازی در اسکوپوس)

در مجموع، حدود ۷۷ درصد مجلات ایرانی (۲۸۹ عنوان) در چارک‌های سوم و چهارم قرار دارند. همچنین نسبت به سال‌های قبل، رشد متوسطی در تعداد مجلات ایرانی در چارک‌های اول و دوم دیده می‌شود.

۱۰ مجله ایرانی با بالاترین سایت‌اسکور

1. Progress in Color, Colorants and Coatings (7.8)

2. Journal of Applied and Computational Mechanics (7.2)

3. International Journal of Health Policy and Management (7.1)

4. Civil Engineering Journal (6.5)

5. Advanced Pharmaceutical Bulletin (6.4)

6. Health Promotion Perspectives (6.1)

7. Iranian Journal of Catalysis (6)

8. Journal of Soft Computing in Civil Engineering (5.6)

9. Global Journal of Environmental Science and Management (4.9)

10. BioImpacts (4.7)

در بین این ۱۰ مجله، چهار مجله وابسته به دانشگاه‌های علوم پزشکی هستند که سه عنوان آن متعلق به دانشگاه علوم پزشکی تبریز (شماره‌های ۵، ۶ و ۱۰) و یکی متعلق به دانشگاه علوم پزشکی کرمان (شماره ۳) است.

همان‌طور که بارها اشاره شده است، CiteScore یک شاخص استانداردشده بر اساس رشته نیست و مقایسه بین‌رشته‌ای آن صحیح نیست. همچنین، میزان استناد و متعاقب آن CiteScore تا حد زیادی به رشته و رفتار استنادی آن حوزه بستگی دارد.

به عنوان مثال، هرچند مجله Progress in Color, Colorants and Coatings با CiteScore برابر ۷.۸ در چارک اول قرار دارد، اما در صدک ۸۱ام است؛ در مقابل، مجله Archives of Academic Emergency Medicine متعلق به دانشگاه علوم پزشکی شهید بهشتی با CiteScore معادل ۳.۵ در صدک ۹۷ام قرار دارد (رتبه ۱ در بین ۱۷ مجله مرتبط با طب اورژانس).

یا مجله Journal of Medical Ethics and History of Medicine وابسته به دانشگاه علوم پزشکی تهران، با وجود CiteScore تنها ۱.۸، در چارک اول و صدک ۹۳ام حوزه موضوعی تاریخ قرار دارد.

همچنین مجله Persica Antiqua متعلق به گروه پژوهشی باستان‌کاوی تیسافرن با CiteScore برابر ۱، در صدک ۹۳ام حوزه ادبیات و نظریه ادبی قرار گرفته است. مجله Journal of Sistan and Baluchistan Studies نیز با CiteScore برابر ۱، در چارک اول و صدک ۸۲ام حوزه تاریخ جای دارد.

۱۰ مجله ایرانی برتر بر اساس بالاترین صدک موضوعی:

1. Archives of Academic Emergency Medicine 97% (CiteCore=3.5)

2. International Journal of Health Policy and Management 96% (CiteCore=7.1)

3. Iranian Journal of Language Teaching Research 94% (CiteCore=4.6)

4. Journal of Medical Ethics and History of Medicine 93% (CiteCore=1.8)

5. Persica Antiqua 93% (CiteCore=1)

6. Journal of Soft Computing in Civil Engineering 91% (CiteCore=5.6)

7. Global Journal of Environmental Science and Management 89% (CiteCore=4.9)

8. Journal of Applied and Computational Mechanics 88% (CiteCore=7.2)

9. Health Promotion Perspectives 87% (CiteCore=6.1)

10. Journal of Advances in Medical Education and Professionalism 87% (CiteCore=3.6)

شش مجله از ده مجله فوق، صدک‌های بالای ۹۰ دارند، یعنی جزو مجلات ۱۰ درصد برتر در طبقه‌ موضوعی خود در جهان هستند.

🔗 خروجی اکسل اطلاعات تمام مجلات ایرانی

#citescore
#research_metrics
#scopus
#journal
#Iran

🆔 @irevidence
👍75🤔1
▫️ضریب تأثیر 2024 و وضعیت مجلات ایرانی

اخیراً ورژن 2024 ضریب تأثیر (IF) مجلات نمایه شده در ۴ نمایه‌نامه استنادی Web of Science منتشر شده است. مهم ترین تغییر نسبت به قبل، حذف استنادات مربوط به مقالات ریترکت شده است. این تصمیم با هدف جلوگیری از تحریف احتمالی در ارزیابی‌های علمی و حفظ اعتبار شاخص‌های استنادی اتخاذ شده است.

اگرچه استنادهای مربوط به مقالات ریترکت‌شده از محاسبه JIF حذف شده است (در صورت کسر)، اما خودِ این مقالات همچنان در شمارش کل مقالات (مخرج کسر JIF) باقی می‌مانند. این اقدام با هدف حفظ شفافیت و مسئولیت‌پذیری در گزارش‌دهی صورت گرفته است.

حذف این‌گونه استنادات باعث شده است IF بیش از دو هزار مجله کاهش پیدا کند. همچنین چارک 24 مجله تغییر پیدا کرده است. مثلاً تغییر از Q1 به Q2.


بر اساس گزارش JCR، تعداد ۱۶۱ مجله از ایران در نمایه‌های استنادی وب آو ساینس ایندکس شده‌اند و دارای ضریب تأثیر (IF) هستند. از این بین ۱۲۱ مجله (بیش از ۷۵ درصد) در نمایه ESCI قرار دارند. این دومین سالی است که مجلات نمایه‌شده در ESCI نیز IF دریافت می‌کنند.

۴۰ مجله در نمایه استنادی علوم (SCIE) و ۲ مجله در نمایه استنادی علوم اجتماعی (SSCI) قرار دارند که این دو مجله هم‌زمان در SCIE نیز نمایه شده‌اند. هیچ مجله‌ای از ایران در نمایه استنادی هنر و علوم انسانی (AHCI) حضور ندارد.

توزیع مجلات ایرانی در چارک‌های استنادی:

چارک اول: ۸ مجله (۴.۹۶ درصد)
چارک دوم: ۲۰ مجله (۱۲.۴۲ درصد)
چارک سوم: ۳۹ مجله (۲۴.۲۲ درصد)
چارک چهارم: ۹۴ مجله (۵۸.۳۸ درصد)

در مجموع، حدود ۸۳ درصد مجلات ایرانی (۱۳۳ عنوان) در چارک‌های سوم و چهارم قرار دارند.

۱۰ مجله ایرانی با بالاترین ضریب تأثیر (IF):

1. Journal of Nanostructure in Chemistry (7.9 Q1)

2. Asian Journal of Social Health and Behavior (5.2 Q1)

3. International Journal of Health Policy and Management (5.1 Q1)

4. Civil Engineering Journal-Tehran (4.9 Q1)

5. Advanced Pharmaceutical Bulletin (4.1 Q1)

6. International Nano Letters (4 Q3)

7. International Journal of Environmental Research (3.5 Q2)

8. Journal of Applied and Computational Mechanics (3.4 Q2)

9. International Journal of Environmental Science and Technology (3.4 Q2)

10. International Journal of Engineering (2.9 Q2)

در بین این ۱۰ مجله، سه مجله وابسته به دانشگاه‌های علوم پزشکی هستند: دانشگاه علوم پزشکی قزوین (شماره ۲)، دانشگاه علوم پزشکی کرمان (شماره ۳)، و دانشگاه علوم پزشکی تبریز (شماره ۵).

نکته مهم این است که IF، مانند CiteScore، یک سنجه استانداردشده نیست و فقط مجاز هستیم IF مجلات موجود در یک رشته و طبقه خاص را با همدیگر مقایسه و رتبه‌بندی کنیم.

برای مقایسه مجلات رشته‌های مختلف می‌توان از چارک یا صدک استفاده کرد. حدود سه سال قبل سنجه‌ای به نام Journal Citation Indicator یا JCI هم به پروفایل مجلات در JCR اضافه شده است که نرمال شده بر اساس رشته است و از آن می‌توان برای مقایسه مجلات رشته‌های مختلف استفاده کرد (مثلاً برای مقایسه مجلات فیزیک با مجلات فلسفه).


#research_metrics
#impactfactor
#JCR
#webofscience
#journal
#clarivate

🆔 @irevidence
12👍6🙏1
ارزیابی مدل‌های زبانی بزرگ در پلتفرم SciArena

پلتفرم SciArena که توسط مؤسسه Allen Institute for Artificial Intelligence (Ai2) توسعه یافته است، ۲۳ مدل زبانی بزرگ (LLM) را بر اساس توانایی پاسخ‌گویی به سوالات علمی، ارزیابی و رتبه‌بندی کرده است. تا تاریخ ۳۰ ژوئن ۲۰۲۵، بیش از ۱۳ هزار رأی از سوی ۱۰۲ متخصص جمع‌آوری شده و کیفیت پاسخ‌های مدل‌ها به صورت تخصصی مورد ارزیابی قرار گرفته است.

در ادامه، مدل‌های برتر به تفکیک تمامی حوزه‌ها و حوزه‌های تخصصی ارائه شده‌اند:

پنج مدل برتر در تمامی زمینه های علمی

1. مدل o3 (OpenAI)
2. مدل Claude 4 Opus
3. مدل Gemini 2.5 Pro
4. مدل DeepSeek R1 0528
5. مدل o4‑mini (OpenAI)

پنج مدل برتر در حوزه علوم پزشکی و سلامت

1. مدل o3
2. مدل Claude 4 Opus
3. مدل Claude 4 Sonnet
4. مدل o4-mini
5. مدل Gemini 2.5 Pro

پنج مدل برتر در حوزه مهندسی

1. مدل o3
2. مدل Claude 4 Opus
3. مدل GPT-4.1
4. مدل DeepSeek R1 0528
5. مدل Gemini 2.5 Pro

پنج مدل برتر در حوزه علوم اجتماعی و انسانی

1. مدل o3
2. مدل Claude 4 Opus
3. مدل Claude 4 Sonnet
4. مدل Gemini 2.5 Pro
5. مدل Gemini 2.5 Pro-Preview

پنج مدل برتر در حوزه علوم طبیعی

1. مدل o3
2. مدل DeepSeek R1 0528
3. مدل Gemini 2.5 Pro
4. مدل o4-mini
5. مدل Qwen3-235B-A22B

بطور کلی مدل o3 در تمامی حوزه ها رتبه اول را کسب کرده است. بعد از آن، مدل Claude 4 Opus در هر سه حوزه علوم پزشکی و سلامت، مهندسی و نیز علوم اجتماعی و انسانی رتبه بهتری دارد. مدل DeepSeek R1 0528 نیز در علوم طبیعی عملکرد بهتری داشته است.

در پژوهش SciArena، مدلی مثل o3 (که برترین مدل بود) وقتی پاسخ‌های مدل را با رأی متخصصان انسانی مقایسه کردند، دیدند که فقط در ۶۵.۱ درصد موارد، انتخاب مدل با نظر داور انسانی یکسان است. یعنی وقتی یک سؤال علمی مطرح می‌شود و هم مدل هوش مصنوعی (مثل o3) و هم یک انسان متخصص باید بین دو پاسخ انتخاب کنند که کدام بهتر است، فقط در حدود ۶۵ درصد مواقع، مدل همان پاسخی را انتخاب می‌کند که انسان انتخاب کرده است. به عبارت دیگر، نظر مدل و انسان درباره بهترین پاسخ، در یک‌سوم موارد با هم متفاوت است.

در مقابل، در برخی بنچمارک‌های عمومی و ساده‌تر (مثل AlpacaEval که بیشتر برای سوالات عمومی و غیرتخصصی استفاده می‌شود)، این تطابق یا دقت مدل با رای انسان بالاتر از ۷۰ درصد است. یعنی در سوالات عمومی، مدل‌ها بیشتر شبیه نظر انسان قضاوت می‌کنند، اما در سوالات علمیِ تخصصی این هماهنگی کمتر است.

اینکه میزان هماهنگی مدل با نظر انسان فقط ۶۵.۱ درصد است، یعنی حتی بهترین مدل‌های هوش مصنوعی هم هنوز نمی‌توانند مانند یک انسان متخصص به‌درستی درباره پاسخ‌های علمی قضاوت کنند و نتیجه‌ای مشابه داور انسانی بدهند. در واقع، مدل‌ها هنوز به دقت و عمق درک انسانی نرسیده‌اند و نمی‌توانند همیشه جایگزین مطمئنی برای ارزیابی علمی توسط انسان باشند.

چرا این اتفاق می‌افتد؟

سوالات علمی معمولاً سخت‌تر، تخصصی‌تر و نیازمند استناد دقیق‌تر هستند. مدل‌ها ممکن است ظواهر متن یا منابع را درست بازسازی کنند، اما عمق علمی و استدلالی تصمیم انسانی را ندارند. گاهی مدل‌ها دچار خطا، تفسیر اشتباه یا ضعف در فهم متون علمی می‌شوند.

این داده‌ها هشدار می‌دهد که خودکارسازی کامل ارزیابی علمی با مدل‌های زبان بزرگ هنوز قابل اتکا نیست و هنوز برای داوری دقیق علمی، به انسان نیاز داریم.

🔗 توضیحات و آمار بیشتر در:

https://allenai.org/blog/sciarena

همچنین در مجله Nature هم به این ارزیابی و پلتفرم پرداخته شده است. (لینک)

#AI
#LLM
#chatgpt
#Claude
#ranking
#benchmarking

🆔 @irevidence
👍16
▫️ هوش مصنوعی و مرگ نویسنده آکادمیک

Artificial intelligence and the death of the academic author

دکتر Ken Masters از صاحب نظران برجسته آموزش پزشکی، به تازگی نظری مناقشه‌برانگیز در خصوص AI را در قالب Short Communication در مجله Medical Teacher منتشر کرده است.

این مقاله درباره تأثیر هوش مصنوعی و به‌خصوص مدل‌های زبانی بزرگ مانند ChatGPT بر نقش نویسنده آکادمیک (Academic Author) نوشته شده است. نویسنده مقاله با الهام از نظریه معروف رولان بارت (Roland Barthes) به نام مرگ نویسنده (The Death of the Author)، می‌گوید که نویسنده دیگر آن نقش و اهمیت گذشته را ندارد و هوش مصنوعی می‌تواند جای نویسنده را بگیرد.

در گذشته، تصور می‌شد نویسنده کسی است که با خلاقیت خود، یک متن تازه و اصیل تولید می‌کند. اما بارتس می‌گوید که نویسنده فقط متونی را که قبلاً وجود داشته‌اند، به نوعی کنار هم می‌چیند و از چیزهای موجود، یک چیز جدید می‌سازد. این دقیقاً همان کاری است که مدل‌های زبانی بزرگ انجام می‌دهند: آن‌ها با خواندن و یاد گرفتن حجم زیادی از متن، متن جدیدی را بر اساس ترکیب داده‌های قبلی تولید می‌کنند.

نویسنده مقاله می‌گوید در دنیای آکادمیک، اصل کار با پژوهش (Research) است، نه با نوشتن مقاله (Writing). درواقع، پژوهشگر باید ایده و تحقیق را انجام دهد و نوشتن مقاله، بیشتر یک کار مکانیکی و تکراری است که هوش مصنوعی خیلی بهتر و سریع‌تر می‌تواند آن را انجام دهد.

در حال حاضر اکثر دانشگاه‌ها و مجلات، قبول ندارند که هوش مصنوعی به عنوان نویسنده مقاله شناخته شود، چون معتقدند AI نمی‌تواند مسئولیت‌پذیر (Accountable) یا پاسخگو (Responsible) باشد. اما نویسنده معتقد است که این نگرانی بی‌دلیل است، چون در نهایت مسئولیت اصلی با پژوهشگر است، نه با کسی که مقاله را نوشته است؛ چه انسان باشد و چه هوش مصنوعی.

به گفته نویسنده، باید نقش نویسنده (Authorship) و پژوهشگر (Researcher) را از هم جدا کرد. پژوهشگر باید پژوهش را انجام دهد و نکات اصلی، داده‌ها و منابع را جمع کند. سپس نوشتن و نگارش را می‌توان به هوش مصنوعی سپرد. این کار به ویژه به نفع پژوهشگرانی است که زبان انگلیسی، زبان مادری‌شان نیست و برای نوشتن مقاله به مشکل برمی‌خورند. در این صورت، همه می‌توانند فرصت برابر برای انتشار یافته‌های خود داشته باشند.

در آینده‌ای که نویسنده تصویر می‌کند، پژوهشگر به نوعی کارگردان یا مدیر پروژه است: پژوهش انجام می‌دهد، نتایج را جمع‌بندی می‌کند و سپس هوش مصنوعی را راهنمایی می‌کند تا متن مقاله را بنویسد. بنابراین دیگر نیازی نیست وقت و انرژی زیادی صرف نوشتن متن و ویرایش شود، بلکه تمرکز روی تحقیق و تولید دانش خواهد بود.

در پایان، نویسنده می‌گوید که قبول دارد این ایده ممکن است برای خیلی‌ها عجیب یا حتی ناراحت‌کننده باشد، مخصوصاً برای کسانی که نوشتن را دوست دارند. اما معتقد است این روند یک تحول بزرگ (مانند انقلاب کوپرنیکی) در دنیای علم و دانشگاه خواهد بود و در نهایت باعث می‌شود پژوهشگر دوباره در مرکز توجه قرار بگیرد و نوشتن مقاله فقط یک ابزار ساده برای انتقال دانش باشد، نه اصل ماجرا.

شما چه فکر می‌کنید؟

#AI
#LLM
#academic_writing
#research

🆔 @irevidence
👍706🤔4😢2
Evidence
▫️ هوش مصنوعی و مرگ نویسنده آکادمیک Artificial intelligence and the death of the academic author دکتر Ken Masters از صاحب نظران برجسته آموزش پزشکی، به تازگی نظری مناقشه‌برانگیز در خصوص AI را در قالب Short Communication در مجله Medical Teacher منتشر کرده…
▫️نقد دیدگاه Ken Masters

خانم دکتر Lorelei Lingard استاد دانشگاه وسترن کانادا در قالب یک Commentary، دیدگاه آقای Masters را نقد کرده است:

Let’s consider what writing is good for before we hand it over to AI

مهم‌ترین نقدها و محورهای مخالفت لینگارد با ایده Ken Masters به شرح زیر است:

1. نوشتن صرفاً یک کار مکانیکی نیست؛ نوشتن همان اندیشیدن است.

مسترز ادعا می‌کند نوشتن در پژوهش آکادمیک، نقش خلاقانه چندانی ندارد و فقط باید به هوش مصنوعی سپرده شود تا پژوهشگر وقتش را صرف تحقیق کند. این دیدگاه خطرناک است، چون نوشتن بخشی از فرآیند فکر کردن است. پژوهشگر هنگام نوشتن و بازنویسی، افکار خود را شفاف می‌کند و حتی خیلی وقت‌ها، تازه هنگام نوشتن متوجه عمق و جزئیات یافته‌هایش می‌شود.

بنابراین اگر نوشتن را به هوش مصنوعی بدهیم، تفکرمان را ناقص و زودهنگام متوقف می‌کنیم و عملاً فرصت پرورش ایده‌ها را از خود می‌گیریم.

2. نوشتن واحد ارزش‌گذاری و اعتبار دانشگاهی است

نوشتن، معیار سنجش اعتبار علمی است و اعتبار، شهرت و اعتماد به یک پژوهشگر بر اساس کیفیت و شخصیت نگارشی او شکل می‌گیرد.

اگر همه‌چیز را هوش مصنوعی بنویسد، شخصیت، اعتبار و اعتمادپذیری (بطور کلی ethos) پژوهشگر آسیب می‌بیند، حتی اگر اصول شفافیت و امانت‌داری رعایت شود. همچنین تحقیقات نشان داده استفاده از هوش مصنوعی در نوشتن می‌تواند اعتماد به دانش تولیدشده را کاهش دهد، چون دیگر "صدای پژوهشگر" در متن شنیده نمی‌شود.

از طرف دیگر سبک نگارش علمیِ کنونی اغلب ثقیل، بی‌روح، پرطمطراق، نامأنوس و گنگ است و اگر هوش مصنوعی به‌جای انسان بنویسد، احتمالاً همین نثر بی‌روح و غیرقابل‌فهم را بیشتر تکثیر می‌کند. این خطر وجود دارد که ارزش علمی مقالات دچار کاهش جدی شود.

3. نوشتن بخش مهمی از تبدیل شدن به پژوهشگر است.

نوشتن فقط انتقال محتوا نیست، بلکه روشی برای شکل‌گیری هویت علمی است. نوشتن باعث می‌شود پژوهشگر در مسیر تبدیل شدن به یک دانشمند واقعی رشد کند، با ایده‌هایش کلنجار برود و فهم خود را عمیق کند. اگر این "دردسر مفید" نوشتن را حذف کنیم و همه‌چیز را به هوش مصنوعی بسپاریم، پژوهشگران، سطحی می‌شوند و توانایی نقد و تحول دانش را از دست می‌دهند. در نتیجه رشته علمی دچار رکود و ایستایی می‌شود.

نوشتن به زبان غیرمادری دشوار است و هوش مصنوعی می‌تواند در کاهش این چالش کمک کند، اما اگر این دشواری را کاملاً حذف کنیم، رشد فردی و کیفیت دانش نیز قربانی می‌شود.


خلاصه اینکه، لینگارد می‌گوید شعار ما تحقیق می‌کنیم، هوش مصنوعی می‌نویسد (We research, GenAI writes) هرچند جذاب است، اما خطرناک هم هست. چون نوشتن فقط یک مرحله سریع و ساده بعد از پژوهش نیست، بلکه هویت علمی، فرآیند تفکر و اعتبار پژوهشگر وابسته به آن است. اگر نوشتن را به طور کامل به هوش مصنوعی بسپاریم، خیلی بیشتر از آنچه به دست می‌آوریم را از دست خواهیم داد.

#AI
#LLM
#academic_writing
#research
#authorship

🆔 @irevidence
19👍17👎4
▫️ماجرای عجیب یک سرقت علمی: داور ایرانی مقاله پژوهشگر پاکستانی را رد و سپس به نام خود منتشر کرد!

تازه‌ترین گزارش پایگاه Retraction Watch از اقدام عجیب یک داور ایرانی پرده برداشته است. ماجرا از این قرار است:

شفق آفتاب (Shafaq Aftab)، پژوهشگر و مدرس دانشگاه پنجاب مرکزی در پاکستان، ادعا کرده است که داود قربان‌زاده، محقق علوم اجتماعی در دانشگاه آزاد اسلامی واحد تهران شمال، دست‌نوشته او را که برای مجله Information Development (IDV) ارسال و رد شده بود، سرقت کرده و به نام خود در مجله Systems Research and Behavioural Science (SRBS) منتشر کرده است. آفتاب این سرقت ادعایی را از طریق هشداری در ریسرچ‌گیت در پاییز ۲۰۲۴ کشف کرد و اظهار داشته که انتشار این مطالعه از نظر شخصی و حرفه‌ای به‌شدت آسیب‌رسان بوده است.

آفتاب در نوامبر ۲۰۲۳ مقاله‌ای را که حاصل پژوهش دکتری او بود به IDV ارسال کرده بود. این مقاله پس از دو دور داوری در اوت ۲۰۲۴ رد شد. قربان‌زاده مقاله مشابهی را در ژانویه ۲۰۲۴ به مجله SRBS ارسال کرد و این مقاله در سپتامبر ۲۰۲۴ منتشر شد. بررسی تطبیقی نشان داد که ساختار، تحلیل داده‌ها، متن مقدمه، و بخش نتیجه‌گیری دو مقاله تقریباً یکسان بوده و حتی پاراگراف‌هایی کاملاً عیناً تکرار شده است. تفاوت‌های اندکی در تعداد نمونه‌ها و نسخه نرم‌افزار تحلیل آماری وجود دارد.

سردبیر سابق IDV، استیون پارکر، تأیید کرده که قربان‌زاده داور هر دو نسخه دست‌نوشته افتاب برای IDV بوده و پیشنهاد رد آن را داده است. این امر مستقیماً اظهارات قربان‌زاده را رد می‌کند که گفته بود هرگز دست‌نوشته آفتاب را داوری نکرده و توصیه به رد آن نداده است. قربان‌زاده اتهامات سرقت را کاملاً رد کرده و هرگونه شباهت بین دو مقاله را تصادفی توصیف کرده است. او تأکید کرده پژوهشش اصیل بوده و با استانداردهای اخلاقی انجام شده است.

وایلی ناشر مجله SRBS از سپتامبر ۲۰۲۴ تحقیق درباره این موضوع را آغاز کرده است. مشخص شده است که همپوشانی قابل‌توجهی بین دو مقاله وجود دارد. وایلی اعلام کرده که بررسی نهایی در حال انجام است و به زودی نتیجه آن به اطلاع طرف‌های درگیر خواهد رسید. قربان‌زاده گفته است که کاملاً با تحقیقات وایلی همکاری کرده و اسناد و مدارک مربوط به اصالت پژوهش خود را ارائه کرده است.

قابل ذکر است که قبلاً دو مقاله دیگر از قربان‌زاده به دلیل سرقت علمی پس گرفته شده است. یکی از این مقالات که در ژورنال Journal of Health Organization and Management منتشر شده بود، به علت کپی‌برداری گسترده از یک اثر منتشرنشده دیگر بدون ذکر منبع در ژانویه ۲۰۲۴ پس گرفته شد. همچنین، مقاله‌ای دیگر در مجله Current Psychology نیز به دلیل همپوشانی قابل‌توجه با مقاله‌ای که قبلاً منتشر شده بود در دسامبر ۲۰۲۳ پس گرفته شد. در هر دو مورد همکاران قربان‌زاده اعلام کردند که از اقدام وی مطلع نبوده‌اند.

آفتاب ابراز امیدواری کرده که این اتفاق باعث افزایش آگاهی پژوهشگران جوان درباره محافظت از کارهایشان شود. او معتقد است عدم برخورد با چنین سوءاستفاده‌هایی در داوری همتا، زمینه را برای تکرار چنین مواردی فراهم می‌کند و به اعتبار نظام داوری علمی آسیب می‌زند.

⚠️ باید بدانیم که با این رفتارهای غیراخلاقی، نه‌تنها آبروی خود یا دانشگاه‌مان، بلکه اعتبار ایران را خدشه‌دار می‌کنیم و این خطایی بزرگ است. چنین اقداماتی باعث می‌شود سردبیران مجلات علمی نسبت به چاپ مقالات پژوهشگران ایرانی بی‌اعتماد شوند و این امر در حق پژوهشگران و داورانی که صادقانه و اخلاق‌مدارانه فعالیت می‌کنند، ظلم و اجحاف است.

#research_ethics
#plagiarism
#peer_review
#wiley
#Iran

🆔 @irevidence
👍46😢178😁7🤔3
▫️فروش مدرک رسمی از کاردانی تا دکتری تخصصی و حتی دکتری حرفه‌ای!

در یکی از کانال‌های خبری که مخاطب میلیونی دارد، تبلیغ زیر را مشاهده کردم:

👮‍♂️ مدرک رسمی «دانشگاه علوم پزشکی شهید بهشتی» در کمتر از ۱۰ روز!

✔️ از کاردانی تا دکتری | کاملاً غیرحضوری
✔️ قابل استعلام قانونی + قابل ترجمه رسمی
✔️ مناسب برای: مهاجرت | استخدام | ادامه‌ی تحصیل

به ادمین پیام دادم و درخواست هزینه مدارک را کردم. پیام زیر ارسال شد:

فرآیند ثبت‌نام جهت صدور مدارک تحصیلی

۱) انتخاب مقطع و رشته تحصیلی مورد نظر

دیپلم رسمی نظام جدید (شاخه نظری و کارودانش)
شهریه: ۳۸ میلیون تومان

کاردانی (پیوسته یا ناپیوسته) و کارشناسی ناپیوسته – دانشگاه آزاد اسلامی
شهریه: ۳۶ میلیون تومان

کارشناسی پیوسته از دانشگاه‌های:
• دانشگاه آزاد اسلامی: ۴۸ میلیون تومان
• دانشگاه شهید بهشتی: ۶۰ میلیون تومان
• دانشگاه تهران: ۶۰ میلیون تومان

کارشناسی ارشد ناپیوسته:
• دانشگاه آزاد اسلامی: ۴۹ میلیون تومان
• دانشگاه شهید بهشتی: ۶۸ میلیون تومان
• دانشگاه تهران: ۶۸ میلیون تومان

دکترای تخصصی (Ph.D):
• دانشگاه آزاد اسلامی: ۸۹ میلیون تومان
• دانشگاه شهید بهشتی: ۱۱۰ میلیون تومان
• دانشگاه تهران: ۱۷۰ میلیون تومان
⤷ ترجمه رسمی رایگان + امکان چاپ پایان‌نامه، مقاله علمی و کتاب علمی با مجوز رسمی نشر (هزینه جداگانه)



رشته‌های علوم پزشکی و پیراپزشکی فقط از دانشگاه علوم پزشکی شهید بهشتی

کارشناسی پیوسته: ۱۲۰ میلیون تومان

کارشناسی ارشد ناپیوسته: ۱۳۰ میلیون تومان

دکترای تخصصی: ۱۶۰ م تومان

دکترای حرفه‌ای:
• پزشکی عمومی: ۳۰۰ میلیون تومان
• دندان‌پزشکی: ۲۸۰ میلیون تومان
• داروسازی: ۲۶۰ میلیون تومان
⤷ ترجمه رسمی رایگان + گواهی پایان طرح نیروی انسانی (در صورت نیاز)



۲) ارسال اسکن مدارک مورد نیاز :
• شناسنامه (صفحه اول و دوم)
• کارت شناسایی ملی یا گذرنامه
• عکس پرسنلی تمام رخ با زمینه سفید
• کارت پایان خدمت وظیفه (در صورت وجود)
• آخرین مدرک تحصیلی (در صورت وجود)
• اتباع خارجی با گذرنامه ی معتبر امکان ثبت‌نام دارند



۳) پرداخت مبلغ ۴ میلیون تومان به عنوان هزینه اولیه ثبت‌نام



نکات مهم:
• تمامی مراحل از ثبت‌نام تا فارغ‌التحصیلی کاملاً غیرحضوری و توسط مجموعه‌ی ما به عنوان «نماینده شما» انجام می‌شود. نیازی به حضور شما در مراکز آموزش یا حوزه‌ی امتحانات نیست.
• مدارک صرفاً از واحدهای آموزشی رسمی صادر می‌گردند، از جمله:
مراکز آموزش متوسطه روزانه – بزرگسال، دانشگاه آزاد اسلامی، دانشگاه تهران، دانشگاه شهید بهشتی، دانشگاه علوم پزشکی شهید بهشتی، دانشگاه سوره
مدارک نهایی شما:
• قابل ترجمه رسمی با تاییدات دادگستری و وزارت امور خارجه
• قابل استعلام از کلیه ارگان‌های دولتی، خصوصی و دفاتر پیشخوان دولت
• برای مقاطع ارشد و دکتری، در صورت نیاز امکان چاپ پایان‌نامه، مقاله علمی و کتاب وجود دارد (هزینه اختصاصی)



📦 تحویل نهایی:
باقیمانده شهریه پس از مشاهده تصویر مدارک دریافت می‌شود.
مدارک فارغ‌التحصیلان (ریزنمرات، گواهی موقت پایان تحصیلات، اصل دیپلم یا دانشنامه) حداکثر طی ۲ روز کاری از ناحیه‌ی آموزشی یا واحد صادرکننده، به آدرس شما ارسال می‌گردد.



❗️ «متقاضی گرامی مطالب فوق را با دقت مطالعه فرمایید. در صورت نیاز به توضیحات بیشتر، با کارشناسان ما تماس بگیرید.»

“و من الله التوفیق”

ماجرا از دو حالت خارج نیست: یا با یک باند کلاهبرداری طرف هستیم که پول‌های کلان می‌گیرند و مدرکی هم در کار نیست، یا واقعاً دارند مدرک رسمی صادر می‌کنند؛آن هم برای کسانی که هیچ صلاحیتی ندارند.

برای چنین افتضاحی، مسئولان مربوطه و دانشگاه‌های مرتبط باید واقعاً شرمنده باشند که یا خواب هستند یا چشم بر این فاجعه بسته‌اند. بی‌عرضگی اگر این نیست، پس چیست؟

با ۳۰۰ میلیون تومان می‌توان مدرک پزشکی عمومی از دانشگاه علوم پزشکی شهید بهشتی خرید! مدرک دکترای تخصصی؟ فقط ۱۶۰ میلیون تومان.

مدرک‌فروشی به‌صورت علنی، در روز روشن و کسی هم عین خیالش نیست!


#مدرک_رسمی
#مدرک_فروشی

🆔 @irevidence
😢209😁6👍2
Evidence
▫️فروش مدرک رسمی از کاردانی تا دکتری تخصصی و حتی دکتری حرفه‌ای! در یکی از کانال‌های خبری که مخاطب میلیونی دارد، تبلیغ زیر را مشاهده کردم: 👮‍♂️ مدرک رسمی «دانشگاه علوم پزشکی شهید بهشتی» در کمتر از ۱۰ روز! ✔️ از کاردانی تا دکتری | کاملاً غیرحضوری ✔️ قابل…
▫️اقداماتی که انجام دادم:

۱- ابتدا با پلیس فتا تماس گرفتم. پس از چند دقیقه انتظار، با کارشناس مربوطه صحبت کردم و اطلاعات موسسه را در اختیار ایشان قرار دادم. گفتند که موضوع ثبت شد و اقدام لازم انجام خواهد شد. وقتی پرسیدم چگونه می‌توانم پیگیری کنم، گفتند نیازی به پیگیری شما نیست.

۲- با بازرسی دانشگاه علوم پزشکی شهید بهشتی تماس گرفتم. ابتدا گفتند باید با واحد حقوقی تماس بگیرم، اما بعد تأکید کردند که همین جا باید پیگیر باشم. درباره موسسه توضیح دادم و گفتند فرمی در سایت وجود دارد که باید آن را تکمیل و مستندات را ارسال کنم. این کار را انجام دادم. مجدداً تماس گرفتم تا مطمئن شوم اطلاعات را دریافت کرده‌اند؛ گفتند ادمین سایت در مرخصی است و بعداً بررسی خواهد شد.

۳- با حراست دانشگاه شهید بهشتی (وابسته به وزارت علوم) تماس گرفتم و نام موسسه را اعلام کردم. گفتند خودشان در جریان موضوع هستند و به مسئولین ذی‌ربط اطلاع داده‌اند.

۵- با حراست دانشگاه تهران تماس گرفتم. گفتند باید اطلاعات و مستندات را برایشان ایمیل کنم و این کار را انجام دادم.

۶- موفق نشدم شماره تماس واحد حقوقی، حراست یا بازرسی دانشگاه سوره را پیدا کنم. ناچاراً با روابط عمومی آن دانشگاه تماس گرفتم، اما پاسخی دریافت نکردم.

امیدوارم اقدام کنند!

به‌روزرسانی

دانشگاه علوم پزشکی شهید بهشتی اطلاعیه زیر را در صفحه اول سایت خود منتشر کرده است:

هشدار دانشگاه علوم پزشکی شهید بهشتی درباره تبلیغات کلاهبرداری صدور مدرک تحصیلی پزشکی در فضای مجازی


🆔 @irevidence
59👍24😁8👌6🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
▫️قابلیت Video Overviews به هوش مصنوعی NotebookLM اضافه شد

ابزار هوش مصنوعی NotebookLM گوگل با آپدیت جدید خود، امکان ساخت پادکست ویدیویی را به قابلیت‌هایش افزوده است. این ویژگی تازه که با نام Video Overviews شناخته می‌شود، به کاربران اجازه می‌دهد تا خلاصه‌های تصویری از اطلاعات و یادداشت‌های خود تهیه کنند.

این قابلیت اکنون بخش‌های مختلفی مانند راهنمای مطالعه، اسناد خلاصه، پرسش‌های متداول، جدول‌های زمانی و نقشه‌های ذهنی را در قالب ویدیوهای ساده و قابل فهم ارائه می‌کند. کاربران می‌توانند با تعیین موضوعات و هدف مخاطب، محتوای ویدیویی اختصاصی و متناسب با نیاز خود بسازند؛ به طور مثال می‌توانند مشخص کنند که روی کدام بخش‌ها یا موضوعات تاکید بیشتری شود.

قابلیت Video Overviews با استفاده از نمودار، تصویر و نقل‌قول، اطلاعات پیچیده را به زبانی ساده‌تر توضیح می‌دهد و به درک بهتر مطالب کمک می‌کند. فعلاً این ویژگی برای کاربران انگلیسی‌زبان فعال است اما قرار است به زودی پشتیبانی از زبان‌ها و فرمت‌های بیشتر هم اضافه شود.

#AI
#notebooklm

🆔 @irevidence
10👌4
▫️خودکارسازی مرورهای سیستماتیک با استفاده از مدل‌های زبانی بزرگ

Automation of Systematic Reviews with Large Language Models

این پژوهش (که بصورت Preprint در سرور medrxiv منتشر شده است) یک گردش کار عاملی (agentic workflow) پیشرفته مبتنی بر هوش مصنوعی به نام otto-SR را معرفی و ارزیابی می‌کند که با استفاده از مدل‌های زبانی بزرگ فرآیند مرور سیستماتیک را از جستجوی اولیه تا تحلیل نهایی، به صورت خودکار انجام می‌دهد.

گردش کار سنتی به طور معمول شامل جستجو، غربالگری چکیده‌ها (Abstract Screening) و متن کامل (Full-text Screening) توسط دو داور انسانی به صورت مستقل و سپس استخراج داده‌ها (Data Extraction) توسط دو داور دیگر است که اختلافات توسط داور سوم حل می‌شود.

اما گردش کار سامانه otto-SR بدین صورت است:

غربالگری مقالات: از مدل GPT-4.1 برای غربالگری چکیده‌ها و متن کامل مقالات استفاده می‌کند.

استخراج داده‌ها: از مدل o3-mini-high برای استخراج متغیرهای تعریف‌شده از مقالات نهایی بهره می‌برد.

پردازش PDF: برای خواندن فایل‌های PDF و تبدیل آن‌ها به فرمت ساختاریافته Markdown (MD) جهت تحلیل توسط مدل‌های دیگر، از Gemini 2.0 Flash استفاده می‌شود.

ارزیابی عملکرد otto-SR در مقابل انسان و ابزارهای دیگر

‏otto-SR در دو بخش اصلی فرآیند SR (غربالگری و استخراج داده) با عملکرد داوران انسانی و یک نرم‌افزار تجاری دیگر به نام Elicit مقایسه شد.

غربالگری مقالات (Article Screening):

‏otto-SR عملکردی فراتر از انسان (superhuman) از خود نشان داد و توانست مطالعات مرتبط بیشتری را با حفظ دقت بالا شناسایی کند.

حساسیت (Sensitivity): توانایی در شناسایی صحیح مقالات مرتبط.

otto-SR با 96.7 درصد

داوران انسانی: 81.7 درصد (پس از حذف یک مطالعه نامرتبط)

ویژگی (Specificity): توانایی در رد صحیح مقالات نامرتبط

otto-SR با 97.9 درصد

داوران انسانی: 98.1 درصد

استخراج داده‌ها (Data Extraction):

‏ootto-SR در این بخش نیز به طور قابل توجهی دقیق‌تر از داوران انسانی و ابزار Elicit عمل کرد.

دقت (Accuracy):

‌‏otto-SR با 93.1 درصد

داوران انسانی: 79.7 درصد

سامانه Elicit با 74.8 درصد

یک نکته بسیار مهم این بود که در موارد اختلاف بین داده‌های استخراج شده توسط otto-SR و نویسندگان اصلی مرورها، یک هیئت داوری انسانی در 69.3 درصد موارد، داده‌های استخراج شده توسط otto-SR را صحیح تشخیص داد.

کاربرد در دنیای واقعی: بازتولید و به‌روزرسانی مرورهای کاکرین (Cochrane Reviews)

برای نمایش قابلیت otto-SR در عمل، محققان یک شماره کامل از مجله مرورهای مجله کاکرین (12 مرور) را بازتولید و به‌روزرسانی کردند:

سرعت شگفت‌انگیز: این کار که به طور سنتی معادل 12سال کاری تخمین زده می‌شود، توسط otto-SR تنها در دو روز انجام شد.

یافته‌های جدید: otto-SR به طور متوسط 2 مطالعه واجد شرایط در هر مرور پیدا کرد که به احتمال زیاد توسط نویسندگان اصلی نادیده گرفته شده بودند.
با اضافه شدن این مطالعات جدید، متاآنالیزها (Meta-analyses) تغییر کردند:

2 مرور به نتایج آماری معنادار جدیدی دست یافتند و 1 مرور معناداری آماری خود را از دست داد.

به عنوان مثال، در یک مرور تغذیه، otto-SR با یافتن 5 مطالعه اضافی نشان داد که مکمل‌های تقویت‌کننده سیستم ایمنی قبل از جراحی معده، میانگین اقامت در بیمارستان را یک روز کاهش می‌دهد؛ نتیجه‌ای که در مرور اصلی کاکرین یافت نشده بود.

چند نکته مهم:

پتانسیل عظیم LLMها: این فناوری می‌تواند برای به‌روزرسانی سریع مرورهای موجود، ایجاد مرورهای زنده و پویا (living systematic reviews) که به صورت روزانه یا هفتگی به‌روز می‌شوند، و تولید سریع مرورهای کاملاً جدید (de novo reviews) به کار گرفته شود.

چالش‌های تکرارپذیری: این مطالعه نشان داد که مرورهای فعلی اغلب در زمینه تکرارپذیری (به‌ویژه در استراتژی جستجو) دچار مشکل هستند.

آینده نشر علمی: نیاز به انتشار مطالعات به صورت قابل خواندن با ماشین (machine-readable) برای تسهیل چنین تحلیل‌های خودکاری بیش از پیش احساس می‌شود.


محققان به چندین محدودیت در کار خود اشاره کرده‌اند:

نیاز به ارزیابی در حوزه‌های بالینی بیشتر و مرورهای کیفی

خطاهای احتمالی در پردازش فایل‌های PDF.

عدم استخراج داده از جداول و شکل‌های تکمیلی

استفاده از "LLM به عنوان داور" برای ارزیابی دقت که خود ممکن است خطا داشته باشد.

ممکن است مرورهای Cochrane آوریل 2024 در داده‌های آموزش مدل وجود داشته باشد و این باعث سوگیری جزئی به نفع مطالعات قبلاً وارد شده شود، اما روی مطالعات جدیدی که otto-SR پیدا کرده تأثیری ندارد.

#AI
#LLM
#systematic_review
#evidence_synthesis

🆔 @irevidence
11👍6🤔3
▫️ویژگی‌های مهم GPT-5: مدل پرچم‌دار OpenAI

مدل GPT-5 در تاریخ ۷ آگوست به‌طور رسمی رونمایی شد و به‌عنوان جدیدترین و قدرتمندترین مدل شرکت OpenAI معرفی گردید. با عرضه این مدل، تمام نسخه‌های قبلی از جمله 40، 1-4، O3، O4 mini و سایر مدل‌ها کنار گذاشته شدند. اکنون تنها مدل موجود، GPT-5 است.

بر اساس توضیحات ارائه شده در سایت رسمی OpenAI، ویژگی‌های مهم و کلیدی این مدل عبارت‌اند از:

هوش و سرعت بالا: GPT-5 هوشمندترین و سریع‌ترین مدل OpenAI تا امروز است و می‌تواند هم در کارهای روزمره سریع باشد و هم در مسائل پیچیده با دقت و عمق فکر کند.

دو مسیر پردازش: دارای دو حالت اصلی است یک مدل سریع برای پاسخ‌های فوری و یک حالت "GPT-5 Thinking" برای حل مسائل سخت‌تر که با پرامپت خاص (مثلاً با نوشتن think hard about this) یا به‌صورت خودکار فعال می‌شود.

توانایی‌های کدنویسی پیشرفته: می‌تواند با یک پرامپت کامل، وب زیبا و واکنش‌گرا بسازد، کدهای پیچیده را اشکال‌زدایی کند و طراحی را با فاصله‌گذاری، تایپوگرافی و وایت‌اسپیس (فضای خالی) مناسب بهبود دهد.

کمک در نویسندگی و تولید محتوا: از از ایده‌پردازی اولیه تا نگارش متنی دقیق، منسجم و خوش‌خوان را پشتیبانی می‌کند و حتی در قالب‌های چالش‌برانگیز ادبی، مانند شعر آزاد یا موزون، آثاری با کیفیت و هنری ارائه می‌دهد.

دستیار هوشمند در حوزه سلامت: در سوالات مرتبط با سلامت عملکردی قوی دارد، نکات مهم را پررنگ می‌کند و سؤالات تکمیلی می‌پرسد، هرچند جایگزین مشاوره پزشکی نیست.

دقت بالا و خطای (توهم) کمتر: در مقایسه با مدل‌های قبلی، نرخ اشتباهات واقعی (factual) تا ۴۵٪ کمتر شده و در حالت thinking این کاهش به حدود ۸۰٪ می‌رسد، همچنین کمتر دچار اعتمادبه‌نفس کاذب می‌شود.

ایمنی و مسئولیت‌پذیری بیشتر: با رویکرد Safe Completions حتی در موضوعات حساس، پاسخ‌هایی امن و هم‌زمان کاربردی ارائه می‌دهد و هنگام امتناع دلیل آن را شفاف بیان می‌کند.

در مدل‌های قدیمی‌تر، سیستم اغلب بین دو حالت ساده گیر می‌کرد: یا پاسخ را کامل می‌داد (حتی اگر ممکن بود خطرناک یا نامناسب باشد) یا یک‌باره "رد می‌کرد" و چیزی نمی‌گفت. Safe Completions این رویکرد را اصلاح کرده و کاری می‌کند که:

پاسخ ایمن ارائه شود حتی در موضوعات حساس یا پرریسک، به‌جای صرفاً مسدود کردن.

اطلاعات خطرناک یا سوءاستفاده‌پذیر حذف یا بازنویسی شوند، اما بقیۀ محتوای مفید باقی بماند.

دلایل امتناع یا محدودیت‌ها شفاف توضیح داده شوند، به‌جای پاسخ مبهم یا خشک.

تعامل طبیعی‌تر: لحن مکالمه کمتر چاپلوسانه و ایموجی‌محور شده و شخصیت‌های آماده مثل Cynic، Robot، Listener و Nerd برای تنظیم سبک گفت‌وگو قابل انتخاب هستند.

کارآمدی بالاتر: با مصرف کمتر توکن می‌تواند همان کیفیت یا بهتر را ارائه دهد، که برای کاربران حرفه‌ای و پروژه‌های طولانی به‌صرفه‌تر است.

دسترسی گسترده: به‌صورت پیش‌فرض در ChatGPT موجود است و بسته به سطح اشتراک، کاربران می‌توانند از حالت کامل، Pro یا نسخه mini استفاده کنند؛ توسعه‌دهندگان نیز امکان استفاده از آن در ابزارهایی مثل Codex CLI را دارند.

آلتمن (مدیر شرکت OpenAI) مسیر رشد GPT را چنین توصیف می‌کند: GPT-3 شبیه گفت‌وگو با دانش‌آموز دبیرستانی بود، GPT-4 مثل حرف‌زدن با دانشجوی دانشگاه و GPT-5 برای نخستین بار حس هم‌صحبتی با متخصصی هم‌تراز دکترا را می‌دهد؛با پاسخ‌هایی پخته‌تر و قابل‌اتکاتر.

بلافاصله ایلان ماسک نیز، احتمالاً برای عقب نماندن از رقیبش، دسترسی رایگان همه کاربران به Grok 4 را فراهم کرد!

قبلاً پستی تحت عنوان: "پژوهش‌هایی که قبل از انتشار، منسوخ می‌شوند" نوشته بودم. با شتاب فعلی پیشرفت GPT، اوضاع از گذشته هم چالش‌برانگیزتر شده است؛ هزاران پژوهشِ منتشرشده با نسخه‌های قدیمی‌تر GPT و هزاران مقاله در حال نگارش، ارسال یا داوری، بر پایه مدل‌هایی انجام شده‌اند که دیگر وجود ندارند. بنابراین نه نتایجشان تکرارپذیر است و نه می‌توان با اطمینان به آنها تکیه کرد.

🔻از سرویس عکس GPT-5 خواستم برای این بیت تصویری بکشد:

یارم به یک لا پیرهن خوابیده زیر نسترن
ترسم که بوی نسترن مست است و هوشیارش کند

عکس را در پیوست می‌توانید ببینید. تصوراتم را نسبت به این بیت نابود کرد!


#AI
#LLM
#chatgpt
#gpt_5

🆔 @irevidence
😁307👌3👍2🙏1
▫️نظریه ناهماهنگی شناختی

دوستی داشتم که دانشجوی دکتری تخصصی بود و سیگار می‌کشید. هرگاه درباره مضرات سیگار صحبت می‌کردیم، او همیشه دلیل می‌آورد که سیگار برایش ضرری ندارد و آسیبی به او نرسانده است. مثلاً وقتی با هم فوتبال بازی می‌کردیم، می‌گفت: "ببینید، من از همه‌تان بیشتر می‌دوم و نفسم هم بهتر است. پس سیگار تأثیری روی من ندارد."

به دنبال نظریه‌ای بودم که بتواند این رفتار را تبیین کند. به‌طور کاملاً اتفاقی با نظریه ناهماهنگی شناختی (Cognitive Dissonance) آشنا شدم. این نظریه بیان می‌کند که:

وقتی فرد دو فکر، باور یا رفتار متضاد داشته باشد، دچار احساس ناراحتی روانی می‌شود. برای کاهش این ناراحتی، تلاش می‌کند یکی از آنها را تغییر دهد یا توجیه کند.


به زبان ساده تر:

وقتی چیزی که می‌دانیم با کاری که می‌کنیم جور درنیاید، ذهن‌مان دنبال بهانه یا توجیه می‌گردد تا آرام شود.

مبدع این نظریه، لئون فستینگر (Leon Festinger) است که روان‌شناس اجتماعی آمریکایی بود. او این نظریه را نخستین بار در سال ۱۹۵۷ در کتاب مشهورش با عنوان A Theory of Cognitive Dissonance مطرح کرد.

برگردیم به دوستم و ببینیم با این نظریه چگونه می‌توان رفتار او را تبیین کرد:

باور اول (دانش عمومی): سیگار مضر است و خطر سرطان و بیماری‌های قلبی-ریوی را بالا می‌برد.

رفتار واقعی: ولی دوستم سیگار می‌کشد.

این دو در تضادند، بنابراین ناهماهنگی شناختی ایجاد می‌شود.

راه‌حل‌های ذهنی دوستم برای کاهش این تنش:


انکار شواهد علمی یا کم‌اهمیت جلوه دادن آن‌ها: سیگار برای من ضرر ندارد.

تکیه بر تجربه‌های شخصی برای ابطال علم: من از همه بیشتر می‌دوم و نفسم قوی‌تر است، پس اثر منفی ندارد.

احساس استثنا بودن: دیگران ممکن است بیمار شوند، اما بدن من قوی‌تر است.

این سازوکارها نمونه‌های کلاسیک کاهش ناهماهنگی شناختی هستند. فرد به‌جای تغییر رفتار (ترک سیگار)، تفسیری از واقعیت می‌سازد که هم سیگار کشیدن را ادامه دهد و هم احساس بدی از تناقض با دانسته‌های علمی نداشته باشد.

یک مثال دیگر:

دانشجویی به فرد دیگری پول می‌دهد تا پایان‌نامه‌اش را برایش بنویسد.

باور درونی: موفقیت تحصیلی باید حاصل تلاش شخصی من باشد و تخلف علمی، غیراخلاقی است.

رفتار واقعی: سپردن پایان‌نامه به شخص دیگر

این تضاد باعث ناهماهنگی شناختی می‌شود. برای کاهش این تنش، دانشجو ممکن است باورش را تغییر دهد یا توجیه کند، مثلاً:

همه این کار را می‌کنند.

در کشور ما فقط به مدرک اهمیت می‌دهند، نه به یادگیری واقعی

اساتید به ما درست آموزش نداده‌اند؛ بنابراین من هم مجبور شدم این راه را انتخاب کنم

سیستم آموزشی ناکارآمد است، پس تقصیر من نیست.

به این ترتیب، به جای تغییر رفتار (نوشتن پایان‌نامه توسط خودش)، با تغییر یا توجیه باور، از فشار روانی رها می‌شود.

به نظر می‌رسد در بسیاری از مواقع، به‌جای آن‌که رفتار متناقض با باورهایمان را تغییر دهیم، باور خود را تغییر می‌دهیم تا از تنش روانی دور بمانیم. البته منظور، باورهای درست است نه باورهای کاذب.

🆔 @irevidence
👍3118👌4🙏2
▫️معیارهای نه گانه برادفورد هیل برای تعیین علیت رابطه‌ها

می دانیم که هر رابطه‌ای (Association) لزوماً از نوع علیت (causation) نیست. در سال 1965 سر آستین بردفورد هیل-استاد آمار زیستی دانشگاه لندن- مقاله‌ای تحت عنوان The Environment and Disease: Association or Causation منتشر کرد که در اصل، متن سخنرانی وی در یک کنفرانس بود.

هیل در این مقاله 9 معیار را برای تشخیص علیتِ رابطه‌های مشاهده شده، بیان می‌کند. البته هشدار هم می‌دهد که هیچکدام از این معیارها به تنهایی اثباتِ قطعی علت و معلول نیستند، بلکه مثل 9 منظر یا زوایه دید هستند که کمک می‌کنند تصمیم بگیریم: آیا رابطه‌ای که می‌بینیم بهترین توضیحش، علیت است یا نه؟

این معیارها بعد از گذشت 60 سال، همچنان قابل اعتنا هستند. با اینکه این معیارها در حوزه پزشکی و بهداشت مطرح شده‌اند، ولی بیشتر آن‌ها را می‌توان در حوزه‌های دیگر مثل آموزش، روانشناسی و سیاستگذاری هم اعمال کرد.

معیارهای نه‌گانه برادفورد هیل

1. قدرت ارتباط (Strength): یک ارتباط قوی و چشمگیر، بسیار بیشتر از یک ارتباط ضعیف احتمال دارد که علیّت را نشان دهد.

هرچه ریسک ابتلا به بیماری در افرادی که با یک عامل در تماس هستند، نسبت به افراد دیگر بیشتر باشد، احتمال اینکه آن عامل واقعاً علت بیماری باشد، بالاتر می‌رود.

2. تکرارپذیری یا سازگاری (Consistency): یافته‌ها باید تکرارپذیر باشند؛ یعنی توسط پژوهشگران مختلف، در مکان‌ها، زمان‌ها و شرایط گوناگون، نتیجه یکسانی مشاهده شود.

اگر مطالعات متعددی که در کشورهای مختلف و با روش‌های متفاوت انجام شده‌اند، همگی به یک نتیجه مشترک برسند (مثلاً سیگار با سرطان ریه ارتباط دارد)، اطمینان ما به وجود رابطه علیّت بیشتر می‌شود.

3. اختصاصی بودن (Specificity): یک عامل خطر مشخص، به یک بیماری مشخص منجر شود.

اگر یک عامل فقط و فقط باعث یک بیماری خاص در یک گروه خاص از افراد شود، این یک شاهد قوی برای علیّت است.

البته این معیار همیشه صادق نیست و نباید روی آن پافشاری کرد. یک عامل می‌تواند باعث چندین بیماری شود (مثلاً سیگار) و یک بیماری نیز می‌تواند چندین علت داشته باشد (مثلاً بیماری قلبی).

4. ترتیب زمانی (Temporality): علت باید همیشه پیش از معلول (بیماری) رخ دهد.

این شرط، یک اصل بدیهی و الزامی است. فرد باید ابتدا در معرض عامل خطر قرار گیرد و سپس به بیماری مبتلا شود.

5. شیب زیستی یا رابطه دوز-پاسخ (Biological Gradient): هرچه میزان مواجهه با عامل خطر بیشتر باشد، احتمال بروز بیماری نیز بیشتر شود.

اگر با افزایش مقدار یا مدت تماس با یک عامل، ریسک بیماری نیز به‌طور متناسب افزایش یابد، این یک شاهد بسیار قوی برای علیّت است.

6. باورپذیری (Plausibility): ارتباط مشاهده‌شده باید با دانش زیستی و پزشکی فعلی ما جور دربیاید و منطقی به نظر برسد.

آیا سازوکار قابل قبولی وجود دارد که توضیح دهد چگونه این عامل می‌تواند باعث آن بیماری شود؟

نکته مهم: هیل به‌شدت تأکید می‌کند که این معیار، یک شرط لازم نیست. دانش بشری همیشه در حال تکامل است و ممکن است یک ارتباط واقعی، با دانش امروزی ما غیرقابل‌باور به نظر برسد. نبودِ باورپذیری نباید باعث رد کردن یک ارتباط قوی شود.

7. همخوانی (Coherence): تفسیر علت و معلولی نباید با تاریخچه طبیعی و زیست‌شناسی شناخته‌شده آن بیماری در تضاد باشد.

یافته‌های ما باید با سایر دانسته‌هایمان درباره آن بیماری هماهنگ باشد و تصویر کلی را تکمیل کند.

8. شواهد تجربی (Experiment): اگر بتوانیم با انجام یک مداخله، میزان بیماری را کاهش دهیم، این قوی‌ترین نوع شاهد برای علیّت است.

اگر ما عامل خطری را که به آن مشکوک هستیم حذف کنیم (مثلاً با کاهش گرد و غبار در کارخانه یا تشویق مردم به ترک سیگار) و ببینیم که پس از آن، شیوع بیماری کاهش می‌یابد، این عملاً علیّت را اثبات می‌کند.

9. قیاس (Analogy): آیا ارتباط مشابهی در موارد دیگر مشاهده شده است؟


هیل هشدار می‌دهد که شواهد قوی به معنای شواهد قطعی و بی‌نقص نیست. علم همیشه در حال تکامل است و ما هرگز به دانش کامل دست پیدا نمی‌کنیم. ما نباید منتظر رسیدن به قطعیت مطلق بمانیم، بلکه باید بر اساس بهترین شواهد موجود در هر زمان، شجاعت تصمیم‌گیری و اقدام را داشته باشیم.

🔗 برای توضیحات بیشتر همراه با مثال به این لینک مراجعه کنید.


🆔 @irevidence
12👍5🙏2
Evidence
▫️قابلیت Video Overviews به هوش مصنوعی NotebookLM اضافه شد ابزار هوش مصنوعی NotebookLM گوگل با آپدیت جدید خود، امکان ساخت پادکست ویدیویی را به قابلیت‌هایش افزوده است. این ویژگی تازه که با نام Video Overviews شناخته می‌شود، به کاربران اجازه می‌دهد تا خلاصه‌های…
Media is too big
VIEW IN TELEGRAM
▫️ قابلیت Video Overviews گوگل NotebookLM از زبان فارسی هم پشتیبانی کرد.

کافیست به Settings بروید و از گزینه Output Language زبان فارسی را انتخاب کنید. فیلم فوق مربوط به مطلب معیارهای نه‌گانه بردفورد هیل برای تعیین رابطه علی و معلولی است که این هوش مصنوعی در عرض چند دقیقه آن را درست کرده است.

هنوز اشکالات ریزی وجود دارد ولی قطعاً رفته رفته برطرف خواهند شد.


🔗 https://notebooklm.google.com/

#AI
#notebookLM
#podcast

🆔 @irevidence
16👍2👌2👎1
🔷 عنوان کتاب: Illustrated Epidemiology: A Visual Guide

🟢 نویسنده: جلال پورالعجل (استاد اپیدمیولوژی)

🟢 ناشر: اشپرینگر (Springer)

🟢تاریخ انتشار: 2025

🟢 تعداد صفحات: 147

مزیت مهم این کتاب در مقایسه با متون کلاسیک اپیدمیولوژی، استفاده‌ی گسترده از ابزارهای بصری است. نویسنده با الهام از تجربه‌های آموزشی خود، به شکلی سیستماتیک مفاهیم پایه‌ای مانند شیوع، بروز و پیشگیری را توضیح داده و سپس به طراحی مطالعات، روش‌های نمونه‌گیری، تحلیل‌های آماری و بحث علیت در اپیدمیولوژی می‌پردازد. هر فصل علاوه بر شرح موضوع، مثال‌های عملی و سوالات مفهومی دارد تا یادگیری فعال تقویت شود. دکتر پورالعجل استاد اپیدمیولوژی دانشگاه علوم پزشکی همدان است.

🟢 عناوین فصل‌ها

1. Basic Concepts of Epidemiology
2. Evaluating Diagnostic and Screening Tests
3. Epidemiological Study Designs
4. Types of Literature Reviews
5. Sampling Methods in Epidemiology
6. Randomization Techniques in Clinical Trials
7. Matching Methods in Epidemiological Studies
8. Measures of Association in Epidemiology
9. Errors, Biases, Confounding, and Interaction in Epidemiological Research
10. Protocol Deviation in Randomized Controlled Trials
11. Statistical Concepts in Epidemiology
12. The Concept of Causality in Epidemiology


#book
#methodology
#study_design
#epidemiology
#springer

🆔 @irevidence
20👍5
▫️چه زمانی باید استفاده از هوش مصنوعی مولد را به ناشر اعلام کنیم؟

ناشران معتبر بین‌المللی دستورالعمل‌هایی برای استفاده از هوش مصنوعی مولد در نگارش مقالات و کتاب‌ها تدوین کرده‌اند. در راهنمای هوش مصنوعی انتشارات وایلی (Wiley) آمده است که در صورت استفاده از هوش مصنوعی در موارد زیر، لازم است نویسندگان موضوع را به ناشر اعلام کنند:

1️⃣ هنگامی که بخشی از خروجی تولیدشده توسط هوش مصنوعی را به‌صورت مستقیم (verbatim) در اثر خود به کار می‌برید؛

2️⃣ هنگامی که محتوای موجود را به‌طور قابل توجهی با کمک هوش مصنوعی ویرایش می‌کنید؛

3️⃣ هنگامی که مواد تکمیلی (supplementary materials) مانند تصویر، جدول یا نمودار را با استفاده از هوش مصنوعی تولید می‌کنید؛

4️⃣ هنگامی که تحلیل‌های مهمی انجام می‌دهید که بر نتیجه‌گیری‌های پژوهش شما اثرگذار است.

وایلی موارد استفاده از هوش مصنوعی مولد در محتوای علمی را در چهار دسته‌ی اصلی طبقه‌بندی کرده است:

نگارش و ویرایش متن (Writing and Editing)

پژوهش و تحلیل (Research and Analysis)

محتوای بصری (Visual Content)

محتوای آموزشی (Educational Content)

سپس در قالب جدولی، مواردی را که نیازمند اعلان (Declaration) و افشا (Disclosure) هستند و نیز مواردی که به چنین اقدامی نیاز ندارند، مشخص کرده است. در ادامه به این موارد اشاره می‌شود.


نگارش و ویرایش متن


نیازمند افشا:
نگارش یا ویرایش بخش‌هایی از دستنوشته
تولید مثال یا مطالعات موردی
ترجمه محتوا
نگارش یا بازنویسی بخش‌های اساسی دست‌نوشته
ارائه تحلیل‌هایی که بر استدلال‌ها یا نتیجه‌گیری اثرگذار است

نیازی به افشا نیست:
اصلاحات جزئی گرامری یا املایی
رفع اشکال نگارشی و نشانه‌گذاری
انتخاب عنوان فصل یا بخش
استفاده جزئی یا کم‌اهمیت از خروجی هوش مصنوعی مانند اضافه کردن یک کلمه

پژوهش و آنالیز

نیازمند افشا:
سنتز یا آنالیز متون
استدلال علمی
شناسایی شکاف‌های پژوهشی
استفاده از رفرنس‌های تولیدشده توسط هوش مصنوعی
آنالیز و تفسیر داده
تولید یا تغییر کد

نیازی به افشا نیست:
جستجوی ساده در متون علمی
فرمت‌بندی رفرنس‌ها
مدیریت رفرنس‌ها
جستجو در دیتابیس‌ها

محتوای بصری

نیازمند افشا:
تولید یا تغییر تصاویر، نمودارها و گراف‌ها
تولید یا ویرایش عکس‌ها

نیازی به افشا نیست:
تغییرات جزئی مانند تغییر اندازه یا تنظیم روشنایی و کنتراست

محتوای آموزشی

نیازمند افشا:
ایجاد تمرین یا سؤالات آموزشی
طراحی سوالات یا روبریک‌ها

نیازی به افشار نیست:
فرمت‌بندی ساده مطالب آموزشی


تصویر پیوست شده با سرویس عکس ChatGPT 5 ساخته شده است.

#AI
#wiley
#research
#writing

🆔 @irevidence
10👍5👌2
▫️انتشار مجله جدید توسط گروه انتشاراتی BMJ

مجله BMJ Digital Health & AI یک نشریه علمی جدید از خانواده انتشاراتی BMJ است که به انتشار پژوهش‌های برجسته و نوآورانه در حوزه سلامت دیجیتال و فناوری‌های هوش مصنوعی در Healthcare اختصاص دارد. این مجله بستری برای معرفی مدل‌ها و داده‌های نوین، نتایج کارآزمایی‌های بالینی و مرورهای سیستماتیک فراهم می‌کند و همچنین مقالات تحلیلی و سرمقاله‌هایی در زمینه مسائل اخلاقی، ایمنی بیمار، امنیت داده‌ها و اثربخشی بالینی منتشر می‌نماید.

تاکنون فقط یک شماره از این مجلۀ اوپن اکسس منتشر شده است.

آقای Joel Grunhut پژوهشگر دانشگاه مریلند در قالب سرمقاله‌ای به خطر حلقه بستۀ (closed-loop) هوش مصنوعی پرداخته است. خلاصه‌ای از مقاله وی در زیر آمده است:


مقدمه

هوش مصنوعی (AI) در حال بازتعریف پژوهش پزشکی است. در گذشته تمام چرخه پژوهش ( از فرضیه‌سازی، تحلیل داده‌ها، نگارش و داوری) توسط انسان انجام می‌شد. اما امروزه، AI در همه این مراحل نقش‌آفرین است و سوال اصلی این است: آیا به سمت یک حلقه بسته تمام‌عیار حرکت می‌کنیم که AI همه چرخۀ تولید شواهد و تصمیم‌گیری بالینی را هدایت کند؟

از داده تا بینش: نخستین ورود AI

ورود اولیه AI در پزشکی با تحلیل داده‌های کلان بود: داده‌های تصویربرداری، پرونده‌های الکترونیک، داده‌های ژنومیک و پوشیدنی‌ها. الگوریتم‌های یادگیری عمیق توانستند الگوهایی را شناسایی کنند که فراتر از توان انسان بود. این مرحله عمدتاً مثبت تلقی شد، به شرط آنکه نظارت انسانی و بستر بالینی حفظ شود.

به سوی نویسندگی اتوماتیک: AI به‌عنوان همکار نویسنده

مدل‌های زبانی بزرگ اکنون قادر به تولید متن علمی روان هستند:

کمک به پژوهشگرانی با محدودیت زمانی یا زبانی.

خلاصه‌سازی مرورهای سیستماتیک یا استانداردسازی بخش‌هایی مانند روش‌ها.

البته نویسندگی توسط هوش مصنوعی با خطراتی همراه است. در متون تولیدشده توسط AI، سوگیری‌های ظریف می‌توانند روایت‌ها را تحت تأثیر قرار دهند. اتکای بیش از حد به این فناوری ممکن است توان پژوهشگران در بیان ایده‌های پیچیده را تضعیف کرده و مباحث علمی را یکنواخت‌تر سازد.

‏AI در داوری همتا و تصمیم‌گیری سردبیری

افزایش حجم مقالات، داوری را دشوار کرده است. ابزارهای AI در حال حاضر برای:

تشخیص سرقت علمی،
بررسی آماری،
یا پیشنهاد داور به‌کار می‌روند.

در آینده حتی می‌توانند روش‌شناسی و ارزش علمی مقالات را نیز بسنجند. اما داوری فقط الگوریتمی نیست؛ بصیرت و شهود انسانی برای نقد عمیق و پذیرش کارهای غیرمتعارف ضروری است.

حلقه بسته: از تولید شواهد تا تصمیم‌های بالینی

تصوری از آینده:

‏ AI داده‌ها را از پایگاه‌های عظیم داده‌های بیماران تحلیل می‌کند و یک نشانگر زیستی (biomarker) جدید شناسایی می‌کند.

همان AI مقاله را می‌نویسد و منابع را سازمان‌دهی می‌کند.

مقاله به داوری AI سپرده می‌شود.

شواهد تولید شده توسط AI، تصمیمات بالینی را هدایت می‌کنند.

این سناریو دور از واقعیت نیست، چون بخش‌های آن هم‌اکنون وجود دارد.

پیامدها: سوگیری، مسئولیت‌پذیری و نوآوری

سوگیری‌ها: الگوریتم‌ها از داده‌های تاریخی یاد می‌گیرند و می‌توانند نابرابری‌ها را تشدید کنند.

مسئولیت‌پذیری: اگر شواهد AI، پزشکان را گمراه کند، مسئولیت بر عهده چه کسی است؟ پژوهشگر، سردبیر یا توسعه‌دهنده الگوریتم؟

نوآوری: خطر اینکه علم به‌جای جهش‌های نوآورانه، تنها به پیشرفت‌های تدریجی محدود شود.

اهمیت و کاربرد بالینی (Clinical relevance) و مسیر پیش رو

با توجه به اینکه شواهد علمی، مستقیماً پایه و اساس مراقبت بالینی و تدوین گایدلاین‌ها محسوب می‌شوند:

باید مطمئن شد که خروجی‌های AI عادلانه و بیمارمحور باقی بمانند.

سوگیری‌های تاریخی نباید منجر به توصیه‌های ضعیف یا غیرقابل‌تعمیم شوند.

‏ AI می‌تواند دسترسی جهانی به شواهد را بهبود بخشد، به‌ویژه در مناطقی که منابع تخصصی محدود است.

پژوهش‌ها و سیاست‌های آینده

تدوین راهنماهای رسمی برای استفاده از AI در نگارش و داوری.

اجرای پایلوت‌ها برای آزمودن کارایی و محدودیت‌ها.

طراحی الگوریتم‌هایی که به‌جای تکرار الگوهای موجود، شکاف‌های دانشی را شناسایی کنند.

توسعه ابزارهایی که به روشن‌سازی و ارزیابی کمک می‌کنند، برای حفظ اعتماد و پاسخگویی

نتیجه‌گیری: حفظ بینش انسانی (human insight)

‏AI به‌زودی در همه مراحل نشر علمی حضور خواهد داشت. این امر می‌تواند کارایی را افزایش دهد، اما خطر ایجاد یک حلقه بسته را دارد که در آن خلاقیت انسانی و تنوع فکری کاهش می‌یابد.

راه‌حل: حفظ مشارکت معنادار انسان، همراه با سیاست‌های شفاف، همکاری بین‌رشته‌ای و آموزش، تا تعادل بین استفاده از AI و ارزش‌های انسانی در پژوهش پزشکی برقرار شود.

#AI
#journal
#BMJ
#research
#healthcare

🆔 @irevidence
👍122
▫️رتبه‌بندی شانگهای و نامه معاون راهبردی رئیس جمهور به وزیر بهداشت

محسن اسماعیلی (معاون راهبردی و امور مجلس رئیس‌جمهور) به وزیر بهداشت نامه نوشته است و در آن از کاهش تعداد دانشگاه‌های ایرانی در رتبه‌بندی شانگهای 2025 ابزار نگرانی عمیق کرده است. به اعتقاد وی پیامدهای این افول، شامل کاهش اعتبار علمی ملی و بین‌المللی، تضعیف دیپلماسی علمی، افزایش شکاف منطقه‌ای و تشدید مهاجرت نخبگان است.

قبل از هر اظهار نظری بهتر است معیارهای رتبه‌بندی شانگهای 2025 را با هم مرور کنیم.

روش‌شناسی رتبه‌بندی آکادمیک دانشگاه‌های جهان 2025 شانگهای (ARWU)

دانشگاه‌های نامزد

در رتبه‌بندی ARWU هر دانشگاهی که برندگان جایزه نوبل یا مدال فیلدز، پژوهشگران پراستناد (Clarivate Highly Cited Researchers) یا مقالات منتشرشده در Nature یا Science داشته باشد، مورد بررسی قرار می‌گیرد. علاوه بر این، دانشگاه‌هایی که تعداد قابل‌توجهی مقاله در نمایه‌های Science Citation Index-Expanded (SCIE) و Social Science Citation Index (SSCI) (پایگاه Web of Science) دارند نیز در نظر گرفته می‌شوند. در مجموع، بیش از 2500 دانشگاه رتبه‌بندی و نتایج 1000 دانشگاه برتر منتشر می‌شود.

شاخص‌ها (Indicators) و وزن آن‌ها در ARWU

کیفیت آموزش (Quality of Education):

▫️فارغ‌التحصیلان دانشگاه که موفق به دریافت جایزه نوبل یا مدال فیلدز شده‌اند-10 درصد

کیفیت هیئت علمی (Quality of Faculty):


▫️اعضای هیئت علمی دانشگاه که موفق به دریافت جایزه نوبل یا مدال فیلدز شده‌اند- 20 درصد

▫️پژوهشگران پراستناد (Highly Cited Researchers): تعداد پژوهشگران پراستناد شناسایی‌شده توسط کلاریویت- 20 درصد

برونداد پژوهشی (Research Output):

▫️‏تعداد مقالات منتشرشده در مجلات Nature و Science- با وزن 20 درصد

▫️مقالات نمایه‌شده در نمایه‌نامه‌های استنادی SCIE و SSCI در Web of Science- با وزن 20 درصد

عملکرد سرانه (Per Capita Performance):


▫️عملکرد علمی سرانه دانشگاه- 10 درصد

توضیح اینکه برای دانشگاه‌های تخصصی در حوزه علوم انسانی و اجتماعی (مانند مدرسه اقتصاد لندن)، تعداد مقالات منتشرشده در مجلات Nature و Science محاسبه نمی‌شود و وزن آن، بین سایر شاخص‌ها توزیع می‎شود.

برای هر شاخص، دانشگاهی که بالاترین امتیاز را کسب کند نمره 100 دریافت می‌کند و سایر دانشگاه‌ها بر حسب درصدی از آن محاسبه می‌شوند. در صورت وجود اثر مخدوش‌کننده در توزیع داده‌ها، از روش‌های آماری استاندارد برای تعدیل استفاده می‌شود. امتیاز نهایی هر دانشگاه بر اساس وزن‌دهی شاخص‌ها محاسبه می‌گردد.


تعریف شاخص‌ها

‏ Alumni (فارغ‌التحصیلان): تعداد فارغ‌التحصیلان یک دانشگاه که برنده نوبل یا مدال فیلدز شده‌اند. بسته به سال دریافت مدرک، وزن متفاوتی داده می‌شود (از 100 درصد برای بعد از 2011 تا 10 درصد برای دهه 1920). در صورت داشتن چند مدرک، فقط یک بار محاسبه می‌شود.

‏ Award (جوایز اعضای هیئت علمی): تعداد کارکنان یک مؤسسه که در زمان دریافت جایزه نوبل (فیزیک، شیمی، پزشکی، اقتصاد) یا مدال فیلدز (ریاضیات) عضو هیئت علمی بوده‌اند. وزن‌ها بر اساس سال دریافت جایزه متفاوت است (100 درصد بعد از 2021 تا 10 درصد برای دهه 1930). در صورت وابستگی به چند مؤسسه، امتیاز به نسبت تقسیم می‌شود.

‏ HiCi (پژوهشگران پراستناد): تعداد پژوهشگران پراستناد انتخاب‌شده توسط Clarivate (لیست نوامبر 2024). اگر فردی در بیش از یک حوزه ESI شناسایی شود، هر حوزه جداگانه محاسبه می‌شود. فقط وابستگی اصلی فرد در نظر گرفته می‌شود.

‏ N&S: تعداد مقالات پژوهشی منتشرشده در مجلات Nature و Science بین سال‌های 2020 تا 2024. وزن‌دهی بر اساس جایگاه نویسنده: 100 درصد برای نویسنده مسئول، 50 درصد برای نویسنده اول، 25 درصد برای نویسنده بعدی و 10 درصد برای سایر نویسندگان. تنها مقالات از نوع Article در نظر گرفته می‌شوند.

PUB: تعداد مقالات از نوع Article نمایه‌شده در SCIE و SSCI در سال 2024. ضمناً برای مقالات نمایه‌شده در SSCI ضریب وزنی دو در نظر گرفته می‌شود.

‏PCP (عملکرد سرانه): امتیازهای وزنی پنج شاخص فوق بر تعداد اعضای هیئت علمی تمام‌وقت یا معادل آن تقسیم می‌شود. اگر داده‌های کشوری موجود نباشد، میانگین جهانی 1000 دانشگاه برتر استفاده می‌شود.

☑️ در رتبه‌بندی جدید تنها شش دانشگاه از ایران حضور دارد. در سال 2024 تعداد 9 دانشگاه حضور داشت.

د.ع.پ تهران و دانشگاه تهران: هر دو بین 401-500

دانشگاه تربیت مدرس: بین 701-800

د.ع.پ شهید بهشتی و دانشگاه شریف: هر دو بین 801-900

و د.ع.پ ایران: بین 901-1000


سوال اصلی این است: آیا این کاهش، آنقدر مسئله مهم و پر اهمیتی است که در سطح معاون راهبردی رئیس جمهور باید بررسی و دنبال شود؟

بیشتر به این نامه خواهم پرداخت.

#ranking
#university
#shanghai

🆔 @irevidence
🤔65👍1
▫️وقتی هوش مصنوعی تعیین می‌کند چه پژوهشی دیده شود

به تازگی مقاله‌ای تحت عنوان زیر در مجله Nature منتشر شده است:

AI chatbots are already biasing research — we must establish guidelines for their use now (Link)

در این مقاله آمده است که در سال‌های اخیر توجه زیادی به این شده که هوش مصنوعی چطور به پژوهشگران در نوشتن مقاله کمک می‌کند. اما کمتر به این پرداخته‌ایم که این ابزارها چگونه بر انتخاب منابع و مقالاتی که می‌خوانیم و به آن‌ها استناد می‌کنیم تأثیر می‌گذارند.

هوش مصنوعی برای پاسخ دادن به سوالات، حجم زیادی از مطالب اینترنت را جمع‌آوری می‌کند، اما در مقابل کاربران، خیلی کمتر به سایت ناشران اصلی هدایت می‌شوند. مثلاً در سال 2025 شرکت OpenAI برای اینکه فقط یک نفر را به سایت ناشر بفرستد، خودش حدود 1500 صفحه مطلب از آن ناشر را مصرف کرده بود؛ در حالی‌که قبلاً این مقدار فقط 250 صفحه بود. شرکت Anthropic حتی بیشتر از این هم پیش رفت: به ازای هر بازدیدی که به سایت ناشر می‌داد، نزدیک به 60 هزار صفحه از مطالب او را استفاده می‌کرد. حتی گوگل هم با قابلیت AI Overviews ترافیک ناشران را سه برابر کمتر کرد. این یعنی بخش بزرگی از مخاطبان، مستقیم به جواب آماده AI دسترسی پیدا می‌کنند و دیگر به سایت مقالات اصلی سر نمی‌زنند.

اما مشکل اصلی، توهم‌های هوش مصنوعی (hallucinations) نیست، بلکه سوگیری پنهان در اطلاعات واقعی است. تحقیقات نشان داده که وقتی از AI خواسته می‌شود پژوهشگرانی را به‌عنوان داور پیشنهاد کند، بیشتر افراد غربی و سفیدپوست معرفی می‌شوند و پژوهشگران آسیایی یا کمتر شناخته‌شده نادیده گرفته می‌شوند.

در زمینه‌ی معرفی مقالات هم همین اتفاق می‌افتد: بیش از 60 درصد منابعی که AI پیشنهاد می‌کند جزو 1 درصد مقالات پر استناد هستند. این یعنی Matthew effect (اثر متیو: مشهورها مشهورتر می‌شوند) به شکل افراطی تشدید می‌شود و تحقیقات تازه یا کمتر دیده‌شده پشت پرده می‌مانند.

سیاست‌های علمی تاکنون بیشتر روی اخلاق نوشتن با کمک AI متمرکز بوده‌اند (مثلاً شفافیت و اصالت متن). در حالی که تهدید اصلی در اینجاست که AI دارد تصمیم می‌گیرد چه مقالاتی دیده و استناد شوند. پژوهشگران اغلب خروجی AI را بدون سوال می‌پذیرند و این باعث می‌شود مسیرهای تحقیقاتی محدود و یک‌سویه شوند.

راهکارهای پیشنهادی نویسنده:

1. پژوهش جدی درباره عملکرد AI در محیط آکادمیک: بررسی سوگیری‌ها، شناسایی خطرهایی مثل پرامپت‌های پنهان مخرب (prompt injection).

2. آموزش پژوهشگران: یاد بگیرند که از AI به‌عنوان ابزار کمکی استفاده کنند، نه مرجع نهایی. مثلاً به‌جای پرسیدن "مقالات مهم حوزه X"، بپرسند "چه انتقادهایی به نظریه X وجود دارد؟".

3. آموزش نهادهای ارزیاب و داوران: با توجه به اینکه در پروپوزال‌های پژوهشی، روزبه‌روز از مرورهای متون تهیه‌ شده با کمک AI استفاده زیادی می‌شود، داوران باید آموزش ببینند تا نشانه‌های نفوذ AI را تشخیص دهند؛ مثل تکیه بیش‌ از حد بر چند مقاله پر استناد و نادیده گرفتن پژوهش‌های متنوع یا مخالف.

به اعتقاد نویسنده، همان‌طور که برای نوشتن با AI قوانین گذاشته‌ایم، باید برای یافتن علم با AI هم چارچوب مشخص کنیم. فرصت محدود است و سیاست‌های امروز، آینده‌ی علم را تعیین خواهد کرد.

#AI
#bias
#research


🆔 @irevidence
👍154🙏1