آکادمی بیوانفورماتیک محققان ایرانی – Telegram
آکادمی بیوانفورماتیک محققان ایرانی
1.57K subscribers
1.57K photos
45 videos
423 files
720 links
Iranian Researchers Bioinformatics Academy


Our sister channel:
✅️ https://news.1rj.ru/str/apply_for_future

Our Instagram link:
✅️ https://www.instagram.com/irbioinformatics/

📬 Admin: @h3nrasouli
Download Telegram
آیا استفاده از داده های SRA برای پردازش های RNAseq سرقت علمی محسوب می شود؟

پاسخ به شبهات علمی


همانگونه که مستحضر هستید، پایگاه داده SRA یکی از پایگاه های داده بسیار خوب برای دانلود داده های اگزوم، RNAseq، DNAseq و ژنوم است. به طور متوسط ماهانه بیش از 1000 دیتاست جدید در آن سابمیت می شود. این دیتاست ها در پلتفرم های مختلفی از شرکت های توالی یابی تهیه شده اند که دارای دپث توالی یابی متفاوتی هستند. داده های SRA به نحوی هستند که می توان به راحتی آنها را برای پردازش های ژنومی در مقیاس وسیع مورد استفاده قرار داد. اما با این حال سوالی که پیش می اید ایا استفاده از این دیتاست ها برای مقایسه یا استفاده های دیگر سرقت علمی محسوب می شود؟

پاسخ خیر است. دیتابیس SRA یک دیتابیس علمی بیوانفورماتیک عمومی برای دانلود و پردازش داده های بزرگ یا BIG DATA است، بنابراین به دلیل دسترسی عمومی که به این داده ها وجود دارد کاربران با خیال راحت می توانند از آن استفاده کنند و برای انجام مقایسات ژنومی از داده های آن به عنوان ورودی های مقایسه ای استافده کنن. فقط در صورتی سرقت علمی در کار با داده های زیستی در نظر گرفته می شود که فرد استفاده کننده، مجددا داده های ثبت شده در SRA را با یک شماره دسترسی جدید در این پایگاه داده ثبت نماید. به دلیل مجهز بودن پایگاه داده SRA به ابزار مقایسه محتوای داده و کنترل کیفی محتوای خوانش های سابمیت شده در آن، نمی توان داده های قبلی را مجددا در آن سابمیت کرد. از طرف دیگر برای ثبت داده در SRA بایستی فایل اکسل متادیتای ارائه شده توسط شرکت توالی یابی نیز همراه با رکودهای خوانش شده در مرحله ثبت در این پایگاه داده آپلود شود.

بنابراین به دلیل اینکه SRA و محتوای آن برای ارزیابی های مقایسه ای در حوزه RNAseq، اگزوم یا ژنوم مورد استفاده قرار می گیرد، استفاده از محتوای آن خلاف شرع نبوده و حرام نیست و در نتیجه سرقت علمی محسوب نمی شود😁. پس با خیال راحت اگر اینترنت ارزون دارین و فضای ذخیره کافی ی بسم الله بگین و هرچی دلتون میخاد دانلود کنین و برای یادگیری یا ارزیابی های مقایسه ای ازشون استفاده کنین.

فایل های ذخیره شده در SRA به چهار صورت هستند. فایل های fasta، فایل های FASTQ، فایل های متادیتا و داده های تکنیکال، فایل های متنی. داده های fasta عمدتا خروجی های بعد از مرحله اسمبلی هستند که کاربر خوانش های دریافت شده از شرکت را پس از کنترل کیفی پردازش می کند و خروجی آن را در SRA قرار می دهد. فایل های FASTQ فایل های خام خوانش های دریافت شده از شرکت توالی یابی هستند که عمدتا از سایز بالایی برخوردارند و گاهان بالای 20 گیگ اندازه دارند به خصوص اگر به صورت PE باشند. داده های متا و تکنیکال عمدتا به صورت فایل های csv هستند و نهایتا کمتر از 20 مگابایت اندازه دارند. و فایل های متنی نیز شامل امارهای مربوط به خوانش های صورت گرفته توسط دستگاه توالی یاب شرکت توالی یابی، کیفیت خوانش ها، نوع آزمایش، شماره دسترسی ها و ... هستند و کمتر از 5 مگابایت اندازه دارند. وقتی شما با داده های SRA کار میکنین مشکل اصلی شما حجم داده های خام خوانش ها هستش که مرحله به مرحله پس از انجام هر پردازش محاسباتی سایزشون کوچیک میشه و به اصطلاح اب میرن. مثلا اگر 20 گیگابایت فایل خوانش دارین، بعد از اسمبلی میشه 10 گیگ، بعد از انوتیشن نهایتا بشه 500 مگ، بعد از مپینگ میشه کمتر از 200 مگ و بعد از انتولوژی ژنی و سرچ مسیرهای زیستی در KEGG و Biosamples و .... نهایتا بشه 10 مگابایت. بنابراین شما وقتی یه خوانش رو ارزیابی میکنین هی میاین اون رو رنده میکنین و سایزش کم میکنین تا به اطلاعات دلخواهتون برسین. بنابراین میشه اینجا گفت که برای مرحله اسمبلی بیشترین نیاز سخت افزاری دارین و برای مرحله ترسیم گراف ها و ... که عمدتا با R و پایتون و بیورابی انجام میشه نهایتا با یه PC معمولی یا ی لپتاپ 3 هسته ای هم کارتون راه میفته.

بنابراین، بهتون این اطمینان میدیم که استفاده از داده های SRA برای یادگیری، اشنایی با ابزارهای پردازشی، استفاده از اونا به عنوان دیتاست های مقایسه ای، بازیابی محتوای اطلاعاتیشون برای کشفیات جدید، مقایسه داده های اکسپریمنتال خودتون با اونا و ... سرقت علمی حساب نمیشه و شما میتونین با خیال راحت ازشون استفاده کنین..
👍4
لینک دانلود مستقیم نسخه های مختلف ابزار SRAtoolkit

همانطور که گفتیم برای کار با داده های ژنومی اولین مرحله نیازه که داده های موردنظرتون رو از بانک داده دانلود کنین. و دیتاست خودتون رو بسازین برای اینکار کافیه متناسب با سیستم عامل کامپیوترتون یکی از نسخه های SRA رو نصب کنین و بعد در نهایت اونا رو ران کنین . تو این آموزش لینک سریع دانلود این ابزارها رو براتون گذاشتیم و بعدش در ادامه آموزش رو خدمتتون میگیم که استفاده کنین. هدف از اموزشا هم اینه که نکات کلیدی و کاربردی به دانشجوا منتقل بشه و اونایی که کمتر با دانش سخت افزار و نرم افزار اشنایی دارن مثل بقیه بتون از این دریای علمی استفاده کنن.

دانلود نسخه 64 بیتی سنتوس:
https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/3.0.0/sratoolkit.3.0.0-centos_linux64.tar.gz

دانلود نسخه 64 بیتی اوبنتو:
https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/3.0.0/sratoolkit.3.0.0-ubuntu64.tar.gz

دانلود نسخه 64 بیتی فدورا و دبیان: این ورژن SRA هم رو فدورا و هم رو دبیان به راحتی کار میکنن. بعضی وقتا میان نسخه های فدورا رو روی ابونتو هم نصب میکنن که سرعت بره بالا ولی خب گاها باگ مشاهده میشه و ترجیحا متناسب با هر OS ک دارین نرم افزارهایی ک نیاز دارین رو انتخاب کنین برای نصب:
https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/3.0.0/setup-apt.sh

دانلود نسخه رد هات مخصوص سرورهای مبتنی بر سنتوس:
https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/3.0.0/setup-yum.sh

دانلود نسخه اختصاصی مکینتاش:
https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/3.0.0/sratoolkit.3.0.0-mac64.tar.gz

دانلود نسخه اختصاصی ویندوز 64 بیتی
https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/3.0.0/sratoolkit.3.0.0-win64.zip


دانلود نسخه مدیفای شده همراه با برخی ابزارهای کلیدی برای انالیز توالی های ژنومی برای سیستم عامل سنتوس 64 بیتی:
https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/3.0.0/hisat2-2.2.1-64-ngs.3.0.0-linux.zip

توصیه های کاربردی برای کاربرانی که برای اولین بار میخان کار با SRA رو یاد بگیرین

1- عزیزان اگر مبتدی هستین سعی کنین برای یادگیری هرچه بهتر اول اول نسخه ویندوزی رو کامل مسلط بشین. نسخه ویندوزی کاملا کامندهاش شبیه نسخه لینوکسی با این تفاوت که در ویندوز ما پسوند .exe رو به هر کدوم از ماژول های SRA اضافه میکنیم تا رانش کنیم ولی در لینوکس فقط اسم ماژول رو در ترمینال میزنیم. پس کار با نسخه لینوکسی و ویندوزی چندان تفاوتی باهم ندارن.

2- سعی کنین که روی لبتابتون حداقل 1 ترا فضای خالی داشته باشین تا موقع ران کامندها سیستم قفل نکنه. میتونین هاردتون رو ارتقا بدین یا از هاردهای پرسرعت مجازی استفاده کنین و سرعت پردازش سیستمون رو ببرین. بالا.

3- نکته خیلی مهم اینه اعتماد بنفستون از دست ندین. شرط اول هر کاری اعتماد بنفسه. اگر اعتماد به نفس نداشته باشین همون مرحله دانلود ابزاره با شکست مواجه میشین و دیگه نمیتونین ادامه بدین. درسته که ابتدای کار هستین ولی خب زمان میبره تا فوت و فن کار یاد بگیرین. وقتی خود خوان یاد میگیرین دقت داشته باشین که خطاها رو یاد میگیرین دیگه مثل بعضی جاها که بهتون چارتا اسکریپت کج کوله میدن و اصلا هم سر ازشون در نیمارین نیست، بلکه خودتون به راحتی میتونین کل فرایند پردازش رو انجام بدین و نتایج خوبی ازش بگیرین.

#دانلود_sra
@irbioinformatics
👍4
مراحل موردنیاز در یادگیری اصول RNAseq

برای یادگیری اصولی و کاربردی پردازشهای مربوط به RNAseq نیاز است که کاربران هنگام شروع یادگیری در این مرحله به چند فرایند خیلی مهم دقت داشته باشند.
1- پیدا کردن داده مناسب برای پردازش. همانطور که می دانید در بانک SRA بیش از میلیون ها خوانش RNAseq شرکت های ایلومینا، پک بایو، نانوپور، و... وجود دارد که برای نمونه های مختلف گیاهی و جانوری و ... ثبت شده است. در هر مرحله شما بایستی داده ای انتخاب کنین که مناسب با رشتتون و هدف کارتون هستش. چون هر نوع داده که در SRA وجود داره تفاسیر خاص خودش داره. لذا وقتی در ورکشاپی شرکت میکنن اگر دیتاها خارج از فیلد کاری شما هستش قاعدتا هیچ وقت تفاسیر کاربردی مربوطه رو یاد نمیگیرین. زیرا برای هر سمپلی که میخاین پردازش کنین اطلاعات تفسیری منحصر به فردی وجود داره و باید متناسب با تخصصتون و نیازتون این پردازش ها رو یاد بگیرین.

2- کنترل کیفی داده ها. دقت کنین که ابزارهای مختلفی برای کنترل کیفی داده ها در پلتفرم های مختلف وجود دارند. سعی کنین همیشه بهترین ابزار رو با توجه به نوع داده ای که انتخاب می کنین برای پردازش محاسباتی رو ران کنین در غیر این صورت در مرحله کنترل کیفی ممکنه خیلی از اطلاعاتتون رو از دست بدین یا اصلا کنترل کیفی صحیحی انجام ندین.

3- در مرحله اسمبلی داده های RNAseq خیلی مهمه که اسمبلر مناسبی برای این کار انتخاب کنین. اگر از ابزارهای بی ربط یا کیفیت پایین استفاده کنین ممکنه خوانش هاتون به دقت اسمبل یا مونتاژ نشن و در نتیجه موقع انجام مراحل بعدی با مشکل مواجه بشین. دقت داشته باشین که برای داده های ژنوم اسمبلرهای اختصاصی وجود دارد و برای داده های اگزوم و rnaseq هم همینطور. حتی اگر خوانش های یک طرفه یا دو طرفه داشته باشین بازهم اسمبلر مربوطه باهم متفاوته در نتیجه همیشه قبل از اینکه اسمبلی کنین ی ابزار مناسب با توجه به ماهیت داده ها انتخاب کنین.

4- در مرحله انوتیشین و مپ کردن داده ها خیلی مهمه که یک نقشه ژنومی اپدیت شده برای داده های خوانشی rnaseqتون انتخاب کنین تا بتونین براساس اون خروجی های لازمه رو پردازش کنین در غیر این صورت اصلا نمیتونین مرحله مپینگ و انوتیشن رو به دقت انجام بدین.

5- بعد از انوتیشن باید خروجی هاتون با ی سری مسیرهای زیستی مقایسه کنین. بهتره خیلی سعی کنین که دیتابیس های خیلی مهم و کاربردی رو تو فیلدی ک دارین کار میکنین پیدا کنین. و اخرین نسخه اون ابزارهایی ک دارین برای این کار استفاده می کنین رو دانلود و نصب کنین. اینطوری هم کیفیت کارتون میره بالا و هم اینکه در تفاسیر خطا ندارین.

6- مرحله تفسیر نتایج خیلی مهمه. برای این مرحله جز خودتون و تلاشتون واقعیتش اینه کسی نمیتونه کمکتون کنه. سعی کنین زیاد مقاله بخونین و به کاری ک میخاین انجام بدین کامل مسلط باشین تا بدونین هدفتون چی هستش در کل که با توجه به اون خروجی هاتون رو پردازش کنین.

7- تمرین و تکرار فراوان
@irbioinformatics
👍7
basic commands-linux.pdf
1.1 MB
کامندهای پرکاربرد و پایه ای در لینوکس که باید بلدشون باشین
@irbioinformatics
👍5
🔖گزارشی از یک کیس جالب


🚩در نشریه معتبر پزشکی BMJ در بخش بیماری‌های دستگاه گوارش، یک گزارش جالب و عجیب منتشر شده است.

یک مرد ۴۶ ساله، بعد از آسیب انگشت شست دست خود، مجبور شد که مدت ۳ هفته تمام سفالکسین بخورد.اما یک هفته بعد از پایان دوره درمان دارویی، اطرافیان او متوجه تغییرات شخصیتی عجیب در او که پیش از آن سابقه نداشت شدند. او دچار دوره‌های سرخوشی و افسردگی و رفتارهای خشونت‌آمیز می‌شد.

با توجه به این علایم پزشکان به او مدتی داروی ضد افسردگی دادند. مصرف این داروها ادامه داشت تا اینکه یک بار به خاطر تخلف رانندگی پلیس‌ها خودروی او را متوقف کردند و طبعا تست الکل روی او انجام شد و نشان داد که رانندگی حین مستی داشته است.
بررسی بیشتر نشان داد که سطح الکل خون ۲۰۰ میلی گرم در دسی لیتر بوده که به میزان قابل ملاحظه‌ای از آستانه مجاز بالاتر بود.اما این مرد اصرار داشت که اصلا الکلی مصرف نکرده است. سرانجام «عمه» این مرد که حرفش را باور کرد. یک دستگاه پرتابل آنالیز تنفس که میزان تقریبی الکل خون را نشان می‌دهد، برای او خرید و این دو متوجه شدند که بسیار اوقات میزان الکل بدن این شخص بالاست!

چه اتفاقی افتاده بود؟ آیا مرد سر همه کلاه می‌گذاشت و مخفیانه الکل می‌خورد و اصلا چرا این را مخفی می‌کرد یا داستانی دیگر در کار بود.

🚩آنها به ناچار به پزشکی در اوهایو رفتند، پزشکی که قبلا مورد مشابهی داشت. مشخص شد که مخمرهایی در درون روده باریک و بخشی از روده بزرگ به نام سکوم، جا خوش کرده‌اند و به صورت طبیعی کار تخمیر و تبدیل کربوهیدرات به الکل را انجام می‌دهند.

🚩بررسی‌های اولیه نشان داد که دو میکروارگانیسم Saccharomyces #cerevisiae و S. boulardii در درون روده او هستند.

🚩آزمایش‌های نشان دادند که در پی دادن غذاهای حاوی کربوهیدرات، این مخمرها فعال می‌شوند و ظرف ۸ ساعت، سطح الکل ۵۷ میکروگرم در دسی لیتر را در بدن او را ایجاد می کنند!

🟢چیزی که رخ داده بود این بود که آنتی بیوتیک سفالکسین میکروب‌های نرمال روده این مرد را٫ تغییر را داده بود و با کشتن عده‌ای از آنها، شرایط را برای جایگزین شدن مخمر در بدن او فراهم کرده بود!

🍾به این مورد، سندرم ABS یا سندرم مشروب‌سازی خودکار یا سندرم تخمیر روده‌ای می‌گویند.

برای درمان اولیه دستور محدود کردن غذاهای کربوهیدارتی و داروهای ضدمخمر به او داده شد. اما این درمان موفقیت‌آمیز نبود.

درست همین جا بود که این مرد به نویسندگان کیس ریپورت نشریه BMJ معرفی شد. آنها ارگانیسم‌های دیگری مانند کاندیدا آلبیکنس و C. parapsilosis را هم پیدا کردند، داروهای ضد مخمر را عوض کردند و پروبیوتیک لاکتوباسیلوس اسیدوفیلوس را هم تجویز کردند. این درمان به تدریج پاسخ داد و حالا که یک سال و نیم از آن زمان می‌گذرد، کارخانه مشروب‌سازی داخل بدن بیمارشان از کار افتاده است!

⭐️البته این نخستین گزارش در مورد این سندرم عجیب نبوده است.


➡️https://www.ncbi.nlm.nih.gov/books/NBK513346/

➡️https://bmjopengastro.bmj.com/content/6/1/e000325
🤯5👍4
🔰Some useful literature on how to write an abstract👇👇

https://news.1rj.ru/str/IRBioinformatics/1153
👍3
مصوبه هیات وزیران در خصوص واردات و تعرفه رجیستری آیفون:
سود بازرگانی واردات آیفون ۹۶درصد تعیین شد

+خود اپل انقدر سود نمیکنه 😂😂
یعنی متد اداره کشور رو نشون نویسنده‌های money heist بدی، جیغ می‌کشن فرار می‌کنن
🤣9👍1
#دانستنی‌ها
ترکیب میکروبیوتای دهان به طور قابل توجهی در نواحی مختلف دهان، مانند زبان، لوزه‌ها و حلق، متفاوت است. این تنوع، به همراه نبود پروتکل‌های استاندارد برای انتخاب محل نمونه‌برداری و شرایط آن، انجام مطالعات مقایسه‌ای در محیط‌های پژوهشی مختلف را به چالش می‌کشد. در نتیجه، تحلیل میکروبیوم دهان و مقایسه نتایج بین مطالعات همچنان بسیار پیچیده است.
@irbioinformatics
👍3
#دانستنی‌ها
بیان ژن فرآیندی است که طی آن دستورالعمل‌های موجود در DNA به یک محصول عملکردی مانند پروتئین تبدیل می‌شوند. به عبارت دیگر، این روش شامل استخراج اطلاعات از یک ژن و استفاده از آن برای تولید یک محصول ژنی کاربردی است. این یک فعالیت بیولوژیکی حساس است که حتی یک تغییر کوچک در الگوی بیان ژن می‌تواند به تغییر در کل فرآیند بیولوژیکی منجر شود
@irbioinformatics
👍4
#یادبود
نوبلیست گرهارد دوماک (در تصویر) یکی از اولین آنتی‌بیوتیک‌های تجاری در دسترس را کشف کرد که با نام تجاری پرنتوزیل به بازار عرضه شد.

کشف دوماک از موش‌ها و خرگوش‌ها در برابر دوزهای کشنده‌ی استافیلوکوک‌ها و استرپتوکوک‌های همولیتیک محافظت کرد. با این حال، او اطمینان نداشت که این دارو در انسان نیز به همان اندازه مؤثر باشد. اما در اتفاقی ناگهانی، دختر خودش به عفونت استرپتوکوکی شدیدی مبتلا شد و دوماک، ناامیدانه، به او دوزی از پرنتوزیل داد.

دخترش به‌طور کامل بهبود یافت، اما دوماک در گزارش خود از نتایج اثربخشی دارو، این نتیجه را ذکر نکرد. او تا سال ۱۹۳۵ صبر کرد تا نتایج حاصل از پزشکانی که داروی جدید را روی بیماران آزمایش کرده بودند، به دست آید.
@irbioinformatics
👍3
این مقاله مروری به بررسی جدیدترین پیشرفت‌ها در زمینه چسب‌های مولکولی تخریب‌کننده (Molecular Glue Degraders, MGDs) می‌پردازد و مواردی از جمله کشف MGDs، محدوده اهداف دارویی، کاندیداهای بالینی، مدل‌سازی محاسباتی و فضای فیزیکوشیمیایی آن‌ها را مورد توجه قرار می‌دهد.
@irbioinformatics
👍3
چسپ های مولکولی.pdf
3.8 MB
Advances in molecular glues: exploring chemical space and design principles for targeted protein degradation
https://news.1rj.ru/str/IRBioinformatics/1166
👍4
معرفی ROBERT
ROBERT: Bridging the Gap Between Machine Learning and Chemistry
علاوه بر پاسخگویی به نیازهای فناوری، ادغام یادگیری ماشین (ML) در جوامع انسانی به پایداری نیز کمک کرده است، از طریق پذیرش پروتکل‌های دیجیتالی‌شده. با وجود این مزایا و ابزارهای در دسترس فراوان، فاصله‌ی زیادی در پیاده‌سازی ML وجود دارد که مانع از به‌کارگیری گسترده پروتکل‌های آن در جوامع شیمی محاسباتی و تجربی شده است. در این پژوهش، ابزار ROBERT معرفی شده است، نرم‌افزاری که به دقت برای دسترسی بیشتر شیمیدانان با هر سطح مهارت برنامه‌نویسی به ML طراحی شده است و در عین حال نتایجی هم‌تراز با متخصصان این حوزه ارائه می‌دهد
👍3