آیا مدل های بزرگ زبان (LLM) می توانند درک ما از روابط ژن و فنوتیپ را تغییر دهند؟
▪️ GP-GPT: Large Language Model for Gene-Phenotype Mapping
#علوم_پزشکی #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ GP-GPT: Large Language Model for Gene-Phenotype Mapping
#علوم_پزشکی #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍10❤4👎3
آیا مدلهای زبان بزرگ (LLM) میتوانند تصحیح خطا در گزارشهای رادیولوژی را برای افزایش دقت تشخیصی بهبود بخشند؟
▪️ ReXErr: Synthesizing Clinically Meaningful Errors in Diagnostic Radiology Reports
#علوم_پزشکی #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ ReXErr: Synthesizing Clinically Meaningful Errors in Diagnostic Radiology Reports
#علوم_پزشکی #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍8👎2
Forwarded from DeepMind AI Expert (Farzad 🦅)
تعدادی مقاله #هوش_مصنوعی جالب رو میتونین موضوعات رو دنبال کنید
◾️ Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model
◾️ To Code, or Not To Code? Exploring Impact of Code in Pre-training
◾️ Automated Design of Agentic Systems
◾️ LLM Pruning and Distillation in Practice: The Minitron Approach
◾️ Transformers to SSMs: Distilling Quadratic Knowledge to Subquadratic Models
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
◾️ Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model
◾️ To Code, or Not To Code? Exploring Impact of Code in Pre-training
◾️ Automated Design of Agentic Systems
◾️ LLM Pruning and Distillation in Practice: The Minitron Approach
◾️ Transformers to SSMs: Distilling Quadratic Knowledge to Subquadratic Models
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍6❤2👎1👌1
9999 علاقمند به هوش مصنوعی، پایتون و... شدیم 😍🚶♂
مرسی
مرسی
🆒39👎17👍6❤5🔥5😁2👌2
خود تصحیح یک قابلیت بسیار مطلوب برای مدلهای زبان بزرگ (LLMs) است، اما به طور مداوم در LLMهای مدرن تا حد زیادی بیاثر است. رویکردهای موجود برای آموزش خود اصلاحی یا به چندین مدل نیاز دارند یا به مدلی تواناتر یا سایر اشکال نظارت متکی هستند. برای این منظور، ما یک رویکرد یادگیری تقویتی آنلاین چند نوبتی (RL) به نام SCoRe را توسعه میدهیم که به طور قابلتوجهی توانایی خود اصلاحی LLM را با استفاده از دادههای کاملاً خود تولید شده بهبود میبخشد. برای ایجاد SCoRe، ابتدا نشان میدهیم که انواع تنظیم دقیق نظارت شده (SFT) در ردیابیهای اصلاحی تولید شده توسط مدل آفلاین برای القای رفتار اصلاحی خود کافی نیست. به طور خاص، مشاهده میکنیم که آموزش از طریق SFT یا از عدم تطابق توزیع بین دادههای آموزشی و پاسخهای خود مدل رنج میبرد یا به طور ضمنی فقط یک حالت خاص از رفتار اصلاحی را ترجیح میدهد که اغلب در زمان آزمون مؤثر نیست. SCoRe این چالشها را با آموزش تحت توزیع خود مدل از ردیابیهای اصلاحی خود تولید شده و با استفاده از منظمسازی مناسب برای هدایت فرآیند یادگیری به سمت یادگیری یک استراتژی خود اصلاحی که در زمان آزمون مؤثر است، به جای صرف پاسخهای با پاداش بالا برای سریع داده شده است. این منظمسازی، اجرای فاز اول RL را بر روی یک مدل پایه برای ایجاد یک خطمشی اولیه که کمتر مستعد فروپاشی است و سپس استفاده از پاداش پاداش برای تقویت اصلاح خود در طول آموزش، تجویز میکند. هنگامی که برای مدلهای Gemini 1.0 Pro و 1.5 Flash اعمال میشود، متوجه میشویم که SCoRe به عملکرد پیشرفتهای در خود تصحیح دست مییابد که در معیارهای MATH و HumanEval به ترتیب خود تصحیح مدلهای پایه را به ترتیب 15.6 و 9.1 درصد بهبود میبخشد.
▪️ Self-Contrast: Better Reflection Through Inconsistent Solving Perspectives
#ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ Self-Contrast: Better Reflection Through Inconsistent Solving Perspectives
#ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍4❤2👎1
This media is not supported in your browser
VIEW IN TELEGRAM
اولین ربات چای ریز ایران ساخته شد خب این دستاش خشکه 😂
چراخودتون رو اسباب خنده میکنین اخه😂 مجری خیلی خوبه
#متفرقه #رباتیک
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
چراخودتون رو اسباب خنده میکنین اخه😂 مجری خیلی خوبه
#متفرقه #رباتیک
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
😁12👎8👍1
Forwarded from DeepMind AI Expert (Farzad 🦅)
در هفته ای ک گذشت چه مقالاتی در رشته علوم پزشکی منتشر شد:
◾️ Medical MLLM is Vulnerable: Cross-Modality Jailbreak and Mismatched Attacks on Medical Multimodal Large Language Models
◾️ LLMs are not Zero-Shot Reasoners for Biomedical Information Extraction
◾️ RuleAlign: Making Large Language Models Better Physicians with Diagnostic Rule Alignment
◾️ CTP-LLM: Clinical Trial Phase Transition Prediction Using Large Language Models
◾️ Hibou: A Family of Foundational Vision Transformers for Pathology
◾️ LLaVA-Surg: Towards Multimodal Surgical Assistant via Structured Surgical Video Learning
◾️ MEDCO: Medical Education Copilots Based on A Multi-Agent Framework
◾️ Clinical Insights: A Comprehensive Review of Language Models in Medicine
◾️ FEDKIM: Adaptive Federated Knowledge Injection into Medical Foundation Models
◾️ MSDiagnosis: An EMR-based Dataset for Clinical Multi-Step Diagnosis
#ایده_جذاب #علوم_پزشکی #مقاله
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
◾️ Medical MLLM is Vulnerable: Cross-Modality Jailbreak and Mismatched Attacks on Medical Multimodal Large Language Models
◾️ LLMs are not Zero-Shot Reasoners for Biomedical Information Extraction
◾️ RuleAlign: Making Large Language Models Better Physicians with Diagnostic Rule Alignment
◾️ CTP-LLM: Clinical Trial Phase Transition Prediction Using Large Language Models
◾️ Hibou: A Family of Foundational Vision Transformers for Pathology
◾️ LLaVA-Surg: Towards Multimodal Surgical Assistant via Structured Surgical Video Learning
◾️ MEDCO: Medical Education Copilots Based on A Multi-Agent Framework
◾️ Clinical Insights: A Comprehensive Review of Language Models in Medicine
◾️ FEDKIM: Adaptive Federated Knowledge Injection into Medical Foundation Models
◾️ MSDiagnosis: An EMR-based Dataset for Clinical Multi-Step Diagnosis
#ایده_جذاب #علوم_پزشکی #مقاله
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍10👌6
آیا علاقه مند به به روز ماندن با پژوهشهای پیشرفته هستید اما زمان کم میارید؟ تو کانال یوتیوبم، مقالات و یادداشت های تحقیقاتی پیچیده یادگیری عمیق رو به صورت خلاصه های شفاف و مختصر توضیح میدم تا به نوبه خودم دانش رو برای همه قابل دسترس کنم. چه دانشجو، پژوهشگر یا فقط کنجکاو باشید، محتوای من به شما کمک میکنه تا نکات و مطالب کلیدی رو سریع درک کنید. در جدیدترین اکتشافات به روز بمانید، ایده های نوآورانه رو کشف کنید و دانش خود رو تقویت کنید—کافیه به کانال من بپیوندید و در رشته خود پیش قدم باشید!
https://www.youtube.com/@RezaJavadzadeh
#منابع #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
https://www.youtube.com/@RezaJavadzadeh
#منابع #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
❤16👍7👎5
خیلی دوست داشتم این پادکست طبقه ۱۶ رو پیشنهاد میدم گوش کنین
https://castbox.fm/vb/738456303
Persian version of AI Development & Entrance.
https://castbox.fm/vb/738456303
Persian version of AI Development & Entrance.
d.castbox.fm
Best free podcast app for Apple iOS and Android | Let words move you
Millions of podcasts for all topics. Listen to the best free podcast on Android, Apple iOS, Amazon Alexa, Google Home, Carplay, Android Auto, PC. Create...
👍20👎1
فوت بیش از ۵۱ نفر از هموطنان عزیز در پی حادثه معدن طبس رو تسلیت میگم 🌻🥲
❤94👍5
گیتهاب #کلاس_آموزشی #یادگیری_ماشین دکتر زارچی منتشر شد
https://github.com/SharifiZarchi/Introduction_to_Machine_Learning
#منابع
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
https://github.com/SharifiZarchi/Introduction_to_Machine_Learning
#منابع
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
🔥14👎6👍2👌2🆒2❤1
Maame Vatan
Mohsen Chavoshi
وطن ارثیه من است ...
"فرسوده مانده در صفِ دلگیرِ روزها/
گویی برای مردن، نوبت گرفتهام."
عباس معروفی
#مام_وطن
#طبس 🖤
#متفرقه
"فرسوده مانده در صفِ دلگیرِ روزها/
گویی برای مردن، نوبت گرفتهام."
عباس معروفی
#مام_وطن
#طبس 🖤
#متفرقه
❤15👎1
Forwarded from Daily Laily
Linkedin
امنیت در هوش مصنوعی! 🤖
این یه مثال جالب از هک کردن یه سیستم هوشمند چته… | Ali Ghandi | 12 comments
این یه مثال جالب از هک کردن یه سیستم هوشمند چته… | Ali Ghandi | 12 comments
امنیت در هوش مصنوعی! 🤖
این یه مثال جالب از هک کردن یه سیستم هوشمند چته. یه فروشگاه میتونه از یه LLM استفاده کنه تا به کاربراش راهنمایی لازم رو بده. یا به عنوان واحد پشتیبانی ازش استفاده کنه.👨💻
یوزر اول سعی میکنه که از LLM فروش کل رو بپرسه. از اونجای که…
این یه مثال جالب از هک کردن یه سیستم هوشمند چته. یه فروشگاه میتونه از یه LLM استفاده کنه تا به کاربراش راهنمایی لازم رو بده. یا به عنوان واحد پشتیبانی ازش استفاده کنه.👨💻
یوزر اول سعی میکنه که از LLM فروش کل رو بپرسه. از اونجای که…
👍8👌1
Forwarded from Recommender system (MehriMah Amiri)
NLP_Language_Processing_and_Python_1727095934.pdf
20.7 MB
👍5🔥2
Forwarded from Recommender system (MehriMah Amiri)
نویسنده این پست، ( Raschka) است.
یک سوال رایج ازنظرنويسنده این است که GPT چگونه با Llama مقایسه میشود. به نظر من، یکی از بهترین راهها برای درک تفاوتها، پیادهسازی هر دو مدل از ابتدا است.
خلاصهای از تفاوتهای اصلی بین GPT-2 XL و Llama میپردازد:
1. Vocabulary Size:GPT-2 XL از واژگان بزرگتری با 50,257 توکن پشتیبانی میکند، در حالی که Llama 2 دارای 32,000 توکن است. البته، در مدل اخیر Llama 3، تعداد واژگان به 128K افزایش یافته است.
2. Positional Embeddings:GPT-2 XL از جایگذاری موقعیتی مطلق استفاده میکند، اما Llama از جایگذاریهای موقعیتی چرخشی (ROPE) بهره میبرد.
3. Attention Heads:Llama نسبت به GPT-2 XL سرهای توجه بیشتری دارد، که به معنای توزیع بهتر توجه بر روی دادههای ورودی و درک بهتر زمینه است.
4. Activation Function:GPT-2 XL از تابع فعالسازی GELU استفاده میکند، در حالی که Llama از تابع SiLU (Swish) بهره میبرد، که سادهتر و کارآمدتر است.
5. Normalization:در Llama، نرمالسازی لایه استاندارد با نرمالسازی لایه RMS جایگزین شده است که میتواند به آموزش سریعتر و همگرایی پایدارتر منجر شود.
گيت هاب
یک سوال رایج ازنظرنويسنده این است که GPT چگونه با Llama مقایسه میشود. به نظر من، یکی از بهترین راهها برای درک تفاوتها، پیادهسازی هر دو مدل از ابتدا است.
خلاصهای از تفاوتهای اصلی بین GPT-2 XL و Llama میپردازد:
1. Vocabulary Size:GPT-2 XL از واژگان بزرگتری با 50,257 توکن پشتیبانی میکند، در حالی که Llama 2 دارای 32,000 توکن است. البته، در مدل اخیر Llama 3، تعداد واژگان به 128K افزایش یافته است.
2. Positional Embeddings:GPT-2 XL از جایگذاری موقعیتی مطلق استفاده میکند، اما Llama از جایگذاریهای موقعیتی چرخشی (ROPE) بهره میبرد.
3. Attention Heads:Llama نسبت به GPT-2 XL سرهای توجه بیشتری دارد، که به معنای توزیع بهتر توجه بر روی دادههای ورودی و درک بهتر زمینه است.
4. Activation Function:GPT-2 XL از تابع فعالسازی GELU استفاده میکند، در حالی که Llama از تابع SiLU (Swish) بهره میبرد، که سادهتر و کارآمدتر است.
5. Normalization:در Llama، نرمالسازی لایه استاندارد با نرمالسازی لایه RMS جایگزین شده است که میتواند به آموزش سریعتر و همگرایی پایدارتر منجر شود.
گيت هاب
👍8
سلام بزرگترین نقدی که به این رویداد پاندورا هست، به عقیده من افراد مسئول این رویداد رو ندیدم؛ که حتی به پیشواز بیاد. و خیرمقدم بگه غریبه اومدیم، نشستیم و نفهمیدیم میزبان کی هست و چند نفر ی سری پوشه تبلیغاتی رو دادن فارغ از برنامه خودشون که درون پوشه ها باشه، گویا این رویداد تبلیغ دیگران بود و تبلیغی از افراد حاضر نبود که چه سخنرانی خواهند داشت. و چه ایده ای رو برای ارائه اوردند.بعضی از ارائه ها پروژه های جذابی بودند ولی سرمایه گذار خودش اومده استارت اپ حوزه فعالیتی خودشو معرفی میکنه یک نفری نیومد بگه من سرمایه گذارم اگه حیطه کاری با این موضوعات دارین و قانع شدم میتونیم صحبت کنیم. روی کارتهای مهمان هیچ مشخصاتی از فردمهمان یا بسیار مهمتر از اون هیچ مشخصاتی از سرمایهگذاری ها نبود. و اصلا معلوم نبود قراره با کی صحبت کنیم و صرفا اینکه خودمون با بقیه دوستان خودمون صحبت کنیم. وقتی هیچ مشخصاتی از اینکه استارت اپ دارن یا خیر یا اینکه ایده و.... کلی ایراد دیگه
👍28👎5❤2
آیا مدل های زبان بزرگ می توانند تشخیص های بالینی و تصمیم گیری را تغییر دهند؟
▪️ A Preliminary Study of o1 in Medicine: Are We Closer to an AI Doctor?
#علوم_پزشکی #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ A Preliminary Study of o1 in Medicine: Are We Closer to an AI Doctor?
#علوم_پزشکی #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍6❤1😁1👌1
اگه میخواید از chatgpt و Claude برای ساختار دیاگرام یا نمودارهای ساده استفاده کنید میتونید ازش بخواید که فرمت خروجی رو بصورت mermaid بده
خوبی این فرمت اینه که تو markdown هم میتونید بذاریدش
mermaid.js.org
#نکته
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
خوبی این فرمت اینه که تو markdown هم میتونید بذاریدش
mermaid.js.org
#نکته
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍8👌2