Forwarded from Recommender system (MehriMah Amiri)
نویسنده این پست، ( Raschka) است.
یک سوال رایج ازنظرنويسنده این است که GPT چگونه با Llama مقایسه میشود. به نظر من، یکی از بهترین راهها برای درک تفاوتها، پیادهسازی هر دو مدل از ابتدا است.
خلاصهای از تفاوتهای اصلی بین GPT-2 XL و Llama میپردازد:
1. Vocabulary Size:GPT-2 XL از واژگان بزرگتری با 50,257 توکن پشتیبانی میکند، در حالی که Llama 2 دارای 32,000 توکن است. البته، در مدل اخیر Llama 3، تعداد واژگان به 128K افزایش یافته است.
2. Positional Embeddings:GPT-2 XL از جایگذاری موقعیتی مطلق استفاده میکند، اما Llama از جایگذاریهای موقعیتی چرخشی (ROPE) بهره میبرد.
3. Attention Heads:Llama نسبت به GPT-2 XL سرهای توجه بیشتری دارد، که به معنای توزیع بهتر توجه بر روی دادههای ورودی و درک بهتر زمینه است.
4. Activation Function:GPT-2 XL از تابع فعالسازی GELU استفاده میکند، در حالی که Llama از تابع SiLU (Swish) بهره میبرد، که سادهتر و کارآمدتر است.
5. Normalization:در Llama، نرمالسازی لایه استاندارد با نرمالسازی لایه RMS جایگزین شده است که میتواند به آموزش سریعتر و همگرایی پایدارتر منجر شود.
گيت هاب
یک سوال رایج ازنظرنويسنده این است که GPT چگونه با Llama مقایسه میشود. به نظر من، یکی از بهترین راهها برای درک تفاوتها، پیادهسازی هر دو مدل از ابتدا است.
خلاصهای از تفاوتهای اصلی بین GPT-2 XL و Llama میپردازد:
1. Vocabulary Size:GPT-2 XL از واژگان بزرگتری با 50,257 توکن پشتیبانی میکند، در حالی که Llama 2 دارای 32,000 توکن است. البته، در مدل اخیر Llama 3، تعداد واژگان به 128K افزایش یافته است.
2. Positional Embeddings:GPT-2 XL از جایگذاری موقعیتی مطلق استفاده میکند، اما Llama از جایگذاریهای موقعیتی چرخشی (ROPE) بهره میبرد.
3. Attention Heads:Llama نسبت به GPT-2 XL سرهای توجه بیشتری دارد، که به معنای توزیع بهتر توجه بر روی دادههای ورودی و درک بهتر زمینه است.
4. Activation Function:GPT-2 XL از تابع فعالسازی GELU استفاده میکند، در حالی که Llama از تابع SiLU (Swish) بهره میبرد، که سادهتر و کارآمدتر است.
5. Normalization:در Llama، نرمالسازی لایه استاندارد با نرمالسازی لایه RMS جایگزین شده است که میتواند به آموزش سریعتر و همگرایی پایدارتر منجر شود.
گيت هاب
👍8
سلام بزرگترین نقدی که به این رویداد پاندورا هست، به عقیده من افراد مسئول این رویداد رو ندیدم؛ که حتی به پیشواز بیاد. و خیرمقدم بگه غریبه اومدیم، نشستیم و نفهمیدیم میزبان کی هست و چند نفر ی سری پوشه تبلیغاتی رو دادن فارغ از برنامه خودشون که درون پوشه ها باشه، گویا این رویداد تبلیغ دیگران بود و تبلیغی از افراد حاضر نبود که چه سخنرانی خواهند داشت. و چه ایده ای رو برای ارائه اوردند.بعضی از ارائه ها پروژه های جذابی بودند ولی سرمایه گذار خودش اومده استارت اپ حوزه فعالیتی خودشو معرفی میکنه یک نفری نیومد بگه من سرمایه گذارم اگه حیطه کاری با این موضوعات دارین و قانع شدم میتونیم صحبت کنیم. روی کارتهای مهمان هیچ مشخصاتی از فردمهمان یا بسیار مهمتر از اون هیچ مشخصاتی از سرمایهگذاری ها نبود. و اصلا معلوم نبود قراره با کی صحبت کنیم و صرفا اینکه خودمون با بقیه دوستان خودمون صحبت کنیم. وقتی هیچ مشخصاتی از اینکه استارت اپ دارن یا خیر یا اینکه ایده و.... کلی ایراد دیگه
👍28👎5❤2
آیا مدل های زبان بزرگ می توانند تشخیص های بالینی و تصمیم گیری را تغییر دهند؟
▪️ A Preliminary Study of o1 in Medicine: Are We Closer to an AI Doctor?
#علوم_پزشکی #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ A Preliminary Study of o1 in Medicine: Are We Closer to an AI Doctor?
#علوم_پزشکی #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍6❤1😁1👌1
اگه میخواید از chatgpt و Claude برای ساختار دیاگرام یا نمودارهای ساده استفاده کنید میتونید ازش بخواید که فرمت خروجی رو بصورت mermaid بده
خوبی این فرمت اینه که تو markdown هم میتونید بذاریدش
mermaid.js.org
#نکته
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
خوبی این فرمت اینه که تو markdown هم میتونید بذاریدش
mermaid.js.org
#نکته
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍8👌2
مدل جدید llama 3.2 معرفی شد
https://ai.meta.com/blog/llama-3-2-connect-2024-vision-edge-mobile-devices/
https://www.llama.com/
https://ai.meta.com/blog/llama-3-2-connect-2024-vision-edge-mobile-devices/
https://www.llama.com/
Meta AI
Llama 3.2: Revolutionizing edge AI and vision with open, customizable models
Today, we’re releasing Llama 3.2, which includes small and medium-sized vision LLMs, and lightweight, text-only models that fit onto edge and mobile devices.
👍8❤1👌1
آیا مدلهای زبانی بزرگ (LLM) میتوانند درک ما از توالیهای ژنومی را تغییر دهند؟
▪️ Genomic Language Models: Opportunities and Challenges
#علوم_پزشکی #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ Genomic Language Models: Opportunities and Challenges
#علوم_پزشکی #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
❤5👌2👍1👎1
Don't Sleep on Single-agent Systems
https://www.all-hands.dev/blog/dont-sleep-on-single-agent-systems
#ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
https://www.all-hands.dev/blog/dont-sleep-on-single-agent-systems
#ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍3
Applied Machine Learning in Python: a Hands-on Guide with Code
https://geostatsguy.github.io/MachineLearningDemos_Book/intro.html
#کتاب #منابع
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
https://geostatsguy.github.io/MachineLearningDemos_Book/intro.html
#کتاب #منابع
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
❤5👍1
To Baroon Ke Rafty
Siavash Ghomayshi
هوای بارونی و لذت بخش رو برید بیرون صدای بارون رو بشنوین
#متفرقه
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
#متفرقه
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍3❤2
معرفی #کتاب های #یادگیری_عمیق و #یادگیری_ماشین :
✅ Data Mining and Machine Learning (Zaki)
👉link
✅ Deep Learning
Foundations and Concepts, 2023, (Bishop)
👉link
✅ Pattern Recognition and Machine Learning (Bishop)
👉link
✅ Deep Learning (Goodfellow )
👉 link
✅ Probabilistic Machine Learning_ An Introduction, 2022 , (Murphy)
👉link
✅ Probabilistic Machine Learning: Advanced Topics, 2023 , (Murphy)
👉link
✅ Dive into Deep Learning ,2023
👉link
✅ Linear Algebra and Optimization for Machine Learning
👉link
✅ Deep Learning with Python: Chollet, Francois
👉 link
✅ Deep Learning with PyTorch Step-by-Step
👉 link
✅ Mathematics for Machine Learning
👉 link
✅ Hands-On Data Preprocessing in Python
👉 link
✅ Mastering Machine Learning Algorithms
👉 link
✅ Generative Deep Learning (David Foster)
👉 link
اگر کتاب های مهم دیگه ای هم میشناسید لطفا زیر همین پست کامنت کنید.
#هوش_مصنوعی #آموزش #شبکه_عصبی #مدل_های_دیپ_لرنینگ
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
✅ Data Mining and Machine Learning (Zaki)
👉link
✅ Deep Learning
Foundations and Concepts, 2023, (Bishop)
👉link
✅ Pattern Recognition and Machine Learning (Bishop)
👉link
✅ Deep Learning (Goodfellow )
👉 link
✅ Probabilistic Machine Learning_ An Introduction, 2022 , (Murphy)
👉link
✅ Probabilistic Machine Learning: Advanced Topics, 2023 , (Murphy)
👉link
✅ Dive into Deep Learning ,2023
👉link
✅ Linear Algebra and Optimization for Machine Learning
👉link
✅ Deep Learning with Python: Chollet, Francois
👉 link
✅ Deep Learning with PyTorch Step-by-Step
👉 link
✅ Mathematics for Machine Learning
👉 link
✅ Hands-On Data Preprocessing in Python
👉 link
✅ Mastering Machine Learning Algorithms
👉 link
✅ Generative Deep Learning (David Foster)
👉 link
اگر کتاب های مهم دیگه ای هم میشناسید لطفا زیر همین پست کامنت کنید.
#هوش_مصنوعی #آموزش #شبکه_عصبی #مدل_های_دیپ_لرنینگ
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍9❤3🔥2👌1
امروز بچه های کویرا دانشگاه شریف ما ی نقد کردیم شما رو دیگه تحویل نمیگیرین مارو؟! چرا اخه انتقادات رو بپذیرید فحش ندید و دشمنی نکنین خدا دشمنان رو دوست نداره😂🥺🥺🚶♂️
انتقادی که بهشون داشتیم:👇
https://news.1rj.ru/str/AI_DeepMind/1590
انتقادی که بهشون داشتیم:👇
https://news.1rj.ru/str/AI_DeepMind/1590
❤6👎6😁3👌1
لینک ۵ تا کانال یوتیوب که حول محور LLM ها و مقاله ها و مسائل مربوط به اونا محتوا تولید می کنن علاقمند بودین ببینید.
https://www.kdnuggets.com/5-youtube-channels-to-master-llms
#هوش_مصنوعی #آموزش #شبکه_عصبی #مدل_های_دیپ_لرنینگ #منابع
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
https://www.kdnuggets.com/5-youtube-channels-to-master-llms
#هوش_مصنوعی #آموزش #شبکه_عصبی #مدل_های_دیپ_لرنینگ #منابع
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
KDnuggets
5 YouTube Channels to Master LLMs - KDnuggets
Use these videos to learn Large Language Models from industry experts
👍9
مدل llama 2 روی 546 زبان آموزش دادن خیلی نتایج حیرت انگیزی رو بدست اوردند روی multilingual و cross lingual transfer اموزش دیده شده است.
◾️ EMMA-500: Enhancing Massively Multilingual Adaptation of Large Language Models
#ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
◾️ EMMA-500: Enhancing Massively Multilingual Adaptation of Large Language Models
#ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍11🔥3👌2
چرا در ترنسفورمرها به اپتیمایزر adam نیاز داریم
▪️ Why Transformers Need Adam: A Hessian Perspective
▪️ GitHub
#ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ Why Transformers Need Adam: A Hessian Perspective
▪️ GitHub
#ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍10👌1
#ابزار_ریاضی برای محاسبه #مشتقات_ماتریسی
بعضا پیش میاد توی ریسرچتون نیاز دارید از یک عبارت ریاضی که شامل متغیرهای ماتریسی، برداری و اسکالر هست نسبت به این متغیرها مشتق بگیرید، با توجه به اینکه گرفتن اینگونه مشتقات قوانین پیچیده ای داره، سایت زیر این مشتقات را براتون محاسبه میکنه:
👉 matrixcalculus.org
این ابزار جدای از اینکه مشتق یک عبارت ریاضی را حساب میکنه، کد پایتون و لتکس مربوطه را هم براتون تولید میکنه.
#Matrix_Calculus
#هوش_مصنوعی #آموزش #مدل_های_دیپ_لرنینگ
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
بعضا پیش میاد توی ریسرچتون نیاز دارید از یک عبارت ریاضی که شامل متغیرهای ماتریسی، برداری و اسکالر هست نسبت به این متغیرها مشتق بگیرید، با توجه به اینکه گرفتن اینگونه مشتقات قوانین پیچیده ای داره، سایت زیر این مشتقات را براتون محاسبه میکنه:
👉 matrixcalculus.org
این ابزار جدای از اینکه مشتق یک عبارت ریاضی را حساب میکنه، کد پایتون و لتکس مربوطه را هم براتون تولید میکنه.
#Matrix_Calculus
#هوش_مصنوعی #آموزش #مدل_های_دیپ_لرنینگ
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
1👍18
زومیت:
رونمایی از موتور هوش مصنوعی ایرانی اختراعات؛ RIT در آستانه ورود به بازار قرار دارد
🔴 نشست خبری رونمایی از موتور هوش مصنوعی اختراعات RIT امروز (هشتم مهر ماه) با حضور مدیرعامل مجموعه Research Innovation Teams (RIT) برگزار شد.
🔴 موتور هوش مصنوعی اختراعات RIT اکنون به۵۰ زبان زنده دنیا خدمات ارائه میدهد و صادرات این موتور هوش مصنوعی ایرانی به سایر کشورها را هدف خود قرار داده است
چه بودجه ای ک قراره برا این خورده شه 😂😂
رونمایی از موتور هوش مصنوعی ایرانی اختراعات؛ RIT در آستانه ورود به بازار قرار دارد
🔴 نشست خبری رونمایی از موتور هوش مصنوعی اختراعات RIT امروز (هشتم مهر ماه) با حضور مدیرعامل مجموعه Research Innovation Teams (RIT) برگزار شد.
🔴 موتور هوش مصنوعی اختراعات RIT اکنون به۵۰ زبان زنده دنیا خدمات ارائه میدهد و صادرات این موتور هوش مصنوعی ایرانی به سایر کشورها را هدف خود قرار داده است
چه بودجه ای ک قراره برا این خورده شه 😂😂
😁50👎5🔥4❤2👍2🆒1