YouTube
مدل های زبانی بزرگ (LLM) چگونه کار میکنند؟ به زبان خیلی ساده
0:00 مقدمه
2:12 یک مدل زبانی شامل چیست؟
5:41 ترین مدل های زبانی
11:44 در شبکه های عصبی چه اتفاقی میوفتد؟
14:53 مدل از جهان اطراف یاد میگیرد
19:45 مدل رویاپردازی میکند
24:34 نحوه خلق assistant های هوش مصنوعی
این ویدیو حاصل سرچ از منابع مختلف و ساده سازی…
2:12 یک مدل زبانی شامل چیست؟
5:41 ترین مدل های زبانی
11:44 در شبکه های عصبی چه اتفاقی میوفتد؟
14:53 مدل از جهان اطراف یاد میگیرد
19:45 مدل رویاپردازی میکند
24:34 نحوه خلق assistant های هوش مصنوعی
این ویدیو حاصل سرچ از منابع مختلف و ساده سازی…
این یکی رو خیلی برای دلم خودم درست کردم:))
احتمالا یه عالمه منبع خفن باشن که بتونین باهاش بفهمین مدل های زبانی چجوری کار میکنن
ولی قول میدم این یکی از همه بیشتر فان باشه:))
تلاش کردم به ساده ترین زبان ممکن توضیحشون بدم و تصور غلط رایجی که میگه GPT همون اینترنت هست رو موشکافی کنم
میدونم طولانیه و خوشحال میشم کامل ببینید و نظر بدید
دقیقه ۲۳ رو هم قطعا از دست ندید:)))
@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
70❤22👍10
تو چند وقت اخیر یک مدل مرموز به اسم Red Panda توی رده بندی ها سرو کله اش پیدا شد 🤓
همه گمانه زنی میکردن که مدل مخفی شرکت های بزرگ هست و دارن تست میکنن🤔
ولی همین هفته پیش استارتاپ کوچیک Recraft اعلام کرد که این مدل متعلق به اوناست!
این مدل جدید توی رده بندی ها برای بعضی از شاخص ها از میدجرنی و فلاکس هم عبور کرده!
به شدت مناسب طراحی لوگو، ساخت illustration های طراح های گرافیک و کلا ساخت عکس هایی هست که برای برندینگ و بازاریابی مناسبن!
مهمترین نکته اینکه این مدل قابلیت خروجی noscript هم داره
توی نوشتن متن داخل عکس هم بسیااااار حرفه ایه!
برای استفاده حرفه ای تر بهتره از سایتشون استفاده کنید اما اپشون هم روزانه ۵۰ کردیت رایگان برای ساخت عکس میده و هر بار تولید عکس تقریبا ۲تا کردیت استفاده میکنه
@aipulse24
همه گمانه زنی میکردن که مدل مخفی شرکت های بزرگ هست و دارن تست میکنن
ولی همین هفته پیش استارتاپ کوچیک Recraft اعلام کرد که این مدل متعلق به اوناست!
این مدل جدید توی رده بندی ها برای بعضی از شاخص ها از میدجرنی و فلاکس هم عبور کرده!
به شدت مناسب طراحی لوگو، ساخت illustration های طراح های گرافیک و کلا ساخت عکس هایی هست که برای برندینگ و بازاریابی مناسبن!
مهمترین نکته اینکه این مدل قابلیت خروجی noscript هم داره
توی نوشتن متن داخل عکس هم بسیااااار حرفه ایه!
برای استفاده حرفه ای تر بهتره از سایتشون استفاده کنید اما اپشون هم روزانه ۵۰ کردیت رایگان برای ساخت عکس میده و هر بار تولید عکس تقریبا ۲تا کردیت استفاده میکنه
@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
Audio
پادکست این هفته یکم متفاوت هست
مقاله نیست یه پست ردیت هست که یه نفر امده یه تصویر خیلیییی باحال (نمیگم درست) از اینکه به نظرش چطوری میتونیم به AGI برسیم ترسیم کرده
توی این تصویر اومده از نوروساینس، هوش مصنوعی و حتی روانشناسی استفاده کرده
مقاله هارو تیکه تیکه بهم چسبونده تا یه روش برای رسیدن به AGI ارائه بده
به نظرم گوش دادنش خالی از لطف نیست
@aipulse
مقاله نیست یه پست ردیت هست که یه نفر امده یه تصویر خیلیییی باحال (نمیگم درست) از اینکه به نظرش چطوری میتونیم به AGI برسیم ترسیم کرده
توی این تصویر اومده از نوروساینس، هوش مصنوعی و حتی روانشناسی استفاده کرده
مقاله هارو تیکه تیکه بهم چسبونده تا یه روش برای رسیدن به AGI ارائه بده
به نظرم گوش دادنش خالی از لطف نیست
@aipulse
👍8❤1
هاگینگ فیس یه سری ابزار جدید به اسم smol-tools معرفی کرده که از مدل زبانی SmolLM2 استفاده میکنن. این مدل با اینکه فقط ۱.۷ میلیارد پارامتر داره (که یه مدل نسبتا کوچیک محسوب میشه!)، ولی میتونه کارهای خیلی جالبی انجام بده.
این مجموعه دوتا ابزار اصلی داره: یکیش یه خلاصهساز متنه که میتونه تا ۲۰ صفحه رو برات خلاصه کنه و حتی میتونی ازش سوال هم بپرسی. اون یکی هم یه ابزار بازنویسی متنه که میتونه نوشتههات رو بهتر و خوشخوانتر کنه.
و اما بهترین قسمت ماجرا: برخلاف خیلی از مدلهای دیگه، میتونی همه اینا رو روی لپتاپ یا کامپیوتر خودت اجرا کنی! نیازی به سختافزار عجیب و غریب یا کارت گرافیک آنچنانی هم نداری. کیفیت خروجیهاش هم واقعاً قابل قبوله - یه نمونه عالی از اینکه چطور میشه مدلهای کوچیک ولی کاربردی ساخت!
از اینجا میتونید بهش دسترسی داشته باشید.
@aipulse24
این مجموعه دوتا ابزار اصلی داره: یکیش یه خلاصهساز متنه که میتونه تا ۲۰ صفحه رو برات خلاصه کنه و حتی میتونی ازش سوال هم بپرسی. اون یکی هم یه ابزار بازنویسی متنه که میتونه نوشتههات رو بهتر و خوشخوانتر کنه.
و اما بهترین قسمت ماجرا: برخلاف خیلی از مدلهای دیگه، میتونی همه اینا رو روی لپتاپ یا کامپیوتر خودت اجرا کنی! نیازی به سختافزار عجیب و غریب یا کارت گرافیک آنچنانی هم نداری. کیفیت خروجیهاش هم واقعاً قابل قبوله - یه نمونه عالی از اینکه چطور میشه مدلهای کوچیک ولی کاربردی ساخت!
از اینجا میتونید بهش دسترسی داشته باشید.
@aipulse24
❤🔥13👍4
گوگل یک ابزار هوش مصنوعی جدید به نام Learn About معرفی کرده که با چتباتهای معمول مثل جمینای و چتجیپیتی کاملاً متفاوته. این ابزار که روی مدل LearnLM ساخته شده، بر اساس تحقیقات آموزشی طراحی شده و با نحوه یادگیری انسان تطابق داره. محتواش پر از عناصر بصری و تعاملی با فرمت آموزشیه.
تو یه مقایسه بین Learn About و جمینای با سوال "کیهان چقدر بزرگه؟"، هر دو سیستم جواب دادن که کیهان قابل مشاهده حدود ۹۳ میلیارد سال نوری قطر داره. ولی Learn About با کادرهای آموزشی، توضیحات تکمیلی و واژهنامه، جواب رو به شکل آموزشیتری ارائه داده، در حالی که جمینای فقط یک نمودار از ویکیپدیا و دو پاراگراف متن با لینک منابع ارائه کرده.
این ابزار جدید حتی در مواجهه با سوالهای چالشبرانگیز هم دقت و ارزش آموزشی بالاتری نشون داده و مثلاً وقتی درباره چسب زدن روی پیتزا سوال شده (که قبلاً برای هوش مصنوعی گوگل مشکلساز شده بود)، این بار جواب درستی ارائه کرده. تمرکز این ابزار روی آموزش، اون رو به گزینهای متمایز در مقایسه با چتباتهای موجود تبدیل کرده.
میتونید از اینجا بهش دسترسی داشته باشید، البته هنوز برای خیلی از کشورها در دسترس نیست.
@aipulse24
تو یه مقایسه بین Learn About و جمینای با سوال "کیهان چقدر بزرگه؟"، هر دو سیستم جواب دادن که کیهان قابل مشاهده حدود ۹۳ میلیارد سال نوری قطر داره. ولی Learn About با کادرهای آموزشی، توضیحات تکمیلی و واژهنامه، جواب رو به شکل آموزشیتری ارائه داده، در حالی که جمینای فقط یک نمودار از ویکیپدیا و دو پاراگراف متن با لینک منابع ارائه کرده.
این ابزار جدید حتی در مواجهه با سوالهای چالشبرانگیز هم دقت و ارزش آموزشی بالاتری نشون داده و مثلاً وقتی درباره چسب زدن روی پیتزا سوال شده (که قبلاً برای هوش مصنوعی گوگل مشکلساز شده بود)، این بار جواب درستی ارائه کرده. تمرکز این ابزار روی آموزش، اون رو به گزینهای متمایز در مقایسه با چتباتهای موجود تبدیل کرده.
میتونید از اینجا بهش دسترسی داشته باشید، البته هنوز برای خیلی از کشورها در دسترس نیست.
@aipulse24
❤🔥22👍5❤1😁1
AI Pulse
Photo
کدوم یکی از این عکسها تولید هوش مصنوعیه؟
Anonymous Quiz
47%
عکس بالا
18%
عکس پایین
23%
هردو
13%
هیچ کدام
😁22🤬7
شرکت چینی DeepSeek از مدل اوپن سورس جدیدش DeepSeek-R1 رونمایی کرده که با مدل o1 از OpenAI رقابت تنگاتنگی داره. نسخه پیشنمایش این مدل که اسمش DeepSeek-R1-Lite-Preview هست، تو آزمونهای معتبر مثل AIME و MATH عملکرد خیلی خوبی داشته و حتی از o1 هم بهتر عمل کرده.
این مدل جدید مثل o1 از روش «زنجیره فکری» استفاده میکنه که باعث میشه مسائل پیچیده رو قدم به قدم حل کنه. این روش کمک میکنه که مدل بتونه درستی محاسباتش رو چک کنه و از اشتباهات رایج دوری کنه. کاربرها میتونن مراحل فکر کردن مدل رو ببینن، ولی خب این دقت باعث میشه که جواب دادن به سوالهای پیچیده کمی زمانبر بشه.
با اینکه DeepSeek-R1 خیلی خوب کار میکنه و از سیستمهای پیشرفتهای مثل GPT-4 و Claude هم توی بنچمارکها بهتر عمل کرده، ولی هنوز یه سری مشکلات داره. ضمنا از اونجایی که یه محصول چینیه، به موضوعات سیاسی حساس مربوط به چین هم جواب نمیده.
قراره DeepSeek-R1 به صورت اوپنسورس منتشر بشه و API هم در دسترس کاربران قرار بگیره. فعلاً میشه از طریق وبسایت DeepSeek Chat از اینجا باهاش کار کرد، و کاربرهای رایگان روزی ۵۰ تا پیام میتونن بفرستن.
@aipulse24
این مدل جدید مثل o1 از روش «زنجیره فکری» استفاده میکنه که باعث میشه مسائل پیچیده رو قدم به قدم حل کنه. این روش کمک میکنه که مدل بتونه درستی محاسباتش رو چک کنه و از اشتباهات رایج دوری کنه. کاربرها میتونن مراحل فکر کردن مدل رو ببینن، ولی خب این دقت باعث میشه که جواب دادن به سوالهای پیچیده کمی زمانبر بشه.
با اینکه DeepSeek-R1 خیلی خوب کار میکنه و از سیستمهای پیشرفتهای مثل GPT-4 و Claude هم توی بنچمارکها بهتر عمل کرده، ولی هنوز یه سری مشکلات داره. ضمنا از اونجایی که یه محصول چینیه، به موضوعات سیاسی حساس مربوط به چین هم جواب نمیده.
قراره DeepSeek-R1 به صورت اوپنسورس منتشر بشه و API هم در دسترس کاربران قرار بگیره. فعلاً میشه از طریق وبسایت DeepSeek Chat از اینجا باهاش کار کرد، و کاربرهای رایگان روزی ۵۰ تا پیام میتونن بفرستن.
@aipulse24
👍22❤4