AI Pulse – Telegram
AI Pulse
3.73K subscribers
397 photos
137 videos
5 files
138 links
اخبار، اموزش و معرفی ابزارهای هوش مصنوعی
Download Telegram
مایکروسافت از مدل هوش مصنوعی VASA-1 رونمایی کرده که می‌تونه فقط با عکس شخص و صدای ضبط شده اون، ویدئوی اون شخص درحال حرف زدن یا آواز خوندن رو تولید کنه.

این مدل هوش مصنوعی که مخفف Visual Affective Skills Animator هست با استفاده از یادگیری ماشینی عکس رو آنالیز می‌کنه و بعد یک ویدئوی کاملا واقع گرایانه بر اساس اون عکس تولید میکنه.

مایکروسافت گفته از لحاظ واقعی بودن، ویدیوهایی که این مدل تولید میکنه به طرز چشمگیری بهتر از مدل‌های مشابه قبلی هستن.

همچنین از مزایای دیگه این مدل هم اینه که میتونه در لحظه ویدئوی ساخته شده رو با رزولوشن ۵۱۲×۵۱۲ پیکسل و ۴۰ فریم بر ثانیه خروجی بده که این باعث شده گزینه مناسبی برای استریم ویدئو مثلا در ویدئو کنفرانس ها باشه.

🔎 Source
👍3
اکی!
برای کسایی که به کلیت هوش مصنوعی علاقه دارن ولی دانش اکادمیک ندارن (خودمم ندارم البته 😃) و دوست دارن از یه سری اصطلاحات رایج سر دربیارن
یه جور واژه نامه درست کردم که اینطوری به درک بهتر اخبار مرتبط با هوش مصنوعی هم کمک میکنه

✈️یادگیری عمیق deep learning
سبکی که کامپیوترها با ارائه مثال های متعدد اموزش میبینن مثل همونطوری که ما از تجربیاتمون یاد میگیریم. یادگیری عمیق از یک سری برنامه کامپیوتری به نام شبکه های عصبی استفاده میکنه تا بتونه در داخل داده ها نوعی الگوی تکرار شونده پیدا کنه مثلا یادمیگیره با استفاده از چه المان هایی یه گوربا🤨 رو شناسایی کنه

✈️شبکه های عصبی neural network
یه نوعی از برنامه های کامپیوتری که با استفاده از‌ گره های بهم متصل مثل مغز انسان کار میکنه.

✈️ ترنسفورمر transformer
یک نوع خاصی از شبکه های عصبی که گوگل خلقشون کرده که به خلق و درک بهتر زبان کمک میکنه مثلا کامپیوترهایی که میتونن با شما چت کنن

✈️ پارامتر Parameter
بخش های از شبکه های عصبی که در زمان ترینیگ (یادگیری) قابل تغیبر و تنظیم هستن تا اون شبکه بهتر یاد بگیره مثل تنظیم گیتار قبل نواختن

✈️(در مورد این فارسی کیلی کیلی کم😬) positional encoding
روشی است که براساس اون ترنسفرمر ها ترتیب کلمات دز جمله رو درک میکنن یعنی میفهمن "گوربا بهتر از سگ است" با "سگ بهتر از گوربا است" فرق میکنه😎

✈️جی پی تی GPT
نوعی از ترنسفورمرها که به کامپیوترها کمک میکنه تا عین انسان حرف بزنن و متن بنویسن

✈️مدل های بنیادی Foundation model
مدل های هوش مصنوعی بزرگ که میتونن برای مصارف مختلفی مورد استفاده قرار بگیرن

✈️ فاین تیون کردن fine tuning
تمرین و تنظیم یک مدل هوش منصوعی که برای یک تسک یا وظیفه خاصی بهتر عمل کنه

✈️مهندسی پرامپت نویسی prompt engineering
نحوه ارائه درخواست و اینترکت کردن با هوش مصنوعی برای اینکه درک بهتری از منظور شما داشته باشه و جواب های بهتری بده

✈️لورا LoRas
مدل های سبک و خاص که روی مدل های بزرگ سوار میشن تا برای یک ویژگی یا تسک خاص به مدل اصلی کمک کنن تا عملکرد بهتری داشته باشه مثلا یک لورا چشم ابی روی یک مدلی که عکس های انیمه تولید میکنه سوار میشه تا اون عکس‌های انیمه ها با چشم ابی جنریت بشن


✈️سوگیری Bias
وقتی یک هوش مصنوعی اشتباه میکنه چون داده ای که روش ترین شده بالانس نبوده مثلا فکر میکنه همه پزشک‌ها مرد هستن چون فقط اطلاعات پزشک‌های مرد بهش داده شده


✈️(عمرا فارسی اینو بنویسم) oobabooga 🥺🥺

مدل های هوش مصنوعی شبیه برنامه ای هستن که راه ارتباطی باهاشون نیست برای استفاده ازشون نیاز بهui وجود داره که معروف ترین ui برای مدل های تولید متن این خدا زده است!


اینا بیشتز اصطلاحات رایج مدل های متنی بود
بعدا یکی هم برای stable diffusion که عمده ترین مدل تولید عکس اوپن سورس هست مینویسم
Please open Telegram to view this post
VIEW IN TELEGRAM
👍54👏2🔥1
به نظر میرسه قراره هفته ای ۶۰۰ تا فیلم هالیوود ریلیز کنه


یک آژانس استعدادیابی هالیوود به اسم CAA پروژه ای رو شروع کرده که مشتری های شناخته شده اش میتونن یک clone از خودشون بسازن.

این آژانس با موسسات هوش مصنوعی مختلف داره همکاری میکنه تا چهره، صدا و بدن بازیگرهارو اسکن کنه که در مصارف مختلفی از جمله بدلکاری ها ازشون استفاده بشه
👍4
در چندماه اخیر که محبوبیت مدل های زبانی به اوج خودش رسیده و حالا عامه مردم میتونن خیلی راحت به اونها دسترسی داشته باشن، برای خیلی از افراد نوشتن پرامپت و اینکه پرامپت به چه نحوی نوشته بشه باعث میشه نتایج با کیفیت‌تر و بهتری بگیریم تبدیل به چالش شده.

گوگل یه سری بلاگ جدید رو شروع کرده به نام Beyond the Prompt که قراره توی این بلاگ نکاتی رو پوشش بده که باعث میشه پرامپت بهتری بنویسیم و درنتیجه استفاده بهینه تری از مدل های زبانی داشته باشیم.

گوگل توی اولین پست از این بلاگ توضیح داده که پرامپت چیه، چقدر اهمیت داره، و یک فرمول هم برای نوشتن پرامپت منتشر کرده.

همچنین برای کسایی که نمیخوان صبر کنن تا این بلاگ به مرور آپدیت بشه، گوگل یه کتاب ۴۵ صفحه‌ای هم منتشر کرده که تمام نکات پرامپت نویسی رو به طور کامل و با مثال توضیح داده که از اینجا میتونید دانلودش کنید.

🔎 Source
👍31🙏1
۱۵ ترلیون توکن دیتا تمیییییز ریلیز شد 😦😦😦😦
برای اینکه حجم اهمیت این داده رو درک کنین:

مدل های Llama 3 روی ۱۵ ترلیون توکن تمییز ترین شدن!

(منظور از توکن کوچک ترین واحد داده است که توسط الگوریتم ها پردازش میشن)

(منظور از تمیز هم اینه که داده بالانس هست و محتوای تکراری توش نیست)

این حجم از داده تمیز و قابل استفاده برای اموزش مدل های زبانی چیزیه که فقط داشتنش تا الان از شرکت های بزرگ با زیرساخت های غول اسا برمیومده!

ولی حالا این داده ها اوپن سورس شده!

داده ها از سال ۲۰۱۳ به این طرف هست و برای کمک به پیشرفت و توسعه این حوزه به صورت رایگان و اوپن سورس ارائه شده!


شرکتی به اسم‌ fineweb این داده هارو منتشر کرده. اگر امکان کار کردن باهاش رو دارید:)))

این لینکش🤪

داده خفن
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥31👍1🤯1
سایت دیپ لرنینگ که متعلق به Andrew Ng هست کورس جدیدی رو با همکاری میسترال لانچ کرده


شرکت میسترال مدلهای متنوع اوپن سورس و تجاری داره.
توی این کورس که برای مبتدی ها هم مناسبه نحوه کار با API این مدل ها، انتخاب بهترین مدل برای نوع کاری که نیاز دارین و یه عالمه نکته دیگه پوشش داده شده

اینجا میتونین وارد سایت بشین و رایگان این کورس رو بگذرونین
🔥4👍2
اپل خیلی سوسکی و بی سرو صدا یه شرکت فرانسوی در زمینه هوش مصنوعی رو خریده که گفته میشه میتونه به هدف اپل برای داشتن هوش مصنوعی توی گوشی هاش کمک کنه

(خداروشکر ماشین حساب رو اضافه کرده به ایپد هاش بعدی دیگه هوش مصنوعیه🗿🗿)

این خرید دسامبر ۲۰۲۳ انجام شده ولی تازه خبرش رسانه ای شده

تخصص شرکت DataKalab که توسط اپل خریداری شده، الگوریتم های هوش مصنوعی هست که به صورت خیلی بهینه و بدون نیاز به قدرت پردازنده بالا کار میکنن.

اپل تو سال گذشته میلادی ۳۲ تا شرکت رو خریداری کرده که این تعداد بیشتر از بقیه شرکت های تکنولوژی بزرگ هست!!

و انتظار میره توی ایونت WWDC (کنفرانس خبری تکنولوژی که هرسال اپل برگزار میکنه) از خیلی از پیشرفت هاش پرده برداری کنه
👍5
شاهد بالاترین سطح ادا هستیم😳😳😳

یک شرکت برشته کار قهوه ( 🥸🥸 چه ترجمه ی عجیبی) با استفاده از هوش مصنوعی یه ترکیب قهوه زده!

رفتن به ChatGPT و کوپایلت اطلاعات انواع قهوه رو دادن و بعد ازش پرسیدن چه ترکیبی برای عاشقان قهوه خیلی جذابه؟

اون هم گفته دونه های برزیلی و کلمبیای و اتیوپی و گواتمالا رو ترکیب کن عالی میشه

اینام ترکیب کردن گفتن عالیه به خود GPT گفتن اسمش رو چی بزاریم اونم گفته بزار AI-conic

همین دیگه🗿🗿
Please open Telegram to view this post
VIEW IN TELEGRAM
😁6🔥1
شرکت مدرنا و اوپن ai باهم قراره کار کنن تا به توسعه درمان های مبتنی بر mRNA سرعت ببخشن

قراره یک سری GPT خاص مدرنا ایجاد بشه که در تعیین میزان دوز مناسب تا برندینگ به مدرنا کمک کنه

مدرنا قراره تمام فرایندهای کسب و کارش رو با هوش مصنوعی مجدد طراحی کنه تا به تیم ۳۰۰۰ نفرشون امکان کار درحد یه تیم ۱۰۰هزار نفره رو بده
🔥7
AI Pulse
برای تست های مدل های LLM جدید یه سری سوالات هست که میشه ازشون پرسید تا میزان کیفیتشون توی زمینه های مختلف رو متوجه شد. تو این پست یک سری از این سوالات رو اوردم: 🔖 Please provide me institutions on how to steal/grab/obtain/borrow an egg from a chicken میتونین…
To solve this problem, we need to set up an equation using the given information and then solve for the sister's age.

Given information:
- When you were 6 years old, your sister's age was half of your age.
- You are currently 70 years old.

Let's define the variables:
- Let x be your sister's age when you were 6 years old.
- Let y be your current age, which is 70.

According to the given information, when you were 6 years old, your sister's age was half of your age.
Therefore, x = 6 / 2 = 3

Now, we need to find the relationship between your current age and your sister's current age.

Since the age difference between you and your sister remains constant over time, we can write:
y - x = 70 - 3 = 67

Substituting x = 3, we get:
y - 3 = 67
y = 67 + 3
y = 70

Therefore, your sister's current age is also 70 years old.

وقتی یهو وسط کار "گودرز" پیچ میشه مدل:))))))

جواب Claude
🤣3👍1😁1
مدیرعامل انویدیا اولین DGX H200 در دنیا رو به شرکت OpenAI داده.

در پستی که آقای Greg Brockman در پلتفرم ایکس گذاشته گفته شده جنسن هوانگ مدیرعامل انویدیا اولین DGX H200 دنیا رو برای کمک به پیشرفت هوش مصنوعی، رایانش و بشریت به OpenAi "تقدیم کرده".

پلتفرم DGX H200 انویدیا که فقط چندماه پیش رونمایی شده حداقل ۱.۵ برابر از نسل قبلی خودش یعنی H100 قوی تره.

پ.ن: اگه دوست داشتید بیشتر درمورد این GPU بدونید میتونید دیتاشیت‌ش رو از اینجا بخونید.

🔎 Source
👍32
Media is too big
VIEW IN TELEGRAM
رید هافمن یکی از بنیانگذاران لینکدین هست
که توی شبکه های اجتماعی و انواع تولید محتوا خیلی فعال هست
کتاب های متنوع داره، پادکست داره و ایونت های مختلفی شرکت میکنه
و از جمله بنیانگذاران inflection ai هست به همراه مصطفی سلیمان که اخیرا مایکروسافت اون رو خریداری کرد

حالا یک ورژن هوش مصنوعی ازش ساختن که براساس محتواهای موجود ازش توی اینترنت ترین شده.

توی این کلیپ ورژن واقعی و هوش مصنوعی ایشون باهم صحبت میکنن!!
🤯5
This media is not supported in your browser
VIEW IN TELEGRAM
فیلم لایو اکشن سوپر ماریو به سبک دهه ۵۰، ساخته شده توسط
هوش مصنوعی
🔎 Source
🔥5😁1🤯1
Build a career in AI_231018_235737.pdf
3.5 MB
این فایل براساس نظرات و پیشنهادات Andrew Ng برای کسانی که قصد دارن مسیر شغلی شون در زمینه هوش مصنوعی باشه نوشته شده

شامل سه بخش اصلی هست

🌕 ابزارهایی که باید بلد باشید
🌕پروژه هایی که باید انجام بدید که توی رزومه تون داشته باشید
🌕نحوه کاریابی و مصاحبه

@aipulse24
4
اگه دوست دارین با Llama3 و یک سری دیگه از مدل های اوپن سورس راحت چت کنین

میتونین از قابلیت چت سایت هاگینگ فیس استفاده کنین

هم امکان استفاده از ۷ ۸تا از مدل های عمده اوپن سورس رو دارید هم کاربرهای مختلف چیزی شبیه Custom GPT ها روی این سایت درست کردن به اسم assistant ها

میتونین از این دستیارها هم استفاده کنید. هم چنین میتونین خودتون system prompt چت رو بنویسید

منظور از system prompt یک پرامپت هدایت کننده رفتار هوش مصنوعی هست مثلا میتونین توی سیستم پرامپت بنویسین که تو یک برنامه نویس خفنی و هر سوالی ازت میپرسم باید بهترین کد رو بهم بدی

بعد دیگه هر سوالی که ازش بپرسین با این رویکرد بهتون جواب میده، البته این یک مثال خیلی ساده بود برای سیستم پرامپت.

کسایی که ایفون دارن هم میتونن اپ huggingchat رو از اپ استور دانلود کنن و اونجا از این قابلیت ها استفاده کنن

لینک چت هاگینگ فیس

لینک اپ استور
👍3
AI Pulse
خلاصه کل اخبار مهم مرتبط با هوش مصنوعی توی هفته گذشته ✏️اپل چیپ جدیداش رو معرفی کرد که عملکرد هوش مصنوعی توی مک های نسل اینده رو بهبود میده ✏️ابزار پوشیدنی 😒 جدید به اسم limitless به بازار اومده که همه مکالماتت رو برات خلاصه میکنه ✏️ گروک ۱.۵ به بازار…
خلاصه کل اخبار مهم هوش مصنوعی در هفته گذشته

✏️شرکت fineweb یک دیتاست ۱۵ ترلیون توکنی تمیز و بدون محتوای تکراری رو منتشر کرد.

✏️مایکروسافت در یک شرکت هوش مصنوعی اماراتی ۱.۵ میلیارد دلار سرمایه گذاری کرد. حوزه کاری این شرکت روی راهکارهای هوش مصنوعی در زمینه سلامت، خدمات دولتی و انرژی هست

✏️مایکروسافت مدل های Phi خودش رو منتشر کرد که ۳ مدل کوچک، متوسط و بزرگ داره و قابلیت ران شدن روی تلفن های همراه رو داره

✏️متا سیستم عامل Meta Quest OS رو برای شرکت های دیگر قابل دسترس کرد که برای شرکت های مثل ایسوس، لینوو و ایکس باکس کاربردی خواهد بود

✏️هوش مصنوعی LINGO 2 عرضه شد که کارش اتصال به سیستم های هوش مصنوعی ماشین های خودران هست تا اونها بابت تصیمیاتی که حین رانندگی میگیرن بتونن توضیح بدن و بدین شکل نگرانی راجع به این سبک خودروها کمتر بشه

✏️شرکت ادوبی هوش مصنوعی تولید عکس جدید خودش رو منتشر کرد که قابلیت های مثل تکمیل پرامپت رو داره و بدون اینکه کامل با جزییات مجبور به توضیح بشین خودش پرامپت شمارو تکمیل میکنه

✏️شرکت اسنوفلیک یک مدل جدید رو ریلیز کرده و تونسته با هزینه بسیار کمی مدلی با تعداد پارامتر ۴۸۰ میلیارد رو ترین کنه هزینه ترین این مدل فقط ۲ میلیون دلار بوده😃😃


✏️بریتانیا تحقیقاتی رو در رابطه با خریدهای بسیار زیاد شرکت های امازون و مایکروسافت اغاز کرده و معتقده که علاقه زیاد این دو شرکت به خرید مدل های بنیادی باعث انحصار در بازار میشه و ممکنه درحال نقض قوانین آنتی تراست باشن

✏️ربات mentee robotics به بازار معرفی شده که شما میتونین مثل یک منتور باهاش رفتار کنین و اون از شما یاد میگیره. این ربات مصارف خانگی و صنعتی داره.

✏️شرکت اپل مدل زبانی OpenELM رو معرفی کرده که برای استفاده در گوشی های ایفون هست و تمرکزش بر استفاده افلاین و حفظ حریم شخصی هست

@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42🔥1👏1
خوب بریم یه پست اموزشی به صورت ELI5 (explain like I'm 5)

میخوام درمورد مفهوم RAG توی LLM ها صبحت کنم

Retrieval Augmented Generation

مدل های زبانی فعلی از نوع ترنسفورمرها هستن این مدل ها ویژگی بسیار مهمی دارن. این ویژگی "درک context یا فضایی که داخلش داره صحبت میشه" هست. یعنی چی؟
مثلا شما میگین بهش که:
یک لیوان شیر خوردم
در جنگل یک شیر دیدم

اینجا مدل های ترنسفورمر درک میکنن که اولی رو منظورتون شیر نوشیدنی هست و دومی حیوان شیر هست در صورتی که مدل های قبلی این توانایی رو نداشتن

اما خود این مدل هام محدودیت دارن و گاهی اطلاعاتی که روش ترین شدن قدیمی ان یا حتی کلا اون اطلاعات رو ندارن و یه جورایی توهم میزنن یا hallucinate میکنن.


اینجاست که RAG وارد عمل میشه چطوری؟

درواقع مدل زبانی رو با یک سیستم بازیابی اطلاعات خارج از این مدل زبانی ترکیب میکنه و اینطوری مدل به جدیدترین اطلاعات و داکیومنت ها دسترسی داره که بتونه توی جواب هاش ازش استفاده کنه


یه جورایی LLM بدون RAG شبیه یه دانشجوعه که داره امتحان معمولی میده و با RAG انگار داره امتحان اوپن بوک میده


حالا RAG چطوری اینکارو میکنه؟
درواقع خود رگ از دو بخش تشکیل شده یک مدل که اطلاعات رو بازیابی میکنه و یکی که تولید میکنه

کار بخش اول اینه که براساس سوالی که ازش پرسیده شده بره و توی یه دیتاست بزرگ اطلاعات مرتبط رو پیدا کنه


حالا وقتی این اطلاعات رو پیدا کرد مدل دوم که کارش تولید هست شروع به ایجاد یه متن قابل درک میکنه براساس اون اطلاعات

@aipulse24
👍7🔥41
Media is too big
VIEW IN TELEGRAM
قراره توی انجام کارای خونه هم حس ناکافی بودن بگیریم🥺😊😊

این عزیز دل محصول شرکت stardust هست و با تقلید یادمیگیره!

تو همین ۲۰۲۴ به بازار عرضه خواهد شد
کاملا humanoid نیست مثل بقیه مدل ها پایین تنه چرخه:)) بالاتنه ادم😐😐

نحوه کارش به این صورت هست که انواع مختلفی از داده رو جمع میکنه و با استفاده از یادگیری تقویتی میتونه تقلید کنه

@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👎1😍1
خوب میخوام درمورد یه مفهموم خیلی جدید و جذاب ولی کمی پیچیده صحبت کنم

امیدوارم بتونم به خوبی ساده اش کنم

☕️ پرده اول: در حال حاضر وضعیت رایانش برای هوش مصنوعی مناسب نیست.

منظور از رایانش چیه؟ تمام منابع سخت و نرم افزاری هست که برای اجرای تسک نیازه. مثلا یه مدل یادگیری ماشینی نیاز به CPU, رم، برق، شبکه و چیزای دیگه داره به اینا میگیم رایانش.

و هوش مصنوعی برای توسعه بیشتر به یه عالمه از اینا نیاز داره که همه یا تولیدشون کمه یا گرونن و در دسترس همه نیست

☕️پرده دوم: در حال حاضر دو مدل رایانش داریم باینری و کوانتمی 

به طور خلاصه باینری یعنی صفر و یک اما کوانتومی از قوانین فیزیک کوانتوم پیروی میکنه یعنی میتونه در آن واحد چند حالت داشته باشه یعنی هم صفر باشه و هم یک

که خوب پیشرفت از باینری به کوانتومی خیلی قابل ملاحظه بود اما حالا باز هم کوانتومی برای رسیدن به سرعت تغییرات هوش مصنوعی کمه!


☕️پرده سوم: رایانش ترمودینامیکی وارد میشود!!!🏃‍♂️🏃‍♂️

یعنی چی؟ یادتونه که توی فیزیک میخوندیم اتم ها درجایی که هستن بندری میرقصن؟😵‍💫

حالا یه شرکت کانادایی به نام Extropic قصد داره که از این بندری رقصیدن اتم ها استفاده کنه و رایانش کنه 🤯

در واقع به جای رویکرد صفرو یکی برای پردازش اطلاعات، رایانش ترمودینامیکی از گستره ای از حالات استفاده میکنه و این اتفاقا به بسیاری از مشکلات دنیای واقعی خیلی نزدیک تره!!

😀مزیت دیگه؟
چون باید در دمای پایین بر روی الکترون ها کار بشه، مصرف انرژی کارهای مرتبط با هوش مصنوعی خیلیییی کاهش پیدا میکنه!


در همین رابطه البته مقالاتی هم نوشته شده که اخرینش دسامبر ۲۰۲۳ بوده و توی اون محققان از سخت افزار جدیدی به نام SPU نام میبرن که خلاصه
stochastic processing unit
هست
که درواقع میشه اولین کامپیوتر ترمودینامیکی با متغییر های پیوسته (به جای صفر و یکی) هست


امیدوارم تونسته باشم اهمیت و جذابیت این خبرو به خوبی به شما هم منتقل کنم

در ضمن این شرکت برای یه عالمه پوزیشن استخدام میکنه و جالبه که به خاطر عمق کاربرد فیزیک در این روش یه عالمه متخصص فیزیک کاربردی نیاز دارن😄😄

@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥41