شرکت چینی DeepSeek از مدل اوپن سورس جدیدش DeepSeek-R1 رونمایی کرده که با مدل o1 از OpenAI رقابت تنگاتنگی داره. نسخه پیشنمایش این مدل که اسمش DeepSeek-R1-Lite-Preview هست، تو آزمونهای معتبر مثل AIME و MATH عملکرد خیلی خوبی داشته و حتی از o1 هم بهتر عمل کرده.
این مدل جدید مثل o1 از روش «زنجیره فکری» استفاده میکنه که باعث میشه مسائل پیچیده رو قدم به قدم حل کنه. این روش کمک میکنه که مدل بتونه درستی محاسباتش رو چک کنه و از اشتباهات رایج دوری کنه. کاربرها میتونن مراحل فکر کردن مدل رو ببینن، ولی خب این دقت باعث میشه که جواب دادن به سوالهای پیچیده کمی زمانبر بشه.
با اینکه DeepSeek-R1 خیلی خوب کار میکنه و از سیستمهای پیشرفتهای مثل GPT-4 و Claude هم توی بنچمارکها بهتر عمل کرده، ولی هنوز یه سری مشکلات داره. ضمنا از اونجایی که یه محصول چینیه، به موضوعات سیاسی حساس مربوط به چین هم جواب نمیده.
قراره DeepSeek-R1 به صورت اوپنسورس منتشر بشه و API هم در دسترس کاربران قرار بگیره. فعلاً میشه از طریق وبسایت DeepSeek Chat از اینجا باهاش کار کرد، و کاربرهای رایگان روزی ۵۰ تا پیام میتونن بفرستن.
@aipulse24
این مدل جدید مثل o1 از روش «زنجیره فکری» استفاده میکنه که باعث میشه مسائل پیچیده رو قدم به قدم حل کنه. این روش کمک میکنه که مدل بتونه درستی محاسباتش رو چک کنه و از اشتباهات رایج دوری کنه. کاربرها میتونن مراحل فکر کردن مدل رو ببینن، ولی خب این دقت باعث میشه که جواب دادن به سوالهای پیچیده کمی زمانبر بشه.
با اینکه DeepSeek-R1 خیلی خوب کار میکنه و از سیستمهای پیشرفتهای مثل GPT-4 و Claude هم توی بنچمارکها بهتر عمل کرده، ولی هنوز یه سری مشکلات داره. ضمنا از اونجایی که یه محصول چینیه، به موضوعات سیاسی حساس مربوط به چین هم جواب نمیده.
قراره DeepSeek-R1 به صورت اوپنسورس منتشر بشه و API هم در دسترس کاربران قرار بگیره. فعلاً میشه از طریق وبسایت DeepSeek Chat از اینجا باهاش کار کرد، و کاربرهای رایگان روزی ۵۰ تا پیام میتونن بفرستن.
@aipulse24
👍22❤4
آنتروپیک یک استاندارد جدید به نام پروتکل MCP یا Model Context Protocol معرفی کرده که میتونه دستیارهای هوش مصنوعی مثل Claude رو به منابع مختلف اطلاعاتی و سیستمها متصل کنه. با این پروتکل دیگه نیازی نیست برای هر منبع اطلاعاتی یک رابط جداگانه نوشته بشه.
ساختار MCP از دو بخش تشکیل شده: سرورهای MCP که اطلاعات رو از پلتفرمهای مختلف در دسترس قرار میدن، و کلاینتهای MCP که برنامههای مبتنی بر هوش مصنوعی هستن. آنتروپیک مشخصات فنی، SDK و یک مخزن متنباز از سرورهای آماده MCP برای سیستمهای محبوب مثل گوگل درایو، اسلک و گیتهاب رو منتشر کرده.
همچنین این استاندارد مورد استقبال کاربران و توسعه دهندگان زیادی قرار گرفته و باعث شده سرورهای مختلفی برای MCP توسعه بدن، مثلا در یکی از ویدیوهایی که بالا ضمیمه کردم یک کاربر با یک سرور MCP متصل به آمازون تونسته مواد غذایی مورد نیازش رو با استفاده از کلاد سفارش بده.
در حال حاضر MCP در نسخه دسکتاپ کلاد برای مک و ویندوز در دسترسه و کاربرها میتونن به فایلهای محلی، اینترنت و حتی کانالهای اسلک دسترسی داشته باشن.
این پروتکل میتونه تاثیر زیادی روی برنامههای هوش مصنوعی بذاره چون یک روش استاندارد برای تغذیه اطلاعات خارجی به مدلهای هوش مصنوعی فراهم میکنه. شرکتهای بزرگی مثل Cloudflare از الان شروع به توسعه سرورهای MCP کردن و با بلوغ این اکوسیستم، سیستمهای هوش مصنوعی میتونن در حین حرکت بین ابزارها و دادههای مختلف، متن رو هم بهتر درک کنن.
سرورهای آماده MCP رو از اینجا و نسخه دسکتاپ کلاد رو از اینجا میتونید دانلود کنید.
@aipulse24
ساختار MCP از دو بخش تشکیل شده: سرورهای MCP که اطلاعات رو از پلتفرمهای مختلف در دسترس قرار میدن، و کلاینتهای MCP که برنامههای مبتنی بر هوش مصنوعی هستن. آنتروپیک مشخصات فنی، SDK و یک مخزن متنباز از سرورهای آماده MCP برای سیستمهای محبوب مثل گوگل درایو، اسلک و گیتهاب رو منتشر کرده.
همچنین این استاندارد مورد استقبال کاربران و توسعه دهندگان زیادی قرار گرفته و باعث شده سرورهای مختلفی برای MCP توسعه بدن، مثلا در یکی از ویدیوهایی که بالا ضمیمه کردم یک کاربر با یک سرور MCP متصل به آمازون تونسته مواد غذایی مورد نیازش رو با استفاده از کلاد سفارش بده.
در حال حاضر MCP در نسخه دسکتاپ کلاد برای مک و ویندوز در دسترسه و کاربرها میتونن به فایلهای محلی، اینترنت و حتی کانالهای اسلک دسترسی داشته باشن.
این پروتکل میتونه تاثیر زیادی روی برنامههای هوش مصنوعی بذاره چون یک روش استاندارد برای تغذیه اطلاعات خارجی به مدلهای هوش مصنوعی فراهم میکنه. شرکتهای بزرگی مثل Cloudflare از الان شروع به توسعه سرورهای MCP کردن و با بلوغ این اکوسیستم، سیستمهای هوش مصنوعی میتونن در حین حرکت بین ابزارها و دادههای مختلف، متن رو هم بهتر درک کنن.
سرورهای آماده MCP رو از اینجا و نسخه دسکتاپ کلاد رو از اینجا میتونید دانلود کنید.
@aipulse24
❤19👍8
اوپنروتر، یک سرویس پیشرفته هوش مصنوعی هست که امکان استفاده از انواع مدلهای زبانی رو با یک API ساده فراهم میکنه. تصور کنید به جای اینکه مجبور باشید برای هر مدل هوش مصنوعی یک حساب جداگانه بسازید، میتونید از طریق یک درگاه واحد به همه اونها دسترسی داشته باشید.
تنوع مدلهای موجود در اوپنروتر واقعاً چشمگیره. از مدلهای سبک و سریع مثل Llama گرفته تا مدلهای قدرتمندی مثل GPT و Claude. هر کدوم از این مدلها برای کار خاصی بهینه شدن؛ مثلاً بعضیهاشون توی خلاصهنویسی عالی عمل میکنن، بعضیها توی برنامهنویسی، و بعضیها توی تحلیل متنهای طولانی.
در مورد هزینهها، اوپنروتر کاملاً شفاف عمل میکنه. شما میتونید قبل از استفاده، قیمت دقیق هر مدل رو ببینید و مقایسه کنید. سیستم پرداخت هم خیلی سادهست، حسابتون رو شارژ میکنید و فقط به اندازه استفادهتون هزینه پرداخت میکنید. این یعنی هم برای یک کاربر عادی مناسبه، هم برای یک برنامهنویس مستقل، و هم برای یک شرکت بزرگ. ضمنا میتونید با رمزارزها هم حسابتون رو شارژ کنید که برای کاربران ایرانی به دلیل در دسترس نبودن سیستم های پرداخت سنتی بسیار حائز اهمیت هست.
نکته جالب دیگه اینه که به عنوان توسعه دهنده میتونید خیلی راحت بین مدلهای مختلف جابجا بشید. مثلاً اگه دیدید یک مدل جدید اومده که برای کارتون بهتره، کافیه فقط اسم مدل رو عوض کنید - نیازی نیست کل برنامهتون رو تغییر بدید. این ویژگی باعث میشه اوپنروتر برای همه کاربرها، از مبتدی تا حرفهای، یک گزینه عالی باشه.
نکته هیجانانگیز اینه که حتی اگه برنامهنویس نیستید یا اصلاً نمیدونید API چیه، میتونید از طریق رابط کاربری ساده چت اوپنروتر، با بیش از ۲۰۰ مدل هوش مصنوعی مختلف گفتگو کنید. یکی از قابلیتهای جالبش اینه که میتونید همزمان از چند مدل مختلف جواب بگیرید و جوابها رو با هم مقایسه کنید تا از درستی اطلاعات مطمئن بشید. حتی میتونید تنظیمات مختلف هر مدل رو تغییر بدید - مثلاً میزان خلاقیت یا دقت مدل رو کم و زیاد کنید - تا دقیقاً به جوابی که میخواید برسید.
لازمه بدونید که حتی بدون شارژ کردن حسابتون هم میتونید از تعدادی از این مدلها به صورت کاملا رایگان برای تست API و یا قابلیت چت اوپن روتر استفاده کنید که لیست این مدل ها از اینجا قابل مشاهدهست.
به زبون سادهتر، اوپنروتر مثل یک مرکز خرید بزرگ برای هوش مصنوعی میمونه - همه چیز رو یکجا و با قیمتهای شفاف پیدا میکنید، و میتونید هر وقت خواستید از هر مدلی که دوست دارید استفاده کنید، چه برنامهنویس باشید چه نباشید.
سرویس چت اوپن روتر از اینجا در دسترسه، همچنین لیست مدل های موجود رو از اینجا و مستندات API رو از اینجا میتونید مشاهده کنید.
@aipulse24
تنوع مدلهای موجود در اوپنروتر واقعاً چشمگیره. از مدلهای سبک و سریع مثل Llama گرفته تا مدلهای قدرتمندی مثل GPT و Claude. هر کدوم از این مدلها برای کار خاصی بهینه شدن؛ مثلاً بعضیهاشون توی خلاصهنویسی عالی عمل میکنن، بعضیها توی برنامهنویسی، و بعضیها توی تحلیل متنهای طولانی.
در مورد هزینهها، اوپنروتر کاملاً شفاف عمل میکنه. شما میتونید قبل از استفاده، قیمت دقیق هر مدل رو ببینید و مقایسه کنید. سیستم پرداخت هم خیلی سادهست، حسابتون رو شارژ میکنید و فقط به اندازه استفادهتون هزینه پرداخت میکنید. این یعنی هم برای یک کاربر عادی مناسبه، هم برای یک برنامهنویس مستقل، و هم برای یک شرکت بزرگ. ضمنا میتونید با رمزارزها هم حسابتون رو شارژ کنید که برای کاربران ایرانی به دلیل در دسترس نبودن سیستم های پرداخت سنتی بسیار حائز اهمیت هست.
نکته جالب دیگه اینه که به عنوان توسعه دهنده میتونید خیلی راحت بین مدلهای مختلف جابجا بشید. مثلاً اگه دیدید یک مدل جدید اومده که برای کارتون بهتره، کافیه فقط اسم مدل رو عوض کنید - نیازی نیست کل برنامهتون رو تغییر بدید. این ویژگی باعث میشه اوپنروتر برای همه کاربرها، از مبتدی تا حرفهای، یک گزینه عالی باشه.
نکته هیجانانگیز اینه که حتی اگه برنامهنویس نیستید یا اصلاً نمیدونید API چیه، میتونید از طریق رابط کاربری ساده چت اوپنروتر، با بیش از ۲۰۰ مدل هوش مصنوعی مختلف گفتگو کنید. یکی از قابلیتهای جالبش اینه که میتونید همزمان از چند مدل مختلف جواب بگیرید و جوابها رو با هم مقایسه کنید تا از درستی اطلاعات مطمئن بشید. حتی میتونید تنظیمات مختلف هر مدل رو تغییر بدید - مثلاً میزان خلاقیت یا دقت مدل رو کم و زیاد کنید - تا دقیقاً به جوابی که میخواید برسید.
لازمه بدونید که حتی بدون شارژ کردن حسابتون هم میتونید از تعدادی از این مدلها به صورت کاملا رایگان برای تست API و یا قابلیت چت اوپن روتر استفاده کنید که لیست این مدل ها از اینجا قابل مشاهدهست.
به زبون سادهتر، اوپنروتر مثل یک مرکز خرید بزرگ برای هوش مصنوعی میمونه - همه چیز رو یکجا و با قیمتهای شفاف پیدا میکنید، و میتونید هر وقت خواستید از هر مدلی که دوست دارید استفاده کنید، چه برنامهنویس باشید چه نباشید.
سرویس چت اوپن روتر از اینجا در دسترسه، همچنین لیست مدل های موجود رو از اینجا و مستندات API رو از اینجا میتونید مشاهده کنید.
@aipulse24
3🔥22👍10❤🔥1🥰1👏1
Media is too big
VIEW IN TELEGRAM
لوما AI بهتازگی از جدیدترین دستاورد خودش در زمینه تولید ویدیو با هوش مصنوعی رونمایی کرده: Ray2. این مدل جدید که بخشی از پلتفرم Dream Machine هست، یک جهش چشمگیر در ساخت محتوای ویدیویی واقعگرایانه و پویا از متن به حساب میاد.
قدرت پردازشی Ray2 نسبت به نسخه قبلیش ۱۰ برابر افزایش پیدا کرده. این ارتقای قابل توجه باعث شده بتونه ویدیوهای ۵ تا ۱۰ ثانیهای با کیفیت بالا تولید کنه که حرکتهای طبیعی و منسجمی دارن. این مدل در تولید انیمیشنهای واقعگرایانه، انتقالهای نرم و فیلمبرداری پیشرفته عملکرد فوقالعادهای داره و درک بهتری از فیزیک دنیای واقعی نشون میده.
در حال حاضر، Ray2 از تبدیل متن به ویدیو پشتیبانی میکنه و کاربرها میتونن با وارد کردن توضیحات متنی، کلیپهای کوتاه تولید کنن. این مدل قادره محتوا رو با کیفیت 1080P تولید کنه و قراره در بهروزرسانیهای آینده، مدت زمان ویدیوها به ۲۰ ثانیه افزایش پیدا کنه. لوما AI همچنین خبر داده که قابلیتهای جدیدی مثل تبدیل عکس به ویدیو، ویدیو به ویدیو و ابزارهای ویرایش پیشرفته در راه هستن.
مدل Ray2 هماکنون برای مشترکین پلتفرم Dream Machine در دسترسه و قیمت اشتراکها از ۷ دلار در ماه شروع میشه.
@aipulse24
قدرت پردازشی Ray2 نسبت به نسخه قبلیش ۱۰ برابر افزایش پیدا کرده. این ارتقای قابل توجه باعث شده بتونه ویدیوهای ۵ تا ۱۰ ثانیهای با کیفیت بالا تولید کنه که حرکتهای طبیعی و منسجمی دارن. این مدل در تولید انیمیشنهای واقعگرایانه، انتقالهای نرم و فیلمبرداری پیشرفته عملکرد فوقالعادهای داره و درک بهتری از فیزیک دنیای واقعی نشون میده.
در حال حاضر، Ray2 از تبدیل متن به ویدیو پشتیبانی میکنه و کاربرها میتونن با وارد کردن توضیحات متنی، کلیپهای کوتاه تولید کنن. این مدل قادره محتوا رو با کیفیت 1080P تولید کنه و قراره در بهروزرسانیهای آینده، مدت زمان ویدیوها به ۲۰ ثانیه افزایش پیدا کنه. لوما AI همچنین خبر داده که قابلیتهای جدیدی مثل تبدیل عکس به ویدیو، ویدیو به ویدیو و ابزارهای ویرایش پیشرفته در راه هستن.
مدل Ray2 هماکنون برای مشترکین پلتفرم Dream Machine در دسترسه و قیمت اشتراکها از ۷ دلار در ماه شروع میشه.
@aipulse24
1👍14❤4👀1
مدلهای زبانی بزرگ (LLM) که بر پایه معماری ترنسفورمر کار میکنن، تحول چشمگیری در پردازش متن ایجاد کردن. این مدلها از ماژولهای توجه (attention) استفاده میکنن که مثل یه حافظه قدرتمند عمل میکنن و میتونن ارتباطهای پیچیده بین کلمات رو درک کنن. اما یه مشکل اساسی دارن: هرچی متن طولانیتر باشه، نیاز به محاسبات و حافظه بهطور تصاعدی افزایش پیدا میکنه و این باعث میشه که استفاده از اونها در دنیای واقعی با محدودیتهای جدی مواجه بشه.
خبر خوب اینه که محققان گوگل یه راهحل نوآورانه پیشنهاد کردن که اسمش رو گذاشتن Titans. این سیستم جدید از یه ماژول حافظه عصبی بلندمدت استفاده میکنه که میتونه اطلاعات تاریخی رو به شکل کارآمدی ذخیره و بازیابی کنه. جالبترین ویژگی Titans اینه که از یه سیستم حافظه دوگانه استفاده میکنه: یه بخش برای حافظه کوتاهمدت که وظیفهش مدلسازی دقیق وابستگیهای متنی در محدوده کوچکه، و یه بخش برای حافظه بلندمدت که اطلاعات مهم رو برای استفادههای بعدی نگه میداره.
این سیستم جدید از سه ماژول اصلی تشکیل شده: یه هسته مرکزی که مسئول پردازش اصلی دادههاست، یه شاخه حافظه بلندمدت که اطلاعات تاریخی رو ذخیره میکنه، و یه بخش حافظه دائمی که پارامترهای ثابت و مستقل از داده رو نگه میداره. محققان با استفاده از تکنیکهای پیشرفتهای مثل اتصالات باقیمانده، توابع فعالسازی SiLU و نرمالسازی، عملکرد سیستم رو بهینه کردن.
نتایج آزمایشها نشون میده که این سیستم جدید عملکرد فوقالعادهای داره. سه نسخه مختلف Titans (MAC، MAG و MAL) همگی از مدلهای موجود بهتر عمل میکنن و میتونن متنهای خیلی طولانی (بیشتر از ۲ میلیون توکن) رو با دقت بالا پردازش کنن. این موفقیت به خاطر سه ویژگی کلیدیه: مدیریت بهینه حافظه، قابلیتهای پیشرفته حافظه غیرخطی، و توانایی حذف هوشمندانه اطلاعات غیرضروری از حافظه.
این دستاورد مهم میتونه تأثیر زیادی روی آینده هوش مصنوعی و کاربردهای عملی اون داشته باشه. حالا میتونیم به سیستمهایی فکر کنیم که قادرن متنهای خیلی طولانی رو درک کنن، ویدیوها رو تحلیل کنن و پیشبینیهای دقیقتری از روندهای طولانیمدت داشته باشن. این پیشرفت، درهای جدیدی رو به روی محققان و توسعهدهندگان باز میکنه و میتونه به حل مسائل پیچیدهتر در آینده کمک کنه.
از اینجا میتونید نسخه کامل این مقاله رو دانلود و مشاهده کنید.
👀 منبع
@aipulse24
خبر خوب اینه که محققان گوگل یه راهحل نوآورانه پیشنهاد کردن که اسمش رو گذاشتن Titans. این سیستم جدید از یه ماژول حافظه عصبی بلندمدت استفاده میکنه که میتونه اطلاعات تاریخی رو به شکل کارآمدی ذخیره و بازیابی کنه. جالبترین ویژگی Titans اینه که از یه سیستم حافظه دوگانه استفاده میکنه: یه بخش برای حافظه کوتاهمدت که وظیفهش مدلسازی دقیق وابستگیهای متنی در محدوده کوچکه، و یه بخش برای حافظه بلندمدت که اطلاعات مهم رو برای استفادههای بعدی نگه میداره.
این سیستم جدید از سه ماژول اصلی تشکیل شده: یه هسته مرکزی که مسئول پردازش اصلی دادههاست، یه شاخه حافظه بلندمدت که اطلاعات تاریخی رو ذخیره میکنه، و یه بخش حافظه دائمی که پارامترهای ثابت و مستقل از داده رو نگه میداره. محققان با استفاده از تکنیکهای پیشرفتهای مثل اتصالات باقیمانده، توابع فعالسازی SiLU و نرمالسازی، عملکرد سیستم رو بهینه کردن.
نتایج آزمایشها نشون میده که این سیستم جدید عملکرد فوقالعادهای داره. سه نسخه مختلف Titans (MAC، MAG و MAL) همگی از مدلهای موجود بهتر عمل میکنن و میتونن متنهای خیلی طولانی (بیشتر از ۲ میلیون توکن) رو با دقت بالا پردازش کنن. این موفقیت به خاطر سه ویژگی کلیدیه: مدیریت بهینه حافظه، قابلیتهای پیشرفته حافظه غیرخطی، و توانایی حذف هوشمندانه اطلاعات غیرضروری از حافظه.
این دستاورد مهم میتونه تأثیر زیادی روی آینده هوش مصنوعی و کاربردهای عملی اون داشته باشه. حالا میتونیم به سیستمهایی فکر کنیم که قادرن متنهای خیلی طولانی رو درک کنن، ویدیوها رو تحلیل کنن و پیشبینیهای دقیقتری از روندهای طولانیمدت داشته باشن. این پیشرفت، درهای جدیدی رو به روی محققان و توسعهدهندگان باز میکنه و میتونه به حل مسائل پیچیدهتر در آینده کمک کنه.
از اینجا میتونید نسخه کامل این مقاله رو دانلود و مشاهده کنید.
👀 منبع
@aipulse24
11❤22🔥8👍3
این هفته شرکت مینیمکس (MiniMax) که با پشتیبانی علیبابا و تنسنت تا کنون ۸۵۰ میلیون دلار سرمایه جذب کرده و ارزش اون بیش از ۲.۵ میلیارد دلار هست، از سه مدل جدید هوش مصنوعی رونمایی کرد. این مدلها شامل MiniMax-Text-01 برای پردازش متن، MiniMax-VL-01 برای درک تصویر و متن، و T2A-01-HD برای تولید صدا میشن.
مدل MiniMax-Text-01 با ۴۵۶ میلیارد پارامتر، ادعا میکنه که از مدلهای مطرحی مثل Gemini 2.0 Flash گوگل در معیارهای MMLU و SimpleQA عملکرد بهتری داره. نکته قابل توجه اینه که این مدل میتونه حدود ۴ میلیون توکن رو پردازش کنه که این ظرفیت حدود ۳۱ برابر بیشتر از مدلهای GPT-4o و Llama 3.1 هست.
مدل MiniMax-VL-01 هم در رقابت با Claude 3.5 Sonnet شرکت Anthropic قرار گرفته و در زمینه درک چندرسانهای مثل تحلیل نمودارها و دیاگرامها عملکرد قابل توجهی داره. مدل T2A-01-HD که برای تولید صدا بهینه شده، میتونه در ۱۷ زبان مختلف از جمله انگلیسی و چینی صدای مصنوعی تولید کنه و با فقط ۱۰ ثانیه نمونه صوتی، صدای افراد رو شبیهسازی کنه.
نکته جالب توجه اینکه با وجود در دسترس بودن این مدلها در GitHub و Hugging Face، استفاده از اونها تحت مجوز محدودکننده MiniMax قرار داره و پلتفرمهایی با بیش از ۱۰۰ میلیون کاربر فعال ماهانه باید مجوز ویژهای از MiniMax درخواست کنن.
میتونید از اینجا به صورت رایگان یا از طریق اوپن روتر به این مدلها دسترسی داشته باشید.
@aipulse24
مدل MiniMax-Text-01 با ۴۵۶ میلیارد پارامتر، ادعا میکنه که از مدلهای مطرحی مثل Gemini 2.0 Flash گوگل در معیارهای MMLU و SimpleQA عملکرد بهتری داره. نکته قابل توجه اینه که این مدل میتونه حدود ۴ میلیون توکن رو پردازش کنه که این ظرفیت حدود ۳۱ برابر بیشتر از مدلهای GPT-4o و Llama 3.1 هست.
مدل MiniMax-VL-01 هم در رقابت با Claude 3.5 Sonnet شرکت Anthropic قرار گرفته و در زمینه درک چندرسانهای مثل تحلیل نمودارها و دیاگرامها عملکرد قابل توجهی داره. مدل T2A-01-HD که برای تولید صدا بهینه شده، میتونه در ۱۷ زبان مختلف از جمله انگلیسی و چینی صدای مصنوعی تولید کنه و با فقط ۱۰ ثانیه نمونه صوتی، صدای افراد رو شبیهسازی کنه.
نکته جالب توجه اینکه با وجود در دسترس بودن این مدلها در GitHub و Hugging Face، استفاده از اونها تحت مجوز محدودکننده MiniMax قرار داره و پلتفرمهایی با بیش از ۱۰۰ میلیون کاربر فعال ماهانه باید مجوز ویژهای از MiniMax درخواست کنن.
میتونید از اینجا به صورت رایگان یا از طریق اوپن روتر به این مدلها دسترسی داشته باشید.
@aipulse24
👍12🔥12
شرکتهای OpenAI, Oracle و SoftBank امروز اعلام کردن که قراره یک شرکت جدید به نام Stargate تاسیس کنن تا زیرساختهای هوش مصنوعی رو در ایالات متحده گسترش بدن. سم آلتمن (مدیرعامل OpenAI)، ماسایوشی سان (مدیرعامل SoftBank) و لری الیسون (رئیس Oracle) در کاخ سفید حضور پیدا کردن و در کنار دونالد ترامپ، این پروژه رو که رئیس جمهور اون رو "بزرگترین پروژه زیرساختی هوش مصنوعی در تاریخ" خوند، معرفی کردن.
این شرکتها در مرحله اول ۱۰۰ میلیارد دلار سرمایهگذاری میکنن و برنامه دارن که این رقم رو تا ۵۰۰ میلیارد دلار در سالهای آینده افزایش بدن. طبق گفته ترامپ، این پروژه قراره ۱۰۰ هزار شغل جدید در آمریکا ایجاد کنه. اولین مرکز داده این پروژه که مساحتش یک میلیون فوت مربع هست، هماکنون در تگزاس در حال ساخته.
سم آلتمن که قبلاً هم با مقامات آمریکایی درباره اهمیت توسعه زیرساختهای هوش مصنوعی صحبت کرده بود، این پروژه رو "مهمترین پروژه این دوران" خونده. اون تأکید کرده که هوش مصنوعی برخلاف نرمافزارهای معمولی، به زیرساختهای عظیم، از جمله برق، تراشههای کامپیوتری و مراکز داده نیاز داره و آمریکا باید برای پیشتاز موندن در این حوزه، این زیرساختها رو در داخل کشور بسازه.
در این پروژه، SoftBank مسئولیت مالی و OpenAI مسئولیت عملیاتی رو به عهده میگیره و ماسایوشی سان به عنوان رئیس Stargate انتخاب شده. این در حالیه که OpenAI هفته گذشته در یک گزارش اعلام کرد که حدود ۱۷۵ میلیارد دلار سرمایه جهانی آماده سرمایهگذاری در پروژههای هوش مصنوعی هست و اگر آمریکا نتونه این سرمایهها رو جذب کنه، به سمت پروژههای چینی سرازیر میشن.
@aipulse24
این شرکتها در مرحله اول ۱۰۰ میلیارد دلار سرمایهگذاری میکنن و برنامه دارن که این رقم رو تا ۵۰۰ میلیارد دلار در سالهای آینده افزایش بدن. طبق گفته ترامپ، این پروژه قراره ۱۰۰ هزار شغل جدید در آمریکا ایجاد کنه. اولین مرکز داده این پروژه که مساحتش یک میلیون فوت مربع هست، هماکنون در تگزاس در حال ساخته.
سم آلتمن که قبلاً هم با مقامات آمریکایی درباره اهمیت توسعه زیرساختهای هوش مصنوعی صحبت کرده بود، این پروژه رو "مهمترین پروژه این دوران" خونده. اون تأکید کرده که هوش مصنوعی برخلاف نرمافزارهای معمولی، به زیرساختهای عظیم، از جمله برق، تراشههای کامپیوتری و مراکز داده نیاز داره و آمریکا باید برای پیشتاز موندن در این حوزه، این زیرساختها رو در داخل کشور بسازه.
در این پروژه، SoftBank مسئولیت مالی و OpenAI مسئولیت عملیاتی رو به عهده میگیره و ماسایوشی سان به عنوان رئیس Stargate انتخاب شده. این در حالیه که OpenAI هفته گذشته در یک گزارش اعلام کرد که حدود ۱۷۵ میلیارد دلار سرمایه جهانی آماده سرمایهگذاری در پروژههای هوش مصنوعی هست و اگر آمریکا نتونه این سرمایهها رو جذب کنه، به سمت پروژههای چینی سرازیر میشن.
@aipulse24
👍18❤3🔥1
امروز شرکت Anthropic از قابلیت جدید Citations در API خودش رونمایی کرد. این ویژگی به هوش مصنوعی Claude اجازه میده تا پاسخهاش رو بر اساس منابع موثق ارائه کنه و دقیقاً مشخص کنه که هر بخش از پاسخش رو از کدوم منبع و کدوم قسمت استخراج کرده. این قابلیت باعث میشه خروجیهای Claude قابل راستیآزمایی و مطمئنتر باشن.
قبلاً توسعهدهندگان مجبور بودن از پرامپتهای پیچیده استفاده کنن تا Claude اطلاعات منبع رو هم مشخص کنه، که این کار زمانبر و غیر قابل اتکا بود. ارزیابیها نشون میده که این قابلیت جدید تا ۱۵ درصد دقت بیشتری نسبت به روشهای دستی داره.
این ویژگی کاربردهای متنوعی داره، از خلاصهسازی اسناد طولانی گرفته تا پاسخگویی به سوالات پیچیده و... ، Claude میتونه دقیقاً مشخص کنه که هر بخش از پاسخش رو از کدوم قسمت منابع برداشته. این قابلیت الان روی نسخههای Claude 3.5 Sonnet و Claude 3.5 Haiku در دسترسه.
شرکتهای بزرگی مثل Thomson Reuters و Endex از این قابلیت استفاده میکنن و نتایج فوقالعادهای گرفتن. مثلاً Endex گزارش داده که میزان خطا در ارجاعدهی به منابع از ۱۰ درصد به صفر رسیده و تعداد ارجاعات در هر پاسخ ۲۰ درصد افزایش پیدا کرده. این نشون میده که این قابلیت میتونه تاثیر قابل توجهی در دقت و قابلیت اطمینان به خروجیهای هوش مصنوعی داشته باشه.
این قابلیت در حال حاضر فقط از طریق API برای توسعهدهندگان در دسترس هست و ممکنه در اینده به نسخه وب و اپ Claude هم اضافه بشه.
@aipulse24
قبلاً توسعهدهندگان مجبور بودن از پرامپتهای پیچیده استفاده کنن تا Claude اطلاعات منبع رو هم مشخص کنه، که این کار زمانبر و غیر قابل اتکا بود. ارزیابیها نشون میده که این قابلیت جدید تا ۱۵ درصد دقت بیشتری نسبت به روشهای دستی داره.
این ویژگی کاربردهای متنوعی داره، از خلاصهسازی اسناد طولانی گرفته تا پاسخگویی به سوالات پیچیده و... ، Claude میتونه دقیقاً مشخص کنه که هر بخش از پاسخش رو از کدوم قسمت منابع برداشته. این قابلیت الان روی نسخههای Claude 3.5 Sonnet و Claude 3.5 Haiku در دسترسه.
شرکتهای بزرگی مثل Thomson Reuters و Endex از این قابلیت استفاده میکنن و نتایج فوقالعادهای گرفتن. مثلاً Endex گزارش داده که میزان خطا در ارجاعدهی به منابع از ۱۰ درصد به صفر رسیده و تعداد ارجاعات در هر پاسخ ۲۰ درصد افزایش پیدا کرده. این نشون میده که این قابلیت میتونه تاثیر قابل توجهی در دقت و قابلیت اطمینان به خروجیهای هوش مصنوعی داشته باشه.
این قابلیت در حال حاضر فقط از طریق API برای توسعهدهندگان در دسترس هست و ممکنه در اینده به نسخه وب و اپ Claude هم اضافه بشه.
@aipulse24
👌20👍7🔥4❤🔥1❤1
ارزش استارتاپ Clay که در زمینه هوش مصنوعی و پردازش دادههای فروش فعالیت میکنه به رقم ۱.۲۵ میلیارد دلار رسید! این استارتاپ، موفق شده در مدت کوتاه ۶ ماه ارزش خودش رو دو برابر کنه.
استارتاپ Clay با استفاده از هوش مصنوعی پیشرفته، به شرکتها کمک میکنه تا مشتریان بالقوه خودشون رو با دقت بیشتری شناسایی کنن. این شرکت با جمعآوری و تحلیل دادههای متنوع مثل نرمافزارهایی که شرکتها استفاده میکنن، مشتریان فعلیشون و سوابق کاری تصمیمگیرندههای کلیدی، به تیمهای فروش کمک میکنه تا لیدهای باکیفیتتری پیدا کنن. جالبه بدونید که Clay از یک ابزار هوش مصنوعی اختصاصی به نام 'Claygent' استفاده میکنه که میتونه سوالات پیچیده رو تحلیل کنه و نتایج دقیق ارائه بده.
در حال حاضر بیش از ۵۰۰۰ کسبوکار از جمله شرکت های مطرحی مثل OpenAI، Anthropic، Canva و Rippling از خدمات Clay استفاده میکنن. درآمد این شرکت در سال ۲۰۲۴ به حدود ۳۰ میلیون دلار رسیده و قراردادهای سالانهشون به صدها هزار دلار میرسه. یه نکته جالب دیگه اینه که یک اکوسیستم قوی حول Clay شکل گرفته - کانال اسلک این شرکت بیش از ۱۸،۰۰۰ کاربر فعال داره و بیش از ۹۰ آژانس مشاوره کوچک، از طریق کمک به شرکتها برای استفاده از Clay درآمدهای قابل توجهی کسب میکنن.
موفقیت Clay در کشف الگوهای غیرمنتظره در دادهها واقعاً چشمگیره. برای مثال، یکی از مشتریاشون به اسم Intercom (یک یونیکورن در حوزه خدمات مشتری) با استفاده از Clay متوجه شد شرکتهایی که کلمه "fertility" توی وبسایتشون هست، احتمال بیشتری داره که به نرمافزارشون نیاز داشته باشن - صرف نظر از اینکه توی چه صنعتی فعالیت میکنن. این نوع بینشهای منحصر به فرد که قبلاً کشفشون تقریباً غیرممکن بود، Clay رو به یکی از موفقترین نمونههای کاربرد عملی هوش مصنوعی در دنیای کسبوکار تبدیل کرده.
نکته قابل توجه دیگه اینه که Clay یک سرمایهگذاری ۴۰ میلیون دلاری جدید رو جذب کرده که توسط Meritech انجام شده، اما هنوز از این پول استفاده نکرده.
👀 منبع
@aipulse24
استارتاپ Clay با استفاده از هوش مصنوعی پیشرفته، به شرکتها کمک میکنه تا مشتریان بالقوه خودشون رو با دقت بیشتری شناسایی کنن. این شرکت با جمعآوری و تحلیل دادههای متنوع مثل نرمافزارهایی که شرکتها استفاده میکنن، مشتریان فعلیشون و سوابق کاری تصمیمگیرندههای کلیدی، به تیمهای فروش کمک میکنه تا لیدهای باکیفیتتری پیدا کنن. جالبه بدونید که Clay از یک ابزار هوش مصنوعی اختصاصی به نام 'Claygent' استفاده میکنه که میتونه سوالات پیچیده رو تحلیل کنه و نتایج دقیق ارائه بده.
در حال حاضر بیش از ۵۰۰۰ کسبوکار از جمله شرکت های مطرحی مثل OpenAI، Anthropic، Canva و Rippling از خدمات Clay استفاده میکنن. درآمد این شرکت در سال ۲۰۲۴ به حدود ۳۰ میلیون دلار رسیده و قراردادهای سالانهشون به صدها هزار دلار میرسه. یه نکته جالب دیگه اینه که یک اکوسیستم قوی حول Clay شکل گرفته - کانال اسلک این شرکت بیش از ۱۸،۰۰۰ کاربر فعال داره و بیش از ۹۰ آژانس مشاوره کوچک، از طریق کمک به شرکتها برای استفاده از Clay درآمدهای قابل توجهی کسب میکنن.
موفقیت Clay در کشف الگوهای غیرمنتظره در دادهها واقعاً چشمگیره. برای مثال، یکی از مشتریاشون به اسم Intercom (یک یونیکورن در حوزه خدمات مشتری) با استفاده از Clay متوجه شد شرکتهایی که کلمه "fertility" توی وبسایتشون هست، احتمال بیشتری داره که به نرمافزارشون نیاز داشته باشن - صرف نظر از اینکه توی چه صنعتی فعالیت میکنن. این نوع بینشهای منحصر به فرد که قبلاً کشفشون تقریباً غیرممکن بود، Clay رو به یکی از موفقترین نمونههای کاربرد عملی هوش مصنوعی در دنیای کسبوکار تبدیل کرده.
نکته قابل توجه دیگه اینه که Clay یک سرمایهگذاری ۴۰ میلیون دلاری جدید رو جذب کرده که توسط Meritech انجام شده، اما هنوز از این پول استفاده نکرده.
👀 منبع
@aipulse24
❤12👍10🔥1
شرکت Retro Biosciences با حمایت سم آلتمن میخواد یک میلیارد دلار سرمایه جذب کنه. هدف این شرکت افزایش ۱۰ ساله طول عمر انسانها در مقایسه با عمر طبیعی یک انسان سالم هست.
سم آلتمن، مدیرعامل OpenAI، پیش از این مبلغ ۱۸۰ میلیون دلار به عنوان سرمایه اولیه به این شرکت اختصاص داده بود و اکنون نیز در دور جدید سرمایهگذاری مشارکت میکنه.
این شرکت مستقر در سانفرانسیسکو، که برنامه تولید داروهایی برای درمان بیماریهایی نظیر آلزایمر رو داره، اخیراً با همکاری OpenAI موفق شده یک مدل هوش مصنوعی برای تبدیل سلولهای معمولی به سلولهای بنیادی طراحی کنه.
جو بتس-لاکروا، مدیرعامل شرکت، اعلام کرده میخواد در دهه ۲۰۲۰ به کشف و توسعه دارو برسه.
این شرکت به جمع پروژههای مهم افزایش طول عمر با حمایت میلیاردرها پیوسته، از جمله Altos Labs که در سال ۲۰۲۲ با سرمایه ۳ میلیارد دلاری جف بزوس راهاندازی شد و Unity Biotechnology که مورد حمایت بزوس و پیتر تیل قرار داره.
@aipulse24
سم آلتمن، مدیرعامل OpenAI، پیش از این مبلغ ۱۸۰ میلیون دلار به عنوان سرمایه اولیه به این شرکت اختصاص داده بود و اکنون نیز در دور جدید سرمایهگذاری مشارکت میکنه.
این شرکت مستقر در سانفرانسیسکو، که برنامه تولید داروهایی برای درمان بیماریهایی نظیر آلزایمر رو داره، اخیراً با همکاری OpenAI موفق شده یک مدل هوش مصنوعی برای تبدیل سلولهای معمولی به سلولهای بنیادی طراحی کنه.
جو بتس-لاکروا، مدیرعامل شرکت، اعلام کرده میخواد در دهه ۲۰۲۰ به کشف و توسعه دارو برسه.
این شرکت به جمع پروژههای مهم افزایش طول عمر با حمایت میلیاردرها پیوسته، از جمله Altos Labs که در سال ۲۰۲۲ با سرمایه ۳ میلیارد دلاری جف بزوس راهاندازی شد و Unity Biotechnology که مورد حمایت بزوس و پیتر تیل قرار داره.
@aipulse24
❤15👍5
شرکت OpenAI از مدل جدید خودش به نام o3-mini رونمایی کرده که جدیدترین و مقرونبهصرفهترین مدل در سری مدلهای استدلالی این شرکته. این مدل الان هم از طریق ChatGPT و هم API در دسترسه. o3-mini تواناییهای خیلی خوبی در زمینههای علمی، ریاضی و برنامهنویسی داره، در حالی که هزینه و تأخیر کمتری نسبت به o1-mini داره.
این مدل جدید اولین مدل کوچک OpenAI هست که از ویژگیهای پرطرفدار توسعهدهندهها مثل function calling، Structured Outputs و developer messages پشتیبانی میکنه. کاربران میتونن بین سه سطح استدلالی - کم، متوسط و زیاد - انتخاب کنن تا برای موارد استفاده خاص خودشون بهینهسازی کنن. البته این مدل از قابلیتهای تصویری پشتیبانی نمیکنه و برای وظایف مربوط به تصویر باید از OpenAI o1 استفاده کرد.
در ارزیابیهای انجام شده، o3-mini با سطح استدلال متوسط، عملکردی مشابه o1 در زمینههای ریاضی، کدنویسی و علوم داره، در حالی که پاسخهای سریعتری ارائه میده. آزمایشها نشون دادن که o3-mini پاسخهای دقیقتر و واضحتری نسبت به o1-mini تولید میکنه و توانایی استدلال قویتری داره. در ۵۶٪ موارد، پاسخهای o3-mini به o1-mini ترجیح داده شده و خطاهای جدی در سوالات دشوار دنیای واقعی ۳۹٪ کاهش پیدا کرده.
در مقایسه با OpenAI o1، این مدل جدید عملکرد سریعتری داره و کارایی بهتری رو نشون میده. در تستهای A/B، مدل o3-mini پاسخهایی ۲۴٪ سریعتر از o1-mini ارائه داده، با میانگین زمان پاسخ ۷.۷ ثانیه در مقایسه با ۱۰.۱۶ ثانیه. کاربران ChatGPT Plus، Team و Pro میتونن از همین امروز به o3-mini دسترسی داشته باشن، و دسترسی Enterprise هم طی یک هفته آینده فراهم میشه.
@aipulse24
این مدل جدید اولین مدل کوچک OpenAI هست که از ویژگیهای پرطرفدار توسعهدهندهها مثل function calling، Structured Outputs و developer messages پشتیبانی میکنه. کاربران میتونن بین سه سطح استدلالی - کم، متوسط و زیاد - انتخاب کنن تا برای موارد استفاده خاص خودشون بهینهسازی کنن. البته این مدل از قابلیتهای تصویری پشتیبانی نمیکنه و برای وظایف مربوط به تصویر باید از OpenAI o1 استفاده کرد.
در ارزیابیهای انجام شده، o3-mini با سطح استدلال متوسط، عملکردی مشابه o1 در زمینههای ریاضی، کدنویسی و علوم داره، در حالی که پاسخهای سریعتری ارائه میده. آزمایشها نشون دادن که o3-mini پاسخهای دقیقتر و واضحتری نسبت به o1-mini تولید میکنه و توانایی استدلال قویتری داره. در ۵۶٪ موارد، پاسخهای o3-mini به o1-mini ترجیح داده شده و خطاهای جدی در سوالات دشوار دنیای واقعی ۳۹٪ کاهش پیدا کرده.
در مقایسه با OpenAI o1، این مدل جدید عملکرد سریعتری داره و کارایی بهتری رو نشون میده. در تستهای A/B، مدل o3-mini پاسخهایی ۲۴٪ سریعتر از o1-mini ارائه داده، با میانگین زمان پاسخ ۷.۷ ثانیه در مقایسه با ۱۰.۱۶ ثانیه. کاربران ChatGPT Plus، Team و Pro میتونن از همین امروز به o3-mini دسترسی داشته باشن، و دسترسی Enterprise هم طی یک هفته آینده فراهم میشه.
@aipulse24
🔥23👍3❤1