گوگل به تازگی از یک ابزار هوش مصنوعی جدید به نام "Career Dreamer" رونمایی کرده که به افراد کمک میکنه موقعیتهای شغلی بیشتری رو کشف کنن. این ابزار هوشمند با استفاده از تجربیات، تحصیلات، مهارتها و علایق شما، الگوهایی رو پیدا میکنه و شما رو با فرصتهای شغلی متناسب آشنا میکنه. با کمک Career Dreamer میتونید یک Career Identity بنویسید و اون رو به رزومهتون اضافه کنید یا در مصاحبههای شغلی ازش استفاده کنید.
این ابزار جدید به شما امکان میده تا با نمایش یک شبکه بصری از موقعیتهای شغلی مختلف، مشاغل متناسب با پیشینه و علایقتون رو ببینید. همچنین میتونید با کمک دستیار هوش مصنوعی Gemini، روی نوشتن کاور لتر و رزومه کار کنید و ایدههای شغلی بیشتری رو کشف کنید. لازم به ذکره که برخلاف سرویسهایی مثل Indeed و LinkedIn، این ابزار شما رو به آگهیهای شغلی واقعی متصل نمیکنه و هدفش فقط کمک به کشف سریع مسیرهای شغلی مختلفه.
در حال حاضر Career Dreamer به صورت آزمایشی فقط در ایالات متحده در دسترسه و هنوز مشخص نیست که آیا گوگل قصد داره این ابزار رو به کشورهای دیگه هم بیاره یا نه.
طبق گزارش مجمع جهانی اقتصاد، افراد به طور میانگین ۱۲ شغل مختلف رو در طول زندگیشون تجربه میکنن و پیشبینی میشه که نسل Z حدود ۱۸ شغل در ۶ مسیر شغلی متفاوت داشته باشه. گوگل امیدواره که این ابزار بتونه به همه افراد جویای کار، از دانشجویان گرفته تا تازهفارغالتحصیلان و افراد نظامی در حال انتقال به بخش غیرنظامی، کمک کنه تا مهارتهای موجودشون رو بهتر با فرصتهای شغلی تطبیق بدن.
@aipulse24
این ابزار جدید به شما امکان میده تا با نمایش یک شبکه بصری از موقعیتهای شغلی مختلف، مشاغل متناسب با پیشینه و علایقتون رو ببینید. همچنین میتونید با کمک دستیار هوش مصنوعی Gemini، روی نوشتن کاور لتر و رزومه کار کنید و ایدههای شغلی بیشتری رو کشف کنید. لازم به ذکره که برخلاف سرویسهایی مثل Indeed و LinkedIn، این ابزار شما رو به آگهیهای شغلی واقعی متصل نمیکنه و هدفش فقط کمک به کشف سریع مسیرهای شغلی مختلفه.
در حال حاضر Career Dreamer به صورت آزمایشی فقط در ایالات متحده در دسترسه و هنوز مشخص نیست که آیا گوگل قصد داره این ابزار رو به کشورهای دیگه هم بیاره یا نه.
طبق گزارش مجمع جهانی اقتصاد، افراد به طور میانگین ۱۲ شغل مختلف رو در طول زندگیشون تجربه میکنن و پیشبینی میشه که نسل Z حدود ۱۸ شغل در ۶ مسیر شغلی متفاوت داشته باشه. گوگل امیدواره که این ابزار بتونه به همه افراد جویای کار، از دانشجویان گرفته تا تازهفارغالتحصیلان و افراد نظامی در حال انتقال به بخش غیرنظامی، کمک کنه تا مهارتهای موجودشون رو بهتر با فرصتهای شغلی تطبیق بدن.
@aipulse24
❤20👍8
شرکت چینی علی بابا چند ساعت پیش ورژن جدید مدل تولید ویدیوی خودش رو معرفی کرد.
مدل Wanx 2 که اولین بار در جولای ۲۰۲۳ معرفی شده بود حالا با یه پیشرفت فوق العاده در کیفیت خروجی با نام Wanx 2.1 معرفی شده.
به طور کلی مدل های چینی چند ماه بعد از معرفی Chat GPT برای رقابت با محصولات امریکایی وارد بازار شدن ولی صرفا بعد از موفقیت اخیر Deepseek که باعث ریزش بازار سهام توی آمریکا شد، توجه هارو به خودشون جلب کردن.
اغلب مدل های تولید فیلم توی ساخت ویدیوهای حرکات پیچیده انسانی مثل ژیمناستیک و پاتیناژ شدیدا مشکل دارن اما این مدل توی ویدیوی معرفی نشون میده که بدون مشکل میتونه این حرکات رو بازسازی کنه.
این توانایی های فوق العاده مدل به همراه بهبود کیفیت پیکسل کلیپ ها، رعایت قوانین فیزیک و بهبود پیروی از پرامپت باعث شده تا در رده بندی مدل های ویدیویی نمره ۸۴.۷ رو به دست بیاره
(هرچند که اخیرا خیلی بنچ مارک ها قابل اطمینان نیستن)
این مدل به زودی اوپن سورس خواهد بود ولی فعلا روی سایت چینی خودش و استادیو هوش مصنوعی علی بابا قابل دسترسی هست
لازم به ذکره که متاسفانه دوستان چینی کلا علاقه به اسم های ناجور دارن و اسم این مدل توی انگلیسی معنی بدی میده😭 🥺 😭
@aipulse24
مدل Wanx 2 که اولین بار در جولای ۲۰۲۳ معرفی شده بود حالا با یه پیشرفت فوق العاده در کیفیت خروجی با نام Wanx 2.1 معرفی شده.
به طور کلی مدل های چینی چند ماه بعد از معرفی Chat GPT برای رقابت با محصولات امریکایی وارد بازار شدن ولی صرفا بعد از موفقیت اخیر Deepseek که باعث ریزش بازار سهام توی آمریکا شد، توجه هارو به خودشون جلب کردن.
اغلب مدل های تولید فیلم توی ساخت ویدیوهای حرکات پیچیده انسانی مثل ژیمناستیک و پاتیناژ شدیدا مشکل دارن اما این مدل توی ویدیوی معرفی نشون میده که بدون مشکل میتونه این حرکات رو بازسازی کنه.
این توانایی های فوق العاده مدل به همراه بهبود کیفیت پیکسل کلیپ ها، رعایت قوانین فیزیک و بهبود پیروی از پرامپت باعث شده تا در رده بندی مدل های ویدیویی نمره ۸۴.۷ رو به دست بیاره
(هرچند که اخیرا خیلی بنچ مارک ها قابل اطمینان نیستن)
این مدل به زودی اوپن سورس خواهد بود ولی فعلا روی سایت چینی خودش و استادیو هوش مصنوعی علی بابا قابل دسترسی هست
لازم به ذکره که متاسفانه دوستان چینی کلا علاقه به اسم های ناجور دارن و اسم این مدل توی انگلیسی معنی بدی میده
@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤12👍4🤣3❤🔥1
استارتاپ مرکور (Mercor) که توسط سه جوان ۲۱ ساله تاسیس شده، موفق شده در دور سرمایهگذاری سری B خودش ۱۰۰ میلیون دلار جذب کنه و به ارزش ۲ میلیارد دلاری برسه.
این استارتاپ که در حوزه استخدام هوشمند فعالیت میکنه، با استفاده از هوش مصنوعی فرآیند استخدام رو سادهتر کرده. کارفرماها شرح شغل رو آپلود میکنن و سیستم مرکور بهترین کاندیداها رو پیشنهاد میده. متقاضیان کار هم یک مصاحبه ۲۰ دقیقهای با هوش مصنوعی انجام میدن که مهارتهاشون رو ارزیابی میکنه و یک پروفایل براشون میسازه.
جالبه بدونید که شرکتهای بزرگ تکنولوژی مثل OpenAI در حال حاضر از ابزارهای مرکور استفاده میکنن. این استارتاپ ادعا میکنه که سیستمش نه تنها استخدام رو سادهتر میکنه، بلکه تعصب و سوگیری رو هم از این فرآیند حذف میکنه. البته این ادعا که سیستمهای هوش مصنوعی کمتر از انسانها دچار سوگیری میشن، همیشه درست نبوده.
درآمد سالانه مرکور در حال حاضر به ۷۵ میلیون دلار رسیده. برندان فودی، مدیرعامل شرکت، معتقده که مرکور به جای جایگزین کردن نیروی انسانی، داره به شناسایی مشاغلی کمک میکنه که هوش مصنوعی نمیتونه انجام بده - مثل آموزش مدلهای هوش مصنوعی، مدیریت تصمیمگیریهای پیچیده یا نقشهای خلاقانه و استراتژیک.
@aipulse24
این استارتاپ که در حوزه استخدام هوشمند فعالیت میکنه، با استفاده از هوش مصنوعی فرآیند استخدام رو سادهتر کرده. کارفرماها شرح شغل رو آپلود میکنن و سیستم مرکور بهترین کاندیداها رو پیشنهاد میده. متقاضیان کار هم یک مصاحبه ۲۰ دقیقهای با هوش مصنوعی انجام میدن که مهارتهاشون رو ارزیابی میکنه و یک پروفایل براشون میسازه.
جالبه بدونید که شرکتهای بزرگ تکنولوژی مثل OpenAI در حال حاضر از ابزارهای مرکور استفاده میکنن. این استارتاپ ادعا میکنه که سیستمش نه تنها استخدام رو سادهتر میکنه، بلکه تعصب و سوگیری رو هم از این فرآیند حذف میکنه. البته این ادعا که سیستمهای هوش مصنوعی کمتر از انسانها دچار سوگیری میشن، همیشه درست نبوده.
درآمد سالانه مرکور در حال حاضر به ۷۵ میلیون دلار رسیده. برندان فودی، مدیرعامل شرکت، معتقده که مرکور به جای جایگزین کردن نیروی انسانی، داره به شناسایی مشاغلی کمک میکنه که هوش مصنوعی نمیتونه انجام بده - مثل آموزش مدلهای هوش مصنوعی، مدیریت تصمیمگیریهای پیچیده یا نقشهای خلاقانه و استراتژیک.
@aipulse24
❤13👍10❤🔥2🔥2🤡2
آنتروپیک بالاخره از مدل جدیدش رونمایی کرد. کلاد ۳.۷ سانت (Claude 3.7 Sonnet) هوشمندترین مدل این شرکت تا به امروز و اولین مدل هیبریدی استدلالی در دنیا محسوب میشه. این مدل با رویکردی کاملاً متفاوت طراحی شده و میتونه مثل مغز انسان، هم پاسخهای سریع بده و هم با تفکر عمیق به حل مسائل پیچیده بپردازه.
نکته جالب اینجاست که کلاد ۳.۷ در واقع دو مدل در یک مدله. در حالت استاندارد، یک نسخه ارتقا یافته از کلود ۳.۵ هست و در حالت تفکر بسطیافته، با خودارزیابی قبل از پاسخ، عملکرد بهتری در ریاضیات، فیزیک، برنامهنویسی و وظایف پیچیده داره. کاربران API هم میتونن زمان تفکر مدل رو تا سقف ۱۲۸ هزار توکن تنظیم کنن.
در حوزه برنامهنویسی، نتایج تستهای اولیه نشون میده که کلاد در صدر قرار داره. شرکتهای معتبری مثل Cursor، Cognition و Vercel تأیید کردن که این مدل در انجام وظایف واقعی برنامهنویسی و مدیریت کدهای پیچیده، عملکرد فوقالعادهای داره.
همزمان با این بهروزرسانی، ابزار جدید "کلاد کد" هم معرفی شده که یک ایجنت فعال برای توسعهدهندگان محسوب میشه. این ابزار میتونه کد بخونه، فایلها رو ویرایش کنه، تست بنویسه و اجرا کنه، و حتی کد رو به گیتهاب push کنه - و در تمام این مراحل، شما رو در جریان کار قرار میده.
خوشبختانه این مدل روی تمام پلنهای کلاد - شامل رایگان، حرفهای، تیمی و سازمانی - و همینطور پلتفرمهای ابری معتبر مثل آمازون Bedrock و Google Cloud Vertex AI در دسترسه. از نظر قیمتگذاری هزینهها مثل قبل مونده: ۳ دلار برای هر میلیون توکن ورودی و ۱۵ دلار برای هر میلیون توکن خروجی.
آنتروپیک تأکید کرده که این مدل با دقت زیادی تست شده و استانداردهای امنیتی، ایمنی و قابلیت اطمینان رو رعایت میکنه. حتی در تشخیص درخواستهای مضر و بیضرر هم ۴۵٪ بهتر از نسخه قبلی عمل میکنه.
@aipulse24
نکته جالب اینجاست که کلاد ۳.۷ در واقع دو مدل در یک مدله. در حالت استاندارد، یک نسخه ارتقا یافته از کلود ۳.۵ هست و در حالت تفکر بسطیافته، با خودارزیابی قبل از پاسخ، عملکرد بهتری در ریاضیات، فیزیک، برنامهنویسی و وظایف پیچیده داره. کاربران API هم میتونن زمان تفکر مدل رو تا سقف ۱۲۸ هزار توکن تنظیم کنن.
در حوزه برنامهنویسی، نتایج تستهای اولیه نشون میده که کلاد در صدر قرار داره. شرکتهای معتبری مثل Cursor، Cognition و Vercel تأیید کردن که این مدل در انجام وظایف واقعی برنامهنویسی و مدیریت کدهای پیچیده، عملکرد فوقالعادهای داره.
همزمان با این بهروزرسانی، ابزار جدید "کلاد کد" هم معرفی شده که یک ایجنت فعال برای توسعهدهندگان محسوب میشه. این ابزار میتونه کد بخونه، فایلها رو ویرایش کنه، تست بنویسه و اجرا کنه، و حتی کد رو به گیتهاب push کنه - و در تمام این مراحل، شما رو در جریان کار قرار میده.
خوشبختانه این مدل روی تمام پلنهای کلاد - شامل رایگان، حرفهای، تیمی و سازمانی - و همینطور پلتفرمهای ابری معتبر مثل آمازون Bedrock و Google Cloud Vertex AI در دسترسه. از نظر قیمتگذاری هزینهها مثل قبل مونده: ۳ دلار برای هر میلیون توکن ورودی و ۱۵ دلار برای هر میلیون توکن خروجی.
آنتروپیک تأکید کرده که این مدل با دقت زیادی تست شده و استانداردهای امنیتی، ایمنی و قابلیت اطمینان رو رعایت میکنه. حتی در تشخیص درخواستهای مضر و بیضرر هم ۴۵٪ بهتر از نسخه قبلی عمل میکنه.
@aipulse24
❤21👍6❤🔥1🔥1
OpenAI روز سهشنبه اعلام کرد که قابلیت Deep Research رو برای تمام کاربران پولی ChatGPT منتشر میکنه.
مشترکین ChatGPT Plus، Team، Enterprise و Edu ماهانه ۱۰ کردیت Deep Research دریافت میکنن. این قابلیت قبلاً فقط برای کاربران ChatGPT Pro، اشتراک ۲۰۰ دلاری این شرکت در دسترس بود؛ همچنین کاربران ChatGPT Pro الان ماهانه ۱۲۰ کردیت Deep Research میگیرن، که از ۱۰۰ کردیت در زمان راهاندازی بیشتر شده.
Google هم هفته گذشته قابلیت Deep Research خودش رو برای تمام کاربران Gemini Advanced منتشر کرده بود.
@aipulse24
مشترکین ChatGPT Plus، Team، Enterprise و Edu ماهانه ۱۰ کردیت Deep Research دریافت میکنن. این قابلیت قبلاً فقط برای کاربران ChatGPT Pro، اشتراک ۲۰۰ دلاری این شرکت در دسترس بود؛ همچنین کاربران ChatGPT Pro الان ماهانه ۱۲۰ کردیت Deep Research میگیرن، که از ۱۰۰ کردیت در زمان راهاندازی بیشتر شده.
Google هم هفته گذشته قابلیت Deep Research خودش رو برای تمام کاربران Gemini Advanced منتشر کرده بود.
@aipulse24
❤🔥9👍4👀3🤣1
This media is not supported in your browser
VIEW IN TELEGRAM
توی این پست تصمیم دارم به بررسی ابزارهای مختلف هوش مصنوعی برای پژوهش بپردازم
قطعا ابزارهای خیلی زیادی وجود دارن و هر روز داره به تعدادشون هم اضافه میشه ولی همه شون خوب نیستن!
🌕 اول از همه پیدا کردن research gap هست برای این کار میتونین از پرپلکسیتی استفاده کنید فقط کافیه یه پرامپت ساده بهش بدید مثل این:
Analyze recent publications on [topic]. Identify research gaps or areas where further study is needed
🌕 یک ابزار دیگه برای پیدا کردن ارتباط مقالات و گپ ها connected papers هست که ارتباط بین مقالات رو شبیه شبکه Obsidian براتون میکشه
🌕 ابزار بعدی که تازه گوگل معرفی کرده و قراره به زودی در دسترس عموم قرار بگیره AI co-scientist هست. این ابزار فرای دیپ ریسرچ و قابلیت های reasoning مدل های مختلف میره و با دانش عمیقی که از مقالات داره فرضیه های تحقیق خلاقانه و مدرن ارائه میکنه. اینجا میتونید بیشتر راجع بهش بخونید
🌕 ابزار بعدی Semantic Scholar هست که یک پروژه اوپن سورس هست و با بررسی 8 میلیون مقاله به سوالات شما حوزه خاصی جواب میده. اینجا میتونید ازش استفاده کنید.
🌕 از سایت scite هم غافل نشید که یک دستیار تحقیق فوق العاده است و به سوالاتتون با رفرنس مقاله جواب میده.
🌕 ابزار بعدی papergen هست که دیگه خیلی کارو راحت کرده و از مرور ادبیات تا مقاله کلاسی یا مقاله برای مجلات علمی رو به طور کامل با تمام رفرنس هاش براتون مینویسه. اینجا میتونید ازش استفاده کنید .
🌕 یک ابزار دیگه outread هست که شبیه blinkist هست اما برای مقالات علمی و شما میتونید خلاصه های ساده 15 دقیقه ای از مقالات خیلی پیچیده علمی ازش دریافت کنید.
🌕 ابزار اخر یعنی Storm هم توسط دانشگاه استنفورد درست شده و براساس سرچ اینترنت برای هر موضوعی صفحات شبیه ویکیپیدیا با رفرنس درست میکنه این یکی بیشتر برای تحقیقات کلاسی مناسبی تا مقالات علمی.
یک سری از این سایت ها کاملا رایگان هستن و یک سریشون گزینه استفاده محدود رایگان به همراه اشتراک ماهانه رو دارن
@aipulse24
قطعا ابزارهای خیلی زیادی وجود دارن و هر روز داره به تعدادشون هم اضافه میشه ولی همه شون خوب نیستن!
Analyze recent publications on [topic]. Identify research gaps or areas where further study is needed
یک سری از این سایت ها کاملا رایگان هستن و یک سریشون گزینه استفاده محدود رایگان به همراه اشتراک ماهانه رو دارن
@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
6🔥21👍4❤1👏1🙏1
Forwarded from Videomarketing(+AI)
This media is not supported in your browser
VIEW IN TELEGRAM
به یک ویدیوساز چینی دیگه از کمپانی Alibaba بنام Wan سلام کنیم. این هوش مصنوعی در دو مدل Wan2.1 و Wan-VAE عرضه شده:
❗️ ❗️ ❗️ ❗️
🟢 دسترسی به ژنراتور ساخت ویدئوی Wan
⏰ پست مرتبط: معرفی دیگر محصول هوش مصنوعی علی بابا به نام Qwen با امکان ساخت ویدیو
از ایدهها به دیدهها برسیم
🔤 Videomarketing(+AI)
A little dog wearing headphones is riding a colorful scooter across a lush green field, with a basket filled with various fresh vegetables, resembling a moving pastoral landscape painting. Uniquely, a relaxed little cat is perched on the dog's back, and the two of them work together harmoniously, enjoying the thrill of the speedy ride. In the background, rolling mountains and a blue sky decorated with fluffy white clouds create a soothing and delightful scene. The dog's focused expression and the cat's comfortable posture together illustrate this extraordinary joy of riding.
از ایدهها به دیدهها برسیم
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🤣6⚡1
عید نزدیک و مثلا قرار نیست نان استاپ صیغه بلعت رو صرف کنید و میخواید یک کار مفید کنید 😃 😂
واسه همین گفتم زمان خوبی هست که یه عالمه کورس های خفنی که شرکت های بزرگ و مهم واسه یادگیری هوش مصنوعی معرفی کردن رو باهاتون به اشتراک بگذارم
اغلب این کورس ها برای سطح مبتدی طراحی شدن و اگر به صورت تخصصی این حوزه رو بلد نیستید راحت میتونید دنبالشون کنید
یه سری هاشون حول محور کدنویسی درست شدن ولی تعداد زیادیشون صرفا توضیح اصول هوش مصنوعی بدون کدنویسی هست یا آموزش پرامپت نویسی حرفه ای
خلاصه این شما و اینم لیستی که میریزید تو سیو مسیج که بعد عمرا برید سراغش😭 😭
✅ کورس های شرکت آنتروپیک (صاحب مدل کلاد) که برای نحوه بهتر پرامپت نویسی هستن و کار با API این مدل.
✅ کورس های شرکت مایکروسافت با عنوان AI for Beginners که مفاهیم تخصصی رو برای کسانی که تازه کار هستن توضیح میده
✅ دروه های شرکت انویدیا از ساده و اصول اولیه مدل های زبانی شروع میشه تا سطوح پیشرفته
✅ کورس های گوگل کلاد که از سطح ساده شروع میشه تا پیشرفته
✅ دوره های ماشین لرنینگ خود گوگل که از آموزش آمار شروع میکنه تا خود ماشین لرنینگ
✅ این ریپو و این یکی هم اومدن کلی دوره، کتاب و بلاگ پست های خفن این حوزه رو یک جا جمع کردن که بد نیست اینام چک کنید
همین دیگه بفرستید برای بقیه که اونام تو عید این رو هی ببینن و شیرینی هایی که میخورن کوفتشون بشه😊 😊
@aipulse24
واسه همین گفتم زمان خوبی هست که یه عالمه کورس های خفنی که شرکت های بزرگ و مهم واسه یادگیری هوش مصنوعی معرفی کردن رو باهاتون به اشتراک بگذارم
اغلب این کورس ها برای سطح مبتدی طراحی شدن و اگر به صورت تخصصی این حوزه رو بلد نیستید راحت میتونید دنبالشون کنید
یه سری هاشون حول محور کدنویسی درست شدن ولی تعداد زیادیشون صرفا توضیح اصول هوش مصنوعی بدون کدنویسی هست یا آموزش پرامپت نویسی حرفه ای
خلاصه این شما و اینم لیستی که میریزید تو سیو مسیج که بعد عمرا برید سراغش
همین دیگه بفرستید برای بقیه که اونام تو عید این رو هی ببینن و شیرینی هایی که میخورن کوفتشون بشه
@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
10❤35👍12🤣6🙏2
AI Pulse
Photo
🤣12🎉5
مدل صوتی جدیدی اخیرا با نام Sesame به عرصه مدل های هوش مصنوعی اضافه شده است. این مدل فعلا به صورت دمو هست و شما میتونین با مدل Maya و Miles چت کنید.
این مدل که از تکنولوژی conversational speech استفاده میکنه، یکی از بزرگترین مشکلات دستیاران صوتی یعنی بی احساس بودن صداشون حین گفتگو رو حل کرده.
رویکرد متفاوت در ساخت این مدل که شرکت اون رو با عنوان voice presence اعلام کرده باعث میشه تا از بقیه مدل های تبدیل متن به وویس (tts) متمایزش کنه و حین گفتگو کاملا دارای احساس باشه و حس درک و شنیده شدن به مخاطب بده.
این مدل شرایط احساسی در صدا، زمان بندی درست، توقف و تشدید توی صدا حین گفتگو رو کامل درک میکنه.
این مدل همچنین در بنچ مارک های مختلف عملکرد فوق العاده ای داشته. در بنچمارک سنتی تونسته امتیازی کاملا نزدیک به انسان کسب کنه!
همچنین در تفاوت تلفظ بین لغاتی که شبیه هم هستن ولی معنی متفاوتی دارن مثل Lead به معنی سرب یا Lead به معنی هدایت کردن با درک درست موقعیت تونسته دقتی ۹۰ درصدی توی تلفظ داشته باشه
مهمتر از همه در تست های انسانی که افراد نمیدونستن دارن با ai صحبت میکنن یا انسان، تعداد کمی تونستن به درستی شناسایی اش کنن.
مسیر آینده این مدل هم به صورت زیر:
✅ اوپن سورس کردن عناصر اصلی تحقیق تا بقیه بتونن با استفاده ازش محصول تولبد کنن
✅ مدل رو بزرگتر کنن
✅ پشتیبانی از ۲۰ زبان دیگه رو اضافه کنن
✅ با بقیه مدل های زبانی ترکیبش کنن
✅ درنهایت مدل هایی بسازن که بتونه به صورت طبیعی گفتگو ایجاد کنه
توی ویدیوهای همراه پست میتونین تجربه کاربرای مختلف از استفاده از این مدل رو ببینید.
1️⃣ ویدیو خود فاندر مدل هست که باهاش کار کرده
2️⃣ یک کاربر ردیت هست که اصلا توش مشخص نیست کدوم ai هست و کدوم انسان واقعی که یکیشون داره از اون یکی اخاذی میکنه.
3️⃣ استفاده خود من هست که البته ته اش یه تهدید ریزی هم بشریت رو میکنه🥺 😳 😳 😳
دمو این مدل روی سایتشون قابل استفاده است
@aipulse24
این مدل که از تکنولوژی conversational speech استفاده میکنه، یکی از بزرگترین مشکلات دستیاران صوتی یعنی بی احساس بودن صداشون حین گفتگو رو حل کرده.
رویکرد متفاوت در ساخت این مدل که شرکت اون رو با عنوان voice presence اعلام کرده باعث میشه تا از بقیه مدل های تبدیل متن به وویس (tts) متمایزش کنه و حین گفتگو کاملا دارای احساس باشه و حس درک و شنیده شدن به مخاطب بده.
این مدل شرایط احساسی در صدا، زمان بندی درست، توقف و تشدید توی صدا حین گفتگو رو کامل درک میکنه.
این مدل همچنین در بنچ مارک های مختلف عملکرد فوق العاده ای داشته. در بنچمارک سنتی تونسته امتیازی کاملا نزدیک به انسان کسب کنه!
همچنین در تفاوت تلفظ بین لغاتی که شبیه هم هستن ولی معنی متفاوتی دارن مثل Lead به معنی سرب یا Lead به معنی هدایت کردن با درک درست موقعیت تونسته دقتی ۹۰ درصدی توی تلفظ داشته باشه
مهمتر از همه در تست های انسانی که افراد نمیدونستن دارن با ai صحبت میکنن یا انسان، تعداد کمی تونستن به درستی شناسایی اش کنن.
مسیر آینده این مدل هم به صورت زیر:
توی ویدیوهای همراه پست میتونین تجربه کاربرای مختلف از استفاده از این مدل رو ببینید.
دمو این مدل روی سایتشون قابل استفاده است
@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16😁2👏1
شرکت Inception از مدل جدیدی رونمایی کرده که برخلاف LLM های رایج از متود Diffusion، همون متودی که تا امروز برای تولید عکس و ویدیو در مدلهایی مثل Sora و Midjourney استفاده میشد، برای تولید و ویرایش متنها استفاده میکنه.
این موضوع باعث میشه که این مدل بتونه کارهایی که مدلهای کنونی انجام میدن رو با سرعت بسیار بیشتری انجام بده.
مدل های LLM کنونی به صورت Sequential کار میکنن، یعنی مثلا برای تولید یک عبارت سه حرفی در ابتدا باید کلمه اول، سپس دوم و در آخر سومین کلمه تولید بشه، تولید کلمه دوم مادامی که تولید کلمه اول به اتمام نرسیده باشه ممکن نیست.
اما مدل های Diffusion در همون ابتدا یک برآورد کلی از خروجیای که قراره درنهایت تولید بشه (مثل یک عکس) دارن و سپس دیتا رو حول محور اون جمع آوری و تولید میکنند، وقتی که این مکانیزم رو با مدلهای زبانی کنونی ترکیب کنیم، نتیجه میشه یک مدل زبانی بسیار سریع که میتونه به صورت موازی تولید متون مختلف رو انجام بده.
آقای Ermon، بنیانگذار این شرکت که استاد دانشگاه استنفورد هم هست، به همراه یکی از دانشجوهاش پیپر مربوط به این تکنیک رو سال گذشته منتشر کردن.
این شرکت همچنین از خانواده مدلهایی که بر این اساس ساخته شدن به اسم Mercury هم رونمایی کرده که به گفته این شرکت ۱۰ برابر سریعتر از مدل های کنونی هستن. این مدلها که Mercury Coder Mini و Mercury Coder Small نام دارند، میتونن روی کارت های Nvidia H100 تا ۱۰۰۰ توکن بر ثانیه خروجی داشته باشن، که این سرعت تا قبل از این فقط با چیپهای شخصی سازی شده قابل دستیابی بود.
مدل Mercury Coder که تمرکز اون روی کد نویسی هست از اینجا در دسترس و قابل استفاده هست.
@aipulse24
این موضوع باعث میشه که این مدل بتونه کارهایی که مدلهای کنونی انجام میدن رو با سرعت بسیار بیشتری انجام بده.
مدل های LLM کنونی به صورت Sequential کار میکنن، یعنی مثلا برای تولید یک عبارت سه حرفی در ابتدا باید کلمه اول، سپس دوم و در آخر سومین کلمه تولید بشه، تولید کلمه دوم مادامی که تولید کلمه اول به اتمام نرسیده باشه ممکن نیست.
اما مدل های Diffusion در همون ابتدا یک برآورد کلی از خروجیای که قراره درنهایت تولید بشه (مثل یک عکس) دارن و سپس دیتا رو حول محور اون جمع آوری و تولید میکنند، وقتی که این مکانیزم رو با مدلهای زبانی کنونی ترکیب کنیم، نتیجه میشه یک مدل زبانی بسیار سریع که میتونه به صورت موازی تولید متون مختلف رو انجام بده.
آقای Ermon، بنیانگذار این شرکت که استاد دانشگاه استنفورد هم هست، به همراه یکی از دانشجوهاش پیپر مربوط به این تکنیک رو سال گذشته منتشر کردن.
این شرکت همچنین از خانواده مدلهایی که بر این اساس ساخته شدن به اسم Mercury هم رونمایی کرده که به گفته این شرکت ۱۰ برابر سریعتر از مدل های کنونی هستن. این مدلها که Mercury Coder Mini و Mercury Coder Small نام دارند، میتونن روی کارت های Nvidia H100 تا ۱۰۰۰ توکن بر ثانیه خروجی داشته باشن، که این سرعت تا قبل از این فقط با چیپهای شخصی سازی شده قابل دستیابی بود.
مدل Mercury Coder که تمرکز اون روی کد نویسی هست از اینجا در دسترس و قابل استفاده هست.
@aipulse24
4👍18🔥10❤4👌1