AI Pulse – Telegram
AI Pulse
3.73K subscribers
397 photos
137 videos
5 files
138 links
اخبار، اموزش و معرفی ابزارهای هوش مصنوعی
Download Telegram
شرکت Runway چهارمین دوره از مسابقه Runway Gen 48 رو اپریل برگزار کرد.

برای شرکت در این مسابقه شما ۴۸ ساعت فرصت دارید تا یک فیلم کوتاه با استفاده از هوش مصنوعی بسازید.

توی این تایم (۴۸ ساعت ) به افراد شرکت‌کننده دسترسی به یک اکانت رایگان بی نهایت داده میشه تا باهاش فیلم شون رو بسازن و اینطوری برای شرکت در مسابقه مجبور به پرداخت هزینه ای نباشن.🥺

💰جوایزش هم به این صورت هست:

گرند پری و برگزیده مردمی هرکدوم:

🏆 ۵۰۰۰ دلار نقد + ۱ میلیون کردیت استفاده از runway

بقیه برندگان:

🏆۵۰۰ هزار کردیت ران وی


این ۵ فیلم هرکدوم توی کتگوری های مختلف برنده شدن

اولین فیلم با عنوان Aelita برنده بخش "برگزیده مردمی" شده

ردیف وسط اولین کلیپ از چپ عنوانش هست Clover و برنده بخش "انتخاب داوران" شده

ردیف وسط دومین کلیپ از چپ عنوانش Home هست و برنده بخش "گرند پری" شده

ردیف وسط اولی از راست عنوانش No pressure هست و یکی دیگه از برنده های بخش "انتخاب داوران" هست

اخرین فیلم هم عنوانش هست Eyes on Me هست و یکی دیگه از برندگان "انتخاب داوران" هست.


عزیزان متخصص فیلم و سریال نظرتون چیه؟

کدوم بهتره؟

آیا میشه دراینده نزدیک فیلم کامل با هوش مصنوعی در سطح اکران سینمایی ببینیم؟

@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍165🤯3
استارتاپ Windsurf که به‌خاطر ابزارهای محبوبش برای برنامه‌نویس‌ها شناخته می‌شه، روز پنج‌شنبه از اولین خانواده‌ی مدل‌های هوش مصنوعی اختصاصی خودش به نام SWE-1 رونمایی کرد. این مجموعه شامل سه نسخه‌ی اصلی، لایت و مینی هست که طبق گفته‌ی شرکت، نه فقط برای کدنویسی بلکه برای تمام فرآیند مهندسی نرم‌افزار بهینه‌سازی شدن.

این خبر در حالی منتشر شده که طبق گزارش‌ها، OpenAI به‌تازگی قرارداد خرید ۳ میلیارد دلاری Windsurf رو نهایی کرده. با این حال، عرضه‌ی مدل‌های داخلی توسط Windsurf نشون می‌ده که این استارتاپ داره از صرفاً ساخت اپلیکیشن فراتر می‌ره و به سمت توسعه‌ی مدل‌های پایه‌ی هوش مصنوعی هم حرکت می‌کنه.

مدل اصلی یعنی SWE-1 توی بنچمارک‌های داخلی برنامه‌نویسی، عملکردی نزدیک به مدل‌های مطرحی مثل Claude 3.5 Sonnet، GPT-4.1 و Gemini 2.5 Pro داشته، اما هنوز به پای مدل‌های پیشرویی مثل Claude 3.7 Sonnet نمی‌رسه. نسخه‌های Lite و Mini این مدل برای تمام کاربران (رایگان یا پولی) در دسترسه، اما نسخه‌ی کامل SWE-1 فقط برای کاربران پولی فعاله. با اینکه قیمت‌گذاری رسمی اعلام نشده، Windsurf می‌گه هزینه‌ی اجرای SWE-1 از مدل‌هایی مثل Claude 3.5 کمتره.

‏Windsurf بیشتر به‌خاطر سبکی از کدنویسی به اسم "vibe coding" معروفه؛ مدلی که برنامه‌نویس‌ها می‌تونن از طریق گفتگو با چت‌بات‌ها کدنویسی و ویرایش انجام بدن. تا حالا، بیشتر شرکت‌هایی مثل Windsurf، Cursor و Lovable برای این کار از مدل‌های OpenAI، Anthropic یا گوگل استفاده می‌کردن، اما حالا Windsurf داره تلاش می‌کنه راه خودش رو جدا کنه.

طبق گفته‌ی نیکلاس موی، رئیس بخش تحقیقات Windsurf، مدل‌های پیشتاز الان توی کدنویسی خوبن، ولی برای مهندسی نرم‌افزار کافی نیستن. اون گفته: «کدنویسی، مهندسی نرم‌افزار نیست». به گفته‌ی این شرکت، مدل SWE-1 طوری آموزش دیده که بتونه توی محیط‌های مختلف — مثل ترمینال، IDE و مرورگر — که برنامه‌نویس‌ها به‌طور روزمره باهاش سروکار دارن، عملکرد خوبی نشون بده.

‏Windsurf اعلام کرده که SWE-1 فقط یه طرح اولیه‌س و احتمالاً مدل‌های پیشرفته‌تری هم در آینده منتشر خواهد کرد.

@aipulse24
👍174
خوب خوب نظرسنجی جدید داریم ولی این سری رویکرد و نگاه شما به وضعیت هوش مصنوعی در حال حاضر و در آینده است!
بگید که به نظر شما کدوم یکی از گزینه ها به واقعیت نزدیک تره؟

۱. الان مثبت و آینده هم روشنه! 🙋‍♀
هوش مصنوعی همین الانشم داره دنیا رو متحول می‌کنه!
قراره آینده‌ای بیاد که توش پیشرفت بشر می‌ترکونه.

۲. الان درهمه ولی آینده روشنه! 🔮

فعلاً تاثیر خاصی رو زندگیم نداشته، ولی کلی ذوق دارم ببینم چه کارا می‌تونه بکنه.

۳. الان منفیه ولی آینده روشنه! 😠

درسته که الان گند زده، ولی اگه سفت بگیریمش و قوانین سفت و سخت بزاریم می‌تونه یه دنیای عادلانه‌تر بسازه.


۴. الان مثبت ولی آینده نا معلوم 😔

هوش مصنوعی الان خوبه، ولی باید از نزدیک ببینیم و نظارت کنیم تا آخرش خوب باشه.



۵. الان درهمه آینده هم نامعلومه! 🤷‍♀🤔
نه می‌تونم بگم خوبه، نه بگم بده.
فقط دارم نگاه می‌کنم ببینم چی می‌شه.
(از اونایی که پاپ‌کورن بدسته)


۶. الان منفیه آینده هم نا معلومه😥

فعلاً که فقط داره ضرر می‌زنه و کسی هم براش راه‌حل درست‌درمون نداره.



۷. الان مثبت ولی آینده تاریکه! 😓
الان به درد می‌خوره، ولی باید سریع با قانون‌گذاری جلوی ضررهاشو بگیریم.
(از اونایی که یه دستش رو موسه، یه دستش رو ماشه)


۸. الان درهمه ولی آینده تاریکه 🤨

این چیزایی که می‌گن زیادی بزرگ‌نماییه.
ولی ته دلم حس می‌کنم بوی بیکاری و از بین رفتن حریم خصوصی میاد.


۹. الان منفیه آینده هم فاجعه باره! 👹

این قطار داره مستقیم می‌ره سمت دره.
آخرش یا نابود می‌شیم، یا بدتر!
(از اونایی که با هر آپدیت GPT، وصیت‌نامه‌شون رو آپدیت می‌کنن)


@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8😁32
This media is not supported in your browser
VIEW IN TELEGRAM
گوگل اعلام کرده که از این هفته، تب جدیدی به اسم «AI Mode» رو برای همه‌ی کاربراش توی آمریکا فعال می‌کنه؛ تب جدیدی که به کاربرا اجازه می‌ده با استفاده از چت‌بات Gemini، توی وب جست‌وجو کنن.

گوگل قراره تابستون امسال یه‌سری قابلیت جدید رو توی این حالت آزمایش کنه؛ مثل «جست‌وجوی عمیق» و ساخت نمودار برای سوالات مربوط به اقتصاد و ورزش. امکان خرید از طریق AI Mode هم قراره توی ماه‌های آینده فعال بشه.

@aipulse24
1👍123
گوگل همچنین از نسخه‌ی جدید مدل تولید ویدئوش یعنی Veo 3 رونمایی کرده؛ مدلی که حالا می‌تونه علاوه‌بر ساخت ویدیو، صداهایی مثل افکت صوتی، صدای محیط و حتی دیالوگ رو هم بسازه و با ویدیو همگام کنه.

دمیس هاسابیس، مدیرعامل دیپ‌مایند گفته Veo 3 ما رو از «دوران ویدیوی بی‌صدا» بیرون آورده. کاربرا می‌تونن با یه پرامپت ساده، صحنه و شخصیت‌ها رو توصیف کنن و حتی بگن دیالوگ‌ها چه جوری صدا بده.

گوگل می‌گه یکی از تفاوت‌های اصلی Veo 3 با مدل‌های دیگه، مثل Runway، Pika یا OpenAI، قابلیت تولید و هم‌زمان‌سازی خودکار صدا با تصویر براساس پیکسل‌های خام ویدیوئه. این توانایی می‌تونه برگ برنده‌ای برای گوگل باشه تو بازاری که حالا دیگه حسابی شلوغ شده. با اینکه ابزارهای تولید صدا با هوش مصنوعی قبلاً معرفی شده بودن، Veo 3 با درک عمیق‌تر از تصویر، یه قدم جلوتره.

گفته می‌شه دیپ‌مایند برای ساخت این مدل از پژوهش‌های قبلیش تو زمینه «ویدیو به صدا» استفاده کرده؛ و البته احتمالش زیاده که یوتیوب هم یکی از منابع آموزشی این مدل بوده باشه.

در کنار معرفی Veo 3، گوگل یه‌سری قابلیت جدید هم برای Veo 2 فعال کرده. حالا کاربرا می‌تونن عکس‌هایی از کاراکترها، صحنه‌ها یا سبک بصری بدن تا خروجی ویدیوها یک‌دست‌تر بشه. Veo 2 همچنین حرکات دوربین مثل چرخش یا زوم رو هم بهتر درک می‌کنه و امکان حذف یا اضافه‌کردن اشیا تو ویدیو یا تغییر قاب از پرتره به منظره رو فراهم کرده. این امکانات قراره به‌زودی از طریق پلتفرم Vertex AI گوگل در اختیار توسعه‌دهنده‌ها هم قرار بگیره.

مدل Veo 3 فعلاً فقط برای مشترکای پلن AI Ultra با قیمت ۲۴۹.۹۹ دلار در ماه از طریق چت‌بات Gemini در دسترسه.

@aipulse24
1🤯125🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
گوگل علاوه‌بر به‌روزرسانی مدل‌های هوش مصنوعیش، از یه اپلیکیشن جدید فیلم‌سازی با هوش مصنوعی به اسم «Flow» رونمایی کرده. این ابزار با استفاده از مدل‌های Veo، Imagen و Gemini می‌تونه کلیپ‌های هشت‌ثانیه‌ای بسازه؛ فقط کافیه یه متن یا تصویر بهش بدین.

اپ Flow ابزارهایی برای ساخت صحنه هم داره که به کاربرا اجازه می‌ده این کلیپ‌ها رو به هم وصل کنن و ویدیوهای بلندتری با کمک هوش مصنوعی تولید کنن.

@aipulse24
🔥92
جمنای ۲.۵ پرو حالا یه حالت جدید به اسم «تفکر عمیق» اضافه کرده که برای سوال‌های پیچیده مخصوصاً تو حوزه‌ی ریاضی و برنامه‌نویسی طراحی شده. این حالت آزمایشی می‌تونه قبل از پاسخ دادن، چند تا فرضیه‌ی مختلف رو بررسی کنه. البته فعلاً فقط برای یه تعداد تستر مورد اعتماد فعال می‌شه.

هم‌زمان، گوگل مدل سبک‌تر و سریع‌تر جمینی ۲.۵ فلش رو هم برای همه‌ی کاربرا توی اپ جمینی فعال کرده. قراره این مدل که بهینه‌تر و مقرون‌به‌صرفه‌تره، به‌زودی با یه‌سری بهبود جدید از طریق Google AI Studio به شکل گسترده‌تر عرضه بشه.

@aipulse24
10👍1
This media is not supported in your browser
VIEW IN TELEGRAM
پروژه‌ی «Astra» قبلاً هم می‌تونست از دوربین گوشی برای دیدن اشیای اطراف استفاده کنه، اما حالا تو نسخه‌ی جدیدش، این مدل می‌تونه حتی بدون اینکه مستقیم ازش چیزی بخواین، بعضی کارها رو به‌جای شما انجام بده.

توی ویدیوی بالا ببینید که چطوری با بهره گرفتن از منابع متعدد به کاربر کمک میکنه تا دوچرخه‌ش رو تعمیر کنه.

@aipulse24
👍96
This media is not supported in your browser
VIEW IN TELEGRAM
گوگل داره دستیار هوش مصنوعیش رو مستقیماً به مرورگر کروم اضافه می‌کنه. از ۲۱ مه، کاربرای پلن‌های Pro و Ultra می‌تونن با زدن دکمه‌ی Gemini توی کروم، ازش بخوان محتوای صفحات وب رو براشون خلاصه یا شفاف‌سازی کنه، یا حتی به‌جاشون تو سایت‌ها بچرخه.

فعلاً این قابلیت فقط با دو تب به‌طور هم‌زمان کار می‌کنه، ولی گوگل گفته که قراره تا آخر امسال پشتیبانی از تب‌های بیشتر رو هم بهش اضافه کنه.

@aipulse24
10🔥6
گوگل در ادامه از یه ابزار جدید به اسم «Stitch» رونمایی کرده؛ ابزاری مبتنی بر هوش مصنوعی که می‌تونه با استفاده از یه توضیح ساده و انتخاب یه تم، رابط کاربری تولید کنه.

کاربرا می‌تونن برای هدایت بهتر خروجی Stitch از وایرفریم‌ها، اسکچ‌ها و حتی اسکرین‌شات‌هایی از رابط‌های دیگه استفاده کنن. این ابزار فعلاً به‌صورت آزمایشی از طریق Google Labs در دسترسه.

stitch.withgoogle.com

@aipulse24
15
This media is not supported in your browser
VIEW IN TELEGRAM
گوگل میت یه قابلیت جدید اضافه کرده که می‌تونه حرف‌های شما رو تقریباً به‌صورت لحظه‌ای به زبون ترجیحی طرف مقابل ترجمه کنه.

فعلاً این قابلیت فقط از زبان‌های انگلیسی و اسپانیایی پشتیبانی می‌کنه و به‌صورت بتا برای مشترکای پلن‌های Google AI Pro و Ultra فعال شده.

@aipulse24
🔥181👍1