AI Pulse – Telegram
AI Pulse
3.73K subscribers
397 photos
137 videos
5 files
138 links
اخبار، اموزش و معرفی ابزارهای هوش مصنوعی
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
از امروز میتونید گزارش هایی که با قابلیت Deep Research چت جی‌پی‌تی براتون تهیه شده رو به صورت PDF به همراه عکس‌ها، جداول و منابع دانلود کنید.

@aipulse24
🔥256👍6😁2
حالا که صحبت از جایگزینی هوش مصنوعی با ادم ها بالا گرفته سوال اینه:

عملکرد ایجنت ها به عنوان یک کارمند مستقل توی یک فضای کاری واقعی چطوره؟ 🤔

آیا واقعا میتونیم کل یه شرکت رو با یه سری ایجنت مدیریت کنیم؟!🤔

یه گروه از محققای دانشگاه CMU امریکا یک بنچ مارک جدید ساختن که کارش بررسی عملکرد ایجنت ها توی فضای غیر ازمایشگاهی و کنترل شده است. عنوان این بنچ مارک TheAgentCompany هست.

✔️منظور از این شرکت چیه؟

یک شرکت توسعه نرم افزار فیک تعریف کردن. توی این شرکت برای کارهای توسعه نرم افزار از GitLab، برای نگهداری مدارک و فایل ها از ownCloud، برای ارتباط درون سازمانی از اپ RocketChat و برای مدیریت پروژه از نرم افزار Plane استفاده میکنن. این بنچ مارک یه فضای کامل دیجیتال هست با همکارهای فیک، فرایندهای چند مرحله ای و تعاملاتی که انسان ها هر روز سرکار باهم دارن

✔️ روش کار این بنچ مارک به چه صورته؟:

به ایجنت های هوش مصنوعی وظایفی از دپارتمان های مختلف میدی از دپارتمان مهندسی، منابع انسانی گرفته تا مالی و مدیریت پروژه که باید این وظایف رو بدون وجود هیچ انسانی به سرانجام برسونن.


✔️کدوم مدل ها توی این بنچ مارک بررسی شدن؟

درکل ۱۱ تا مدل بررسی شدن از جمله مدل Claude 3.5 ، ChatGPT 4o ، جمنای، مدل نوا آمازون و مدل های اوپن سورس لاما و Qwen.

هرکدوم از این مدل ها رو انداختن توی این فضای شرکتی تقلبی و بهش ۱۷۵ تا تسک دادن تا انجام بده


🤪 بخش جذاب ماجرا🤪

عملکرد مدل ها چطور بوده؟😭😭😭

کلاد که مثلا بهترین عملکرد رو داشته تونسته فقط ۲۴ درصد از کل تسک هارو به سرانجام برسونه.

🥺 مشکل اصلی کجا بوده؟🥺

اینکه مدل های عزیز کلا تو کارشون "بلد نیستم یکی بیاد بگه چیکار کنم" نبوده:))
با اعتماد به نفس کارهارو می پیچوندن و ادعای موفقیت میکردن😂

از جمله سوتی هایی که دادن:

فردی که باید بهش مسیج میداده رو نیافته رفته اسم یکی رو توی سیستم عوض کرده به اون شخص خاص و گفته مسیج دادم

کلا مراحل زیر مجموعه یک تسک بزرگتر رو بیخیال شده و مدعی شده کارو به سرانجام رسونده

از اساس یه سری فایل و داکیومنت رو فیک درست کرده و گفته براساس اینا عمل کردم

وقتی روی صفحه نتی که باهاش کار میکرده یک مسیج pop up اومده به طور کل جیغ زده فرار کرده😂


خلاصه محققان نتیجه گرفتن که هنوز حوزه های زیادی هست که ایجنت ها توانایی انجامشون بدون هدایت و نظارت انسان هارو ندارن، اما تسک های مهندسی نرم افزار جزو گروهی از وظایف بوده که بهترین شکل تونستن به سرانجام برسونن

پس نباید از ایجنت ها انتظار عملکرد plug and play داشت و همسو کردن این ایجنت ها با نیازهای شرکت زمان میبره و نیاز به نظارت انسانی داره

این مقاله رو میتونید اینجا بخونید

@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
3🤣41👍173
شرکت Runway چهارمین دوره از مسابقه Runway Gen 48 رو اپریل برگزار کرد.

برای شرکت در این مسابقه شما ۴۸ ساعت فرصت دارید تا یک فیلم کوتاه با استفاده از هوش مصنوعی بسازید.

توی این تایم (۴۸ ساعت ) به افراد شرکت‌کننده دسترسی به یک اکانت رایگان بی نهایت داده میشه تا باهاش فیلم شون رو بسازن و اینطوری برای شرکت در مسابقه مجبور به پرداخت هزینه ای نباشن.🥺

💰جوایزش هم به این صورت هست:

گرند پری و برگزیده مردمی هرکدوم:

🏆 ۵۰۰۰ دلار نقد + ۱ میلیون کردیت استفاده از runway

بقیه برندگان:

🏆۵۰۰ هزار کردیت ران وی


این ۵ فیلم هرکدوم توی کتگوری های مختلف برنده شدن

اولین فیلم با عنوان Aelita برنده بخش "برگزیده مردمی" شده

ردیف وسط اولین کلیپ از چپ عنوانش هست Clover و برنده بخش "انتخاب داوران" شده

ردیف وسط دومین کلیپ از چپ عنوانش Home هست و برنده بخش "گرند پری" شده

ردیف وسط اولی از راست عنوانش No pressure هست و یکی دیگه از برنده های بخش "انتخاب داوران" هست

اخرین فیلم هم عنوانش هست Eyes on Me هست و یکی دیگه از برندگان "انتخاب داوران" هست.


عزیزان متخصص فیلم و سریال نظرتون چیه؟

کدوم بهتره؟

آیا میشه دراینده نزدیک فیلم کامل با هوش مصنوعی در سطح اکران سینمایی ببینیم؟

@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍165🤯3
استارتاپ Windsurf که به‌خاطر ابزارهای محبوبش برای برنامه‌نویس‌ها شناخته می‌شه، روز پنج‌شنبه از اولین خانواده‌ی مدل‌های هوش مصنوعی اختصاصی خودش به نام SWE-1 رونمایی کرد. این مجموعه شامل سه نسخه‌ی اصلی، لایت و مینی هست که طبق گفته‌ی شرکت، نه فقط برای کدنویسی بلکه برای تمام فرآیند مهندسی نرم‌افزار بهینه‌سازی شدن.

این خبر در حالی منتشر شده که طبق گزارش‌ها، OpenAI به‌تازگی قرارداد خرید ۳ میلیارد دلاری Windsurf رو نهایی کرده. با این حال، عرضه‌ی مدل‌های داخلی توسط Windsurf نشون می‌ده که این استارتاپ داره از صرفاً ساخت اپلیکیشن فراتر می‌ره و به سمت توسعه‌ی مدل‌های پایه‌ی هوش مصنوعی هم حرکت می‌کنه.

مدل اصلی یعنی SWE-1 توی بنچمارک‌های داخلی برنامه‌نویسی، عملکردی نزدیک به مدل‌های مطرحی مثل Claude 3.5 Sonnet، GPT-4.1 و Gemini 2.5 Pro داشته، اما هنوز به پای مدل‌های پیشرویی مثل Claude 3.7 Sonnet نمی‌رسه. نسخه‌های Lite و Mini این مدل برای تمام کاربران (رایگان یا پولی) در دسترسه، اما نسخه‌ی کامل SWE-1 فقط برای کاربران پولی فعاله. با اینکه قیمت‌گذاری رسمی اعلام نشده، Windsurf می‌گه هزینه‌ی اجرای SWE-1 از مدل‌هایی مثل Claude 3.5 کمتره.

‏Windsurf بیشتر به‌خاطر سبکی از کدنویسی به اسم "vibe coding" معروفه؛ مدلی که برنامه‌نویس‌ها می‌تونن از طریق گفتگو با چت‌بات‌ها کدنویسی و ویرایش انجام بدن. تا حالا، بیشتر شرکت‌هایی مثل Windsurf، Cursor و Lovable برای این کار از مدل‌های OpenAI، Anthropic یا گوگل استفاده می‌کردن، اما حالا Windsurf داره تلاش می‌کنه راه خودش رو جدا کنه.

طبق گفته‌ی نیکلاس موی، رئیس بخش تحقیقات Windsurf، مدل‌های پیشتاز الان توی کدنویسی خوبن، ولی برای مهندسی نرم‌افزار کافی نیستن. اون گفته: «کدنویسی، مهندسی نرم‌افزار نیست». به گفته‌ی این شرکت، مدل SWE-1 طوری آموزش دیده که بتونه توی محیط‌های مختلف — مثل ترمینال، IDE و مرورگر — که برنامه‌نویس‌ها به‌طور روزمره باهاش سروکار دارن، عملکرد خوبی نشون بده.

‏Windsurf اعلام کرده که SWE-1 فقط یه طرح اولیه‌س و احتمالاً مدل‌های پیشرفته‌تری هم در آینده منتشر خواهد کرد.

@aipulse24
👍174
خوب خوب نظرسنجی جدید داریم ولی این سری رویکرد و نگاه شما به وضعیت هوش مصنوعی در حال حاضر و در آینده است!
بگید که به نظر شما کدوم یکی از گزینه ها به واقعیت نزدیک تره؟

۱. الان مثبت و آینده هم روشنه! 🙋‍♀
هوش مصنوعی همین الانشم داره دنیا رو متحول می‌کنه!
قراره آینده‌ای بیاد که توش پیشرفت بشر می‌ترکونه.

۲. الان درهمه ولی آینده روشنه! 🔮

فعلاً تاثیر خاصی رو زندگیم نداشته، ولی کلی ذوق دارم ببینم چه کارا می‌تونه بکنه.

۳. الان منفیه ولی آینده روشنه! 😠

درسته که الان گند زده، ولی اگه سفت بگیریمش و قوانین سفت و سخت بزاریم می‌تونه یه دنیای عادلانه‌تر بسازه.


۴. الان مثبت ولی آینده نا معلوم 😔

هوش مصنوعی الان خوبه، ولی باید از نزدیک ببینیم و نظارت کنیم تا آخرش خوب باشه.



۵. الان درهمه آینده هم نامعلومه! 🤷‍♀🤔
نه می‌تونم بگم خوبه، نه بگم بده.
فقط دارم نگاه می‌کنم ببینم چی می‌شه.
(از اونایی که پاپ‌کورن بدسته)


۶. الان منفیه آینده هم نا معلومه😥

فعلاً که فقط داره ضرر می‌زنه و کسی هم براش راه‌حل درست‌درمون نداره.



۷. الان مثبت ولی آینده تاریکه! 😓
الان به درد می‌خوره، ولی باید سریع با قانون‌گذاری جلوی ضررهاشو بگیریم.
(از اونایی که یه دستش رو موسه، یه دستش رو ماشه)


۸. الان درهمه ولی آینده تاریکه 🤨

این چیزایی که می‌گن زیادی بزرگ‌نماییه.
ولی ته دلم حس می‌کنم بوی بیکاری و از بین رفتن حریم خصوصی میاد.


۹. الان منفیه آینده هم فاجعه باره! 👹

این قطار داره مستقیم می‌ره سمت دره.
آخرش یا نابود می‌شیم، یا بدتر!
(از اونایی که با هر آپدیت GPT، وصیت‌نامه‌شون رو آپدیت می‌کنن)


@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8😁32
This media is not supported in your browser
VIEW IN TELEGRAM
گوگل اعلام کرده که از این هفته، تب جدیدی به اسم «AI Mode» رو برای همه‌ی کاربراش توی آمریکا فعال می‌کنه؛ تب جدیدی که به کاربرا اجازه می‌ده با استفاده از چت‌بات Gemini، توی وب جست‌وجو کنن.

گوگل قراره تابستون امسال یه‌سری قابلیت جدید رو توی این حالت آزمایش کنه؛ مثل «جست‌وجوی عمیق» و ساخت نمودار برای سوالات مربوط به اقتصاد و ورزش. امکان خرید از طریق AI Mode هم قراره توی ماه‌های آینده فعال بشه.

@aipulse24
1👍123
گوگل همچنین از نسخه‌ی جدید مدل تولید ویدئوش یعنی Veo 3 رونمایی کرده؛ مدلی که حالا می‌تونه علاوه‌بر ساخت ویدیو، صداهایی مثل افکت صوتی، صدای محیط و حتی دیالوگ رو هم بسازه و با ویدیو همگام کنه.

دمیس هاسابیس، مدیرعامل دیپ‌مایند گفته Veo 3 ما رو از «دوران ویدیوی بی‌صدا» بیرون آورده. کاربرا می‌تونن با یه پرامپت ساده، صحنه و شخصیت‌ها رو توصیف کنن و حتی بگن دیالوگ‌ها چه جوری صدا بده.

گوگل می‌گه یکی از تفاوت‌های اصلی Veo 3 با مدل‌های دیگه، مثل Runway، Pika یا OpenAI، قابلیت تولید و هم‌زمان‌سازی خودکار صدا با تصویر براساس پیکسل‌های خام ویدیوئه. این توانایی می‌تونه برگ برنده‌ای برای گوگل باشه تو بازاری که حالا دیگه حسابی شلوغ شده. با اینکه ابزارهای تولید صدا با هوش مصنوعی قبلاً معرفی شده بودن، Veo 3 با درک عمیق‌تر از تصویر، یه قدم جلوتره.

گفته می‌شه دیپ‌مایند برای ساخت این مدل از پژوهش‌های قبلیش تو زمینه «ویدیو به صدا» استفاده کرده؛ و البته احتمالش زیاده که یوتیوب هم یکی از منابع آموزشی این مدل بوده باشه.

در کنار معرفی Veo 3، گوگل یه‌سری قابلیت جدید هم برای Veo 2 فعال کرده. حالا کاربرا می‌تونن عکس‌هایی از کاراکترها، صحنه‌ها یا سبک بصری بدن تا خروجی ویدیوها یک‌دست‌تر بشه. Veo 2 همچنین حرکات دوربین مثل چرخش یا زوم رو هم بهتر درک می‌کنه و امکان حذف یا اضافه‌کردن اشیا تو ویدیو یا تغییر قاب از پرتره به منظره رو فراهم کرده. این امکانات قراره به‌زودی از طریق پلتفرم Vertex AI گوگل در اختیار توسعه‌دهنده‌ها هم قرار بگیره.

مدل Veo 3 فعلاً فقط برای مشترکای پلن AI Ultra با قیمت ۲۴۹.۹۹ دلار در ماه از طریق چت‌بات Gemini در دسترسه.

@aipulse24
1🤯125🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
گوگل علاوه‌بر به‌روزرسانی مدل‌های هوش مصنوعیش، از یه اپلیکیشن جدید فیلم‌سازی با هوش مصنوعی به اسم «Flow» رونمایی کرده. این ابزار با استفاده از مدل‌های Veo، Imagen و Gemini می‌تونه کلیپ‌های هشت‌ثانیه‌ای بسازه؛ فقط کافیه یه متن یا تصویر بهش بدین.

اپ Flow ابزارهایی برای ساخت صحنه هم داره که به کاربرا اجازه می‌ده این کلیپ‌ها رو به هم وصل کنن و ویدیوهای بلندتری با کمک هوش مصنوعی تولید کنن.

@aipulse24
🔥92
جمنای ۲.۵ پرو حالا یه حالت جدید به اسم «تفکر عمیق» اضافه کرده که برای سوال‌های پیچیده مخصوصاً تو حوزه‌ی ریاضی و برنامه‌نویسی طراحی شده. این حالت آزمایشی می‌تونه قبل از پاسخ دادن، چند تا فرضیه‌ی مختلف رو بررسی کنه. البته فعلاً فقط برای یه تعداد تستر مورد اعتماد فعال می‌شه.

هم‌زمان، گوگل مدل سبک‌تر و سریع‌تر جمینی ۲.۵ فلش رو هم برای همه‌ی کاربرا توی اپ جمینی فعال کرده. قراره این مدل که بهینه‌تر و مقرون‌به‌صرفه‌تره، به‌زودی با یه‌سری بهبود جدید از طریق Google AI Studio به شکل گسترده‌تر عرضه بشه.

@aipulse24
10👍1
This media is not supported in your browser
VIEW IN TELEGRAM
پروژه‌ی «Astra» قبلاً هم می‌تونست از دوربین گوشی برای دیدن اشیای اطراف استفاده کنه، اما حالا تو نسخه‌ی جدیدش، این مدل می‌تونه حتی بدون اینکه مستقیم ازش چیزی بخواین، بعضی کارها رو به‌جای شما انجام بده.

توی ویدیوی بالا ببینید که چطوری با بهره گرفتن از منابع متعدد به کاربر کمک میکنه تا دوچرخه‌ش رو تعمیر کنه.

@aipulse24
👍96
This media is not supported in your browser
VIEW IN TELEGRAM
گوگل داره دستیار هوش مصنوعیش رو مستقیماً به مرورگر کروم اضافه می‌کنه. از ۲۱ مه، کاربرای پلن‌های Pro و Ultra می‌تونن با زدن دکمه‌ی Gemini توی کروم، ازش بخوان محتوای صفحات وب رو براشون خلاصه یا شفاف‌سازی کنه، یا حتی به‌جاشون تو سایت‌ها بچرخه.

فعلاً این قابلیت فقط با دو تب به‌طور هم‌زمان کار می‌کنه، ولی گوگل گفته که قراره تا آخر امسال پشتیبانی از تب‌های بیشتر رو هم بهش اضافه کنه.

@aipulse24
10🔥6