AI Pulse – Telegram
AI Pulse
3.76K subscribers
396 photos
137 videos
5 files
138 links
اخبار، اموزش و معرفی ابزارهای هوش مصنوعی
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
همونطور که میدونید تصاویری که با جمنای تولید میشن دارای یک واترمارک نامرئی به نام SynthID هستن که تقریبا غیر قابل حذفه.

از امروز میتونید وقتی شک داشتید که عکسی واقعیه یا با هوش مصنوعی تولید شده، اون رو برای جمنای بفرستید و ازش بپرسید که آیا این عکس تولید شده توسط هوش مصنوعی هست یا خیر، جمنای این واترمارک رو تشخیص میده و نتیجه رو به شما اعلام میکنه.

@aipulse24
👍302
This media is not supported in your browser
VIEW IN TELEGRAM
مدل Nano Banana Pro به ابراز NotebookLM هم اضافه شده و حالا میتونه اینفوگرافیک مرتبط با منابعی که آپلود کردید براتون تولید کنه.

@aipulse24
16👍3🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
مدل جدید Nano Banana Pro به گوگل اسلایدز هم رسیده و الان میتونید ازش بخواید تا اسلاید هاتون رو زیباتر کنه و حتی براتون اسلاید های جدید بسازه.

@aipulse24
12👍4🔥1
AI Pulse
Photo
تصویر ساخته شده توسط یکی از اعضای کانال.
تکست رندرینگ و consistency مدل شگفت انگیزه.

@aipulse24
24🔥13🤯8👍3
بلک فارست لبز به تازگی از خانواده جدید مدل‌های تصویرساز خودش یعنی Flux 2 رونمایی کرده که پیشرفت‌های چشمگیری نسبت به نسل قبل داشته.

این مدل‌های جدید می‌تونن تصاویری با رزولوشن بالا تا ۴ مگاپیکسل تولید کنن، اما مهم‌ترین ویژگی‌شون سیستم Multi-reference هست؛ یعنی کاربر می‌تونه تا ۱۰ تصویر رو همزمان به مدل بده تا کاراکترها، محصولات یا استایل بصری توی تمام خروجی‌ها کاملاً یکدست و ثابت بمونه.

علاوه بر این، موتور رندر متن هم بازسازی شده تا تایپوگرافی، اینفوگرافیک‌ها و طراحی‌های رابط کاربری (UI) رو خیلی دقیق‌تر و تمیزتر از قبل دربیاره.

از نظر معماری فنی، فلاکس ۲ از یک ساختار هیبریدی استفاده می‌کنه که شامل مدل بینایی-زبانی "Mistral-3 24B" برای فهم دقیق متن و تصویر و یک ماژول "Rectified Flow Transformer" برای مدیریت منطق و چیدمان تصویره. این ترکیب باعث میشه جزئیات و متریال‌ها خیلی دقیق‌تر ظاهر بشن.

این خانواده شامل چهار نسخه مختلفه: نسخه Flux 2 [pro] که قوی‌ترین مدل برای رقابت با سیستم‌های بسته است و فقط از طریق API در دسترسه، و نسخه Flux 2 [flex] که برای توسعه‌دهنده‌ها طراحی شده تا بتونن سرعت و کیفیت رو خودشون تنظیم کنن.

نسخه محبوب‌تر برای جامعه متن‌باز، Flux 2 [dev] هست؛ یک مدل ۳۲ میلیارد پارامتری که وزن‌های اون (Weights) روی Hugging Face منتشر شده. این مدل تولید تصویر و ویرایش رو یکجا انجام میده و نسخه بهینه‌شده‌ش (fp8) حتی روی کارت‌های گرافیک مصرفی مثل سری RTX انویدیا هم به خوبی اجرا میشه (البته استفاده تجاری ازش نیاز به لایسنس داره).

در نهایت نسخه Flux 2 [klein] هم معرفی شده که یک مدل فشرده و کوچک‌تره و قراره به زودی تحت لایسنس کاملاً متن‌باز Apache 2.0 منتشر بشه تا با مدل‌های هم‌رده خودش رقابت کنه.

@aipulse24
21🔥7👍2😁1
گوگل به‌تازگی از یک مرورگر آزمایشی و متفاوت به نام «دیسکو» (Disco) رونمایی کرده که قرار نیست جایگزین کروم بشه، بلکه قراره نحوه تعامل ما با وب رو از طریق هوش مصنوعی متحول کنه.

این پروژه که از دل یکی از هکاتون‌های داخلی گوگل بیرون اومده، حول محور ایده‌ای به نام GenTabs می‌چرخه؛ قابلیتی که به جای ارائه لیست ساده‌ای از لینک‌ها یا متن، بر اساس درخواست کاربر یک مینی‌اپلیکیشن سفارشی و تعاملی می‌سازه. مثلاً اگه ازش برای برنامه‌ریزی سفر کمک بخواین، یه رابط کاربری کامل شامل نقشه، زمان‌بندی و لیست جاذبه‌ها براتون طراحی می‌کنه که کاملاً شخصی‌سازی شده باشه.

فناوری اصلی پشت دیسکو، مدل هوش مصنوعی Gemini 3 هست که توانایی ساخت رابط‌های کاربری لحظه‌ای رو داره. وقتی کاربر یک «پروژه» جدید ایجاد می‌کنه و درخواستی رو تایپ می‌کنه، دیسکو همزمان هم تب‌های مرتبط رو باز می‌کنه و هم یک GenTab می‌سازه که اطلاعات رو به شکل تعاملی نمایش میده. نکته کلیدی اینجاست که این سیستم یک‌طرفه نیست؛ یعنی اگه کاربر خودش تب‌های جدیدی باز کنه و اطلاعات بیشتری به پروژه اضافه کنه، GenTab به‌صورت هوشمند آپدیت میشه و اون داده‌های جدید رو هم در برنامه نهایی بگنجونه تا نتیجه کار دقیق‌تر و کامل‌تر باشه.

تیم توسعه‌دهنده دیسکو تأکید داره که هدف این مرورگر حذف وب‌گردی نیست، بلکه برعکس، تلاش می‌کنه کاربر رو به باز کردن سایت‌ها و بررسی منابع تشویق کنه تا هوش مصنوعی بتونه بر اساس اون‌ها محتوا بسازه. هنوز مشخص نیست که آیا دیسکو و قابلیت‌های GenTabs در آینده به عنوان یک محصول مستقل باقی می‌مونن یا به بخشی از کروم و سرویس‌های گوگل ورک‌اسپیس تبدیل میشن، اما این آزمایش نشون میده که گوگل به دنبال ترکیب کردن مفهوم مرورگر وب با ابزارهای تولید محتواست تا مرز بین جستجو و خلق کردن رو کمرنگ کنه.

@aipulse24
🔥248
This media is not supported in your browser
VIEW IN TELEGRAM
کافیه 🎁 رو توی یک چت جدید توی ChatGPT وارد کنید (بدون هیچ متنی) تا به صورت اتوماتیک بعد از اپلود یه عکس براتون یک کلیپ کوتاه تولید کنه که به پیام هایی که با ChatGPT توی این یک سال ردو بدل کردید مربوطه

(البته اگر قابلیت Memory رو توی ChatGPT فعال کرده باشید)

کلیپ های تولیدی تون رو با ما توی کامنت ها به اشتراک بگذارید 😊

(کانال هایی که کپی میکنید توروقران کلیپ خودتون رو حداقل روش بگذارید این واسه خودمه با تشکر از بی وجدانی شما غیر بزرگواران)

ضمیمه به همون غیر بزرگواران:
میدونم ۲ ساعت دیگه همه جا پر میشه ولی مهم اونی که زودتر زده

@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
🎄17😁72👎1🆒1