https://fuckinghomepage.com/
Fucking Homepage is regularly updated with weird, interesting, useful facts and websites.
Fucking Homepage is regularly updated with weird, interesting, useful facts and websites.
پش. مام.
این یه مدل ترکیبی عه که «عکس» رو به «آهنگ» تبدیل میکنه! یکی دو بار دیگه این جمله رو بخونید تا بفهمید چرا پشمام! 😅
https://huggingface.co/spaces/fffiloni/img-to-music
این یه مدل ترکیبی عه که «عکس» رو به «آهنگ» تبدیل میکنه! یکی دو بار دیگه این جمله رو بخونید تا بفهمید چرا پشمام! 😅
https://huggingface.co/spaces/fffiloni/img-to-music
huggingface.co
Img To Music - a Hugging Face Space by fffiloni
Discover amazing ML apps made by the community
شبکه داستانی عصبی
پش. مام. این یه مدل ترکیبی عه که «عکس» رو به «آهنگ» تبدیل میکنه! یکی دو بار دیگه این جمله رو بخونید تا بفهمید چرا پشمام! 😅 https://huggingface.co/spaces/fffiloni/img-to-music
حجم پردازش خیلی زیاده و چون از سرور رایگان داره استفاده میکنه روی عکس با کیفیت یا حجم زیاد به مشکل میخوره
شبکه داستانی عصبی
پش. مام. این یه مدل ترکیبی عه که «عکس» رو به «آهنگ» تبدیل میکنه! یکی دو بار دیگه این جمله رو بخونید تا بفهمید چرا پشمام! 😅 https://huggingface.co/spaces/fffiloni/img-to-music
خب
اندکی راجع به اینکه چجوری کار میکنه:
اول عکس به یه مدل CLIP Interrogator داده میشه که برعکس کار مدلهای clip رو میکنه؛ یعنی بر اساس عکس براش کپشن مینویسه. البته این خیلی تسک قدیمیتریه به اسم image captioning که چیز جدیدی نیست.
مثلا این خروجی اون مدل برای عکس ققنوسیه که درست کردم. این متن رو من ندادم. متن دیگهای دادم. ولی این مدل این رو در توضیحش نوشته:
a fire bird flying through the air, a detailed painting, Artstation contest winner, fantasy art, full body portrait of jean grey, 3 d icon for mobile game, 1128x191 resolution, fire texture, tall female angel, dota 2 game screenshot, medibang, benevolent android necromancer
بعد خروجی متن داده میشه به یه مدل دیگه یه اسم Mubert که البته یه شرکته و متن رو میگیره و آهنگ تحویل میده
اندکی راجع به اینکه چجوری کار میکنه:
اول عکس به یه مدل CLIP Interrogator داده میشه که برعکس کار مدلهای clip رو میکنه؛ یعنی بر اساس عکس براش کپشن مینویسه. البته این خیلی تسک قدیمیتریه به اسم image captioning که چیز جدیدی نیست.
مثلا این خروجی اون مدل برای عکس ققنوسیه که درست کردم. این متن رو من ندادم. متن دیگهای دادم. ولی این مدل این رو در توضیحش نوشته:
a fire bird flying through the air, a detailed painting, Artstation contest winner, fantasy art, full body portrait of jean grey, 3 d icon for mobile game, 1128x191 resolution, fire texture, tall female angel, dota 2 game screenshot, medibang, benevolent android necromancer
بعد خروجی متن داده میشه به یه مدل دیگه یه اسم Mubert که البته یه شرکته و متن رو میگیره و آهنگ تحویل میده
شبکه داستانی عصبی
خب اندکی راجع به اینکه چجوری کار میکنه: اول عکس به یه مدل CLIP Interrogator داده میشه که برعکس کار مدلهای clip رو میکنه؛ یعنی بر اساس عکس براش کپشن مینویسه. البته این خیلی تسک قدیمیتریه به اسم image captioning که چیز جدیدی نیست. مثلا این خروجی اون مدل…
پش. مام. ۲!!!!
این متنی که از رو عکسم درست کرده رو مجدد دادم به مدل stablediffusion و این نتایجه:
این متنی که از رو عکسم درست کرده رو مجدد دادم به مدل stablediffusion و این نتایجه:
من عاجزانه از علی خواهشمندم بره بخوابه و اینا رو بذاره برای فردا 🚶🚶🚶
پس شب بخیر
پس شب بخیر
😁8
Forwarded from Blue Phoenix