شبکه داستانی عصبی
چند ماه اخیرم به روایت تصویر و موسیقی... https://www.youtube.com/watch?v=WT-A76SgrA0
ولی انصافا دمشون گرم. خیییییییلی قطعاتش تکنیکهای وحشتناکی داره!!!! 😱😱😱
👍1
من هدفونم خراب شده و باید هدفون بلوتوثی بگیرم
و خب میخوام یه جوری باشه که گم و گور نشه و قیمتش هم منطقی باشه
کسی پیشنهادی داره؟
و خب میخوام یه جوری باشه که گم و گور نشه و قیمتش هم منطقی باشه
کسی پیشنهادی داره؟
من هر دفعه که میخواستم یه چیزی رو شیر کنم توی گوگل میت، با دو تا اکانت میومدم. یکی برای گوشی که بهش هدفون وصل بشه. یکی دیگه هم با لپ تاپ جوین میشدم که باهاش بتونم اسکرین شیر کنم یا چت رو راحتتر ببینم.
الان دیدم این قابلیت رو اضافه کرده که وقتی داری وارد میشی میتونی ازش استفاده کنی.
https://support.google.com/meet/answer/11295884
الان دیدم این قابلیت رو اضافه کرده که وقتی داری وارد میشی میتونی ازش استفاده کنی.
https://support.google.com/meet/answer/11295884
https://fuckinghomepage.com/
Fucking Homepage is regularly updated with weird, interesting, useful facts and websites.
Fucking Homepage is regularly updated with weird, interesting, useful facts and websites.
پش. مام.
این یه مدل ترکیبی عه که «عکس» رو به «آهنگ» تبدیل میکنه! یکی دو بار دیگه این جمله رو بخونید تا بفهمید چرا پشمام! 😅
https://huggingface.co/spaces/fffiloni/img-to-music
این یه مدل ترکیبی عه که «عکس» رو به «آهنگ» تبدیل میکنه! یکی دو بار دیگه این جمله رو بخونید تا بفهمید چرا پشمام! 😅
https://huggingface.co/spaces/fffiloni/img-to-music
huggingface.co
Img To Music - a Hugging Face Space by fffiloni
Discover amazing ML apps made by the community
شبکه داستانی عصبی
پش. مام. این یه مدل ترکیبی عه که «عکس» رو به «آهنگ» تبدیل میکنه! یکی دو بار دیگه این جمله رو بخونید تا بفهمید چرا پشمام! 😅 https://huggingface.co/spaces/fffiloni/img-to-music
حجم پردازش خیلی زیاده و چون از سرور رایگان داره استفاده میکنه روی عکس با کیفیت یا حجم زیاد به مشکل میخوره
شبکه داستانی عصبی
پش. مام. این یه مدل ترکیبی عه که «عکس» رو به «آهنگ» تبدیل میکنه! یکی دو بار دیگه این جمله رو بخونید تا بفهمید چرا پشمام! 😅 https://huggingface.co/spaces/fffiloni/img-to-music
خب
اندکی راجع به اینکه چجوری کار میکنه:
اول عکس به یه مدل CLIP Interrogator داده میشه که برعکس کار مدلهای clip رو میکنه؛ یعنی بر اساس عکس براش کپشن مینویسه. البته این خیلی تسک قدیمیتریه به اسم image captioning که چیز جدیدی نیست.
مثلا این خروجی اون مدل برای عکس ققنوسیه که درست کردم. این متن رو من ندادم. متن دیگهای دادم. ولی این مدل این رو در توضیحش نوشته:
a fire bird flying through the air, a detailed painting, Artstation contest winner, fantasy art, full body portrait of jean grey, 3 d icon for mobile game, 1128x191 resolution, fire texture, tall female angel, dota 2 game screenshot, medibang, benevolent android necromancer
بعد خروجی متن داده میشه به یه مدل دیگه یه اسم Mubert که البته یه شرکته و متن رو میگیره و آهنگ تحویل میده
اندکی راجع به اینکه چجوری کار میکنه:
اول عکس به یه مدل CLIP Interrogator داده میشه که برعکس کار مدلهای clip رو میکنه؛ یعنی بر اساس عکس براش کپشن مینویسه. البته این خیلی تسک قدیمیتریه به اسم image captioning که چیز جدیدی نیست.
مثلا این خروجی اون مدل برای عکس ققنوسیه که درست کردم. این متن رو من ندادم. متن دیگهای دادم. ولی این مدل این رو در توضیحش نوشته:
a fire bird flying through the air, a detailed painting, Artstation contest winner, fantasy art, full body portrait of jean grey, 3 d icon for mobile game, 1128x191 resolution, fire texture, tall female angel, dota 2 game screenshot, medibang, benevolent android necromancer
بعد خروجی متن داده میشه به یه مدل دیگه یه اسم Mubert که البته یه شرکته و متن رو میگیره و آهنگ تحویل میده