دیروز معرفی شد:
بعد از مدلهایی که با متن عکس درست میکنند حالا مدلهایی که با متن صدا درست میکنن!!
We present “AudioGen: Textually Guided Audio Generation”!
AudioGen is an autoregressive transformer LM that synthesizes general audio conditioned on text (Text-to-Audio).
https://twitter.com/FelixKreuk/status/1575846953333579776?t=nxspRrlWnoQ4BKKIr04dGQ&s=19
بعد از مدلهایی که با متن عکس درست میکنند حالا مدلهایی که با متن صدا درست میکنن!!
We present “AudioGen: Textually Guided Audio Generation”!
AudioGen is an autoregressive transformer LM that synthesizes general audio conditioned on text (Text-to-Audio).
https://twitter.com/FelixKreuk/status/1575846953333579776?t=nxspRrlWnoQ4BKKIr04dGQ&s=19
Twitter
We present “AudioGen: Textually Guided Audio Generation”!
AudioGen is an autoregressive transformer LM that synthesizes general audio conditioned on text (Text-to-Audio).
📖 Paper: https://t.co/XKctRaShN1
🎵 Samples: https://t.co/e7vWmOUfva
💻 Code & models…
AudioGen is an autoregressive transformer LM that synthesizes general audio conditioned on text (Text-to-Audio).
📖 Paper: https://t.co/XKctRaShN1
🎵 Samples: https://t.co/e7vWmOUfva
💻 Code & models…
و همچنین رقیب جدید و جدی Copilot که میگفتی چی میخوای برات برنامه اش رو مینوشت، خودش هم به شکل اپن سورس:
The Gradio Demo for CodeGeeX, a large-scale multilingual code generation model with 13 billion parameters, pre-trained on a large code corpus of more than 20 programming languages is now on huggingface Spaces
https://twitter.com/_akhaliq/status/1575925494754996225?t=YkmxjDtTynKESIJlzjUR_Q&s=19
The Gradio Demo for CodeGeeX, a large-scale multilingual code generation model with 13 billion parameters, pre-trained on a large code corpus of more than 20 programming languages is now on huggingface Spaces
https://twitter.com/_akhaliq/status/1575925494754996225?t=YkmxjDtTynKESIJlzjUR_Q&s=19
Twitter
The @Gradio Demo for CodeGeeX, a large-scale multilingual code generation model with 13 billion parameters, pre-trained on a large code corpus of more than 20 programming languages is now on @huggingface Spaces
demo: https://t.co/wzPItu8T40
demo: https://t.co/wzPItu8T40
یه مقاله جالب جدید در زمینهی به مرحله کارکرد بردن مدلهای یادگیری ماشین که بررسی خیلی جالبی داشته و دستهبندی کرده و یه سری پترن و آنتی پترن درآورده:
Another really interesting paper on MLOPs. It's great to get insights into how some companies deploy machine learning systems today.
https://twitter.com/omarsar0/status/1575884962653405184?t=SzQFA69hJ_-FZWrg2Iu7jA&s=19
Another really interesting paper on MLOPs. It's great to get insights into how some companies deploy machine learning systems today.
https://twitter.com/omarsar0/status/1575884962653405184?t=SzQFA69hJ_-FZWrg2Iu7jA&s=19
شبکه داستانی عصبی
«برای» شروین
This media is not supported in your browser
VIEW IN TELEGRAM
برای اینکه ویدیوش رو هم هی ببینم
❤6
امروز تسلا، همون شرکته که مال ایلان ماسکه و ماشین خودران و اینا میساخت، اولین پروتوتایپ از ربات انساننمای آپیتموس رو رونمایی کرد
https://twitter.com/_brohrer_/status/1576368293719736320?t=HifVdkYRqYA4s2CNrNj6cw&s=19
https://twitter.com/_brohrer_/status/1576368293719736320?t=HifVdkYRqYA4s2CNrNj6cw&s=19
شبکه داستانی عصبی
امروز تسلا، همون شرکته که مال ایلان ماسکه و ماشین خودران و اینا میساخت، اولین پروتوتایپ از ربات انساننمای آپیتموس رو رونمایی کرد https://twitter.com/_brohrer_/status/1576368293719736320?t=HifVdkYRqYA4s2CNrNj6cw&s=19
و نکته اینجاست که این نسخه یک رو توی شش ماه ساختند!!!
https://twitter.com/ElectrekCo/status/1576019791193657344?t=S0ubxT0eoFRwgShglbsMzQ&s=19
https://twitter.com/ElectrekCo/status/1576019791193657344?t=S0ubxT0eoFRwgShglbsMzQ&s=19
This media is not supported in your browser
VIEW IN TELEGRAM
Baraye” by Shervin english translation performed by oiammusic
https://twitter.com/Erfanmusic/status/1577009999162638336?t=4lCpOsIIsgDySJ_1oMy2og&s=19
https://twitter.com/Erfanmusic/status/1577009999162638336?t=4lCpOsIIsgDySJ_1oMy2og&s=19
❤1😢1
Zan Zendegi Azadi
Madgal (latest release)
https://open.spotify.com/track/5np5OHfRLuktQfhlKbPgTQ?si=4NJiujZbQIivwD4gynzSaQ&utm_source=native-share-menu
Madgal (latest release)
https://open.spotify.com/track/5np5OHfRLuktQfhlKbPgTQ?si=4NJiujZbQIivwD4gynzSaQ&utm_source=native-share-menu
Spotify
Zan Zendegi Azadi
Madgal · Song · 2022
👍1
حدود یک ماه و نیم پیش، مجموعه openai یه چیز جدیدی به dalle2 (همون اولین مدل خفن تبدیل متن به عکس) اضافه کرد به اسم Outpainting که این امکان رو میداد که یه عکس به عنوان شروع بدی و اطرافش رو بکشی و پر کنی. این پستشه:
https://openai.com/blog/dall-e-introducing-outpainting/
مدل dalle2 یک مدل تجاری بود اما یکی از مدلهای اپن سورس (که همه به کدش و خودش دسترسی دارند) که کمی بعدتر ارائه شد stablediffusion بود. این مدل هم اخیرا نسخهای مشابه outpainting داد به اسم infinity که کدش رو اینجا میشه دید:
https://github.com/lkwq007/stablediffusion-infinity
اما چیز جالب این دمو عه:
https://huggingface.co/spaces/lnyan/stablediffusion-infinity
توی این دمو میتونید عکستون رو آپلود کنید؛ بعد یه متن بنویسید و بخشهای مختلفش رو گسترش بدید و بکشید.
https://openai.com/blog/dall-e-introducing-outpainting/
مدل dalle2 یک مدل تجاری بود اما یکی از مدلهای اپن سورس (که همه به کدش و خودش دسترسی دارند) که کمی بعدتر ارائه شد stablediffusion بود. این مدل هم اخیرا نسخهای مشابه outpainting داد به اسم infinity که کدش رو اینجا میشه دید:
https://github.com/lkwq007/stablediffusion-infinity
اما چیز جالب این دمو عه:
https://huggingface.co/spaces/lnyan/stablediffusion-infinity
توی این دمو میتونید عکستون رو آپلود کنید؛ بعد یه متن بنویسید و بخشهای مختلفش رو گسترش بدید و بکشید.
شبکه داستانی عصبی
حدود یک ماه و نیم پیش، مجموعه openai یه چیز جدیدی به dalle2 (همون اولین مدل خفن تبدیل متن به عکس) اضافه کرد به اسم Outpainting که این امکان رو میداد که یه عکس به عنوان شروع بدی و اطرافش رو بکشی و پر کنی. این پستشه: https://openai.com/blog/dall-e-introducing…
این دو تا رو الان سعی کردم بکشم با مضامین این روزها. البته که خیلی کار و حوصلهی بیشتری میخواد که چیزهای بهتری بشه ازش به دست آورد. این همون جاییه که «مهندسی متن ورودی» یا Prompt engineering مطرح میشه؛ به این معنا که ما متن ورودی رو دقیقا چی بدیم که بشه نتایج خوبی گرفت.
👍2