Tensorflow(@CVision) – Telegram
Tensorflow(@CVision)
15.3K subscribers
1.29K photos
310 videos
81 files
2.53K links
اخبار حوزه یادگیری عمیق و هوش مصنوعی
مقالات و یافته های جدید یادگیری عمیق
بینایی ماشین و پردازش تصویر

TensorFlow, Keras, Deep Learning, Computer Vision

سایت:
http://class.vision

👨‍💻👩‍💻پشتیبان دوره ها:
@classvision_support

لینک گروه:
@tf2keras
Download Telegram
Forwarded from Shenasa-ai.ir
استودیو بات؛ با هوش مصنوعی کد بنویسید و اپلیکیشن اندرویدی بسازید

گوگل ابزار جدیدی به نام استودیو بات دارد که مبتنی‌بر هوش مصنوعی است و به توسعه‌دهندگان برای کدنویسی کمک می‌کند.

گوگل باتِ کدنویسی جدیدی بر پایه‌ی هوش مصنوعی برای توسعه‌دهندگان اندروید معرفی کرده است که Studio Bot نام دارد. استودیو بات گوگل ازطریق تولید کد، رفع خطاها و پاسخ به سؤالاتی درباره‌ی اندروید، به توسعه‌دهندگان برای ساخت اپلیکیشن کمک می‌کند.

به گفته‌ی گوگل، بات جدید بر پایه‌ی مدل کدنویسی بنیادین Codey تولید شده. خود Codey نسخه‌ی ویژه‌ای از مدل زبانی PaLM 2 محسوب می‌شود که به‌طور ویژه برای کدنویسی بهینه شده است. Studio Bot از زبان‌های برنامه‌نویسی Kotlin و Java پشتیبانی می‌کند.

گوگل می‌گوید نسخه‌ی پیش‌نمایش Codey ازطریق سرویس گوگل کلاد قابل‌دسترس است. Codey مدلی بهینه‌شده برای برنامه‌نویسی است که امکان تعلیم‌دادن آن بر اساس پایگاه کد (کدبیس) اختصاصی خودتان وجود دارد.

————————-
مجموعه دانش بنیان شناسا ( داده پویان آلما):
http://shenasa.ai
http://shenasa-ai.ir
@shenasa_ai
👍9
Forwarded from Tensorflow(@CVision) (Alireza Akhavan)
دوره‌ی آموزشی آنلاین Graph Neural Network
https://class.vision/product/graph-neural-network/
Tensorflow(@CVision)
دوره‌ی آموزشی آنلاین Graph Neural Network https://class.vision/product/graph-neural-network/
تعدادی از دوستان به پشتیبانی گفته بودند با توجه به اینکه یاداوری نشده؛ از کد استفاده نکرده اند.
این کد تخفیف تا سه شنبه فعال خواهد بود:
gnn_lc
🙏4
This media is not supported in your browser
VIEW IN TELEGRAM
No Code 🙅‍♂️👨‍💻 Computer Vision platform by Google

Use a live camera and ML models to create effects like face stickers.
Import custom ML models and compare side-by-side results.
Use Visual Blocks in Colab and create nodes for custom Python code.

https://visualblocks.withgoogle.com/
https://github.com/google/visualblocks
👍5
Forwarded from School of AI
پروژه Open Assistant یک چت‌بات مکالمه‌ای اوپن‌سورس است که توسط شرکت LAION (سازنده‌ی Stable Diffusion) معرفی شده. این چت‌بات:

- توانایی بازیابی اطلاعات را دارد
- میتواند از طریق api به سیستم‌های دیگر متصل شود و با آن‌ها تعامل کند
- مبتنی بر چند LLM اوپن‌سورس است
- از Reinforcement Learning with Hindsight Feedback استفاده می‌کند
- کاملا رایگان است
- کاملا اوپن‌سورس است و می‌تواند برای کابرد خاص شما fine-tune شود

https://open-assistant.io/
👍121
This media is not supported in your browser
VIEW IN TELEGRAM
SoundStorm: Efficient Parallel Audio Generation

SoundStorm generates 30 seconds of audio in 0.5 seconds on a TPU-v4.
Demonstrate the ability of model to scale audio generation to longer sequences by synthesizing high-quality, natural dialogue segments, given a trannoscript annotated with speaker turns and a short prompt with the speakers' voices

https://huggingface.co/papers/2305.09636

project page:
https://google-research.github.io/seanet/soundstorm/examples/
👌3
Scikit-LLM is a scikit-learn compatible wrapper around OpenAI API, which allows to build ChatGPT-based text classification models

GitHub: https://github.com/iryna-kondr/scikit-llm
Blog Post: https://medium.com/@iryna230520/scikit-llm-nlp-with-chatgpt-in-scikit-learn-733b92ab74b1
👍10👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold
https://huggingface.co/papers/2305.10973

#gan
👍3
Tensorflow(@CVision)
دوره‌ی آموزشی آنلاین Graph Neural Network https://class.vision/product/graph-neural-network/
دوستان بزرگواری که در دوره ی شبکه های عصب گرافی ثبت نام کرده اند اما هنوز در گروه تلگرامی مروبط به دوره عضو نشده اند لطفا حتما به پشتیبانی دوره پیام بدهند:
@classvision_support
2👍2
خبر جعلی انفجار، بازار سهام آمریکا را تکان داد!

اومدن یه فیلم با استفاده از مدل‌های هوش مصنوعی تولید کردند که یه انفجار بزرگ رو در نزدیکی پنتاگون نمایش میده، معامله‌گرها هم ترسیدن و شروع کردن به فروختن سهام‌شون و بورس آمریکا به اصطلاح ریخته!

بعد که خبر بیشتر تو فضای مجازی پیچیده، پنتاگون اعلام کرده ویدئو جعلیه و در نزدیکی وزارت دفاع آمریکا هیچ انفجاری رخ نداده!

دوباره معامله‌گرها هم پوزیشن باز کردن؛ خلاصه یه ویدئوی جعلی با استفاده از مدل‌های هوش مصنوعی، تونسته تمام بازارشون رو به هم بریزه!

به نظر کسی که این اتفاق رو رقم زده آدم خلاقی بوده، قیمت رو آورده پایین و خرید زده! البته قدرت رسانه‌ای خوبی هم داشته که تونسته اتفاق به این بزرگی رو رقم بزنه!

🙏Thanks to: @Ai_Events
👏24👍6🔥4👎3😁31👌1
MMS: Massively Multilingual Speech.
- Can do speech2text and text speech in 1100 languages.
- Can recognize 4000 spoken languages.
- Code and models available under the CC-BY-NC 4.0 license.
- half the word error rate of Whisper.

Code+Models:
https://github.com/facebookresearch/fairseq/tree/main/examples/mms

Paper | Blog

منبع
👍4
Papers that extend your horizon and sharpen your cognitive abilities.

1- Stable Diffusion
is a deep learning, text-to-image model mainly designed to fabricate intricate images based on text inputs, with potential usage in other tasks like text-guided image-to-image conversions.
https://github.com/CompVis/stable-diffusion

2- Composed of standard ConvNet modules, ConvNeXts competes favorably with Transformers in accuracy and scalability, achieving ImageNet top-1 accuracy and surpassing Transformers, while retaining the simplicity and efficiency of standard ConvNets.
https://github.com/facebookresearch/ConvNeXt

3- In NLP, DNNs frequently fall prey to backdoors during the fine-tuning process of large-scale Pre-trained Language Model (PLM) with corrupted samples. The solution lies in leveraging the pre-trained (unfine-tuned) weights to neutralize backdoors in fine-tuned language models.
https://arxiv.org/pdf/2210.09545v1.pdf

4- Make-A-Video introduces an avant-garde text-to-video model capable of creating videos derived from a text prompt.
https://arxiv.org/abs/2209.14792

5- PaddleOCR's mission is to build multilingual, superior, leading, and practical OCR tools that empower users to train better models and put them into application.
https://github.com/PaddlePaddle/PaddleOCR

6- Gato, a versatile agent, operates as a multi-modal, multi-task, multi-embodiment generalist policy; its capabilities span from playing Atari to conversing and stacking blocks with a real robot arm.
https://arxiv.org/abs/2205.06175v3

7- Meta AI Unveils an expansive translation model (NLLB-200), proficient in translating between 200 languages.
https://arxiv.org/abs/2207.04672v3
👍6