Tensorflow(@CVision) – Telegram
Tensorflow(@CVision)
15.3K subscribers
1.29K photos
310 videos
81 files
2.53K links
اخبار حوزه یادگیری عمیق و هوش مصنوعی
مقالات و یافته های جدید یادگیری عمیق
بینایی ماشین و پردازش تصویر

TensorFlow, Keras, Deep Learning, Computer Vision

سایت:
http://class.vision

👨‍💻👩‍💻پشتیبان دوره ها:
@classvision_support

لینک گروه:
@tf2keras
Download Telegram
Machine Learning life lesson:

Deep learning requires time and effort.🧐


https://twitter.com/tunguz/status/1574016133291642882
👎7👍5
امروز گوگل کتابخونه اوپن سورس TensorStore رو معرفی کرد که هم در پایتون و هم در سی‌پلاس‌پلاس موجوده. این کتابخونه برای ذخیره و انجام عملیات مختلف روی داده‌های n بعدی نوشته شده که مدیریت مجموعه داده‌های بزرگ رو بسیار ساده میکنه. برخی ویژگی‌های این کتابخونه شامل:

•Provides a uniform API for reading and writing multiple array formats, including zarr and N5.
•Natively supports multiple storage systems, including Google Cloud Storage, local and network filesystems, HTTP servers, and in-memory storage.
• Supports read/writeback caching and transactions, with strong atomicity, isolation, consistency, and durability (ACID) guarantees.
• Supports safe, efficient access from multiple processes and machines via optimistic concurrency.
•Offers an asynchronous API to enable high-throughput access even to high-latency remote storage.
•Provides advanced, fully composable indexing operations and virtual views.

گوگل از این کتابخونه در حین آموزش مدل زبانی PaLM هم استفاده کرده. اطلاعات بیشتر رو میتونید از لینک زیر بخونید:

https://ai.googleblog.com/2022/09/tensorstore-for-high-performance.html?m=1
👍10😢2
SpeechCLIP: Integrating Speech with Pre-Trained Vision and Language Model

Data-driven speech processing models usually perform well with a large amount of text supervision, but collecting transcribed speech data is costly. Therefore, we propose SpeechCLIP, a novel framework bridging speech and text through images to enhance speech models without trannoscriptions. We leverage state-of-the-art pre-trained HuBERT and CLIP, aligning them via paired images and spoken captions with minimal fine-tuning. SpeechCLIP outperforms prior state-of-the-art on image-speech retrieval and performs zero-shot speech-text retrieval without direct supervision from trannoscriptions. Moreover, SpeechCLIP can directly retrieve semantically related keywords from speech.

Blog post: https://atosystem.github.io/blogs/speechclip
Paper: https://arxiv.org/abs/2210.00705
Code: https://github.com/atosystem/SpeechCLIP
👍2
دیروز DeepMind مقاله‌ای رو توی nature چاپ کرد که توی اون مدلی رو معرفی کرده که میتونه عملیات ضرب ماتریسی رو از پیشرفته‌ترین الگوریتم انسانی سریع‌تر انجام بده. این یعنی این یک مدل هوش مصنوعی یادگرفته که چطوری میشه مدل‌های هوش مصنوعی رو سریع‌تر آموزش داد چون در حین آموزش این مدل‌ها، از عملیات ضرب ماتریسی به طور مکرر استفاده میشه.
این مدل که اسمش AlphaTensor هست در چارچوب یادگیری تقویتی آموزش دیده شده.
برای اطلاعات بیشتر میتونید مقاله و پست وبلاگ رو بخونید:

مقاله:
https://www.nature.com/articles/s41586-022-05172-4

پست وبلاگ:
https://www.deepmind.com/blog/discovering-novel-algorithms-with-alphatensor
👍17
اخیرا گوگل اومده از شیوه آموزش مدل‌های زبانی (Language Models) برای تولید audio استفاده کرده.
این مدل audioLM در هر دو بخش تولید speech و music به طور عجیبی خوب عمل میکنه و سمپل‌های تولید شده خیلی با کیفیت و با معنی به نظر میرسند!
میتونید عملکرد این مدل رو توی این کلیپ ببینید:
https://youtube.com/watch?v=_xkZwJ0H9IU&feature=share

اطلاعات بیشتر در مورد مدل رو هم میتونید اینجا پیدا کنید:
https://ai.googleblog.com/2022/10/audiolm-language-modeling-approach-to.html?m=1
👍9👏1
Build a 𝑭𝒂𝒄𝒆 𝑫𝒆𝒕𝒆𝒄𝒕𝒐𝒓 in just a few lines of Python code using Kornia.

Kornia is a Differentiable Library based on PyTorch.

https://kornia.readthedocs.io/en/latest/applications/face_detection.html
👌4
Media is too big
VIEW IN TELEGRAM
سرفصل‌های دوره‌ی جدید بینایی کامپیوتر با Opencv

زمان تخمینی ریلیز دوره: در دو هفته ی پیش رو

این ویدیو را در آپارات ببینید
👍19
This media is not supported in your browser
VIEW IN TELEGRAM
🎉📢دوره ی opencv با همکاری #کلاس_ویژن و #مکتب_خونه منتشر شد

📜 موضوع دوره:
پردازش تصویر، بینایی ماشین و بینایی کامپیوتر

👨‍💻👩‍💻مباحث تئوری پایه به همراه حدود ۱۰۰ مثال عملی در پایتون با کتابخانه opencv

📎لینک توضیحات و ثبت نام دوره در:
کلاس‌ویژن | مکتب‌خونه


🎊🎊کد تخفیف ۲۰ درصد برای اعضای کانال:
classvision

سرفصلهای دوره | ویدیو سرفصلهای دوره
🔥21👏5👍32
Applied Machine Learning (Cornell CS5785)

"Starting from the very basics, covering all of the most important ML algorithms and how to apply them in practice. Executable Jupyter notebooks (and as slides)"

Lectures | Notebooks
👍101
This media is not supported in your browser
VIEW IN TELEGRAM
RunwayML just introduced Erase and Replace!

A new AI Magic Tool that allows you to transform your images simply by using a natural language denoscription.
Available now: https://runwayml.com

Check out https://AlphaSignal.ai to get a summary of top publications and breakthroughs in Machine Learning.
👍6
Andrej Karpathy: Tesla AI, Self-Driving, Optimus, Aliens, and AGI | Lex Fridman Podcast #333

https://www.youtube.com/watch?v=cdiD-9MMpb0
👍2
به لطف استقبال و همراهی اعضای کانال،
دوره‌ی پردازش تصویر و بینایی کامپیوتر با OpenCV در بین لیست پر فروش‌های هفته سایت مکتب‌خونه جای گرفت.
—-
اطلاعات دوره: https://news.1rj.ru/str/cvision/2829
👏18🎉2