Data Secrets – Telegram
Data Secrets
78.8K subscribers
6.44K photos
669 videos
20 files
2.71K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
У кого лучшие рекомендательные системы в России? Ответ кажется очевидным.

Не будем тянуть. Сегодня наш гость, Кирилл Хрыльченко – лид команды R&D рекомендаций в Яндексе и автор канала @inforetriever, рассказал о том, как работают SOTA персонализации рекомендаций на примере Яндекса.
👍41🔥169😁3🤨3
Внимание тем, кто пользуется PyTorch: у нас для вас подарок, тыкайте реакции 😬

Те, кто пользуется TensorFlow: не обижайтесь и тоже тыкайте 😘
Please open Telegram to view this post
VIEW IN TELEGRAM
🫡157🗿30👍26😁16🍓1552🤯2🌭2🤨2🤝1
This media is not supported in your browser
VIEW IN TELEGRAM
😐76🔥34😁16👍13🗿123💯32🌚2
Очень интересный материал «HUMANS ARE BIASED.
GENERATIVE AI
IS EVEN WORSE» от Bloomberg


Авторы рассказывают о том, как нейросеть Stable Diffusion усиливает расовые и гендерные стереотипы. Например, все портреты по запросу «инженер» мужские. Люди, сгенерированные по запросу «преступник» – в основном темнокожие мужчины, а темнокожие женщины, по мнению нейросети, занимаются уборкой или продают бургеры.

При этом в мире SD все даже хуже, чем в реальности. Например, по запросу «доктор» нейросеть генерирует всего 7% женщин, хотя в реальности женщин-докторов 32%.

В конце можно посмотреть примеры генераций и прочитать рассуждения о том, кто в ответе за такой расизм и сексизм нейросети. Спойлерить не будем. Лучше расскажите: что думаете об этом?
👍36😁206🤔4🔥3🤯3💯2😎1
Nvidia внедрили в свою GPU серии RTX искусственный интеллект, который может апгрейднуть видео-изображение с SDR на HDR. Функция будет доступна и тем, кто приобрел видеокарту раньше. Как отмечают владельцы, лучше всего результат заметен на хорошем HDR мониторе. Подобные технологии Nvidia также использует в играх и для улучшения качества старых или загруженных извне фото и видео.
👍35🔥114
😻 Начинаем рабочий четверг с мудрой цитаты

Разница между посредственным ML-решением и исключительным заключается в тех проблемах, которые вы избегаете, а не в тех, которые вы решаете.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32🔥12🤯54
Как думаете, какая из перечисленных компаний инвестирует в ИИ больше всего?
Anonymous Quiz
28%
Google
6%
Amazon
15%
Meta
33%
Microsoft
8%
Apple
1%
Accenture
3%
IBM
7%
Яндекс
🤯109😁14👍9🤔2🌭21🤨1
Двигаясь тихо и не подавая вида, Apple действительно инвестирует в ИИ активнее, чем конкуренты. С 2017 года компания приобрела 21 стартап, в том числе WaveOne этой осенью. По сообщениям инсайдеров, компания работает над собственными LLM и планирует выводить на новый уровень запуск внутренних систем ИИ на мобильных устройствах.
38👍14🔥13
OpenAI опять ворвались с обновлениями. Давайте по порядку:

– Многие пользователи жаловались, что GPT-4 последнее время «ленится», то есть выполняет задания нехотя или неполностью. Разработчики подправили это, но правда только для GPT-4 Turbo. Что конкретно они сделали – не пишут.

– Стали доступны эмбеддинг-модели: text-embedding-3-small и text-embedding-3-large. Большое событие, особенно для RAG-систем.

– Обновили GPT-3 Turbo и понизили цены на генерации.

– В ближайшее время пообещали раскатить GPT-4 Turbo Vision на всех пользователей. Ждем!
🔥307👍4
Искусственный интеллект: справедливость или клевета?

В 1990 году в парке города Беркли произошла трагедия: во время пробежки там была убита 32-х летняя Мария Вайдхофер. Никаких следов предступления убийца не оставил. Кроме ДНК, но это полицейским не помогло: образцы не нашлись ни в одной базе данных.

В 2017 году следствие возобновилось с помощью лаборатории Parabon NanoLabs: там исследователи занимались воссозданием лиц по ДНК. Вскоре после этого воссозданный фенотип подозреваемого мужчины уже опубликовали, а еще спустя 3 года начали хотели начать гонять по базам данных фотографий.

И вот тут-то началось недовольство юристов и граждан США: какое право полицейские имеют искать людей с помощью непонятных, ничем не подтвержденных алгоритмов? Ведь так могут оказаться под следсвием невиновные случайные люди.

С одной стороны, полицейские сделали все, чтобы восстановить справедливость и найти убийцу. С другой, нарушили с десяток этических правил. Внимание, вопрос: на чьей стороне вы?
🔥5111👍8
Что почитать кроме Data Secrets?

Рекомендация для тех, кому всегда всего мало, а особенно обучающих постов. Наши друзья из канала DeepSchool как раз отличный вариант, если хочется погрузится в CV и не только.

Команда из практикующих ML инженеров регулярно пишет статьи, дает практические советы по ML/DL, разбирает теорию и пишет туториалы.

Ловите подборку из наших любимых статей с канала ребят:

Что такое attention?
Виды сверток
Основы RL
— Ликбез по архитектурам
(раз два три четыре)
— История YOLO (раз два три четыре)

Подпишись, чтобы не потерять: @deep_school
24🔥7👍6🤯2🗿2
Forwarded from Банки, деньги, два офшора
Обновленный GigaChat PRO от Сбера обогнал по качеству ответов GPT-3.5-turbo от OpenAI. Отечественная модель обошла американскую сразу на русском и английском языках. Тест включал в себя вопросы в 57 областях знаний, среди которых математика, история, медицина, физика, знания о мире и способности решать проблемы. В среднем точность ответов GigaChat Pro была выше на 6%, посчитали исследователи.

Сбер запустил GigaChat в режиме тестирования в апреле прошлого года, а в начале сентября сервис стал доступен всем желающим. Сегодня им пользуются более 1,5 млн человек. «С его помощью бизнес может создавать собственные решения и оптимизировать внутренние процессы», — заявил старший вице-президент и руководитель блока «Технологий» Сбера Андрей Белевцев. @bankrollo
😁49🫡19🔥6👍5🤔2🤩2🤯1🌭1👀1🙈1
Когда добавил 10 эпох и скор улучшился на 0.01
🔥131😁26👍178🗿4🤯2
Hugging Face и Google Cloud будут сотрудничать

Это означает, что теперь во всех сервисах Hugging Face разработчикам будут доступны возможности Google Cloud, GPU в том числе. В общем, любимая платформа станет еще круче.

А для Google это еще один большой шаг к статусу лидера индустрии. Такой же, как, например, покупка Kaggle. К слову, Hugging Face оценивают сейчас в $4.5 млрд.
👍48🔥128
Как сделать так, чтобы нейросеть не переобучалась

Переобучение – это одно из главных проклятий большинства ML-алгоритмов, в том числе нейросетей. Вещь неприятная, конечно, но в большинстве случаев фиксится достаточно просто. Надо только знать специальные фокусы...

P.S. C вас – реакции, с нас – вторая часть)
👍210🔥5521🤯3