Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
629 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​🎬Коллаборативная фильтрация vs Рейтинг фильма на Кинопоиске. Мой опыт написания кино рекомендательной системы

В этой статье автор рассмотрит рекомендательные алгоритмы, основанные на методе «Коллаборативной фильтрации».

Читать...
​​🐍Пример уменьшения размерности данных с помощью линейных и нелинейных методов в Python

В этой статье автор расскажет как методы уменьшения размерности данных решают проблему, предоставляя меньшее количество измерений (столбцов) при сохранении наиболее важной информации.

Читать...
​​📉Как мы снизили нагрузку на SAP HANA незаметно для пользователей

В этой статье автор расскажет как существенно сэкономить бюджет клиента и сделать период внедрения новых решений практически незаметным для пользователей.

Читать...
​​🐈Сможете ли вы отличить собаку от кошки, или Как объяснить проблемы дата-сайентиста коллегам. Часть 2

В этой статье автор расскажет, что и в какой степени влияет на качество моделей, а также для дата-сайентистов приведет код Python, который был использован для получения картинок в задании.

Читать...
​​🤖AI доступный каждому разработчику

В этой статье автор расскажет как самому разработать софт, напечатать на 3D-принтере корпуса и собрать свои устройства для взаимодействия с виртуальным ассистентом.

Читать...
​​👾LlamaIndex: создаем AI-бота без боли и страданий

В этой статье автор расскажет о Langchain - мощном инструменте для создания приложений с использованием больших языковых моделей.

Читать...
​​🧑‍💻 Какое качество можно выжать из нейросетевой модели весом менее 20 МБ

Разработчик Яндекс Клавиатуры объяснил, почему команда отказалась от n-граммной модели и выбрала нейроязыковую. Автор разбирает подходы, которые используют Samsung и Google, размышляет на тему LSTM-энкодера в 2023 году и объясняет выбор CNN-эмбеддинга.

Читать…
​​👾Нейронные сети, графы и эмерджентность

В этой статье автор рассмотрит некоторые интересные, области науки, с которыми он сталкивался в контексте работы с нейронными сетями, и найти между ними взаимосвязь.

Читать...
​​🗣Как сделать контекстное окно на 100K в большой языковой модели

В данной статье рассмотрены приёмы, позволяющие ускорить обучение больших языковых моделей (LLM) и нарастить в них вывод (inference).

Читать...
1
​​🤖Генерация текстов, кластеризация и определение E-A-T и коммерческости запросов на нейросети OpenAI (GPT-3)

В данной статье автор покажет 5 примеров использования искусственного интеллекта (ИИ) на нейросети OpenAI (GPT-3) применительно к SEO

Читать...
​​👾Создаем конвейер машинного обучения с помощью DBT

В этой статье автор проведет вас по процессу создание хорошего конвейера данных шаг за шагом.

Читать...
​​🦆Заходит утка в бар: понимает ли ИИ юмор?

В этой статье автор как именно оценивалось чувство юмора машин, есть ли оно вообще, и если да, то чем отличается от человеческого.

Читать...
​​Как маленькая нейроязыковая модель в Клавиатуре победила серверные подсказки

В этой статье автор расскажет, как мы создавали нейроязыковую модель для Яндекс Клавиатуры, ушли от облачных подсказок и научили клавиатуру адаптироваться к приложениям. 

Читать...
​​🚀Запускаем Stable Diffusion на Raspberry PI Zero 2 (или на 260 МБ ОЗУ)

В этой статье автор расскажет как запустить Stable Diffusion, включающую большую трансформирующую модель c почти 1 миллиардом параметров, на Raspberry Pi Zero 2 с 512 МБ RAM, не добавляя дополнительного пространства подкачки и не выгружая промежуточные результаты на диск.

Читать...
​​📊Как использовать нейросети в финансах и аналитике

В этой статье рассказываем, как используют нейросети в финансах и аналитике, какие преимущества и недостатки они имеют, и какие перспективы развития они открывают для финансовой отрасли.

Читать...
​​😵Свойство типа Controller Service в кастомном процессоре NiFi

В этой статье автор приведёт примеры кода, а так же покажет, как подсунуть свою заглушку в интеграционный тест процессора.

Читать...
​​😶🌫Анализ временных рядов, или как предсказать погоду на завтра

В данной статье автор рассмотрит способы анализа временных рядов, а также разберет основные методы прогнозирования упорядоченных данных.

Читать...
​​🔍Под капотом поискового движка: Как Uzum Market применяет ML, чтобы вы нашли желаемое

В этой статье автор расскажет про боли и трудности, с которыми пришлось столкнуться на пути к статистически значительным изменениям в метриках.

Читать...
​​🗣Создание deepfake видео и синтез речи open-source проект Wunjo AI

В этой статье автор расскажет о своем open-source проекте Wunjo AI с открытым исходным кодом, который позволит вам создавать дипфейк видео и синтезировать речь из текста у себя на компьютере.

Читать...
​​🧑‍💻Импортозамещаем numpy, pandas, scipy и sklearn

В этой статье речь пойдет о библиотеках-аналогах numpy, pandas, scipy и sklearn на C++ (np, pd, scipy, sklearn соответственно).

Читать...
​​🚀Эффективная загрузка внешних данных в корпоративное хранилище: опыт «Магнита»

В этой статье автор расскажет о проблемах, с которыми он столкнулся и решениях, которые помогли облегчить процесс загрузки, повысить эффективность и ускорить получение доступа к данным.

Читать...