Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20K subscribers
621 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​Воссоздаем старую компьютерную графику с помощью генеративных моделей

Могут ли современные алгоритмы создавать улучшенные версии старой графики видеоигр с более высоким разрешением?

Последние несколько дней я использовал ИИ-генерацию изображений для воспроизведения одного из кошмаров моего детства. Я использовал Stable Diffusion, Dall-E и Midjourney, чтобы посмотреть, как эти инструменты генерации изображений могут помочь улучшить старую визуальную историю - вступительный фильм к старой видеоигре (Nemesis 2 на MSX). В этом посте описывается процесс и мой опыт использования этих моделей для улучшения графики.

Читать...
​​Математика для Data Science и машинного обучения за 8 месяцев. Подробный план обучения

Беспилотные автомобили, продвинутые голосовые ассистенты, рекомендательные системы – это только малая часть тех классных продуктов, которые создаются с помощью инженеров по машинному обучению и, думаю, не для кого не секрет, что за кулисами сего чуда стоит математика. Именно от ее знания зависит понимание алгоритмов машинного и глубокого обучения.

Читать...
​​Разделяй и властвуй, или Зачем управлять данными

Сегодня, в предпраздничный день, публикую статью Кирилла Евдокимова, директора практики Data Governance GlowByte. В области данных и аналитики он работает уже около 20 лет, последние 7 лет основной фокус – это Data Governance. Как говорит Кирилл, история с управлением данными всё еще остаётся terra incognita. В статье под катом он разбирает наиболее частые ошибки, проблемы, с которыми приходится сталкиваться компаниям, вступающим на тернистый путь управления данными.

Читать...
​​Как ChatGPT за меня тестовое задание для собеседования писал

Я сейчас активно ищу работу, прохожу собеседования и иногда работодатели присылают тестовые задания, прежде чем пригласить на интервью. В очередной раз мне прислали простенькое тестовое задание, в целом много таких похожих: из списка вершин построить дерево.

Читать...
​​Решение бизнес-задачи с помощью многофакторного кластерного анализа и здравого смысла

В рамках данной публикации я постарался не только поделиться своим практическим опытом решения аналитической задачи, но и уделить внимание профессиональным особенностям, связанным и с софт-скиллами, так как глубоко убеждён, что когнитивные умения в работе не менее важны, чем умение использовать тот или иной инструмент.

Читать...
​​ML-задача на 30 минут: гадаем по cookie

«Я тебя по IP вычислю!» – помните такую угрозу из интернета времен нулевых годов? Мы решили выяснить, можно ли составить хотя бы приблизительное представление о человеке, обладая информацией о сайтах, которые он посещает. Мы сгенерировали полусинтетические данные, чтобы понять, насколько смелыми можно быть в этих ваших интернетах.

Приглашаем вас попробовать составить портрет пользователя на основе этих данных и посмотреть, насколько точным он получится. Также под катом вы найдете наш baseline решения, написание которого займет около получаса.

Читать...
​​Первый опыт работы с ChatGPT с примером

В процессе сотрудничества с одним из новостных порталов была озвучена задача генерации осмысленного текста по наборам тезисов. Это увеличивает время пребывания пользователей на сайте, что, в свою очередь, привлекает рекламодателей. Для этой цели воспользовались общедоступной версией ChatGPT от OpenAI.

Читать...
​​Искусственный Интеллект. Самообучение играм на победу на примере «Крестики-Нолики»

Робот сыграет сам с собою много-много партий и таким образом сам научится хорошо играть. Вот такую гипотезу мы сформулировали для обучения робота.

И это сработало (!)
За 100 секунд робот сыграл сам с собой 100 000 партий и теперь во время игры с оппонентом просто достает из памяти «лучший» ход.

Читать...
​​MedBench: NLP-задачи в медицине, модели и методы их решения

Уже некоторое время я занимаюсь изучением методов машинного обучения, в частности, касающихся автоматической обработки текстов (Natural Language Processing, NLP). В конце прошлого года мне удалось попасть на стажировку в Sber AI Lab. Оказавшись в команде проекта MedBench, у меня появилась возможность поработать над практическими NLP задачами. В этой статье я бы хотел рассказать вам о проекте, которым занимался на протяжении своей стажировки. Проект связан с использованием нейронных сетей в сфере медицины, но подробнее о нём после небольшого введения.

Читать...
​​Важные исследования в области AI в 2022 г

Данная статья представляет собой свободный перевод раздела "Исследования" из доклада State of the Art 2022 (октябрь). Доклад State of the Art публикуется уже пятый год. Это подборка самых интересных вещей в мире AI.

Читать...
​​Пишем прототип программы для обучения английскому языку с помощью OpenAI API

Хочу описать процесс создания приложения, которое работает с OpenAI API. Идея приложения возникла из потребности улучшить мой английский язык. Как говорится, если у вас есть молоток, то все проблемы выглядят как гвозди. Так как я программист, я решил написать Искусственный Интеллект, который будет заменять учителя английского языка.

Читать...
​​Расскажите, что вы думаете про российские IT-компании — кто, на ваш взгляд, делает классные продукты, у кого самые крутые технологии, а кто недостаточно заботится о сотрудниках.

Опрос займёт не больше 5 минут, среди участников будет разыгран iPhone 14 Pro Max (правила тут).

👉Пройти опрос
​​Кому принадлежат платформы генеративного искусственного интеллекта?

Часто новые технологические тенденции становятся «пузырями» задолго до того, как они реально становятся востребованными на рынке. Но бум генеративных ИИ сопровождается реальными достижениями на реальных рынках и реальной подпиткой со стороны реальных компаний. Такие модели, как Stable Diffusion или ChatGPT устанавливают исторические рекорды роста пользователей, а несколько приложений на основе ИИ достигли годового дохода в размере 100 миллионов долларов менее чем через год после запуска. И пора признать, что в некоторых задачах искусственный интеллект уже превосходит людей на несколько порядков. Вопрос один: кто получает основной профит от этого и кто будет владеть всем этим в будущем?

Читать...
​​Введение в диффузионные модели для генерации изображений – полное руководство

Диффузионные модели могут значительно расширить мир творческой работы и создания контента в целом. За последние несколько месяцев они уже доказали свою эффективность. Количество диффузионных моделей растет с каждым днем, а старые версии быстро устаревают

Читать...
​​Прогнозирование авиапассажиропотока между городами РФ

Я работаю в авиакомпанию, занимаюсь анализом продаж, что сильно связано в том числе с планированием и прогнозированием. В условиях, когда российский рынок авиаперевозок сужается, авиакомпании стремятся оптимизировать свою маршрутную сеть, а если и развиваться - то только на направлениях с высоким пассажиропотоком. Дефицит самолетов в условиях санкций делает ошибки непростительными, поэтому своей целью я ставил разработку модели прогнозирования трафика между городами РФ.

Читать...
​​Плантации XXI века. Как экономическая катастрофа превратила Венесуэлу в центр новой IT-индустрии

Это должно было стать временной подработкой — способом получать какие-то деньги во время учебы. Оскарина Фуэнтес Анайя зарегистрировалась на Appen, платформе для маркировки данных с помощью ИИ, когда она еще училась в колледже, рассчитывая получить хорошо оплачиваемую должность в нефтяной индустрии.

Но затем экономика Венесуэлы рухнула. Инфляция резко выросла, и стабильная «нефтяная» работа, которая когда-то была гарантирована, перестала существовать. Подработка перестала быть временной; теперь она стала её основной работой. Благо, австралийская компания с 27-летней историей и огромными прибылями казалась прекрасным вариантом для начала карьеры.

В итоге вышло не так. И теперь, несмотря на угрозы со стороны Appen, Фуэнтес решила официально рассказать о себе. Она хочет, чтобы люди понимали, на что похож ее труд, и как работает эта важная, но незаметная часть глобального конвейера разработки ИИ.

Читать...
​​Решение бизнес-задачи с помощью многофакторного кластерного анализа и здравого смысла

В рамках данной публикации я постарался не только поделиться своим практическим опытом решения аналитической задачи, но и уделить внимание профессиональным особенностям, связанным и с софт-скиллами, так как глубоко убеждён, что когнитивные умения в работе не менее важны, чем умение использовать тот или иной инструмент.

Читать...
​​Fukami. Ч.2.1. Как я наполнял контекст. С примерами

В этой статье я рассказываю подробнее о своем системном подходе в формировании контекста в Чате. Во второй половине статьи сделан детальный разбор некоторых интересных кейсов первой сессии работы с ChatGPT.

Приглашаю продолжить чтение моего дневника разработки...

Читать...
​​MIDV-2020: как мы создали крупнейший датасет документов, удостоверяющих личность

В этой статье мы хотим рассказать как мы создали крупнейший на данный момент набор искусственно созданных документов с большим разнообразием типов документов, их содержания и условий съемки. Каждый из документов имеет уникальные (хоть и выдуманные) значения текстовых полей, уникальную подпись и уникальные искусственно созданные лица.

Читать...
​​Как мы используем нейросети для создания рекламных материалов

Привет! Меня зовут Роман Максимов, я руководитель группы дизайна в Омни СМ. Наша группа входит в отдел цифрового дизайна и занимается диджитал- и веб-дизайном интернет-магазина «Спортмастер» и сайтов монобрендов. Если совсем коротко, то мы отвечаем за всё, что связано с визуальной и креативной составляющей — баннеры, дизайн заглавных страниц, лендингов, видео и всю графическую маркетинговую составляющую.

В этом посте я расскажу про то, как мы используем возможности нейронных сетей, чтобы создавать рекламные материалы и не только.
Итак, про нейронки. Тема уже в целом не новая, но с каждым витком развития получает неплохой импульс в плане актуальности. Крупные компании стали объединять усилия в области генеративного дизайна — Shutterstock запартнёрились с DALL-E, и в будущем можно будет не тратить кучу времени, копаясь в огромном каталоге картинок, а просто взять и написать в поисковой строке нужный запрос. Сеть его обработает и нарисует для подходящую картинку. Если не очень подходящую — просто уточни запрос. 

Читать...
​​💪Стань востребованным инженером, занимающимся разработкой Искусственного интеллекта!

⚡️Приглашаем на бесплатный практикум, на котором расскажем как залететь в ИТ без навыков программирования и получить востребованную профессию с высокой оплатой!

🔥Всего за 3 вечера мы познакомим тебя с нейросетями, ты напишешь свою первую сетку и сможешь лично убедиться насколько интересен AI.

Прими решение поменять свою жизнь сейчас!💥

Регистрация на практикум👈