NEW BOT Телеграм, страница

🔥

Самые интересные статьи за последние дни:

• Разбей и властвуй: как создать кастомный токенизатор в SpaCy

• Функция property() в Python: добавляем управляемые атрибуты в классы

• Что, если не трансформеры: какие альтернативы главной архитектуре нейросетей у нас есть в 2024 году

• cgroups и namespaces в Linux: как это работает?

• ML-тренды рекомендательных технологий: шесть приёмов, которые помогают угадывать желания пользователя

Please open Telegram to view this post

VIEW IN TELEGRAM

2.87K views16:07

Data Science | Machinelearning [ru]

🤔

Размер имеет значение: как исторические данные помогают на этапе дизайна A/B-теста

Статья изучает применение метода CUPED в A/B-тестах для повышения чувствительности и сокращения выборок. Рассматривается его использование на этапе дизайна эксперимента без потери статистической мощности.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

2.76K views10:07

Data Science | Machinelearning [ru]

📝

Подборка вакансий для сеньоров

Data engineer
• SQL, Python, Apache Hadoop
• Уровень дохода не указан | от 3 лет

Data Engineer
• SQL, Python, Apache Airflow, Greenplum, Apache Spark
• от 250 000 ₽ | от 2 лет

Senior Data Scientist
• Python
• Уровень дохода не указан | опыт не указан

ML-инженер
• Машинное обучение, Deep Learning, Нейронные сети, Python, TensorFlow, PyTorch, Keras, Linux, Git, Docker
• Уровень дохода не указан | опыт не указан

Разработчик БД (PostgreSQL, прикладные витрины)
• SQL, PostgreSQL, ETL, Apache Airflow, Greenplum
• Уровень дохода не указан | от 3 лет

Please open Telegram to view this post

VIEW IN TELEGRAM

2.91K views18:07

Data Science | Machinelearning [ru]

📈

Подборка статей для вашей карьеры

• Мои Red-Flags при устройстве в IT-компании: Как не стать гребцом. Часть 2

• Как строить карьеру в корпорации

• История: работа в чешском Red Hat

• Циничные заметки о карьере в IT от «гейткипера»

• Моя петиция EB-1A на грин-карту талантов, одобренная с первой попытки

Please open Telegram to view this post

VIEW IN TELEGRAM

2.92K views10:07

Data Science | Machinelearning [ru]

⚙️

Как обеспечить Data Quality терабайтов данных и зачем: опыт СИБУРа

Статья посвящена опыту СИБУРа в создании DQ-сервиса для обеспечения качества данных. Рассматриваются задачи DQ, архитектура решения и универсальные подходы, применимые для анализа данных в крупных компаниях.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

2.94K views14:07

Data Science | Machinelearning [ru]

📝

Подборка вакансий для лидов

TeamLead Data Analyst
• Python, DWH, ClickHouse
• до 5 000 $ | от 3 лет

Главный администратор данных (Chief Data Steward) [Governance]
• Git, SQL, Apache Kafka, NoSQL, PostgreSQL
• Уровень дохода не указан | опыт не указан

Аналитик данных, senior/lead
• SQL, Python, Apache Airflow, ETL, DWH
• Уровень дохода не указан | от 3 лет

Lead/Senior Automation QA (Python or Java)
• Python, Linux, Java, CI/CD, Docker, Тестирование API, Тестирование UI, Разработка тест-кейсов
• Уровень дохода не указан | от 4 лет

Ведущий питонист
• Python, Django, PostgreSQL, Docker
• от 150 000 до 250 000 ₽ | опыт не указан

Please open Telegram to view this post

VIEW IN TELEGRAM

3K views18:07

Data Science | Machinelearning [ru]

Многие из вас знают, что ШАД - одна из сильнейших школ для подготовки специалистов по анализу данных

Однако попасть в ШАД не так просто, нужно иметь сильную математическую базу и успешно пройти все этапы отбора.

Shad Helper готовит студентов к поступлению в Школу Анализа Данных Яндекса, AI Masters и магистратуру по анализу данных. В школе в основном ведутся занятия по высшей математике и программированию.
Все преподаватели кандидаты и доктора наук из МГУ, МФТИ, ВШЭ.

2 декабря 2024 года запускается новый поток подготовки к ШАД

💎Все преподаватели кандидаты и доктора наук из МГУ, МФТИ, ВШЭ
💎Есть система скидок за хорошую успеваемость
💎Длительность курса: ~6 месяцев
💎Оплата курса еженедельная (можно остановить обучение в любой момент)
💎Регулярные персонализированные домашние задания
💎Работа в мини-группах
💎Есть умный чат бот для студентов ( на базе gpt4)

🔗 Ссылка на телеграм @shadhelper

🎁 Для подписчиков канала скидка 30% на первоначальный взнос по промокоду DEVSP30

Реклама. ООО "Школа высшей математики". ИНН: 9728100991
erid: 2VtzqwmcPtb

3.11K views06:07

Data Science | Machinelearning [ru]

⚙️

Пишем свою Diffusion модель с нуля

Статья предлагает разобраться в устройстве Diffusion моделей, их математике и принципах работы. Автор делится простыми объяснениями, примерами кода и результатами генерации изображений на собственной модели.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

3.34K views10:07

Data Science | Machinelearning [ru]

🕵️‍♂️ Держи код чистым

Никогда не думал, что через пару недель сам не разберёшься в своём коде? А коллеги тем более. Это реальность, если писать быстро и «как получится».

✔️ Совет: трать 10 минут после завершения задачи, чтобы убрать мусор, оставить комментарии и структурировать код. Это спасёт и тебя, и тех, кто будет работать с ним после тебя.

Please open Telegram to view this post

VIEW IN TELEGRAM

3.14K views14:07

Data Science | Machinelearning [ru]

📝

Подборка зарубежных вакансий

Python Developer/Data Scientist
• Python, Pandas, NumPy, NLP, TensorFlow, Keras, SQL, Git, Docker, NoSQL
• от 5 500 $ | от 3 лет

Database Administrator
• ClickHouse, PostgreSQL, Python, Linux, Bash, LVM
• до 5 000 $ | опыт не указан

Python QA automation developer
• Python, Linux, HTTP, TCP, CI/CD, DevOps
• до 5 000 $ | опыт не указа

Please open Telegram to view this post

VIEW IN TELEGRAM

3.12K views18:07

Data Science | Machinelearning [ru]

⚙️

Нейросетевой апскейлинг дома: вторая молодость для классических мультфильмов

Статья рассказывает, как с помощью нейросетей улучшить качество старых видеозаписей, включая VHS и DVD. Описываются инструменты, процесс и результаты с примерами, доступные каждому без глубоких технических знаний.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

3.07K views10:07

Data Science | Machinelearning [ru]

👩‍💻

Проверка, являются ли две строки анаграммами

Напишите функцию, которая принимает две строки и проверяет, являются ли они анаграммами. Анаграммы — это слова, которые содержат одинаковые буквы в одинаковом количестве, но в разном порядке. Игнорируйте регистр и пробелы.

Пример:

result1 = are_anagrams("listen", "silent")
print(result1)  # Ожидаемый результат: True

result2 = are_anagrams("hello", "world")
print(result2)  # Ожидаемый результат: False

Решение задачи🔽

def are_anagrams(str1, str2):
# Удаляем пробелы и приводим к одному регистру
str1 = ''.join(str1.lower().split())
str2 = ''.join(str2.lower().split())

# Проверяем, равны ли отсортированные символы
return sorted(str1) == sorted(str2)

# Пример использования:
result1 = are_anagrams("listen", "silent")
print(result1) # Ожидаемый результат: True

result2 = are_anagrams("hello", "world")
print(result2) # Ожидаемый результат: False

Please open Telegram to view this post

VIEW IN TELEGRAM

3.11K views14:07

Data Science | Machinelearning [ru]

🔥

Самые интересные статьи за последние дни:

• Делают всё роботы, а не человек! Как работать меньше, но продуктивнее? Обзор шести нейросервисов

• Пишем свою Diffusion модель с нуля

• Apple Intelligence на Андроид? Обзор ИИ, портированных на мобильные устройства с локальным запуском

• Как мы обучали LLM для поиска уязвимостей в смарт-контрактах Solidity

• Нейросети, мошенники и «мамонты»: как искусственный интеллект меняет кибермошенничество

Please open Telegram to view this post

VIEW IN TELEGRAM

3.42K views18:07

Data Science | Machinelearning [ru]

🎞

Как за 6 промтов к ChatGPT создать Python скрипт, скачивающий видео с YouTube для просмотра на телевизоре через Kodi

Статья рассказывает, как с помощью Python и ChatGPT создать скрипт для автоматической загрузки видео с YouTube и генерации метаданных (описаний и обложек) для интеграции с медиацентром Kodi.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

3.49K views10:07

Data Science | Machinelearning [ru]

👩‍💻

Поиск самого часто встречающегося элемента в списке

Напишите функцию, которая принимает список и возвращает элемент, который встречается чаще всего. Если таких элементов несколько, вернуть любой из них.

Пример:

numbers = [1, 3, 2, 3, 4, 1, 3, 2, 1]
result = most_frequent(numbers)
print(result)  
# Ожидаемый результат: 3 (или 1, если в списке оба встречаются одинаково часто)

Решение задачи🔽

from collections import Counter

def most_frequent(lst):
count = Counter(lst)
return max(count, key=count.get)

# Пример использования:
numbers = [1, 3, 2, 3, 4, 1, 3, 2, 1]
result = most_frequent(numbers)
print(result) # Ожидаемый результат: 3

Please open Telegram to view this post

VIEW IN TELEGRAM

3.52K views14:07

Data Science | Machinelearning [ru]

📝

Подборка вакансий для джунов

QA Automation Engineer Junior (Python)
• Python, PyTest, ООП, SQL, PostgreSQL
• Уровень дохода не указан | от 1 года

Data Engineer
• Python, SQL, ETL, Docker, Kubernetes, Apache Airflow
• Уровень дохода не указан | опыт не указан

Инженер данных/Data Engineer в Управление анализа данных
• SQL, Jira, Confluence, Hadoop, Bitbucket
• Уровень дохода не указан | опыт не указан

Младший аналитик
• Python, SQL, Microsoft Excel, Английский язык, Анализ данных, Машинное обучение, Нейронные сети
• от 130 000 ₽ | опыт не указан

Please open Telegram to view this post

VIEW IN TELEGRAM

3.51K views18:07

Data Science | Machinelearning [ru]

💬

Внедрение ИИ в общение с клиентами

Статья исследует развитие ИИ в общении с клиентами и его интеграцию в бизнес. Обсуждаются успехи и сложности внедрения чат-ботов, важность настройки под бизнес-цели и перспективы замены сотрудников ИИ.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

3.25K views10:07

Data Science | Machinelearning [ru]

⚙️

Что такое train_test_split в Scikit-learn и зачем он используется?

train_test_split — это функция из библиотеки Scikit-learn, которая используется для разделения данных на тренировочный и тестовый наборы. Это необходимо для оценки качества модели на данных, которые она не видела во время обучения.

➡️

Пример:

from sklearn.model_selection import train_test_split
import numpy as np

# Данные
X = np.array([[1], [2], [3], [4], [5]])
y = np.array([10, 20, 30, 40, 50])

# Разделение данных (80% на обучение, 20% на тест)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

print("Тренировочные данные:", X_train, y_train)
print("Тестовые данные:", X_test, y_test)

🗣️ В этом примере данные разделяются на тренировочный и тестовый наборы в соотношении 80/20. Это позволяет модели обучаться на одной части данных и проверять точность на другой, что предотвращает переобучение.

🖥

Подробнее тут

Please open Telegram to view this post

VIEW IN TELEGRAM

3.33K viewsedited 14:07

Data Science | Machinelearning [ru]

📝

Подборка вакансий для джунов

Data engineer (Python Hadoop Spark)
• Python 3.8+, Hadoop, Hive, Spark (PySpark), Airflow, PostgreSQL, ClickHouse, Kubernetes
• Уровень дохода не указан | от 2 лет

Data Engineer
• Python или Scala, SQL, Apache Spark, CI/CD, Airflow
• Уровень дохода не указан | от 1-2 лет

Data Analyst
• SQL, PL/SQL, Oracle, Jira, Confluence
• Уровень дохода не указан | от 3 лет

Разработчик AI
• Python, Pandas, NumPy, SQL, LangChain, LlamaIndex, OpenAI API, RAG, Faiss, Qdrant, Chroma, Elasticsearch, Git
• Уровень дохода не указан | от 1 года с LLM, от 3 лет с Python

Python Developer
• Python, Django, Linux, PostgreSQL, Celery, Redis, Pandas, NumPy
• до 250 000 ₽ | от 3 лет

Please open Telegram to view this post

VIEW IN TELEGRAM

3.65K views18:07

Data Science | Machinelearning [ru]

👀

Сравнение 30 фотореалистичных ИИ-изображений: Flux1.1 против SD3.5

В статье обсуждаются возможности Flux1.1 Pro и SD3.5 Large в генерации фотореалистичных изображений. Описаны различия моделей и их результаты после разделения команды разработчиков.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1

3.45K views10:07

Data Science | Machinelearning [ru]

👩‍💻

Подсчёт количества слов в строке

Напишите функцию, которая принимает строку и возвращает словарь, где ключами являются слова из строки, а значениями — количество их вхождений. Игнорируйте регистр и знаки препинания.

Пример:

text = "Hello, world! Hello Python world."
result = count_words(text)
print(result)  
# Ожидаемый результат: {'hello': 2, 'world': 2, 'python': 1}

Решение задачи🔽

import re
from collections import Counter

def count_words(text):
# Убираем знаки препинания и приводим к нижнему регистру
words = re.findall(r'\b\w+\b', text.lower())
# Подсчитываем количество вхождений каждого слова
return Counter(words)

# Пример использования:
text = "Hello, world! Hello Python world."
result = count_words(text)
print(result)
# Ожидаемый результат: {'hello': 2, 'world': 2, 'python': 1}

Please open Telegram to view this post

VIEW IN TELEGRAM

3.55K views14:07

About

Blog

Apps

Platform