Data Coffee – Telegram
Data Coffee
2.61K subscribers
173 photos
7 videos
223 links
Еженедельный подкаст о данных🎙️

Сайт https://datacoffee.link
Чат Telegram @datacoffee_chat
Чат Signal https://news.1rj.ru/str/datacoffee/286
Для связи podcast@datacoffee.link
Download Telegram
Forwarded from Alex. Seconds.
Open Source Data Tools
https://datais.me/updates/

Уже довольно давно хотелось найти удобную страничку, с помощью которой можно было бы быстро получить информацию о последних версиях open source data-продуктов, и, про необходимости, посмотреть их историю. К сожалению, не удалось найти что-то подходящее именно мне, и, как это бывает, запустил свое. Если вдруг кому-то ещё пригодится, то будет здорово🥺
🔥31👍65
149 (S6E01). Вечер тяжёлых каламбуров

И мы запускаем новый сезон подкаста Data Coffee, уже шестой!
В этом эпизоде подкаста:
— как мы по вам соскучились
— SteamDeck vs Switch 2
— Биопанк и новые боги

Обсудили
00:00 ИИ в Atlassian
06:32 Мир грибов
09:40 Marblelous Smart Marble Run
12:57 Новости Switch 2
28:07 Гаджеты для чтения
35:51 Docker Model Runner
40:30 Закрыли Skype (или нет)
42:44 Вредный Youtube
45:07 Авторское право в новом мире
54:14 Биопанк


Сайт: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://datacoffee.link⁠⁠⁠⁠⁠⁠⁠⁠⁠
Mastodon: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://techhub.social/@datacoffee⁠⁠⁠⁠⁠⁠⁠⁠⁠
Чаты в Signal и Telegram

#datacoffee #data #podcast #данные #подкаст #кофе #coffee

Где слушать🎧:
Бот-плеер
RSS feed
YouTube
Остальные площадки
🔥23😱5👍4🥰4
150 (S6E02). Перезапуск, попытка номер 2

В этом эпизоде подкаста Data Coffee обсуждаем:
— анонс Nintendo Switch 2 и не-анонс MacBook
— путешествия
— и возрождении Pebble
А самое главное, мы вернулись во второй раз, потому что соскучились по вам, наши дорогие слушатели. И это серьёзно!


00:00 Новый сезон Data Coffee
02:52 Анонс Nintendo Switch 2
09:09 Личные новости
11:48 Путешествия и и гейминг
14:08 Опыт игры на MacBook
28:02 Выбор между MacBook и Steam Deck
37:39 MacOS vs Linux
43:03 Vibe coding и кому оно надо
50:08 Doom поехал на трамвае
55:10 Мрачные стороны генерации контента
01:01:50 Возрождение Pebble

Сайт: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://datacoffee.link
Mastodon: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://techhub.social/@datacoffee⁠⁠⁠⁠⁠⁠⁠⁠⁠
Чаты в Signal и Telegram

#datacoffee #data #podcast #данные #подкаст #кофе #coffee

Где слушать🎧:
Бот-плеер
RSS feed
YouTube
Остальные площадки
🔥96👍1😱1
Live stream scheduled for
Сегодня в 20:00 по UTC и в 23:00 по Москве будем в режиме реального времени ставить Airflow 3.0. Присоединяйтесь!
7👍5😁1
Live stream started
Live stream finished (1 hour)
Установили новую версию Airflow 3.0 вместе со слушателями подкаста🎧, посмотрели на новый модный интерфейс📊, и даже запустили пару DAGs в прямом эфире😱

В свежем видео от Data Coffee рассказываем:
• о новых фичах Airflow в версии 3.0
• как установить себе Airflow локально через Docker Compose
• достучаться до небес интерфейса
• и другое

#datacoffee #airflow #установка #прямойэфир

https://youtu.be/SVJRb9zf9SA?feature=shared
1🔥2412❤‍🔥6👍4
Audio
Мастер-класс по дата-инженерии от Жени. Вы же наверняка соскучились!
🔥16😁11🤪4🥰3
151 (S6E03). Дата-брюзжание

В этом эпизоде подкаста Data Coffee:

— брюзжание как метод эмоциональной разгрузки
— статья про булшит в современных терминах data-инженерии
— переизобретение медальонной архитектуры, Zero ETL, Data Fabric и Data Mesh
— автономные дата-продукты и AI-ready платформы
— исчезновение профессии джун-аналитика из-за LLM
— будущее образования и альтернатива пятилетним курсам
— нейросети, агенты, цифровые двойники и O4 Mini
— безопасность вайп-кодеров и атаки через галлюцинации LLM
— LinkedIn как платформа для банальностей и карьерных постов
— рекомендации от коллег и генерация контента через LLM

И, конечно, шутки, ламповая атмосфера и немного ностальгии по курицам без головы.

Обсудили
00:00 Брюзжание двух мужчин
01:51 Медальонная архитектура
03:32 Посты в LinkedIn — зачем?
06:30 Zero ETL
09:26 Low code
13:23 LLM и аналитики
18:16 Будущее образования
24:46 Data Fabric
42:12 Взлом софта, сгенерированного LLM
46:21 Про Doom
48:43 Грязные данные

Сайт: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://datacoffee.link⁠⁠
Mastodon: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://techhub.social/@datacoffee⁠⁠⁠⁠⁠⁠⁠⁠⁠
Чаты в Signal и Telegram

#datacoffee #data #podcast #данные #подкаст #кофе #coffee

Где слушать🎧:
Бот-плеер
RSS feed
YouTube
Остальные площадки
14👍7🥰1
Audio
1. Где данные?

🎧 Audio episode • 09:02
Published: June 5, 2021 at 8:00 AM
👍71
Друзья всем привет,
На связи Алекс

Хочу сообщить о решении, которое я вынашивал почти год. Даже откопал самый первый эпизод подкаста, чтобы окончательно решить для себя, что настала пора двигаться дальше

Хочу сказать огромное теплое спасибо вам всем за то, что слушали меня, и за эти 4 года, которые мы провели вместе. Мы встретили за это время очень многое: и хорошее, и плохое, обзоры новостей, классных гостей, войну, эмиграцию, онлайн и оффлайн мероприятия… Было много вкусного кофе и качественных данных! И несмотря ни на какие невзгоды, это было отличное время в кругу близких друзей, и я очень благодарен всем и каждому за то, что мы прожили вместе💙

На этом наши истории – моя и подкаста – расходятся. Но мы не прощаемся о обязательно увидимся на просторах интернета и в реальности! Всем добра✌️

P.S.: если хотите, подписывайтесь на мой канал
1135💔24😢8
152 (S6E04). Эпизод, в котором избегали темы ИИ, поэтому говорили только о нём

Очередной новостной выпуск с минимальным количеством новостей, но с философскими рассуждениями на злободневные вопросы:
— смогут ли собраться все ведущие вовремя?
— что такое python-диктант и причем тут двойные листочки?
— как долго можно обсуждать свои дипломные работы вместо новостей?
— кофе, пуэр или массаж мочек уха?
— зачем ведущие лезут в дебри ноды если уже есть ИИ-агенты?
— почему Дата инженеры больше (все еще?) не нужны?
— спасут ли дата контракты профессию от ИИчтожения?
— почему навык сажания картошки необходим?

Вот список вопросов, которые обсудили ведущие в выпуске! Хотите, я добавлю в выпуск пропущенных новостей и попрошу ведущих релизить выпуски чаще?

00:32 Дата-диктант
04:21 LLM-ки
10:53 Изменения в работе у ведущих
18:51 Промпт-инжиниринг
34:16 Заменит ли ИИ дата-инженеров

Сайт: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://datacoffee.link
Mastodon: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://techhub.social/@datacoffee⁠⁠⁠⁠⁠⁠⁠⁠⁠
Чат в Telegram

#datacoffee #data #podcast #данные #подкаст #кофе #coffee

Где слушать🎧:
Бот-плеер
RSS feed
YouTube (пока без него)
Остальные площадки
210🔥5🤩5
153 (S6E05). Эпизод, в котором щемят Ha{censored}op, наслаждаются багетом и (sic!) свежими новостями

В этом без лишней лести и чрезмерного самолюбования выделяющимся среди прочих выпусков ничем, в общем-то, эпизоде ведущие искали ответы на волнующие их самих вопросы:

— сколько нужно ведущих, чтобы зачитать больше одной новости? 
— какие слова нельзя произносить в приличном DE-обществе и при чем тут Had{censred}op?
— выдержат ли читатели очередную историческую справку или скипнут этот эпизод?
— доверяют ли ведущие подкаста облакам также сильно, как слушатели - ведущим? 
— возможно ли обсудить Claire Obscure без спойлеров? 
— какое из всех возможных применений AI моделей самое практичное и почему это Lego GPT?
— как долго можно обсуждать Stanford AI Market Report в кругу не открывавших этот 456-страничный отчет? 

Бонус для тех, кто дослушает эпизод, подпишется на платный бусти и вышлет свои пароли от рута: Как сделать из свинца золото?

01:57 Мёртв ли Хадуп
26:54 Clair Obscur
42:14 ИИ развлекается вместо нас
46:50 Золото из свинца
54:25 Заменит ли ИИ дата-инженеров
56:10 Симуляция физики


Сайт: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://datacoffee.link
Mastodon: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://techhub.social/@datacoffee⁠⁠⁠⁠⁠⁠⁠⁠⁠
Чат в Telegram

#datacoffee #data #podcast #данные #подкаст #кофе #coffee

Где слушать🎧:
Бот-плеер
RSS feed
YouTube (пока без него)
Остальные площадки
10❤‍🔥1
154 (S6E06). Ностальгия и деменция

Очередной выпуск, в котором вопросов строго больше ответов

— сколько выпусков нас ещё ждет и на каком сезоне надо было заканчивать? 
— будут ли фотки с козлятами и голым торсом у Маска нашего Илона? 
— Грок, это правда? 
— сколько раз еще придется плакать навзрыд, проходя Claire obscure? (спойлер: на один раз больше, чем вы думаете) 
— можно ли шутить про деменцию ведущих подкаста? 
— Грок, это правда? 
— каким мессенджером пожилые люди возраста наших ведущих пользуются в повседневной жизни? 
— сколько ретро-игр смогут вспомнить ведущие? 
— что вошло в новый публичный дата-сет Яндекса ?
— застали ли сокращения в бигтехах врасплох наших ведущих?
— какую идею ведущие разрешили украсть до того, как они ее запикают в выпуске? 
— вернемся ли мы к обсуждению данных или хотя бы кофе?
— Грок, это правда? 
— утиные истории и причем тут новый формат данных? 
— когда будет новый оффлайн митап дата кофе? 
— как вступить в сообщество луддитов 21го века?
— Дуров + Маск = ?
— Грок, это правда?


02:27 Телеграм + Грок
08:15 Clair Obscure
10:26 Новость номер 2
12:24 Покет мёртв
15:25 Новый патч Миста
17:11 Датасет от яндекса
21:01 Сокращения в IT
21:59 Скрепочка на LLM-ке
23:02 Опенсорс copilot
28:42 Veo3
31:34 Новый сезон Рика и Морти
32:29 Утки
40:04 pipe в snowflake
41:55 plaude note
49:33 Поведение chatGPT
52:20 Железный чип с питоном
54:13 Новый дум
58:30 Новость номер 3


Сайт: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://datacoffee.link
Mastodon: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://techhub.social/@datacoffee⁠⁠⁠⁠⁠⁠⁠⁠⁠
Чат в Telegram

#datacoffee #data #podcast #данные #подкаст #кофе #coffee

Где слушать🎧:
Бот-плеер
RSS feed
YouTube (пока без него)
Остальные площадки
19🔥6
155 (S6E07). Обедающие философы

Новостной выпуск, в котором ИИ отчасти победил, вечный вопрос свежести данных решен не был, но ведущие смогли добраться до новостей!

— где ведущие берут новости для выпусков?
— сколько нужно LLM-ок, чтобы писать тексты ведущим?
— почему слушатели бросают подкаст на 2м сезоне?
— кто взломал матлаб?
— как сделать пользователя дашбордов довольным качеством данных? (спойлер: не все так просто)
— как быстро LLM-ки убьют классическое образование?
— чему учат современные и не только философы?
— почему с живыми людьми работать все еще приятней, чем с ИИ-агентом?
— как не выгореть, нажимая только tab на работе?
— в каких профессиях роботы еще не лучше людей? (их все меньше)
— что произошло с nintendo switch 2 и никогда бы не произошло со steam deck?
— неужели в этом новостном выпуске были новости?!


00:45 Новость про новости
05:40 Матлаб взломали
12:35 Актуальность данных
24:36 LLM AI AI LLM Искусственный интеллект
46:51 Тату от выгорания
53:08 AI нас всех заменит
57:29 TY от Астрала
62:58 Блиц-новости

Сайт: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://datacoffee.link
Mastodon: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://techhub.social/@datacoffee⁠⁠⁠⁠⁠⁠⁠⁠⁠
Чат в Telegram

#datacoffee #data #podcast #данные #подкаст #кофе #coffee

Где слушать🎧:
Бот-плеер
RSS feed
YouTube (пока без него)
Остальные площадки
4
156 (S6E08). Контракт на душу закостенелого корпората

Выпуск, в котором ведущие заключили дата-контракт на обсуждение новостей и ни разу (ну разве что немножко) его за выпуск не нарушили :

— зачем Databricks покупает Postgres-ориентированный сервис?
— какой рынок у managed Postgres?
— при чем тут ИИ? 
— где в очередной раз утекли паролей пользователей и почему это раз за разом удивляет?
— как прошла WWDC и почему она уже не удивляет?
— почему Nintendo Switch 2 произвели так мало, что их невозможно купить? (искусственный спрос просто, хотя есть прекрасная Steam Deck OLED - комментарий Жени, который отсутствовал, но машет аргументами после боя)
— дата-контракты — панацея от всех дата-бед или очередной дата-меш?
— как дата-контракты могут спасти душу и сердце закоcтенелого корпората?
— сколько нужно фронтендеров, чтобы обсудить фронтенд? 
— что важнее — инструмент или процессы? 
— чем очередная версия Spark превосходит предыдущий релиз?


00:36 Data Bricks покупает Neon
20:53 Утечки всего
25:06 Нативные контейнеры в macOs
35:30 Data Contract Manager
55:02 Spark 4.0

Сайт: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://datacoffee.link
Mastodon: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://techhub.social/@datacoffee⁠⁠⁠⁠⁠⁠⁠⁠⁠
Чат в Telegram

#datacoffee #data #podcast #данные #подкаст #кофе #coffee

Где слушать🎧:
Бот-плеер
RSS feed
YouTube (пока без него)
Остальные площадки
8🤩2
157 (S6E09). Фемто-уровень

Выпуск, в котором ведущие обсудили насущные новости не_месячной_давности, а также пытались среди пестрого роя новостей выбрать самые маленькие, соревнуясь в знании системы СИ.

— Почему яблоко перестало будоражить? 
— A в AI - это все же Apple или уже никогда не да? 
— Что может быть печальнее стоимости кофе? 
— Почему в Лондоне закупаются ремешками от apple? 
— Что делают водители Uber, когда смотрят в телефон? 
— Можно ли избежать политических новостей в подкасте? (нет)
— Какие самозапреты существовали у ведущих в подкасте и почему их уже нет? (censored)
— Новая идея стартапа для внимательных слушателей и при чем тут медицинский EdTech? 
— Кто навсегда в сердечках ведущих и при чем тут snowflake? 
— Какой еще камень полетит в копилку некогда воспеваемой в подкасте компании? 
— Сколько на самом деле лет ведущим? 
— Микроновсть, Наноновость, Пикановость или до какого размера новостей смогу уменьшиться наши ведущие? 
— Чем ИИ не умнее зумеров?


00:04 Презентация Apple
06:39 Таксисты размечают данные
07:24 Рынок IT
17:12 Будущее медицины
27:11 SQL в Snowflakes
34:26 Обучение моделей на пиратском контенте
37:28 AI-движок для Siri
39:28 Новости Nebius
42:21 Синхронные роботы
43:13 Копаемся в мозгах
47:02 Бенчмарк для моделей
50:59 Искусственные дети
57:11 Наноботы


Сайт: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://datacoffee.link
Mastodon: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://techhub.social/@datacoffee⁠⁠⁠⁠⁠⁠⁠⁠⁠
Чат в Telegram

#datacoffee #data #podcast #данные #подкаст #кофе #coffee

Где слушать🎧:
Бот-плеер
RSS feed
YouTube (пока без него)
Остальные площадки
7😱2
season 6 episode 9
Data Coffee
157 (S6E09). Фемто-уровень
2🔥1
158 (S6E10). Дата-кряхтение

(недо)Выпуск, в котором ведущие кряхтят, пыхтят и пытаются обсудить новости, которых одновременно и слишком много, и как бы нет:

— почему использование copilot вызывает кряхтение?
— почему менеджерам надо опасаться за свои места и перемещение колбасок в ганте не будет больше вызывать кряхтение (но у ведущих все еще вызывает)?
— что можно сотворить, совместив SQL, duckdb и doom, и над каким куском кода кряхтели ведущие в этот раз?
— выпустят ли агента, который будет кряхтеть вместо ведущих, или он уже есть?
— ожидает ли нас глобальное кряхтение инвесторов после взрыва пузыря LLM или пока поживем?
— кряхтят ли наши слушатели, когда слышат очередные рассуждения на тему LLM вместо данных или даже кофе?
— кто такой Василиск Рокко и будет ли он кряхтеть, когда наступит его эра?


00:18 Инфра Data Coffee
02:07 CLI для Jira
04:06 Doom на SQL
08:29 AgentDB
29:40 TursoDB
30:53 Google + Rayban = AI-очки


Сайт: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://datacoffee.link
Mastodon: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://techhub.social/@datacoffee⁠⁠⁠⁠⁠⁠⁠⁠⁠
Чат в Telegram

#datacoffee #data #podcast #данные #подкаст #кофе #coffee

Где слушать🎧:
Бот-плеер
RSS feed
YouTube (пока без него)
Остальные площадки
🔥52😁2
season 6 episode 10
Data Coffee
158 (S6E10). Дата-кряхтение
👍41