NEW BOT Телеграм, страница

Forwarded from Технологический Болт Генона

Плейлист PG Day'21
https://www.youtube.com/playlist?list=PL83V-7Vhzqkpj0qwmOimKR-x3FRVg9lDn

Доклады
https://pgday.ru/ru/2021/papers

1.71K views10:35

There will be no singularity

Facebook похвастался своей key value (largest strongly consistent, geographically distributed) базой zippyDB на основе rocksDB, которую они пилят с 2012:

https://engineering.fb.com/2021/08/06/core-data/zippydb/

Похвастался, но сорцов не дал.

О чем тогда новость?

А новость о том, что уже есть (еще один) serverless REDIS с таким же названием, криповым лендом и зарегистрированной торговой маркой:
zippydb.com

Его зарегали в 2014.

Конечно же это всех запутало :)

Смешно будет, если они начнут судиться из-за названия бд…

Engineering at Meta

How we built a general purpose key value store for Facebook with ZippyDB

ZippyDB is the largest strongly consistent, geographically distributed key-value store at Facebook. Since we first deployed ZippyDB in 2013, this key-value store has expanded rapidly, and today, Zi…

1.67K views06:52

There will be no singularity

Если вам вдруг интересно про snowflake, но в наших чатах вам сидеть не хочется, то вот канал со snowflake-новостями

@snowflake_daily

1.55K views10:25

There will be no singularity

Наша постоянная рубрика ~~чего только эти зумеры ни придумают~~ everything is saas:

secfi.com

We are a team of equity experts 100% focused on helping startup employees understand, maximize and unlock the value of their stock options and shares.

1.91K views10:33

спасибо что не клабхаус... – 18

с блокченом? – 52

я джва года ждал... – 7

There will be no singularity

https://erikbern.com/2018/08/30/i-dont-want-to-learn-your-garbage-query-language.html

Erik Bernhardsson

I don't want to learn your garbage query language

This is a bit of a rant but I really don't like software that invents its own query language. There's a trillion different ORMs out there. Another trillion databases with their own query language. Another trillion SaaS products where the only way to query…

2.11K views18:13

There will be no singularity

Слышали про язык V (As fast as C)?

Вот и я не слышал... Но вдруг вам захочется странного, вот SQL database written in pure V.

PS: добавил в свою коллекцию опенсорц тулзин для SQL на github.

По наводке @sysadmin_tools

1.7K viewsedited 11:25

Слышал! – 23

Не слышал... – 47

Я автор :) – 7

There will be no singularity

Oracle придумал ускоритель для managed mysql в своем облаке (HeatWave):
oracle.com/mysql/heatwave/

Это такая in-memory ai нахлобучка, что бы все было быстрее.

For analytics workloads, HeatWave is 6.5X faster than Amazon Redshift at half the cost, 7X faster than Snowflake at one-fifth the cost, 9X faster than Google Big Query at one-fourth the cost, 3X faster than Azure Synapse at one-fifth the cost, and 1400X faster than Amazon Aurora at half the cost. For mixed workloads, HeatWave delivers 42 times better price performance than Amazon Aurora.

Как понимаю, это что-то похожее на ottertune.com от Andy Pavlo.
Мне кажется, что что-то похожее есть в самом оракле уже года 3-4. Но это не точно..

Oracle

Quickly Develop Cloud Applications with Heatwave MySQL

Oracle MySQL Database Service is a fully managed database service with an in-memory query accelerator–HeatWave.

2.58K viewsedited 07:00

пойду куплю… – 4

и кто им пользуется? – 17

у оракла есть облако? – 23

There will be no singularity

~~Хозяйке~~ стартаперам на заметку: в B2B все происходит ОЧЕНЬ долго.

Многие из вас знают, что мы разрабатываем несколько продуктов - holistic.dev, parsers.dev и dwh.dev

У holistic.dev есть интеграции со всеми основными клауд провайдерами в РФ.

Они сделаны в виде FaaS (function as a service) только по одной причине - облакам некогда заниматься такими интеграциями.

Но ребята из MCS (облако mailru) оказались наиболее легкими на подъем и запилили интеграцию для своих managed баз прямо к себе в админку.

Таймлайн выглядел так:
- 2020 весь год. Я ищу контакты в MCS
- 2020 декабрь. С первого разговора с нужным человеком MCS принимают решение об интеграции
- 2021 февраль. Интеграция готова
- 2021 март. Я узнаю о том, что интеграция готова, мы начинаем общаться о промо материалах
- 2021 апрель. Я рассказываю об интеграции у себя в канале
- 2021 июнь. Мы общаемся о промо материалах.
- 2021 август. Промо выходит в медиа каналах mail.ru (Новость на сайте и в телеге)

Собственно, это была подводка к новости - про нашу интеграцию с MCS объявлено официально, ура! :)

PS: если решите делать B2B стартап, ищите sales-кофаундера сразу....

4.7K viewsedited 10:59

ура! – 76

не ура... – 1

долго ему... иди к нам, в геймдев! – 13

There will be no singularity

Из нашего чатика:

https://twitter.com/andy_pavlo/status/1425277882935488518

Twitter

Andy Pavlo

Oracle's @MySQL Autopilot announcement is impressive. Lots of interesting things in the video. They are using ML to generate recommendations for design tasks (provisioning, placement). From what I can tell, they are not picking indexes or tuning knobs. y…

2.17K views12:32

There will be no singularity

@здец подкрался незаметно, хоть виден был из далека...

Сложно это признавать, но не только таксистов и продавцов со дня на день заменят железные болваны, но и нас с вами. Нас, это нас - программистов, верстальщиков, тестировщиков. Всех.

Вы хочите пруфов? Их есть у меня:

https://www.youtube.com/watch?v=Mc-gWblq7K4

~~Ничего не будет. Ни кино, ни театра, ни книг, ни газет – одно сплошное телевидение.~~

Пользуясь пятницей, предлагаю отправиться в запой. В этом нас AI пока не догнал.
Но это только ПОКА...

YouTube

OpenAI codex. Обзор за 15 минут. Что может делать ИИ сегодня? // Айтишники

OpenAI codex - https://openai.com/blog/openai-codex/

OpenAI twitter - https://twitter.com/OpenAI

Артем Ерошенко и Всеволод Брекелов поделились впечатлениями о новой разработке Open AI codex, которая умеет генерировать код и запускать его, анализируя контекст.…

2.36K views09:34

спасибо, бл... – 15

ой да ладно... – 84

так вам и надо! – 18

There will be no singularity

Известного в 80-90х годах музыканта, когда он в сотый раз поехал с турне «лучшее за 30 лет», спросили, не собирается ли он написать новых песен, а то сколько уже можно?

Он ответил: «новые песни пишут те, у кого старые плохие»

Вот и Егор иногда стряхивает пыль со своих нетленок:

ActiveRecord Is Even Worse Than ORM

1.58K views05:51

There will be no singularity

Phil Eaton, который перепиливал PostgreSQL на go, запостил список SQL парсеров на go, js, java, python:
https://twitter.com/phil_eaton/status/1428490231532212231

До моей коллекции SQL тулзин на github ему, конечно, далеко, но несколько новых ссылок я туда добавил :)

1.6K views09:18

There will be no singularity

Firebolt зовут на Product Showdown 25 августа

Но внезапно обнаружились записи весенних сессии
https://vimeo.com/522252264
https://vimeo.com/511021032

Коротко:
- Архитектура Snowflake-like - хранение на s3, независимо запускаемые compute инстансы + слой оркестрации и метадаты.

- Хранение данных очень похоже на clickhouse: колонки, партиции и сжатие.
Колонки сортируются по PRIMARY KEY в пределах партиции (видимо). Для тех, кто не знаком с clickhouse, замечу, что PK в данном случае не имеет ничего общего с уникальностью. Это sparse index, который определяет поля, по которым будет проводиться сортировка (в пределах партиции).

- Есть еще 2 типа индексов - aggregated и join.
Aggregate похож на materialized view. Но это не точно: https://vimeo.com/512940949
Join похож на... обычный индекс: https://vimeo.com/512937916
Пока индексы нужно создавать вручную, но потом система сама начнет их рекомендовать. Почему не делать автоматически - хз.

- Есть ДВА доступных движка: read/write для general purpose (ETL) и read only для data analytics.
Движки выбираются в специальном интерфейсе (а не из SQL, как ожидалось бы) и запускаются на EC2 инстансах, размер которых нужно выбрать до запуска. Можно указать auto-stop период для каждого инстанса: 20 минут/час/никогда.

- Упоминается Firebolt ETL на SQL.
Из уникальных фич: импорт из kafka.

- Заявляется в 10 раз более эффективное расходование ресурсов aws.
$16 snowflake vs $1.54 firebot. Табличка сравнения содержит запросы #1, #2, #3, #4 и #5. Что бы это ни значило....

- Вопрос из зала #1: чем вы отличаетесь от snowflake?
- во-первых, мы быстрее
- во-вторых, мы даем вам больше свободы выбора железа
- в-третьих, мы дешевле

¯\_(ツ)_/¯

- Вопрос из зала #2: какой дилект SQL вы поддерживаете?
- Postgre-sh

- Вопрос из зала #3: сколько времени занимает изменение размера compute-инстанса?
- 2-3 минуты

Формально получается, что firebolt - это оркестратор managed баз.
Скорее всего только Posgresql. В разделе про неструктурированные данные идет речь о функции unnest, которая есть, кажется, только в Posgresql и BigQuery.

Еще возникают интересные вопросы, например, об уровне изоляции транзакций в read/write движке. Теоретически, его же можно применять не только для ETL.
Можно же, да?..

Пока рано говорить об удобстве использования, но выбор движка в интерфейсе, 3 настройки автостопа, и запуск инстанса за 2-3 минуты заставляет приуныть...

1.78K viewsedited 11:18

хайпожор! – 11

абажи, snflk не успели освоить... – 23

boring! – 10

There will be no singularity

Алекс поделился историей про саппорт aws:
https://news.1rj.ru/str/devfounder/112

Для меня недосягаемой вершиной саппорта всегда был Рокетбанк.
Без булщита, с живыми людьми, которые говорят с тобой на одном языке.

Вот тут коротенько написано про них.

С чем категорически не согласен, так это что саппорт это _дешевая_ замена маркетинга. Хороший саппорт - это, сцк, очень дорого.

.и в продакшен

Лет восемь назад у нас взломали AWS-аккаунт и запустили гору GPU-виртуалок для криптомайнинга. Из-за чего месячный счет за одну ночь вырос c 200 баксов до $50к. У нас не был куплен платный "саппорт", мы не были большим и важным клиентом (скорее наоборот,…

1.67K viewsedited 11:04

There will be no singularity

Ребята из JUG опять что-то мутят :) На этот раз про бигдату с джавой.

26 августа в 18:00 компания IT_One вместе с JUG Ru Group проведет бесплатный онлайн митап по Big Data и Java.

На «IT_One Meet Up: Java and Big Data» эксперты будут говорить о технологиях, инструментах, методах и многом другом, чем живут дата-специалисты.

В программе:
— Максим Стаценко, «Обзор технологий хранения больших данных. Плюсы, минусы, кому подойдет»;
— Вадим Опольский, «Apache Flink vs Свой Java Код. Для приземления данных из Kafka»;
— Круглый стол c Максимом Юнусовым, Вадимом Опольским и Максимом Стаценко, на котором спикеры обсудят системы хранения данных, архитектуры и разные подходы к работе с Big Data.

А еще вас будет ждать дискуссионная зона и розыгрыш подарков среди участников 🎁

Участие бесплатное, нужно только зарегистрироваться.

2.15K views08:18

There will be no singularity

Jupyter notebooks ~~здорового человека~~ для дата инженеров:

evidence.dev

маркдаун с sql, который рендерится в статический html

Обсуждение на HN:
https://news.ycombinator.com/item?id=28304781

2.26K views09:01

There will be no singularity

У меня есть еще одна коллекция - подборка экзотических применений SQL

Чего там только нет - и парсинг json и работа с файловой системой, с блокчейном и даже кубером. Сегодня добавился еще один пункт - рейтрейсинг oO

2.12K viewsedited 13:51

фига ты коллекционер... – 18

какой кринж... – 19

я джва года ждал такой sql! – 12

There will be no singularity

Если вы думаете, что создатели ORM уж точно умные ребята, с большой экспертизой в разных БД и знают как надо делать хорошо точно лучше, чем вы (и если историй про Django было недостаточно), то вот sequelize:

CREATE OR REPLACE FUNCTION pg_temp.sequelize_upsert() RETURNS integer AS $func$ BEGIN INSERT INTO ... VALUES(...); RETURN 1; EXCEPTION WHEN unique_violation THEN UPDATE ... SET ... WHERE ... ; RETURN 2; END; $func$ LANGUAGE plpgsql;
SELECT * FROM pg_temp.sequelize_upsert();

from
https://twitter.com/samokhvalov/status/1431147427612880899

Сингулярности не будет (18+)

Хороший фреймворк... и конкурсы интересные...

https://hakibenita.com/django-32-exciting-features#queryset-alias

2.55K viewsedited 07:07

There will be no singularity

Патент на JOIN…

https://twitter.com/andy_pavlo/status/1432405663523688449

Twitter

Andy Pavlo

USPTO just awarded Brytlyt a patent for their parallel join algorithm. In 2021!?! Parallel joins go back to the GRACE hash join algo in 1983 (and even further with MUFFIN). prnewswire.com/news-releases/…

2.24K views07:21

There will be no singularity

Кажется, что на smartdata я не попадаю в качестве докладчика со своими крутыми историями про snowflake, но это, конечно же, не повод не посмотреть эту конференцию. Вот, кстати список докладов. И еще...

1.8K views10:05

There will be no singularity

Конференция для дата-инженеров SmartData 2021 — 11-14 октября, онлайн

Вас ждёт 4 дня докладов о разных аспектах дата-инжиниринга: стриминг, хранение данных, MLOps, инструменты и многое другое.

Среди спикеров:
— Andy Pavlo, профессор компьютерных наук в университете Carnegie Mellon, эксперт по базам данных;
— Ash Berlin-Taylor, контрибьютор и член core team Apache Airflow, Director of Airflow Engineering в Astronomer;
— Владимир Озеров, руководитель компании Querify Labs, которая занимается исследованием и разработкой компонентов СУБД для технологических компаний;
— Tejas Chopra, Senior Software Engineer в команде Data Storage Platform в Netflix.

И это лишь начало списка — программа постоянно пополняется!

Специально для нашего канала организаторы сделали промокод nosingularity2021JRPc (действует на Personal Standard билет).

Подробнее почитать о принятых в программу докладах и купить билеты со скидкой можно на сайте.

2.48K views10:06

About

Blog

Apps

Platform