NEW BOT Телеграм, страница

There will be no singularity

Алекс недавно у себя в канале написал пост, что все и так проклято, а люди web3 с метаверсами пилят.

Но все тут собравшиеся знают, что сингулярности не будет :)

Ну не будет и не будет, чего ворчать-то?

Мне тут просто ~~музыкой~~ навеяло...
В ближайшее время на parsers.dev и holistic.dev ожидается релиз mysql/mariadb.
И пока я писал AST-парсер и компилятор, я желал всех благ и здоровья товарищу Монти.

Почему-то постоянно вспоминал смешную статью "Узник замка Фаренгейт":
"Фаренгейту посчастливилось умереть достаточно давно. Будь он жив, к нему бы пришли люди, говорящие с акцентом и убили его арматурными прутьями"

Но это так...
Раздумывая о том какие правила анализатора надо написать в первую очередь, я наткнулся на кеширование запросов.
Нет, не планов запросов, а запросов. Прям побайтово.
Работало это так:
- ключом кеширования является целиком текст запроса. Прям вот с учетом регистра.
- в кеш сохраняется результат выполнения запроса и список таблиц, которые были использованы.
- если какая-то из таблиц обновилась, то кеш очищается.

Прям мем "we have food at home":
- мама, я хочу materialized view!
- materialized view есть у нас дома.
materialized дома: query cache

Там еще много всяких приколов с транзакциями, но это вообще-то и не особо удивительно.
Дальше я случайно наткнулся на кусок исходника, который за это дело отвечает:

https://github.com/twitter-forks/mysql/blob/master/sql/sql_cache.cc#L603

static bool has_no_cache_directive(char *sql)
{
  int i=0;
  while (sql[i] == ' ')
    ++i;
    
  if (my_toupper(system_charset_info, sql[i])    == 'S' &&
      my_toupper(system_charset_info, sql[i+1])  == 'Q' &&
      my_toupper(system_charset_info, sql[i+2])  == 'L' &&
      my_toupper(system_charset_info, sql[i+3])  == '_' &&
      my_toupper(system_charset_info, sql[i+4])  == 'N' &&
      my_toupper(system_charset_info, sql[i+5])  == 'O' &&
      my_toupper(system_charset_info, sql[i+6])  == '_' &&
      my_toupper(system_charset_info, sql[i+7])  == 'C' &&
      my_toupper(system_charset_info, sql[i+8])  == 'A' &&
      my_toupper(system_charset_info, sql[i+9])  == 'C' &&
      my_toupper(system_charset_info, sql[i+10]) == 'H' &&
      my_toupper(system_charset_info, sql[i+11]) == 'E' &&
      my_toupper(system_charset_info, sql[i+12]) == ' ')
    return TRUE;
  
  return FALSE;       
}

https://github.com/twitter-forks/mysql/blob/master/sql/sql_cache.cc#L1490

if ((my_toupper(system_charset_info, sql[i])     != 'S' ||
      my_toupper(system_charset_info, sql[i + 1]) != 'E' ||
      my_toupper(system_charset_info, sql[i + 2]) != 'L') &&
    sql[i] != '/')
{
  DBUG_PRINT("qcache", ("The statement is not a SELECT; Not cached"));
  goto err;
}

На этом, как говорится, мои полномочия все...
А "Узник замка Фаренгейт" вы прочитайте. Смешное.

2.2K views07:05

п#здец! 44

моя любимая фича :) – 14

релизь уже скорее! – 9

There will be no singularity

не все полимеры еще пролюблены…

2.18K views11:21

There will be no singularity

Forwarded from пивной негодяй (bribón de la cerveza) ඞ

0:59

This media is not supported in your browser

VIEW IN TELEGRAM

зачем нужны типы, если string уже придумали

2.15K views08:23

There will be no singularity

В postgresql 15 (да, осенью будет уже 15 версия, обновитесь уже с вашей 9.6) будут json логи.
нунаканецта! :)

https://www.depesz.com/2022/01/17/waiting-for-postgresql-15-introduce-log_destinationjsonlog/

1.82K views12:19

There will be no singularity

Завидую (нет) упорству тех товарищей, которые уверены, что можно написать универсальный парсер (и компилятор) для разных диалектов SQL.

Нет, ну, парсеры бывают разные. Например, парсеры для подсветки синтаксиса: распознаем все знакомые токены и раскрашиваем их в разные цвета.

Следующий этап - распознать похожие на подходящие токены в нужных местах запроса. Тут довольно часто тоже можно срезать углы, но только если у вас нет в планах компилятора или какого-нибудь intellisense.
Внезапно различия начинаются прямо на этапе описания идентификаторов.

В Postgresql имена таблиц и колонок можно записать как table1, Table1 и "Table1". Первые два будут приведены к одному виду (в нижний регистр), а для обращения к последнему нужно будет и дальше брать в кавычки и соблюдать регистр. Одинарные кавычки будут ошибкой.

В Snowflake table1 и Table1 будут приведены к верхнему регистру, для регистрозависимого имени нужно будет так же указать имя в двойных кавычках.
Можно еще задать имя в обратный одинарных кавычках - `table1`. Оно приведется к верхнему регистру, а кавычки останутся частью имени.

В Mysql table1 и Table1 будут РАЗНЫМИ объектами, а `table1` будет равен table1. Одинарные и двойные кавычки будут ошибкой.
Да, еще в Mysql можно начинать имя с $, нигде такого безобразия нет.

В Postgresql и Mysql имена объектов можно указывать не только латинскими буквами, но и кириллическими.
А в Snowflake нет.

Но зато там есть такая конструкция как identifier:

create table identifier($my_table_name) (i integer);
select * from identifier($my_table_name);

И режим nighmare - валидирующий парсер.
Это когда синтаксис будет распознан как невалидный по тем же правилам, что и в целевой базе.
Здесь появляются отдельные списки токенов, которые нельзя использовать. Причем, нельзя не везде :)

Например, в Snowflake ключевое слово LIMIT - не ключевое слово и его можно использовать как алиас. Во всех базах такое не пройдет:

select * from t as limit limit 1

А в Snowflake все ок.

Еще есть отдельный список того, что нельзя использовать в качестве имен таблиц.
Отдельный список того, что нельзя использовать в качестве имен колонок.
Но не всегда. Иногда можно.

Например, в Snowflake CONSTRAINT может быть именем поля, но только в кавычках. А CURRENT_DATE не может даже в кавычках.
Но это имена полей. Именами таблиц и то и то может быть даже без кавычек...

А в Mysql можно ключевые слова использовать как имена полей, если взять их в обратные кавычки:

create table t(`limit` integer);

Но в запросе

select limit from t;

так нельзя, а так

select t.limit from t;

уже можно :)

В Postgresql и Snowflake можно и так и так...

С компиляторами, кстати, тоже отличная история.
В Snowflake и Clickhouse можно переиспользовать алиасы в рантайме:

 select 1 as a, a + 1 as b

а в Postgresql и Mysql нет.

Mysql важно в каком регистре написаны имена таблиц, но на колонки в этом случае почему-то наплевать: table1.field1 и table1.Field1 это одно и то же.
Очень удобно.

Неименованные динамические колонки так же работают по-разному:

select 1+2
-3 + 'a'

В Postgresql все колонки без имени будут назваться '?column?'
В Mysql и Snowflake будет взят исходный код запроса, в нем заменены все переносы строк на пробелы и все приведено к соответствующему регистру - в Mysql к нижнему, в Snowflake к верхнему и будет выглядеть как "1+2 -3 + 'a'"

"Зачем, ты дед, втираешь нам какую-то дичь?", - спросите вы. А я вам скажу. Будьте зайками, не используйте в именах объектов ключевые слова языка. И кавычки тоже.
Это сэкономит много часов дебага.

В holistic.dev, кстати, есть правило, которое вам на это укажет! (playground)

PS: всем кто не любит js, но любит mysql: там строки в математических операциях молча кастятся к нулю.
И делить на 0 можно. NULL получается.
Ладно хоть NULL = NULL это NULL, а не true...

2.3K views07:05

да ну нахер!.. – 52

вот ты упоролся... – 31

а вакансии у вас есть? – 17

There will be no singularity

Вышла новая бесплатная книга от postgrespro по внутренностям PostgreSQL

https://postgrespro.ru/education/books/internals

Postgres Professional

Компания Postgres Professional

Postgres Professional - российская компания, разработчик систем управления базами данных

2.37K viewsedited 14:36

There will be no singularity

127 окон хватит всем! :)

1.7K views16:34

There will be no singularity

https://dev.mysql.com/doc/relnotes/mysql/8.0/en/news-8-0-28.html

1.87K viewsedited 16:34

There will be no singularity

https://blog.crunchydata.com/blog/postgres-indexes-for-newbies

Crunchy Data

Postgres Indexes for Newbies | Crunchy Data Blog

Samples of b-tree, GIN, and GIST indexes for Postgres beginners.

2.26K views07:57

There will be no singularity

По мотивам истории с faker.js заметка злого фронтенда про гугл шрифты:

https://news.1rj.ru/str/angry_front_end/20

Angry Frontend

Кстати, о вечном.

Немного пострефлексии на ночь.

Вы ведь все фиксируете версию npm пакетов в своих уютных package.json? Никаких ^ и - упаси Боже! - ~? Нет? Тогда мы идём к вам. Но с другой стороны. Ведь как известно, на всякую хитрую жопу найдётся свой…

2.61K views07:48

There will be no singularity

Пришло письмо от PGConf.Russia
В этом году будет проходить 28 февраля – 01 марта.

Программы пока нет, ждут доклады.

https://pgconf.ru/2022

pgconf.ru

PGConf.Russia 2022

PGConf.Russia 2022 – международная техническая конференция по открытой СУБД PostgreSQL, ежегодно проходящая в Москве.

2.1K views10:21

There will be no singularity

Комрадс, свершилось!
Начинаю искать сотрудников в holistic.dev

Работать работу. Оплата деньгами.

Прямо сейчас нужны js'еры, кто умеет в типы (ts/flow) и знает про SQL.
Сначала писать будем правила для анализатора.

Т.е. никаких крудов и перекладывания жсонов (хотя, блин, как посмотреть).

Не-js'ры, желающие влиться в наш ~~молодой (кхе-кхе)~~ дедовский коллектив, тоже вэлкам, бэклог на 5 лет вперед, работа найдется :)
Так же нужен будет техпис, который знает про SQL.

Пишите мне в личку @antonrevyako

Помни, лайк и шер повышает стрит кридабилити! :)

2.51K viewsedited 14:45

There will be no singularity

Forwarded from Протестировал (Sergey Bronnikov)

Крутейшая новость для тех, кто любит читать пейперы (а именно препринты на arXiv). Если в ссылке на abstract статьи заменить "arxiv" на "ar5iv", то можно читать статью в виде веб-страницы. Тут больше деталей - https://twitter.com/dginev/status/1488157927001268231

Примеры статей:

https://arxiv.org/html/1504.00204 → https://ar5iv.org/html/1504.00204
https://arxiv.org/html/2102.02527 → https://ar5iv.org/html/2102.02527

1.87K views14:17

There will be no singularity

https://twitter.com/IaaSgeek/status/1488799161038389252

Twitter

Guillermo Ruiz

I don't know who did this...but It made my day 😂 AWS moving workloads out of Exadata #HappyWednesday #CloudHumor

2.03K views09:50

There will be no singularity

Час назад выложили плейлист SmartData 2021

https://www.youtube.com/playlist?list=PLeN_80lmoMY37-33D7Jbq09x9wt5BcdBb

YouTube

SmartData 2021: Community Day & активности из главной студии - YouTube

2.37K viewsedited 10:39

There will be no singularity

Первый раз в жизни был гостем подкаста и мне с первого раза понравилось :)

Поразгоняли про snowflake, статические анализаторы и наш замечательный data lineage продукт dwh.dev

Го слушать :)

https://news.1rj.ru/str/datacoffee/88

PS: если вы работаете со snowflake, но почему-то еще не в наших чатиков, самое время присоединиться:

ru - https://news.1rj.ru/str/snowflakedbchat
en - https://news.1rj.ru/str/snowflakedbchat_en
news - https://news.1rj.ru/str/snowflake_daily

Data Coffee

▶️3️⃣8️⃣
Ещё один эпизод в копилку “технических”. Мы добрались до Snowflake и послушали правильного для этой темы человека! В гостях подкаста Data Coffee🎙 был Антон Ревяко — автор канала “Сингулярности не будет”, фаундер holistic.dev, dwh.dev и parsers.dev…

2.25K views11:19

найс! – 10

ну ты и болтун :) – 7

There will be no singularity

3.52K views09:07

There will be no singularity

А вот это неплохо:
использовать синтаксис партиционирования, чтобы на балансере сделать из партиций шарды.
Понятно, что про сквозные констрейнты (PK, UNIQUE) можно забыть, но если это не требуется, то звучит интересно…

https://github.com/levkk/pgcat

GitHub

GitHub - postgresml/pgcat: PostgreSQL pooler with sharding, load balancing and failover support.

PostgreSQL pooler with sharding, load balancing and failover support. - postgresml/pgcat

2.18K views08:16

There will be no singularity

https://gist.github.com/joelonsql/e5aa27f8cc9bd22b8999b7de8aee9d47

Gist

1000+ PostgreSQL EXTENSIONs

1000+ PostgreSQL EXTENSIONs. GitHub Gist: instantly share code, notes, and snippets.

2.2K views07:48

There will be no singularity

+1 графовая база со своим языком. На это раз поверх постгри:

https://www.edgedb.com/blog/edgedb-1-0

video: http://youtu.be/WRZ3o-NsU_4

Концепция делать новые базы поверх существующих хороших баз мне очень нравится :)
Сам планирую одну…

К слову, Firebolt сделан поверх Clickhouse, FerretDB поверх постгри.

Geldata

EdgeDB 1.0 | Gel Blog

Today, after years of research, development, and refinement EdgeDB graduates to a production-ready database. We are very proud to announce EdgeDB 1.0.

2.39K views08:01

There will be no singularity

В чатике дата инженеров показали опенсорсную тулзу для lineage.
Мне стало интересно, что даже пришлось ставить богомерзкий питон, чтобы потестить.

Предсказуемо, тулза не понимает специфичного для разных баз синтаксиса, потому что основана на другом опенсорс пакете, который его не понимает.
О чем я и рассказал в этом чатике, позвав всех нуждающихся в lineage для snowflake к нам в dwh.dev

За что мне мгновенно напихали в панамку на тему того, что я скАтина такая, не контрибучу в опенсорс, а посмел сделать что-то лучше, чем есть в опенсорсе, да еще и за деньги (кстати, пока бесплатно).

Так-то оно, конечно, так, но это отличный повод напомнить про мою подборку опенсорс тулзин для SQL :)

https://github.com/antonrevyako/useful-links/blob/master/opensource-sql-tools.md

2.18K views12:33

жадина! – 8

халявщики! – 11

про мильены в oss рассказывали? – 29

About

Blog

Apps

Platform