Forwarded from Записки C3PO
Еще и новую Midjorney подвезли (сетка для генерации изображения по текстовому описанию).
В этом твиттер треде можно глянуть на разницу между v4 и v5. Говорят, что теперь у людей, наконец, 5 пальцев.
https://twitter.com/nickfloats/status/1636116959267004416?s=46&t=I6EHIJSkJGBVFq_MSZWntg
Выглядит😘
В этом твиттер треде можно глянуть на разницу между v4 и v5. Говорят, что теперь у людей, наконец, 5 пальцев.
https://twitter.com/nickfloats/status/1636116959267004416?s=46&t=I6EHIJSkJGBVFq_MSZWntg
Выглядит
Please open Telegram to view this post
VIEW IN TELEGRAM
#midjourney
Если бы мне несколько лет тому сказали, что нейросеть нарисует по тексту вот такую картинку, я бы не поверил. А сегодня это обыденность. Вот вам и экспоненциальный прогресс. Сингулярность всё ближе, мы в неё падаем.
"Street style photo, Closeup shot, Nike Air Force 1 slytherin collab, unique Colorway, snake skin, hogwarts, natural lighting, original, unique, 4k --ar 16:9"
Если бы мне несколько лет тому сказали, что нейросеть нарисует по тексту вот такую картинку, я бы не поверил. А сегодня это обыденность. Вот вам и экспоненциальный прогресс. Сингулярность всё ближе, мы в неё падаем.
"Street style photo, Closeup shot, Nike Air Force 1 slytherin collab, unique Colorway, snake skin, hogwarts, natural lighting, original, unique, 4k --ar 16:9"
#postgres #pgbench #zfs
Потестил pg_bench PG15 на SSD в ext4 и zfs (с шифрованием/сжатием и без) в Ubuntu 22.04.
ZFS ENCRYPTED & COMPRESSED (LZ4):
sudo -i -u postgres pgbench -c 10 -j 2 -t 10000 example
latency average = 4.891 ms
initial connection time = 34.946 ms
tps = 2044.768698 (without initial connection time)
sudo -i -u postgres pgbench -c 10 -j 6 -t 10000 example
latency average = 4.552 ms
initial connection time = 17.378 ms
tps = 2196.925697 (without initial connection time)
ZFS ENCRYPTED & COMPRESSED (LZ4) TUNED WITH TIMESCALEDB:
sudo -i -u postgres pgbench -c 10 -j 2 -t 10000 example
latency average = 4.031 ms
initial connection time = 31.661 ms
tps = 2480.899924 (without initial connection time)
latency average = 3.850 ms
initial connection time = 31.273 ms
tps = 2597.574037 (without initial connection time)
latency average = 3.889 ms
initial connection time = 32.503 ms
tps = 2571.192661 (without initial connection time)
sudo -i -u postgres pgbench -c 10 -j 6 -t 10000 example
latency average = 3.784 ms
initial connection time = 27.329 ms
tps = 2642.536852 (without initial connection time)
latency average = 3.741 ms
initial connection time = 17.922 ms
tps = 2673.011469 (without initial connection time)
latency average = 3.679 ms
initial connection time = 16.235 ms
tps = 2718.262035 (without initial connection time)
ZFS NON-ENCRYPTED & COMPRESSED (LZ4):
sudo -i -u postgres pgbench -c 10 -j 2 -t 10000 example
latency average = 4.660 ms
initial connection time = 38.052 ms
tps = 2146.130682 (without initial connection time)
latency average = 4.507 ms
initial connection time = 39.378 ms
tps = 2218.757361 (without initial connection time)
latency average = 4.266 ms
initial connection time = 36.697 ms
tps = 2344.329379 (without initial connection time)
sudo -i -u postgres pgbench -c 10 -j 6 -t 10000 example
latency average = 3.936 ms
initial connection time = 21.317 ms
tps = 2540.753366 (without initial connection time)
latency average = 3.915 ms
initial connection time = 17.523 ms
tps = 2554.329177 (without initial connection time)
latency average = 4.076 ms
initial connection time = 21.361 ms
tps = 2453.572519 (without initial connection time)
ZFS NON-ENCRYPTED & COMPRESSED (LZ4) TUNED WITH TIMESCALEDB:
sudo -i -u postgres pgbench -c 10 -j 2 -t 10000 example
latency average = 3.648 ms
initial connection time = 34.840 ms
tps = 2741.206504 (without initial connection time)
latency average = 3.473 ms
initial connection time = 39.593 ms
tps = 2879.122987 (without initial connection time)
latency average = 3.592 ms
initial connection time = 34.987 ms
tps = 2783.957080 (without initial connection time)
sudo -i -u postgres pgbench -c 10 -j 6 -t 10000 example
latency average = 3.346 ms
initial connection time = 21.312 ms
tps = 2988.591798 (without initial connection time)
latency average = 3.178 ms
initial connection time = 18.359 ms
tps = 3147.071197 (without initial connection time)
latency average = 3.337 ms
initial connection time = 19.320 ms
tps = 2996.486500 (without initial connection time)
EXT4 NON-ENCRYPTED NON-COMPRESSED TUNED WITH TIMESCALEDB
sudo -i -u postgres pgbench -c 10 -j 2 -t 10000 example
latency average = 2.596 ms
initial connection time = 86.466 ms
tps = 3852.682810 (without initial connection time)
latency average = 2.751 ms
initial connection time = 89.400 ms
tps = 3635.586811 (without initial connection time)
latency average = 2.719 ms
initial connection time = 92.922 ms
tps = 3677.184800 (without initial connection time)
sudo -i -u postgres pgbench -c 10 -j 6 -t 10000 example
latency average = 2.643 ms
initial connection time = 50.687 ms
tps = 3784.041569 (without initial connection time)
latency average = 2.518 ms
initial connection time = 42.306 ms
tps = 3971.158272 (without initial connection time)
latency average = 2.560 ms
initial connection time = 40.711 ms
tps = 3906.430062 (without initial connection time)
Потестил pg_bench PG15 на SSD в ext4 и zfs (с шифрованием/сжатием и без) в Ubuntu 22.04.
ZFS ENCRYPTED & COMPRESSED (LZ4):
sudo -i -u postgres pgbench -c 10 -j 2 -t 10000 example
latency average = 4.891 ms
initial connection time = 34.946 ms
tps = 2044.768698 (without initial connection time)
sudo -i -u postgres pgbench -c 10 -j 6 -t 10000 example
latency average = 4.552 ms
initial connection time = 17.378 ms
tps = 2196.925697 (without initial connection time)
ZFS ENCRYPTED & COMPRESSED (LZ4) TUNED WITH TIMESCALEDB:
sudo -i -u postgres pgbench -c 10 -j 2 -t 10000 example
latency average = 4.031 ms
initial connection time = 31.661 ms
tps = 2480.899924 (without initial connection time)
latency average = 3.850 ms
initial connection time = 31.273 ms
tps = 2597.574037 (without initial connection time)
latency average = 3.889 ms
initial connection time = 32.503 ms
tps = 2571.192661 (without initial connection time)
sudo -i -u postgres pgbench -c 10 -j 6 -t 10000 example
latency average = 3.784 ms
initial connection time = 27.329 ms
tps = 2642.536852 (without initial connection time)
latency average = 3.741 ms
initial connection time = 17.922 ms
tps = 2673.011469 (without initial connection time)
latency average = 3.679 ms
initial connection time = 16.235 ms
tps = 2718.262035 (without initial connection time)
ZFS NON-ENCRYPTED & COMPRESSED (LZ4):
sudo -i -u postgres pgbench -c 10 -j 2 -t 10000 example
latency average = 4.660 ms
initial connection time = 38.052 ms
tps = 2146.130682 (without initial connection time)
latency average = 4.507 ms
initial connection time = 39.378 ms
tps = 2218.757361 (without initial connection time)
latency average = 4.266 ms
initial connection time = 36.697 ms
tps = 2344.329379 (without initial connection time)
sudo -i -u postgres pgbench -c 10 -j 6 -t 10000 example
latency average = 3.936 ms
initial connection time = 21.317 ms
tps = 2540.753366 (without initial connection time)
latency average = 3.915 ms
initial connection time = 17.523 ms
tps = 2554.329177 (without initial connection time)
latency average = 4.076 ms
initial connection time = 21.361 ms
tps = 2453.572519 (without initial connection time)
ZFS NON-ENCRYPTED & COMPRESSED (LZ4) TUNED WITH TIMESCALEDB:
sudo -i -u postgres pgbench -c 10 -j 2 -t 10000 example
latency average = 3.648 ms
initial connection time = 34.840 ms
tps = 2741.206504 (without initial connection time)
latency average = 3.473 ms
initial connection time = 39.593 ms
tps = 2879.122987 (without initial connection time)
latency average = 3.592 ms
initial connection time = 34.987 ms
tps = 2783.957080 (without initial connection time)
sudo -i -u postgres pgbench -c 10 -j 6 -t 10000 example
latency average = 3.346 ms
initial connection time = 21.312 ms
tps = 2988.591798 (without initial connection time)
latency average = 3.178 ms
initial connection time = 18.359 ms
tps = 3147.071197 (without initial connection time)
latency average = 3.337 ms
initial connection time = 19.320 ms
tps = 2996.486500 (without initial connection time)
EXT4 NON-ENCRYPTED NON-COMPRESSED TUNED WITH TIMESCALEDB
sudo -i -u postgres pgbench -c 10 -j 2 -t 10000 example
latency average = 2.596 ms
initial connection time = 86.466 ms
tps = 3852.682810 (without initial connection time)
latency average = 2.751 ms
initial connection time = 89.400 ms
tps = 3635.586811 (without initial connection time)
latency average = 2.719 ms
initial connection time = 92.922 ms
tps = 3677.184800 (without initial connection time)
sudo -i -u postgres pgbench -c 10 -j 6 -t 10000 example
latency average = 2.643 ms
initial connection time = 50.687 ms
tps = 3784.041569 (without initial connection time)
latency average = 2.518 ms
initial connection time = 42.306 ms
tps = 3971.158272 (without initial connection time)
latency average = 2.560 ms
initial connection time = 40.711 ms
tps = 3906.430062 (without initial connection time)
Уважаемые DBA, MLOPS, DS, а вы тюните праметры СУБД перед развёртыванием в проде?
Anonymous Poll
33%
Нет, использую дефолтные
67%
Если хватает времени, пробую вручную несколько комбинаций
0%
Использую бенчмарки и полный перебор всех комбинаций системных и СУБДшных параметров
0%
Использую бенчмарки и стороннее решение для умного подбора лучших параметров (напишу в комментах)
0%
Использую бенчмарки и самописное ML решение для умного подбора лучших параметров
#chatgpt #fantasy
Много лет я пытался вспомнить/найти рассказ, когда-то прочитанный в детстве и оставивший сильное впечатление. Раз в несколько лет я о нём вспоминаю и начинаю пару часов гуглить, как обычно, безуспешно. Там очень красивая история.
Она об учёном, который хотел изобрести космические двигатели нового типа. В которые никто не верил, даже его лучший друг и девушка.
А он вёл разработки, но всё не получалось, он со всеми разругалcя и отчаялся Всё происходило в будущем, уже вышли на контакт с несколькими инопланетными расами. Тут его зовут на работу какие-то как раз представители одной из рас, начальником лаборатории по разработке оружия. И общем, он создаёт для них непобедимую армаду, космический флот, который начинает завоевывать Галактику. И уже давно он догадывается, что его новые друзья хотят повернуть его против землян. Самое интересное, что земляне назначают главой армии защиты.. его друга, который (сюрприз) женат на его бывшей девушке. Бывшие друзья пытаются с ним выйти на связь, убеждают, мол, ты же человек, помоги нам, нафига тебе эти жабы инопланетные. А у него, понятно, уязвлённая гордость, мол - что они противопоставят моим гениальным изобретениям? И при первой стычке понимает, что земные корабли оснащены теми самыми двигателями нового типа, сделанными по его чертежам, которые доработал его друг. Но это все земляным не поможет. В итоге он направляет весь флот захватчиков прямо в Солнце, за что его там же убивают "наниматели".
Много лет я пытался вспомнить/найти рассказ, когда-то прочитанный в детстве и оставивший сильное впечатление. Раз в несколько лет я о нём вспоминаю и начинаю пару часов гуглить, как обычно, безуспешно. Там очень красивая история.
Она об учёном, который хотел изобрести космические двигатели нового типа. В которые никто не верил, даже его лучший друг и девушка.
А он вёл разработки, но всё не получалось, он со всеми разругалcя и отчаялся Всё происходило в будущем, уже вышли на контакт с несколькими инопланетными расами. Тут его зовут на работу какие-то как раз представители одной из рас, начальником лаборатории по разработке оружия. И общем, он создаёт для них непобедимую армаду, космический флот, который начинает завоевывать Галактику. И уже давно он догадывается, что его новые друзья хотят повернуть его против землян. Самое интересное, что земляне назначают главой армии защиты.. его друга, который (сюрприз) женат на его бывшей девушке. Бывшие друзья пытаются с ним выйти на связь, убеждают, мол, ты же человек, помоги нам, нафига тебе эти жабы инопланетные. А у него, понятно, уязвлённая гордость, мол - что они противопоставят моим гениальным изобретениям? И при первой стычке понимает, что земные корабли оснащены теми самыми двигателями нового типа, сделанными по его чертежам, которые доработал его друг. Но это все земляным не поможет. В итоге он направляет весь флот захватчиков прямо в Солнце, за что его там же убивают "наниматели".
🆒1
#fb #ai
Хотя бы алгоритм рекомендации друзей в ФБ поправили для начала, мне какую-то нерелевантную фигню предлагает. Метавселяторы хреновы.
https://3dnews.ru/1083588/tsukerberg-zayavil-chto-iskusstvenniy-intellekt-yavlyaetsya-osnovnim-prioritetom-meta
Хотя бы алгоритм рекомендации друзей в ФБ поправили для начала, мне какую-то нерелевантную фигню предлагает. Метавселяторы хреновы.
https://3dnews.ru/1083588/tsukerberg-zayavil-chto-iskusstvenniy-intellekt-yavlyaetsya-osnovnim-prioritetom-meta
3DNews - Daily Digital Digest
Все самое интересное из мира IT-индустрии
Самые интересные и оперативные новости из мира высоких технологий. На нашем портале - все о компьютерном железе, гаджетах, ноутбуках и других цифровых устройствах. А также обзоры новых игр, достижения современной науки и самые любопытные онлайн-проекты.
#postgres
"pg_repack is a PostgreSQL extension which lets you remove bloat from tables and indexes, and optionally restore the physical order of clustered indexes. Unlike CLUSTER and VACUUM FULL it works online, without holding an exclusive lock on the processed tables during processing. pg_repack is efficient to boot, with performance comparable to using CLUSTER directly."
https://github.com/reorg/pg_repack/
"pg_repack is a PostgreSQL extension which lets you remove bloat from tables and indexes, and optionally restore the physical order of clustered indexes. Unlike CLUSTER and VACUUM FULL it works online, without holding an exclusive lock on the processed tables during processing. pg_repack is efficient to boot, with performance comparable to using CLUSTER directly."
https://github.com/reorg/pg_repack/
GitHub
GitHub - reorg/pg_repack: Reorganize tables in PostgreSQL databases with minimal locks
Reorganize tables in PostgreSQL databases with minimal locks - reorg/pg_repack
#db #tuning #postgres
Любопытная ситуация. За много лет DBA-шное сообщество, кажется, ничего так и не придумало для оптимизации параметров СУБД. Уж на примере Постгре точно. Разрабам ядра PG положить с прибором на это, они слишком старомодны и консервативны, до сих пор считают, что рабочую память, да и все остальные параметры, сисадмин должен ручками прописывать. Есть pg_bench, но неясно, как его толком применить к настройке. Ведь параметры СУБД взаимодействуют с настройками ОС и ФС, причем зачастую нелинейно. А есть же ещё параметры железа. А еще версии ОС, ФС, СУБД. А еще разные запросы и разное распределение данных в таблицах, поэтому универсальные рекомендации дать трудно. Надо или брутфорсить сотни тысяч комбинаций pgbench-ем (на сервере близком к боевому), или оверпровижинить, или забивать на оптимальность. Почему я один в этом вижу проблему? PostgresPro, возможно, как-то над этим работают, но с их ценником в миллион за ядро я их даже не рассматриваю.
Любопытная ситуация. За много лет DBA-шное сообщество, кажется, ничего так и не придумало для оптимизации параметров СУБД. Уж на примере Постгре точно. Разрабам ядра PG положить с прибором на это, они слишком старомодны и консервативны, до сих пор считают, что рабочую память, да и все остальные параметры, сисадмин должен ручками прописывать. Есть pg_bench, но неясно, как его толком применить к настройке. Ведь параметры СУБД взаимодействуют с настройками ОС и ФС, причем зачастую нелинейно. А есть же ещё параметры железа. А еще версии ОС, ФС, СУБД. А еще разные запросы и разное распределение данных в таблицах, поэтому универсальные рекомендации дать трудно. Надо или брутфорсить сотни тысяч комбинаций pgbench-ем (на сервере близком к боевому), или оверпровижинить, или забивать на оптимальность. Почему я один в этом вижу проблему? PostgresPro, возможно, как-то над этим работают, но с их ценником в миллион за ядро я их даже не рассматриваю.
#zfs #slog
https://klarasystems.com/articles/what-makes-a-good-time-to-use-openzfs-slog-and-when-should-you-avoid-it/#:~:text=It%20does%20not%20need%20to,16GB%20to%2064GB%20is%20sufficient.
https://klarasystems.com/articles/what-makes-a-good-time-to-use-openzfs-slog-and-when-should-you-avoid-it/#:~:text=It%20does%20not%20need%20to,16GB%20to%2064GB%20is%20sufficient.
Klara Inc
What Makes a Good Time to Use OpenZFS Slog and When Should You Avoid It
Learn all about the OpenZFS SLOG and ensure new ways to support your data better with ZFS.
#postgres #tuning
Отличное руководство по параметрам постгре, в логической разбивке по группам (память, планировщик, безопасность, подключения, репликация, итд.)
https://www.youtube.com/watch?v=13d4BDYSYyM&ab_channel=EDB
Отличное руководство по параметрам постгре, в логической разбивке по группам (память, планировщик, безопасность, подключения, репликация, итд.)
https://www.youtube.com/watch?v=13d4BDYSYyM&ab_channel=EDB
YouTube
How to use postgresql.conf to configure and tune the PostgreSQL server
Tuning your PostgreSQL server plays an important role in making sure you get the most out of your server resources, and running with default parameters is not always enough. Using the PostgreSQL server configuration file postgresql.conf, we can tune the right…
Forwarded from Kali Novskaya (Tatiana Shavrina)
#nlp #про_nlp #nlp_papers
Я решила немного чаще рассказывать вам про работы, которые мы делаем с коллегами вместе, да и вообще больше привлекать внимания к менее хайповым не-чатгпт научным проблемам, поэтому введу новую рубрику — #nlp_papers
Сегодня поговорим о том, как можно применять теорию общественного выбора к оценке LLM.
Vote'n'Rank: Revision of Benchmarking with Social Choice Theory
Теория общественного выбора (Social choice theory) — это теоретические и практические методы агрегирования или объединения индивидуальных предпочтений в функцию коллективного общественного благосостояния. Обычно в этой области предполагается, что у людей есть предпочтения, и из этого следует, что их можно смоделировать с помощью функций полезности.
🌸Проблема: современные языковые модели оцениваются на целом ворохе различных задач. В результате такой оценки на каждую модель приходится по 20-30 метрик, зачастую разной природы (точность, полнота, Bert score, MCC..) и диапазона (от 0 до 1, от -1 до 1, и т.д.). Как на основании таких результатов выстраивать лидерборд лучших моделей? Усреднять такое явно нельзя. Да и потом, является ли лучшее среднее всех результатов по всем задачам оптимальным направлением наших стремлений?
🌸Идея: Позаимствуем методы рассчетов из теории общественного выбора и перевзвесим результаты моделей на GLUE, SuperGLUE и VALUE (Video-and-Language Understanding Evaluation).
Будем использовать такие правила агрегации, как скоринговые правила (Plurality, Borda, Dowdall), итеративные скоринговые правила (пороговое правило, Baldwin), и мажоритарные правила (Condorcet rule, Copeland rule).
Агрегации Vote'n'Rank более надежны, чем среднее арифметическое всех метрик, и в то же время способны обрабатывать отсутствующие значения на разных задачах и указывать условия, при которых система становится победителем.
• Правило множественности (Plurality)— хороший выбор, если пользователю нужны только лучшие системы по каждой задаче.
• Если все позиции в рейтинге имеют значение, используйте правила Borda или Dowdall. Обратите внимание, что Даудалл присваивает более высокие веса верхним позициям.
• Пороговое правило полезно в тех случаях, когда пользователь хочет свести к минимуму количество задач с низким результатом: правило присваивает наивысший ранг системе, которая считается худшей по наименьшему числу задач.
• Если цель состоит в том, чтобы выбрать систему, которая превосходит все остальные в попарном сравнении, используйте правила Болдуина, Кондорсе, Коупленда или правила Минимакса.
Feel free использовать в своих пайплайнах оценки моделей!
🖥 Paper: https://arxiv.org/abs/2210.05769v3
🖥 Github: https://github.com/PragmaticsLab/vote_and_rank
🌸Accepted EACL 2023
Я решила немного чаще рассказывать вам про работы, которые мы делаем с коллегами вместе, да и вообще больше привлекать внимания к менее хайповым не-чатгпт научным проблемам, поэтому введу новую рубрику — #nlp_papers
Сегодня поговорим о том, как можно применять теорию общественного выбора к оценке LLM.
Vote'n'Rank: Revision of Benchmarking with Social Choice Theory
Теория общественного выбора (Social choice theory) — это теоретические и практические методы агрегирования или объединения индивидуальных предпочтений в функцию коллективного общественного благосостояния. Обычно в этой области предполагается, что у людей есть предпочтения, и из этого следует, что их можно смоделировать с помощью функций полезности.
🌸Проблема: современные языковые модели оцениваются на целом ворохе различных задач. В результате такой оценки на каждую модель приходится по 20-30 метрик, зачастую разной природы (точность, полнота, Bert score, MCC..) и диапазона (от 0 до 1, от -1 до 1, и т.д.). Как на основании таких результатов выстраивать лидерборд лучших моделей? Усреднять такое явно нельзя. Да и потом, является ли лучшее среднее всех результатов по всем задачам оптимальным направлением наших стремлений?
🌸Идея: Позаимствуем методы рассчетов из теории общественного выбора и перевзвесим результаты моделей на GLUE, SuperGLUE и VALUE (Video-and-Language Understanding Evaluation).
Будем использовать такие правила агрегации, как скоринговые правила (Plurality, Borda, Dowdall), итеративные скоринговые правила (пороговое правило, Baldwin), и мажоритарные правила (Condorcet rule, Copeland rule).
Агрегации Vote'n'Rank более надежны, чем среднее арифметическое всех метрик, и в то же время способны обрабатывать отсутствующие значения на разных задачах и указывать условия, при которых система становится победителем.
• Правило множественности (Plurality)— хороший выбор, если пользователю нужны только лучшие системы по каждой задаче.
• Если все позиции в рейтинге имеют значение, используйте правила Borda или Dowdall. Обратите внимание, что Даудалл присваивает более высокие веса верхним позициям.
• Пороговое правило полезно в тех случаях, когда пользователь хочет свести к минимуму количество задач с низким результатом: правило присваивает наивысший ранг системе, которая считается худшей по наименьшему числу задач.
• Если цель состоит в том, чтобы выбрать систему, которая превосходит все остальные в попарном сравнении, используйте правила Болдуина, Кондорсе, Коупленда или правила Минимакса.
Feel free использовать в своих пайплайнах оценки моделей!
🌸Accepted EACL 2023
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - PragmaticsLab/vote_and_rank: Novel aggregation methods for multi-task NLP benchmarking
Novel aggregation methods for multi-task NLP benchmarking - PragmaticsLab/vote_and_rank
❤1