NEW BOT Телеграм, страница

Data Secrets

Время для интересных фактов:

– Факт 1: SQLite – самая распространенная БД, сейчас в мире более триллиона активных баз SQLite

– Факт 2: SQLite создали и обслуживают всего три человека. Вот они, на фотографии. Хотя проект опенсурс, там не допускается свободный контрибьют, то есть все держится на этих троих

– Факт 3: на каждую строку кода в SQLite приходится 600 строк тестов

А как дела у вас в ~~качалке~~ в проекте?

🤯71🔥14👍11

6.8K views12:13

Data Secrets

9 примеров самых безумных корреляций

– Потребление сыра / Число до смерти запутавшихся в простынях. Корреляция 94,71%

– Общая выручка аркадных игр / Докторские степени по компьютерным наукам в США. Корреляция 98,51%

– Число людей, утонувших в бассейне / Количество фильмов с Николасом Кейджем. Корреляция 95,24%

– И еще несколько подобных примеров

Ну в общем, теории заговора или почему не всегда стоит доверять корреляциям

🔥75❤11😁9👍6🤩1

9.72K views17:36

Data Secrets

Amazon закрывают магазины Just Walk Out (те самые берешь и уходишь)

Дело в том, что технология не возымела спрос у крупных ретейлеров. Ну хотя «технология» – сказано громко. Еще год назад выяснилось, что ИИ там никакого нет, и записи с камер вручную обрабатывают кожаные работяги из Индии.

С другой стороны, в Amazon утверждают, что люди подключались только когда моделька затруднялась принять решение. Кому верить – непонятно, но ясно, что без массовой ручной разметки и перепроверки тут не обошлось точно.

Мастер класс по тестированию продуктовых гипотез заказывали?

😁58👏18❤5👍5🤯1🙈1

7.03K views08:13

Data Secrets

Время для интересных фактов: – Факт 1: SQLite – самая распространенная БД, сейчас в мире более триллиона активных баз SQLite – Факт 2: SQLite создали и обслуживают всего три человека. Вот они, на фотографии. Хотя проект опенсурс, там не допускается свободный…

Еще один забавный факт про базы данных вдогонку:

Почти все компьютерные системы в мире зависят от единой базы часовых поясов (tz database). Она обновляется, когда происходят изменения в законодательстве: ну например как отмена перевода времени с зимнего на летнее.

Эту базу поддерживают два человека.

Просто представьте: вы с другом можете заставить почти всех людей в мире поставить будильник на час позже 😈

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍64🫡34🔥17❤2🤔2⚡1🤯1🤝1

6.64K views11:19

Data Secrets

У Anthropic вышла новая статья.

Называется Many-shot jailbreaking (что-то на гангстерском). Изучают методику долгоконтекстного джейлбрейка, и обещают, что подход способен улучшить эффективность LLM.

Наброски Claude 4, вы ли это?

😁26❤8👍3🔥1

6.49K views15:21

Data Secrets

Теперь вы знаете, как должен пахнуть истинный ML-мачо

Заверните два

🔥77😁59👍7❤3

7.45K views06:03

Data Secrets

Поиграем с нейросетью?

Оказывается, у tensorflow есть браузерная игра, в которой можно настраивать и обучать нейросеть. Для этого код писать не нужно, надо просто в интерактивном режиме добавлять и удалять слои, настраивать количество нейронов, функцию активации, количество эпох и так далее.

Затем можно запустить трейн, и график справа будет показывать процесс и результат обучения.

Осторожно, можно надолго залипнуть

🥰44🔥17😍6❤2👍2🌚2🗿2

7.75K views09:25

Data Secrets

Коллеги, кому товары по акции?

🤯41😁28❤5👍2

6.32K views11:39

Data Secrets

Разработчики Принстонского университета зарелизили SWE-агента, который заставляет LLM дебажить код с GitHub

Работает очень красиво: нужно просто отправить issue, и модель выплюнет коммит с решением. Внутри – ИИ-агент ~~на стероидах~~ на промптах, который сам двигается по репозиторию, просматривает, запускает и обрабатывает файлы.

Из фишек: умный линтер для исправления ошибок и вьюер, который во избежании галлюцинаций режет файлы для основной модели по 100 строк (это подобранный разработчиками гиперпараметр).

Пайплайн умеет решать 12,29% багов (а это очень неплохо) и на бенчмарке SWE уже стал опенсурс-SOTA.

👍36🔥10❤5🤔1

6.86K viewsedited 15:42

Data Secrets

Новый уровень распознавания речи от AssemblyAI

Universal-1 – это новая speech2text модель, предобученная на 12.5 милионах часов аудио и затюненая на 1.62 миллионах размеченных и псевдо-размеченных данных. Работает на английском, испанском, французском и немецком. Кстати, написано на JAX.

Напомним: до этого SOTA была модель WhisperX. Однако теперь Universal-1 обгоняет ее:

– и на инференсе: в 5 раз быстрее с распараллеливанием, файлы по 60 минут обрабатывает за 38 секунд (!)

– и по метрикам: работает на 13.5% точнее всех остальных моделей и допускает на 30% меньше галлюцинаций

🔥41👍8❤4

6.95K views06:37

Data Secrets

Кстати про JAX, на котором написан новый Universal. В последнее время его популярность набирает обороты, и неспроста.

Многие знают, что JAX очень крут на TPU, но исследование разработчиков Keras 3 показывает, что и для GPU он выигрывает на 7 из 12 бенчмарков (см. таблицу). В остальных случаях быстрее всех оказывается бэкенд TensorFlow. Pytorch не выиграл нигде(

Тем не менее, надо понимать, что скорость зависит от конкретой архитектуры. В данном случае измерялась не наилучшая возможная производительность, а производительность на распространенных юзер-кейсах (брали StableDiffusion, Gemma, Mistral, SegmentAnything и BERT).

А вы на чем пишете?

❤18👍8🔥5

6.68K views09:03

Data Secrets

Средняя зарплата ИИ-специалиста составляет $174 727

Это самая высокая зарплата среди IT-профессий по данным нового отчета Indeed. Оказалось, что если в вакансии есть слово «ИИ», зарплата сразу взлетает на 47%.

Само количество ИИ-вакансий тоже продолжает расти, за полтора года оно увеличилось на 306%. При этом соискателей таких вакансий стало больше на (внимание) 4000%.

👾34😁9👨‍💻6❤3🤨3

6.77K views11:01

About

Blog

Apps

Platform