Более чем 5️⃣ 1️⃣ тысяча публичных API разделённых по категориям в едином хабе. Есть поиск и фильтры.
Не благодари🔣 rapidapi.com/hub
#api #dev
Не благодари
#api #dev
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥7👏3
@cron_humaniser_bot
🤖 Бот переводит крон-выражение на человеческий. Работает бесплатно, без регистрации и смс.
#de #bot #cron
🤖 Бот переводит крон-выражение на человеческий. Работает бесплатно, без регистрации и смс.
#de #bot #cron
👏9❤🔥1 1 1
Лаборатория инноваций библиотеки Гарварда представила архив data.gov на платформе Source Cooperative. Коллекция объемом 16 ТБ содержит более 311 000 наборов данных, собранных в 2024–2025 годах, что обеспечивает полную картину общедоступных федеральных данных.
Архив будет обновляться ежедневно, обеспечивая доступ к актуальной информации для исследователей, журналистов, аналитиков и общественности. Он включает наборы данных из различных областей, таких как окружающая среда, здравоохранение, экономика, транспорт и сельское хозяйство.
Кроме того, Гарвард выпустил софт с открытым исходным кодом на GitHub для создания аналогичных репозиториев и решений по архивированию данных. Это позволяет другим организациям и исследовательским центрам разрабатывать собственные публичные архивы данных. Проект поддерживается Filecoin Foundation & Rockefeller Brothers Fund
Архив будет обновляться ежедневно, обеспечивая доступ к актуальной информации для исследователей, журналистов, аналитиков и общественности. Он включает наборы данных из различных областей, таких как окружающая среда, здравоохранение, экономика, транспорт и сельское хозяйство.
Кроме того, Гарвард выпустил софт с открытым исходным кодом на GitHub для создания аналогичных репозиториев и решений по архивированию данных. Это позволяет другим организациям и исследовательским центрам разрабатывать собственные публичные архивы данных. Проект поддерживается Filecoin Foundation & Rockefeller Brothers Fund
GitHub
GitHub - harvard-lil/data-vault: Tools for LIL's data preservation project
Tools for LIL's data preservation project. Contribute to harvard-lil/data-vault development by creating an account on GitHub.
❤🔥8
Forwarded from Denis Sexy IT 🤖
Media is too big
VIEW IN TELEGRAM
Классная демка от создателя llama.cpp – два голосовых агента переходят на внутренний язык, для повышения скорости обмена данными, примерно как работали старые модемы
Код тут
Технические детали:
Код тут
Технические детали:
ggwave передаёт небольшие объемы данных через звук, используя метод модуляции с частотным сдвигом (FSK). Данные разбиваются на 4-битные куски, каждый из которых кодируется одной из 96 заранее определённых частот в диапазоне 4.5 кГц. Дополнительно применяется коррекция ошибок (Reed-Solomon) для повышения надёжности передачи. На стороне приёма аудиосигнал анализируется с помощью Фурье-преобразования, частоты сопоставляются с битовыми значениями, после чего данные декодируются и восстанавливаются с учётом ECC.
👏8❤🔥6
Apache Hive и Apache Spark — мощные инструменты для работы с большими данными, но они по-разному выполняют распределённую обработку.
Плюсы:
Минусы:
Плюсы:
Минусы:
#data #bigdata #hive #spark #sql
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥5👏2😁1
Forwarded from Находки в опенсорсе
Media is too big
VIEW IN TELEGRAM
zen browser
После недавней оказии с FireFox, я понял, что нужно менять свой браузер.
Выбор пал на zen (почти arc, но для firefox), потому что я люблю минимализм.
Что мне нужно от браузера?
- Несколько вкладок, у меня их никогда не бывает сильно много, я все их закрываю примерно раз в день
- Панель для ввода адреса с минимумом функциональности (подсказки, история, поиск)
- Минималистичный интерфейс, без лишних кнопок
- Поддержка uBlock, нескольких других похожих плагинов
- Приватность по-умолчанию
Все. Остальные фичи мне скорее мешают. Я не пользуюсь закладками, workspacе'ами, профилями, синками и тд.
Что есть в zen?
Во-первых, браузер почти полностью позволяет убрать свой интерфейс, что приятно. Теперь по пунктам:
- Hidden Tabs: можно настроить "compact mode", чтобы вкладки исчезали, когда они не нужны, нажатие
- Floating Nav Bar: После настройки панель навигации сверху исчезает, когда ей не пользуешься (открывается на
- Busy Mode: при нажатие
- Tab Preview: отключаемая фича, которая позволяет сделать превью страницы и быстро ее закрыть, выглядит полезно для поиска
- Split View: отключаемая фича, которая позволяет открывать две вкладки слева и справа (у меня на `alt-v`) или сверху и снизу (`alt-h`), выглядит полезно для ревью PRов на гитхабе
Ну и конечно же работают все плагины для FireFox и даже есть свои уникальные.
Сверху я все шлифанул кастомным CSS для уничтожения некоторых объектов UI, которые меня отвлекали.
Пока пробую – и мне нравится.
Обсуждение: что сейчас еще есть интересного и удобного в мире браузеров?
| Поддержать | YouTube | GitHub | Чат |
После недавней оказии с FireFox, я понял, что нужно менять свой браузер.
Выбор пал на zen (почти arc, но для firefox), потому что я люблю минимализм.
Что мне нужно от браузера?
- Несколько вкладок, у меня их никогда не бывает сильно много, я все их закрываю примерно раз в день
- Панель для ввода адреса с минимумом функциональности (подсказки, история, поиск)
- Минималистичный интерфейс, без лишних кнопок
- Поддержка uBlock, нескольких других похожих плагинов
- Приватность по-умолчанию
Все. Остальные фичи мне скорее мешают. Я не пользуюсь закладками, workspacе'ами, профилями, синками и тд.
Что есть в zen?
Во-первых, браузер почти полностью позволяет убрать свой интерфейс, что приятно. Теперь по пунктам:
- Hidden Tabs: можно настроить "compact mode", чтобы вкладки исчезали, когда они не нужны, нажатие
cmd+b показывает вкладки, нажатие cmd+1 открывает первую вкладку и тд- Floating Nav Bar: После настройки панель навигации сверху исчезает, когда ей не пользуешься (открывается на
cmd+t для открытия новой вкладки и cmd+L фокуса в текущей)- Busy Mode: при нажатие
ctrl+b включает интерфейс, если нужно что-то найти, если идет какой-то напряженный рабочий режим- Tab Preview: отключаемая фича, которая позволяет сделать превью страницы и быстро ее закрыть, выглядит полезно для поиска
- Split View: отключаемая фича, которая позволяет открывать две вкладки слева и справа (у меня на `alt-v`) или сверху и снизу (`alt-h`), выглядит полезно для ревью PRов на гитхабе
Ну и конечно же работают все плагины для FireFox и даже есть свои уникальные.
Сверху я все шлифанул кастомным CSS для уничтожения некоторых объектов UI, которые меня отвлекали.
Пока пробую – и мне нравится.
Обсуждение: что сейчас еще есть интересного и удобного в мире браузеров?
| Поддержать | YouTube | GitHub | Чат |
❤🔥6
Pandas устарел?
FireDucks предлагает замену без переписывания кода.
🐼 Pandas - самая популярная библиотека для обработки данных, но она уже давно страдает от низкой производительности.
🐻 Современные альтернативы, такие как Polars, предлагают гораздо более высокую производительность, но переход на новые фреймворки требует изучения нового API, что отталкивает многих разработчиков.
🔥 🦆 FireDucks 🦆 🔥 решает эту проблему, предлагая полную совместимость с Pandas, но с многопоточной обработкой и ускорением работы компилятора. Для перехода достаточно изменить одну строку:
FireDucks работает быстрее, чем Pandas и Polars, что подтверждается бенчмарками
🔜 FireDucks github
➡️ Сравнение с Polars и Pandas:
#pandas #polars #fireducks #de #dataengineer #dataengineering
FireDucks предлагает замену без переписывания кода.
import fireducks.pandas as pd
FireDucks работает быстрее, чем Pandas и Polars, что подтверждается бенчмарками
#pandas #polars #fireducks #de #dataengineer #dataengineering
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥7
Поздравляю вас с 8 Марта!
Пусть ваши запросы всегда выполняются мгновенно, джойны будут только удачными, а данные — чистыми и структурированными. Пусть в вашей жизни будет столько же радости, сколько строк в крупнейших базах данных, и столько же успешных решений, сколько индексов в оптимизированном запросе!
Будьте вдохновением для мира технологий, ведь именно благодаря вам data-driven будущее становится еще ярче!
С праздником!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥11
Please open Telegram to view this post
VIEW IN TELEGRAM
😁18
Выбор правильного формата хранения данных имеет решающее значение для машинного обучения (ML) и аналитики. Неправильный выбор может привести к медленным запросам, плохой масштабируемости и проблемам с целостностью данных.
Традиционные хранилища данных сталкиваются со следующими проблемами:
Please open Telegram to view this post
VIEW IN TELEGRAM
delta.io
Home | Delta Lake
2❤🔥7👏3 2
Способы обеспечения согласованности показателей в хранилище
Если ты работаешь с аналитикой, ты, вероятно, сталкивался с ситуацией, когда один и та же метрика рассчитывается по-разному в разных отделах. Это приводит к путанице, снижает доверие к данным и замедляет процесс принятия решений. Расскажу основные причины этой проблемы и два эффективных варианта решения.
Причина кроется в спонтанном росте аналитики:
Чтобы избежать такой ситуации, стоит внедрить единые стандарты управления метриками.
Это промежуточный слой между данными и инструментами аналитики, где метрики определяются централизованно. Они хранятся в статических файлах (например, YAML) и используются для автоматической генерации SQL-запросов.
Здесь заранее создаются таблицы с предварительно вычисленными метриками и фиксированными измерениями.
Оптимальный подход - гибридное использование:
#de #engineering #chaos
Please open Telegram to view this post
VIEW IN TELEGRAM
cube.dev
Cube: Agentic Analytics Platform
Cube, the universal semantic layer, makes it easy to connect BI silos, embed analytics, and power your data data apps and AI with context.