Python Portal – Telegram
Python Portal
56K subscribers
2.42K photos
389 videos
51 files
987 links
Всё самое интересное из мира Python

Связь: @devmangx

РКН: https://clck.ru/3GMMF6
Download Telegram
Теперь можно парсить почти любой документ одной моделью на 1.7B параметров.

Она называется dots-ocr. Одна система, которая умеет работать с текстом, таблицами, формулами, изображениями и PDF на 100+ языках.

Без отдельного OCR-пайплайна. Без моделей под конкретные задачи.

100% исходный код 👏

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
32👍9
Forwarded from Айти мемы
😆😆😆
Please open Telegram to view this post
VIEW IN TELEGRAM
😁95🤣22🔥54
Клонируй любой голос по 5-секундному аудиоклипу.

VoxCPM это open-source проект, который делает TTS принципиально иначе.

большинство TTS-систем сначала переводят речь в дискретные токены. это становится бутылочным горлышком и ограничивает, насколько “живым” может быть звук.

VoxCPM вообще пропускает токенизацию. он моделирует аудио в непрерывном пространстве через end-to-end diffusion autoregressive архитектуру.

в итоге получается речь, которая реально звучит по-человечески.

вот что в нем особенного:

> контекстно-зависимая генерация: читает текст и сам подбирает нужную просодию, эмоцию и темп. ручной тюнинг не нужен.

> zero-shot клонирование голоса: даешь короткий аудиоклип, и он ловит не только тембр, но и акцент, ритм и эмоциональный окрас.

модель обучали на 1.8 млн часов билингвальных данных (английский и китайский)

* поддерживает streaming synthesis
* работает и с full fine-tuning, и с LoRA
* простой Python API: pip install voxcpm

VoxCPM1.5 гоняет на 44.1kHz sampling rate и имеет 800M параметров. поэтому звук заметно более четкий и натуральный.

лицензия Apache-2.0

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
13💊6👍3😢1
This media is not supported in your browser
VIEW IN TELEGRAM
Задеплой любую ML-модель как MCP-сервер.

LitServe: самый простой способ выкатывать агентов, RAG и вообще любые ML-модели. Теперь есть поддержка MCP.

Полностью open-source.

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
11👍6
Когда оперативка бесконечная

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
😁77👍24🤯18💊4😢32
Библиотека алгоритмов по робототехнике, которую должен знать каждый инженер📚

PythonRobotics это open-source коллекция Python-кода и учебник по алгоритмам робототехники, сделанные Atsushi Sakai.

На GitHub у проекта 27.2k звёзд и 7k форков, так что добавить в закладки вообще без вариантов

Там покрыто всё: от локализации (EKF, particle filters, histogram filters) до SLAM (FastSLAM, ICP matching), планирования пути (A*, RRT*, Dijkstra, D*, potential fields, state lattice), трекинга траектории (Stanley, LQR, MPC), навигации манипуляторов, воздушной навигации и даже планирования для двуногих роботов.

Что в нём особенного? Он сделан так, чтобы его было легко читать и понимать: минимум зависимостей и практичные, широко используемые алгоритмы.

Каждый алгоритм идёт с визуальными анимациями, математическими объяснениями и рабочим кодом.

Документация по сути это полноценный учебник по алгоритмам робототехники, бесплатно доступный онлайн.

Требования простые: Python 3.13+, NumPy, SciPy, Matplotlib и cvxpy.

И всё.

Это учебный ресурс с 2,201 коммитом, вкладом от 138 разработчиков и активной поддержкой. Одни только анимации (они лежат в отдельном репозитории) уже стоят того, чтобы их изучать.

Если ты учишь робототехнику, собираешь автономные системы или преподаёшь алгоритмы, это тот самый ресурс. Лицензия MIT, так что можно свободно использовать и в исследованиях, и в коммерческих проектах.

Ссылка:

https://github.com/AtsushiSakai/PythonRobotics


P.S. Вот как выглядит хороший open-source: образовательный, практичный, отлично задокументированный и комьюнити-драйвовый. Добавь в закладки. 🔖

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
👍208
Media is too big
VIEW IN TELEGRAM
Этот чувак буквально за 6 минут объясняет, как с нуля собрать алгоритмический хедж-фонд для трейдинга. Я видел, как команды годами до этого доходят.

Жесть 🙌

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
👍368🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
инженеры смотрят, как все остальные вайб-кодят приложения

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁63👍28🤣145🔥1
Как вам эти 30 незаменимых приемов при программировании на Python 🤭

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
43🔥28👍7
Писать планировщик задач на Python через стандартную библиотеку хоть и просто, но возможностей там немного. Как только появляются асинхронные задачи, работа с таймзонами, ретраи при фейлах и похожие кейсы, становится тяжко. 😢

На GitHub нашел FastScheduler, это опенсорсный легковесный таск-планировщик для Python. Поддерживает async, таймзоны, Cron-выражения и еще имеет визуальную панель.

За счет очень аккуратного синтаксиса на декораторах задачу можно описать одной строкой. Есть разные варианты расписаний: интервалы, конкретное время, Cron и т.д. Асинхронные функции работают из коробки.

Установка через pip в один шаг, а для персистентности доступны разные хранилища вроде SQLite и PostgreSQL. После рестарта сервиса состояние задач не теряется.

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
14👍8🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Чувак создал игру по стрельбе из лука, в которой в качестве контроллера используется зарядный кабель.

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
1👀41😁31🤯13🤣135🌚4👍2
xAI выложила в опенсорс новый рекомендательный алгоритм X

Весь код уже доступен на GitHub.
Обещают обновления каждые 4 недели.

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👀147👍1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Топовый лайфхак с GitHub: добавь 0 к URL pull request, и ИИ поможет тебе ревьюнуть и понять изменения, которые хотят влить.

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
11
Сравнение async и ThreadPoolExecutor в Python

Асинхронная обработка async

В async переключение выполнения на уровне CPU происходит в момент выполнения await.
Но чтобы можно было вызвать await, сам код должен поддерживать async.

Например, если вы хотите делать запись в PostgreSQL через async, то придется использовать asyncpg.
То есть для тех операций, которые поддерживают async, можно реализовать асинхронную обработку с помощью async.

Параллельная обработка ThredPoolExcutor

ThredPoolExcutor имеет смысл использовать в тех случаях, когда:

* код не поддерживает async
* или вы хотите распараллелить выполнение, минимально переписывая существующий код.

Тестовый код

Асинхронная обработка async:

import asyncio
import time

from icecream import ic


async def io_task(name):
print(f"{name} start")
await asyncio.sleep(3) # ожидание неблокирующего I/O
print(f"{name} end")


async def main():
start = time.time()
await asyncio.gather(io_task("A"), io_task("B"), io_task("C"))
print(f"elapsed: {time.time() - start:.3f}")


ic()
asyncio.run(main())
ic()

# Результат выполнения
ic| main_async.py:19 in <module> at 22:06:11.408
A start
B start
C start
A end
B end
C end
elapsed: 3.001
ic| main_async.py:21 in <module> at 22:06:14.412


Параллельная обработка ThredPoolExcutor:

import time
from concurrent.futures import ThreadPoolExecutor

from icecream import ic


def io_task(name):
print(f"{name} start")
time.sleep(3) # блокирующий I/O
print(f"{name} end")


ic()
start = time.time()
with ThreadPoolExecutor(max_workers=3) as executor:
executor.submit(io_task, "A")
executor.submit(io_task, "B")
executor.submit(io_task, "C")

print(f"elapsed: {time.time() - start:.3f}")

# Результат выполнения
ic| main_ThreadPoolExcutor.py:13 in <module> at 22:07:03.543
A start
B start
C start
C end
B end
A end
elapsed: 3.003


Вывод: В случаях, когда требуется блокирующая обработка вроде time.sleep[1], имеет смысл использовать ThredPoolExcutor.

Когда же нужна неблокирующая обработка, как в случае с asyncio.sleep, лучше использовать async.

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17👍83
Qwen3-TTS официально в релизе. Выложили в опенсорс всю линейку: VoiceDesign, CustomVoice и Base, чтобы принести реально качественный TTS в open-комьюнити.

* 5 моделей (0.6B и 1.8B)
* Свободный voice design и клонирование голоса
* Поддержка 10 языков
* SOTA 12Hz токенизатор для сильной компрессии
* Полная поддержка fine-tuning
* SOTA качество

Возможно, самый “взрывной” релиз в опенсорсном TTS на данный момент. Давайте, ломайте, тестите, собирайте что-то крутое. Уже доступно всё: веса, код и статья. Enjoy.

Github: https://github.com/QwenLM/Qwen3-TTS
Hugging Face: https://huggingface.co/collections/Qwen/qwen3-tts
ModelScope: https://modelscope.cn/collections/Qwen/Qwen3-TTS
Blog: https://qwen.ai/blog?id=qwen3tts-0115
Paper: https://github.com/QwenLM/Qwen3-TTS/blob/main/assets/Qwen3_TTS.pdf
Hugging Face Demo: https://huggingface.co/spaces/Qwen/Qwen3-TTS
ModelScope Demo: https://modelscope.cn/studios/Qwen/Qwen3-TTS
API: https://alibabacloud.com/help/en/model-studio/qwen-tts-voice-design


👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
👍145🔥2💊2
Немного подкорректировал

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
67😁37👍8🤣6
This media is not supported in your browser
VIEW IN TELEGRAM
NVIDIA убрала самый жирный тормоз в Voice AI

Они выложили в опенсорс PersonaPlex-7B: full-duplex разговорную speech-to-speech модель, которая умеет слушать и говорить одновременно

Вместо того чтобы ждать, пока ты договоришь, она использует dual-stream архитектуру и обрабатывает входящий звук параллельно с генерацией ответа в реальном времени.

100% открытый исходный код и бесплатно. 🐸

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
👍386💊6🤯1
Мем: на сайте Думы в пояснительной записке к закону о создании реестра молодёжных организаций нашли utm-метку ChatGPT. 😐

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣69🔥6😁42
Media is too big
VIEW IN TELEGRAM
Чувак собрал целую AI-команду “дата-сайентистов” на Python и выложил в опенсорс (полностью бесплатно).

Библиотека автоматизирует типичный DS-пайплайн с помощью AI: загрузка данных, чистка/преобразования, EDA, визуализация, feature engineering. Плюс она логирует каждый шаг так, чтобы все собиралось в 100% воспроизводимый pipeline (можно повторить прогон один в один и понять, что именно делалось).

Таймкоды из демо:
00:00 обзор проекта
01:32 workflow + загрузка данных
02:10 wrangling и cleaning
03:33 инсайты из визуализаций и построение графиков
04:08 feature engineering
05:00 лайв воркшоп на 1 час
05:44 сама Python-библиотека “AI Data Science Team”

GitHub: здесь

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
18👍2🔥2