NEW BOT Телеграм, страница

Omnilingual ASR: Open-Source Multilingual Speech Recognition for 1600+ Languages Аудиораспознавалка 1600+ языков от Meta (запрещено в РФ) включая 500 низкоресурсных языков, которые ранее не транскрибировались с помощью ИИ. носитель неподдерживаемого языка…

1:21

ElevenLabs Scribe v2 Realtime

У ElevenLabs своя аудиораспознавалка. Рилтаймовая, задержка 150мс.

Распознает и маркирует голоса
Превосходит Gemini 2.5 Flash, GPT 4o MiniTranscribe и Deepgram Nova 3
90+ языков, включая русский.
Бесплатного триала нет

Ну и пусть сидят там со своими жалкими 90 за своим дискриминационным забором

#stt #speech2text #asr #realtime

😁12❤1👍1🔥1🤯1

1.89K viewsedited 06:11

0:14

Аттаркцион неслыханной щедрости от Хиггсфилд

Бесплатный Nano-Banana в твиттере.
Nano-Banana который и так бесплатный в браузере.
Но если вам далеко идти на офсайт гугла, а в твиттер недалеко то просто за скромные пиар-услуги Хиггсфилд БЕЗВАЗДМЕЗДНА сгенерит вам нанобананой картинку

- тэгните @higgsfield_ai в любом месте на X а лучше под постом
- Добавьте #nanobanana + свой промпт
- вам ответят картинкой
- Подпишитесь на @higgsfield_ai, ~~и вам выдадут 250 кредитов за то вы такой красивый котик. Но только примерно до 16ч по МСК сегодня.~~ Проверил. картинку сделали (см комменты). Кредитов - шиш пока что

Ну и похоже они собираются каждый день устраивать аттракционы с разными моделями

#tex2image #giveaway

👍4

1.64K viewsedited 07:11

Мэтью Макконахи и Майкл Кейн подписали договор с ElevenLabs на клонирование своих голосов.

ElevenLabs запустили маркетплейс ИИ-голосов знаменитостей для рекламы Iconic Voice Marketplace и уже получили контракт с вышеуказанными актерами.

Макконахи инвестировал в ElevenLabs и использует их технологию для выпуска аудиоверсии своего информационного бюллетеня на испанском языке

На фоне голливудской ИИ-фобии новость смотрится интересно

#news

❤14👍9😁2

1.78K views08:11

VibeThinker-1.5B

Открытая языковая модель с всего 1.5B параметров, уровня DeepSeek R1, у которого на минуточку, параметров в 400 раз больше

А обучение этой рассуждалки стоило жалких $7,800 USD

Веса всего 3.5 ГБ. Очень интересно если в жизни он как в описании

[UPDATE] мухлеж с тестами. Этим джентльменам на слово больше не верим

Гитхаб

#assistant #reasoning

👍8😁4❤3🤯1😱1

3.39K views09:12

Anime2Realism

Лора #QIE для превращения аниме картинок в реалистичные изображения

#lora

🔥9👍6🤯1

1.78K views10:13

Grok Imagine 1.0

Говорят что таинственный картинкогенератор Mandarin на LMarena это Grok Imagine 1.0

Ну и пишут что он уже на https://grok.com/imagine

Но чтото я не вижу явных доказательств

#news #text2image

👍5

1.82K views11:14

ERNIE-4.5-VL-28B-A3B-Thinking: A Breakthrough in Multimodal AI

Очередной визуал-мыслитель Эрни от Baidu

28B параметров, из них 3B активных.

Думает с помощью изображений, может увеличивать и уменьшать их, чтобы рассмотреть детали

Использует внешние инструменты, например, поиск по изображениям, для получения дополнительной информации

Понимает видео, определяет изменения содержания в разных временных сегментах и извлекает субтитры с таймкодами

Понимает и отвечает на русском. Но думает ан английском.

Как видим, успешно галлюцинирует.

Гитхаб с кукбукой
HF
Демо

#multimodal #assistant #vlm #reasoning #image2text

😁16👍5❤1🤯1

1.74K views12:16

0:15

0:25

0:20

0:30