Аудио сообщения распознаются 2 вариантами - локально (но тут лучше через модель Medium, она более-менее работает.
Или же через ваш платный аккаунт в Яндекс облаке
Или же через ваш платный аккаунт в Яндекс облаке
Для тестов можно пробовать провайдера openrouter.ai, у него есть много бесплатных моделей
Нужно выбирать те которые умеют работать с тулами
Вот тут полный список моделей подходящий из бесплатных моделек https://openrouter.ai/models?fmt=cards&input_modalities=text&max_price=0&output_modalities=text&supported_parameters=tools
Нужно выбирать те которые умеют работать с тулами
Вот тут полный список моделей подходящий из бесплатных моделек https://openrouter.ai/models?fmt=cards&input_modalities=text&max_price=0&output_modalities=text&supported_parameters=tools
Можете запускать свои локальные lmstudio / ollama / vllm и так же использовать в проекте
Проект обзавелся раннером и теперь у нас дистрибутивы на любой вкус
https://gitverse.ru/chernov/todeskai-releases/releases
https://gitverse.ru/chernov/todeskai-releases/releases
