Уши и голос у ИИ: распознавание и генерация аудио
Анализ и синтез речи является сегодня одним из самых больших и практических кейсов применения ИИ в бизнесе.
На вебинаре в эту пятницу мы поговорим о том как работают модели, которые переводят голос в текст и как на практике с ними работать (включая бесплатные и локальные). Разберем то как сравнивать различные модели и посмотрим на практические примеры. Разберем методы разделения голоса нескольких участников при расшифровке. Так же поговорим о моделям синтезирующих и клонирующих голос и разберем практические кейсы использования таких моделей, включая бесплатные опции и создание бота.
Этот вебинар для вас, если вы:
Хотите автоматизировать расшифровку звонков и совещаний
Хотите использовать синтезированную речь для продаж и поддержки
Используете речь для анализа и генерации контента
Интересуетесь последними моделями в области речи
Ищете решение для локализации, дубляжа, субтитров
Хотите создать ИИ ассистентов или ботов с ушами и голосом :)
При регистрации вы гарантированно получите запись мероприятия и все материалы, даже если не сможете присутствовать.
Темы
1. Как работает voice to text
2. Сценарии использования voice to text
3. voice-to-text модели по API
4. Open Source voice-to-text модели
5. Инференс моделей
6. Оценка качества моделей
7. Фреймворк для оценки качества
8. Практический пример использования voice to text для анализа аудио
9. Разделение на спикеров (Diarization)
10. Модели для разделения спикеров
11. Text To Voice модели
12. Примеры использования Text To Voice моделей
13. Text To Voice по API
14. Text To Voice Open Source
15. Бот с voice to text + LLM + text to voice
Вебинар полезен для тех, кто хочет разобраться в том как работают речевые модели ИИ, как использовать их в бизнесе или при создании своих продуктов.
Спикеры
Александр Константинов, CТО Raft
Работал в Microsoft, Evernote и OneRail. Специализируюсь на внедрении AI в бизнес, архитектуре ПО, облачных высоконагруженных сервисах и управлении командами.
Разумовский Анатолий, QA lead Raft
До перехода в Raft, работал в инженерных департаментах компании Nissan. Управлял проектами автоматизации производства и обеспечения качества. Так же, как и Александр, теперь специализируюсь на внедрении AI в бизнес, в области обеспечения качества языковых и других нейросетевых моделей, при их внедрении в прикладное ПО.
Степан Гершуни, основатель codex.town
Как попасть?
За последние 6 месяцев в вебинарах Codex.Town поучаствовало больше 10,000 человек и больше 40,000 посмотрели и послушали в записи. Присоединяйтесь 8 декабря в пятницу в 15:00 UTC | 16:00 CET | 18:00 по Москве