Безопасность LLM
В этой лекции мы обсудим важность защиты приложений, работающих на основе Large Language Models (LLM), включая те, которые используются в бизнесе. Основное внимание будет уделено различным видам рисков, проблемам безопасности и методам защиты, которые необходимы для обеспечения надежной работы этих систем.
1. Зачем защищать приложения на LLM: Обсудим причины, по которым приложения на базе LLM требуют специальной защиты, включая уникальные угрозы и вызовы.
2. Виды рисков и AI Alignment: Рассмотрим различные риски для бизнеса, связанные с использованием LLM, а также вопросы AI Alignment, этики и социальной ответственности.
3. Обзор уязвимостей по OWASP: Проанализируем топ-10 уязвимостей LLM согласно OWASP, понимая, какие угрозы наиболее актуальны.
4. Промпт инъекции и Jailbreak: Обсудим, как промпт инъекции и явления типа Jailbreak могут использоваться для обхода ограничений моделей LLM.
5. Непрямые атаки: Рассмотрим случаи непрямых атак, такие как фишинг через суммаризацию веб-страниц.
6. Уязвимости плагинов: Обсудим уязвимости, связанные с плагинами и расширениями LLM-приложений.
7. Атаки отказа в обслуживании на LLM: Разберем как атаки типа DoS могут быть специфичны для LLM и какие последствия они могут иметь.
8. Проблемы с датасетом и риски утечек данных: Обсудим, как проблемы с обучающими данными могут влиять на безопасность и приводить к утечкам данных.
9. Методы защиты: Рассмотрим различные подходы к защите LLM-приложений, включая фильтрацию данных, защиту от инъекций и мониторинг угроз.
Спикер: Евгений Кокуйкин - Директор AI продуктов в Raft.
Управляющий партнер компании Raft и кофаундер стартапа Gyre.tv. Работал с протоколами и драйверами баз данных, проводил фишинговые тренинги и аудит безопасности веб приложений. Изучаю особенности безопасности приложений на LLM.
Как попасть?
За последние 6 месяцев в вебинарах Codex.Town поучаствовало больше 10,000 человек и больше 40,000 посмотрели и послушали в записи. Присоединяйтесь 8 декабря в пятницу в 15:00 UTC | 16:00 CET | 18:00 по Москве