nlp » b.Z - Записки о гаджетах, людях и музыке

4 декабря 2023 0 390

Способы атаки на ИИ (Claude & ChatGPT): floating attention window attack

Хакеры придумывают всё более изощренные способы атаки на искусственный интеллект. Один из наиболее интересных — это атака «плавающего окна внимания»: злоумышленники манипулируют контекстом диалога с ИИ, подталкивая его к опасным выводам и смещению фокуса. Чрезвычайно тонкий подход, позволяющий...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность llm nlp claude chatgpt

7 августа 2023 0 93

Как взломать антиплагиат? — Безопасность и уязвимости NLP -классификаторов. Часть 2

Всем привет! Меня зовут Артём Семенов, я занимаюсь пентестами в компании RTM Group. В первой части данного материала мы говорили о различных методах классификации текста и разобрались с некоторыми техниками для атаки на классификаторы. Сегодня мы возьмемся за NLP-триггеры и стилистические атаки на...

Все блоги / Про интернет

Подробнее

Хабрахабр Информационная безопасность Информационная безопасность Искусственный интеллект информация chatgpt-4 nlp machinelearning hacking

Способы атаки на ИИ (Claude &amp; ChatGPT): floating attention window attack

Как взломать антиплагиат? — Безопасность и уязвимости NLP -классификаторов. Часть 2

Способы атаки на ИИ (Claude & ChatGPT): floating attention window attack