NLP At Scale: вся правда о предобученных моделях в Почте Mail.ru (часть 1)
Антиспам Почты Mail.ru — это симбиоз продуктовой логики и инфраструктурных технологий, про который мы решили более подробно рассказать. В основе конечно же лежит инфраструктура, с помощью которой мы получаем возможности для развития моделей машинного обучения, а также платформа ядра, которая обеспечивает работу антиспама в онлайне. Продуктовая логика представлена в виде большого количества эвристик (куда без них) и ручных правил. На вершине продуктовой пирамиды пребывает стек моделей машинного обучения, хотя положение на вершине в данном случае достаточно условно.
В этой статье мы заберемся на эту вершину, где в последнее время часто вбивают новые колышки текстовые модели. Мы спроецируем мир текстовых ML-моделей на наш сервис, поговорим про эволюцию и решение задач Почты, связанных с текстами. Запасайтесь кислородом и свободным временем.
Читать дальше →
Источник: Хабрахабр
Похожие новости
- Как внедрить двухфакторную аутентификацию в веб-приложения, не предусматривающие ее изначально
- Ландшафт угроз информационной безопасности последних лет. Часть 1
- В России появился единый конструктор писем с ИИ
- Самые интересные задачи для безопасников — Джабба одобряет
- Как пройти путь до руководителя инфобеза?
- Стажировки в SOC. Часть 1: как организовать обучение на 1 тыс. человек
- Эволюция чат-ботов: 5 причин внедрить Telegram Web App
- Тестирование PT NGFW: ранняя версия межсетевого экрана нового поколения от Positive Technologies
- Обеспечение безопасности загрузчика GRUB в Linux
- Кадровый голод в сегменте маркетинговых услуг