Еще новости раздела
Суд разрешил красть крипту в России,

Суд Санкт-Петербурга вынес приговор Петру Пирону и Евгению Пригожину, которые под угрозой пыток заставили потерпевшего

CusDev и CJM — долго, дорого, ох@енно.

Инструкция и кейс по разработке Customer Journey Map. Кейс (строительная ниша, новый продукт) принёс авторам с десяток

5 кибератак, которые легко можно было

Привет, Хабр! Сегодня мы хотим рассказать о новых кибератаках, которые недавно были обнаружены нашими аналитическими

Ищем уязвимости в TikTok при помощи

Вступление TikTok — одно из самых популярных приложений для просмотра мобильного видео. В нём зарегистрировано 800

AES — американский стандарт шифрования.

Прочие статьи цикла AES — американский стандарт шифрования. Часть I АES — американский стандарт шифрования. Часть II

[Перевод] Нет Cookies, нет проблем —

Работая старшим консультантом по дижитал-аналитике в ведущем международном аналитическом агентстве, с огромным

Алгоритмы пост-обработки результатов распознавания текстовых полей

Все блоги / Про интернет 27 апреля 2020 52   

(изображение взято отсюда)

Сегодня мы бы хотели вам рассказать о задаче пост-обработки результатов распознавания текстовых полей исходя из априорных знаний о поле. Ранее мы уже писали про метод коррекции полей на основе триграмм, который позволяет исправлять некоторые ошибки распознавания слов, написанных на естественных языках. Однако значительную часть важных документов, в том числе документов, удостоверяющих личность, составляют поля другого характера – даты, номера, VIN-коды автомобилей, номера ИНН и СНИЛС, машинно-читаемые зоны с их контрольными суммами и многое другое. Хотя их нельзя отнести к полям естественного языка, тем не менее у таких полей зачастую существует некоторая, иногда неявная, языковая модель, а значит, для них тоже можно применить некоторые алгоритмы коррекции. В этом посте речь пойдет об двух механизмах пост-обработки результатов распознавания, которые можно применять для большого количества документов и типов полей.
Читать дальше →
  • Оцените публикацию
  • 0

Похожие публикации

@
  • bowtiesmilelaughingblushsmileyrelaxedsmirk
    heart_eyeskissing_heartkissing_closed_eyesflushedrelievedsatisfiedgrin
    winkstuck_out_tongue_winking_eyestuck_out_tongue_closed_eyesgrinningkissingstuck_out_tonguesleeping
    worriedfrowninganguishedopen_mouthgrimacingconfusedhushed
    expressionlessunamusedsweat_smilesweatdisappointed_relievedwearypensive
    disappointedconfoundedfearfulcold_sweatperseverecrysob
    joyastonishedscreamtired_faceangryragetriumph
    sleepyyummasksunglassesdizzy_faceimpsmiling_imp
    neutral_faceno_mouthinnocent

Новые публикации сайта
Обнаружена опаснейшая уязвимость в

Исследователи в области кибербезопасности из компании Check Point раскрыли новую критическую уязвимость, которая

Заряжаем обычные батарейки

Многие из вас удивятся, когда узнают, что обычные щелочные (alkaline) батарейки можно заряжать с помощью специального

NelliQ - Bass Portal Live #01

➔ Don't forget hit that Subscribe button and give us like Venue & Date: Prague / 25.06.2020 ✖ DnB Portal ✖

Управление мобильностью – здесь и сейчас

В четверг, 09.07.2020, состоялся Бизнес-завтрак в онлайн формате с ведущими разработчиками систем управления мобильными

✉ Рассылка про то, как сшить

Не .RU единым: топ-10 национальных

В России пользуются спросом не только национальные домены .RU, .РФ, международные .COM и .NET и разные тематические