Smart Engines: Шерлок Мультимодальная модель ИИ

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: Smart Engines (Смарт Энджинс)
Дата премьеры системы: 2025/06/20
Дата последнего релиза: 2025/10/01
Технологии: Big Data,  Data Mining,  ИБ - Система обнаружения мошенничества (фрод)

Содержание

Основные статьи:

2025

Выход на рынок Ирана и Пакистана

Российская ИИ-система «Шерлок» для распознавания и проверки документов, созданная Smart Engines, получила возможность работать с удостоверениями личности на урду и персидском языках. Это стало возможным благодаря специализированному датасету MIDV-UP, созданному учеными компании и включающему более 9000 изображений документов Пакистана и Ирана. Данный набор данных закрывает давний пробел в разнообразных и неперсонифицированных обучающих материалах и открывает «Шерлоку» выход на рынки с совокупным населением свыше 330 миллионов человек. Об этом Smart Engines сообщили 1 октября 2025 года.

На октябрь 2025 года языковые технологии искусственного интеллекта поддерживают лишь небольшую часть из более чем 7000 языков мира. Алфавиты на основе латиницы уже давно освоены системами ИИ, в то время как обучение систем распознавания языкам с другими системами письменности происходит значительно медленнее. Особенно остро проблема обстоит с урду и персидским (фарси) – государственными языками Пакистана и Ирана. Оба языка используют модифицированный арабский алфавит и отличаются сложными лигатурами.

Ранее существующие датасеты документов оставляли практически без внимания удостоверения личности на урду и персидском. Это препятствовало разработке технологий распознавания, способных работать с документами Пакистана и Ирана. Представленный Smart Engines датасет MIDV-UP изменил эту ситуацию, обеспечив разработчиков качественными данными для обучения ИИ. В состав MIDV-UP вошли 1000 уникальных образцов удостоверений нескольких типов документов – ID-карт, водительских удостоверений и свидетельств о рождении Ирана, а также ID-карт Пакистана. В общей сложности в датасете содержится 9000 полностью аннотированных изображений, полученных безопасным методом синтеза – способом создания обучающих данных без использования документов реальных людей.«Агропромкомплектация» сократила капитальные вложения в ИТ. CIO компании на TAdviser SummIT — о том, к чему это привело 8.4 т

MIDV-UP охватывает большой спектр сценариев предъявления документов – от сканов до фотографий и видеоклипов с естественными помехами: тенями, бликами и искаженной перспективой. Специалисты Smart Engines использовали MIDV-UP для обучения нейросетевого ансамбля «Шерлок», предназначенного для распознавания и комплексной проверки физических и цифровых документов.

«Шерлок» способен работать одновременно в видимом, ультрафиолетовом и инфракрасном диапазонах, анализировать голограммы и другие защитные элементы, осуществляя в общей сложности более 600 проверок. Это дает возможность детектировать подделки любой сложности и качества, начиная с паспортов с измененными и переклееными фотографиями и заканчивая муляжами и дипфейками. Решение было разработано при финансовой поддержке Фонда содействия инновациям.

«
Отсутствие надежных ИИ-решений долгое время оставляло неавтоматизированным огромный рынок цифровых услуг, требующих ввод данных из документов на урду и фарси. Благодаря нашему датасету эти документы больше не является преградой для «Шерлока». На октябрь 2025 года устойчивый спрос на технологии распознавания наблюдается не только в самих Пакистане и Иране, но и в России и других государствах – чему способствуют значительные миграционные и образовательные потоки. Теперь стало возможным масштабировать «Шерлока» как внутри страны, так и на международных рынках, – отметил один из авторов MIDV-UP, генеральный директор Smart Engines, д.т.н. Владимир Арлазаров.
»

Анонс мультимодальной модели ИИ "Шерлок 2o"

Специалисты российской компании Smart Engines разработали мультимодальную модель искусственного интеллекта для борьбы с поддельными документами. "Шерлок 2o" проверяет документы всех стран на подлинность по 600 параметрам и детектирует сложные подделки в любых каналах обслуживания. Принятые решения модель объясняет понятным для пользователя языком, сообщили представители Smart Engines 20 июня 2025 года.

Как они ответили, мультимодальные модели представляют собой самый прогрессивный класс нейросетевых архитектур, способных одновременно обрабатывать разные типы входных данных – текст, изображения, аудио, видео. На быстрорастущем рынке мультимодального ИИ (оценен в $1,6 млрд) Россия до недавнего времени была представлена преимущественно разработками на базе больших языковых моделей.

Исследователи Smart Engines совершили прорыв, представив технологию в области мультимодальной форензики. "Шерлок 2o" способен одновременно работать с изображениями документов из оптического, ультрафиолетового и инфракрасного спектров, видео-последовательностями с документом, текстовыми полями, данными с бесконтактной RFID-микросхемы, штрих-кодами, метаданными и сигнатурами. Даже если часть информации отсутствует, "Шерлок 2o" сохраняет высокую точность детекции подделки.

При этом модель воспринимает документ не как набор разрозненных данных, а как единую взаимосвязанную систему. "Шерлок 2o" анализирует не только все страницы и элементы по отдельности, но и логические связи между ними. Модель выявляет даже скрытые несоответствия – например, нарушения в нумерации страниц, различия в микрошрифтах или неочевидные расхождения между данными RFID-чипа и визуальной информацией.

Комплексный подход позволяет выявлять сложные подделки, где могут быть заменены отдельные страницы или переклеена фотография, нарушена последовательность элементов защиты или присутствуют микроскопические расхождения в оформлении. ИИ также детектирует подделки, созданные с применением дипфейк-технологий.

Соответствие закону обеспечивается как на этапе обучения ИИ, так и во время работы системы у клиента. "Шерлок 2o" работает в контуре у заказчика без использования GPU, при этом документы и данные ни в каком не передаются на обработку в сторонние сервисы, облачным верификаторам, на краудсорсинговые платформы.

«
«Сегодня во всем мире наблюдается тренд на разработку мультимодальных продуктов. Однако в отличие от уже известных систем, базирующихся на больших языковых моделях, технология Smart Engines использует возможности мультимодального ИИ для решения важнейшей прикладной задачи – защиты от мошеннических атак. Система может использоваться в любых сценариях, требующих предоставления документов – в банках, МФО, страховых компаниях, госсекторе», – отметил генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров.
»

Смотрите также



ПРОЕКТЫ (1) ИНТЕГРАТОРЫ (1) СМ. ТАКЖЕ (1)


Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Loginom Company (Аналитические технологии) (128)
  БизнесАвтоматика НПЦ (123)
  Инфосистемы Джет (13)
  Сбербанк (12)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (11)
  Другие (762)

  БизнесАвтоматика НПЦ (4)
  Sitronics KT, Ситроникс КТ (ранее Кронштадт Технологии) (2)
  Яндекс.Облако (Yandex Cloud) (2)
  Полиматика (Polymatica) (2)
  Группа компаний ЦРТ (Центр речевых технологий) (2)
  Другие (60)

  БизнесАвтоматика НПЦ (6)
  SL Soft (СЛ Софт) (3)
  Сбер Бизнес Софт (3)
  Мобильные ТелеСистемы (МТС) (2)
  Retail Rocket (Ритейл Рокет) (2)
  Другие (67)

  БизнесАвтоматика НПЦ (7)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (4)
  Цифровые технологии и платформы (ЦТиП) (3)
  Ростелеком (3)
  Loginom Company (Аналитические технологии) (3)
  Другие (95)

  Группа компаний ЦРТ (Центр речевых технологий) (1)
  Ростелеком Центр (ЦентрТелеком) Макрорегиональный филиал (1)
  Т1 (1)
  Другие (4)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Loginom Company (Аналитические технологии) (2, 240)
  БизнесАвтоматика НПЦ (2, 122)
  SL Soft (СЛ Софт) (4, 15)
  Полиматика (Polymatica) (4, 15)
  Oracle (12, 14)
  Другие (414, 209)

  БизнесАвтоматика НПЦ (1, 4)
  Сбербанк (3, 3)
  Sitronics KT, Ситроникс КТ (ранее Кронштадт Технологии) (2, 2)
  Полиматика (Polymatica) (1, 2)
  CM.Expert (АвтоЭксперт) (1, 2)
  Другие (17, 20)

  БизнесАвтоматика НПЦ (1, 5)
  Полиматика (Polymatica) (3, 4)
  SL Soft (СЛ Софт) (3, 4)
  Retail Rocket (Ритейл Рокет) (1, 2)
  Rubbles (Раблз) (1, 2)
  Другие (16, 16)

  БизнесАвтоматика НПЦ (1, 7)
  Loginom Company (Аналитические технологии) (1, 4)
  К2Тех (1, 1)
  РИР (Росатом Инфраструктурные решения) (1, 1)
  Т-Банк (1, 1)
  Другие (13, 13)

  Группа компаний ЦРТ (Центр речевых технологий) (1, 1)
  Другие (0, 0)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Deductor - 226
  Visary BI Платформа бизнес-аналитики - 122
  Loginom - 14
  Polymatica Analytics Аналитическая платформа - 13
  IBM SPSS Decision Management - 10
  Другие 193

  Visary BI Платформа бизнес-аналитики - 4
  Polymatica Analytics Аналитическая платформа - 2
  ЦРТ: Speech Analytics Lab - 2
  PIX Process Management (PIX Процессы) - 2
  CM.Expert Data Mining платформа - 2
  Другие 16

  Visary BI Платформа бизнес-аналитики - 5
  Retail Rocket: Smart Placement Ads - 2
  Rubbles Customer Insight - 2
  Polymatica Analytics Аналитическая платформа - 2
  Exodrive Платформа для оценки качества вождения - 1
  Другие 10

  Visary BI Платформа бизнес-аналитики - 7
  Loginom - 4
  VolgaBlob Smart Monitor - 1
  T-Data Аналитическая платформа - 1
  Гринсайт: Ensi Cloud Adviser - 1
  Другие 12

  ЦРТ: SpeechXplore ИИ-решение для исследования и развития коммуникаций с клиентами - 1
  Другие 0

Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  БизнесАвтоматика НПЦ (123)
  Большая Тройка (46)
  Сбербанк (16)
  Умная Логистика (14)
  Доверенная среда (13)
  Другие (610)

  БизнесАвтоматика НПЦ (4)
  РИР (Росатом Инфраструктурные решения) (3)
  Сбер Бизнес Софт (2)
  Департамент информационных технологий Москвы (ДИТ) (2)
  Marketing Logic (Маркетинг Лоджик) (2)
  Другие (60)

  БизнесАвтоматика НПЦ (6)
  Сбер Бизнес Софт (3)
  Наносемантика (Nanosemantics Lab) (2)
  Сбербанк (2)
  Синимекс (Cinimex) (2)
  Другие (75)

  БизнесАвтоматика НПЦ (7)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (6)
  Цифровые технологии и платформы (ЦТиП) (3)
  Ростелеком (3)
  Цифра (2)
  Другие (94)

  Ростелеком Центр (ЦентрТелеком) Макрорегиональный филиал (1)
  Т1 (1)
  Триафлай (1)
  Другие (4)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  БизнесАвтоматика НПЦ (3, 122)
  Большая Тройка (2, 46)
  Умная Логистика (2, 14)
  Триафлай (1, 14)
  Цифра (2, 12)
  Другие (322, 168)

  РИР (Росатом Инфраструктурные решения) (3, 4)
  БизнесАвтоматика НПЦ (1, 4)
  Сбербанк (2, 2)
  DataCatalog (ДатаКаталог) (1, 2)
  Цифра (1, 2)
  Другие (17, 18)

  БизнесАвтоматика НПЦ (1, 5)
  Сбербанк (3, 3)
  DataCatalog (ДатаКаталог) (1, 3)
  Luxms (1, 3)
  Ростелеком (1, 2)
  Другие (19, 22)

  БизнесАвтоматика НПЦ (1, 7)
  РИР (Росатом Инфраструктурные решения) (2, 2)
  Data Sapience (Дата Сапиенс) (1, 2)
  Цифра (1, 2)
  DataCatalog (ДатаКаталог) (1, 2)
  Другие (11, 12)

  Триафлай (1, 1)
  Другие (0, 0)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Visary BI Платформа бизнес-аналитики - 122
  Большая Тройка: АИС Редактор территориальных схем - 39
  Триафлай BI-платформа - 14
  ZIIoT Платформа для работы с промышленными данными - 12
  Luxms BI - 11
  Другие 161

  Visary BI Платформа бизнес-аналитики - 4
  Arenadata Catalog - 2
  Росатом Цифровое теплоснабжение - 2
  ZIIoT Платформа для работы с промышленными данными - 2
  CM.Expert Data Mining платформа - 2
  Другие 17

  Visary BI Платформа бизнес-аналитики - 5
  Arenadata Catalog - 3
  Luxms BI - 3
  RT.Datalake Решение для хранения и обработки данных любых объемов - 2
  Retail Rocket: Smart Placement Ads - 2
  Другие 16

  Visary BI Платформа бизнес-аналитики - 7
  Luxms BI - 2
  Arenadata Catalog - 2
  Data Ocean Nova Платформа данных - 2
  ZIIoT Платформа для работы с промышленными данными - 2
  Другие 11

  Триафлай BI-платформа - 1
  Другие 0