Кабинет заявителя
Размер шрифта:
AAA
Гарнитура:
TT
Цветовая схема:
БГЧ
Изображения:
Вкл.Выкл.
Кернинг:
Стандартный
Средний
Большой
Интервал:
Одинарный
Полуторный
Двойной
Eng

Государственные программы анализа медиаматериалов Агентства перспективных исследований в области обороны США (DARPA)

18.05.2021

Государственные программы анализа медиаматериалов

Агентства перспективных исследований в области обороны США (DARPA)

С целью предотвращения размещения ложной информации и распознавания дипфейков DARPA реализует программы по выявлению возможностей сопоставления физических, речевых, текстовых, эмоциональных данных, технических характеристик оборудования и элементов аудио и видеоинформации. Рассмотрено семь основных программ в области обработки информации.

Программа MediFor (Media Forensics) направлена на разработку инструментов распознавания дипфейков на основе:

сопоставления физических данных в изображениях. Например, по данным о количестве морганий за единицу времени или выравниванию лица в системе координат по лицевым ориентирам (скулы, кончик носа и др.) можно определить сгенерированное изображение;

соответствия пикселей в изображениях. Для этого проводится анализ монолитности всего видеофайла для выявления элементов постобработки видео;

облегчения нейронных сетей. Это способствует сокращению образцов обучения;

моделирования зависимостей между областями изображения, то есть, мелкие детали изображения скоординированы со всеми мелкими деталями в различных частях изображения;

анализа структуры помех светочувствительных датчиков цифровых камер из-за заводских дефектов. Подмена изображений изменяет помехи и помогает выявить сгенерированное изображение;

умышленного искажения входного образца изображения, которое улучшает обучение нейронной сети;

соответствия эмоциональности речи, движений и мимики.

Программа SemaFor (Semantic Forensics) предлагает варианты экспертизы содержания аудио и видео материалов для защиты от дезинформационных атак в режиме реального времени.

Исследования в рамках программы SemaFor направлены на моделирование выражения лица и движений. В сгенерированных изображениях синхронизация движений лица, головы и верхней части туловища нарушена. Эти исследования позволят создать биометрические модели известных личностей и выявлять фальшивые материалы с их участием.

Кроме этого, проведены исследования по сохранению формы объекта, границ и краев изображений и снижению помех (сдвиги в освещении, разрешение сенсора, изменение спектра), которые влияют на распознавание фальшивых изображений.

Программа AIDA (Active Interpretation of Disparate Alternatives)

Программа направлена на разработку семантического механизма, который генерирует альтернативные интерпретации событий, ситуаций и тенденций из множества неструктурированных источников и формирует гипотезы по заданным сценариям. Например, для события «Исчезновение Д. Хашогги» оператор задает гипотезу-сценарий «Д. Хашогги был убит» и программа подбирает под этот сценарий все сообщения, отвечающие гипотезе, такие как «Д. Хашогги не выходил из консульства и там умер» и др. Это позволяет найти альтернативные варианты развития событий.

Программа предполагает следующие элементы анализа:

сценарный анализ текста на основе сопоставления информации о событиях. В основе сценариев лежит семантический, морфологический и синтаксический анализ;

лингвистический анализ эмоциональных состояний, включая анализ текста, речи и визуальных сигналов, и дополнительные входные данные в виде информации о говорящем и контекст;

анализ структурированной и неструктурированной информации главных гипотез о событиях, ситуациях и тенденциях в различных областях.

Иные программы DARPA в области обработки информации

Программа LORELEI (Low Resource Languages for Emergent Incidents) направлена на разработку алгоритма анализа грамматики малых языков и мониторинга событий и ситуаций на территориях с редкими языками.

Программа BOLT (Broad Operational Language Translation) осуществляет перевод неформального текста и речи в личном и онлайн общении на операционный язык. Это позволяет понимать собеседников и различать общественные настроения на любом языке.

Программа DEFT (Deep Exploration and Filtering of Text) осуществляет автоматизированную глубокую обработку естественного языка для анализа текстовой информации, обеспечения понимания связей в тексте, которые не очевидны для человека, и выявления смысловых аномалий.

Программа SOCIALSIM (Computational Simulation of Online Social Behavior) позволяет моделировать эволюционное развитие информационной среды на основе информации из открытых источников. Это позволяет анализировать поведение потенциальных противников и предотвращать дезинформационные кампании.

Информация по финансированию программ в области обработки информации в открытых источниках недоступна.

Бюджет Агентства DARPA за 2020 финансовый год составил 3,5 млрд долл. США. Из них на фундаментальные исследования 486,4 млн, на прикладные исследования 1 млрд 469 млн, на развитие передовых технологий 1 млрд 519 млн, на операционную деятельность 82 млн.

На деятельность Информационного бюро инноваций (подразделение, которое курирует разработки в области обработки информации) в 2020 г. было выделено 442,5 млн долл. США (около 32 млрд руб.), что на 63,5 млн больше, чем в 2018 году.

К реализации проектов привлекаются научные коллективы Техасского Университета в Остине, Общественного Исследовательского Университета Пердье (Индиана), Университета Дж. Хопкинса, Университета в Олбани, Университета Мэриленда, Института науки и техники Кванджу и др.

 

Подробное исследование размещено на rdc.grfc.ru