Недавно аспирант Сюэ Чжипэн из исследовательской группы Ли Чуня Совместного научного центра прикладной математики МГУ — ППИ — Университета МГУ-ППИ в Шэньчжэне выступил первым автором статьи «Квантификация неопределенности для неполных многовидовых данных с использованием мер дивергенции», опубликованной в авторитетном международном журнале по компьютерной графике IEEE Transactions on Image Processing (TIP), где Ли Чунь является автором-корреспондентом. Журнал имеет импакт-фактор 13,7 и относится к изданиям первого квартиля КАН и категории А по классификации CCF. Публикация в данном журнале требует существенного вклада в развитие соответствующей области как в теоретическом, так и в практическом плане. Это достижение свидетельствует о высоком научном потенциале коллектива Университета МГУ-ППИ в Шэньчжэне.


Рисунок 1: Журнал публикации и индексация статьи
Исследование решает проблему существующих методов многовидовой классификации и кластеризации, которые при работе с зашумленными или неполными данными опираются на дивергенцию Кульбака — Лейблера, игнорируя межмодальные различия. Авторы предложили модель KPHD-Net на основе правильной дивергенции Хёльдера (PHD). KPHD-Net впервые применяет вариационное распределение Дирихле для представления вероятностных распределений классов в сочетании с теорией свидетельств Демпстера — Шейфера и фильтрацией Калмана, обеспечивая динамическое объединение многовидовых свидетельств и квантификацию неопределенности. Теоретический анализ и экспериментальные исследования подтверждают, что PHD эффективнее традиционной KLD измеряет различия распределений, существенно повышая точность, робастность и надежность классификации и кластеризации.

Рисунок 2: Архитектура системы квантификации неопределенности для неполных многовидовых данных
На мультимодальных датасетах ADE20K, Caltech101-7, MSRC-v1 модель KPHD-Net продемонстрировала превосходные результаты при различных уровнях шума и степенях неполноты данных: точность классификации повысилась более чем на 5 процентов, робастность кластеризации значительно возросла. Полученные результаты не только предлагают принципиально новую архитектуру квантификации неопределенности для многовидового обучения, но и создают теоретический и методологический фундамент для применения в медицинской визуализации, интеллектуальных системах восприятия и смежных областях.

Рисунок 3: Визуализация результатов многовидовой кластеризации методом t-SNE на датасетах Caltech101-7 и Caltech101-20

Рисунок 4: Сводные результаты классификации на датасете ADE20K при различных уровнях гауссовского шума
В исследовании представлена KPHD-Net — архитектура многовидового обучения, интегрирующая фильтрацию Калмана, правильную дивергенцию Хёльдера и субъективную логику для квантификации неопределенности в задачах классификации и кластеризации через динамическое объединение свидетельств. На датасетах ADE20K, MSRC-v1, Caltech101-7/20 KPHD-Net существенно превосходит существующие методы при различных уровнях шума (σ²=0,03) и степенях неполноты данных, демонстрируя высокую точность и стабильность. Независимо от выбранной архитектуры — ResNet50, DenseNet, Mamba или ViT — система показывает стабильный прирост производительности, подтверждая универсальность и надежность подхода. Полученные результаты формируют новую парадигму квантификации неопределенности для многовидового обучения и создают теоретическую базу для применения в интеллектуальном анализе медицинских изображений, системах восприятия и других передовых областях. Коллектив планирует дальнейшую оптимизацию модели для повышения адаптивности в сложных сценариях и расширения областей применения.
Исследовательская группа под руководством Ли Чуня специализируется на фундаментальных исследованиях и трансфере технологий в области медицинской визуализации, компьютерного зрения на базе искусственного интеллекта, обработки изображений и машинного обучения. Коллектив достиг прорывных результатов в ключевых технологиях и активно внедряет научные разработки в клиническую практику и промышленность, обеспечивая инновационное развитие соответствующих отраслей.
Ссылка на публикацию: https://ieeexplore.ieee.org/document/11045813