Подробная информация о модели:
Авторы: Газпром нефть
Тип модели: Новая модель
Рекомендации по использованию (формат входных и выходных данных, рекомендации по настройке): Данные по месторождению (ГИС, ГДИС, сейсмика)
Фреймворк: PyTorch
Открытость: Несвободного использования
Наличие пропусков: Менее 5% или пропуски объясняются природой данных
Наличие аномальных данных: менее 1%
Согласованность форматов данных: Признаки с несогласованным форматом отсутствуют
Уникальность данных: Обучающий набор содержит менее 5% дубликатов или их присутствие обосновано условиями решаемой задачи
Доля объектов, содержащих не соответствующие действительности данные: Несоответствующие действительности данные отсутствуют
Наличие артефактов обработки: Менее 10%.
Согласованность временных данных (для временных рядов): Все признаки согласованы во времени
Наличие документации с описанием признаков, их источников и методов предварительной обработки: Краткое описание источников, формата данных и процедур предварительной обработки
Достоверность источников данных: только достоверные источники
Достаточность датасета для обучения: Исследуемый датасет составляет 50-100% от среднего по отрасли
Уровень технологической готовности: MLTRL 3: Прототипирование (обучение) модели и подтверждение концепции
Отсутствие данных из обучающей выборки в тестовой: Выборки взаимозависимы или независимость не подтверждена
Соотношение размеров обучающей и тестовой выборок: Тестовая выборка составляет 10-30% от общей или обоснована необходимость другого соотношения
Предотвращение переобучения: Методы предотвращения переобучения не применялись
Отбор признаков: Оценено влияние каждого признака на результат работы модели, неинформативные признаки исключены или отбор не применим
Оптимизация гиперпараметров: Методы оптимизации гиперпараметров применялись
Анализ разложения ошибки на смещение и разброс: Анализ разложения ошибки на смещение, разброс и шум не производился
Входной контроль данных: Присутствуют отдельные механизмы проверки и обработки входящих данных
Интерпретируемость результатов: Обеспечена интерпретируемость результатов работы модели
Возможности предварительной настройки: Предварительная настройка доступна или не требуется
Инструменты визуализации и контроля: Для обеспечения визуализации и контроля работы модели требуется небольшое количество сторонних
Требования к компетенциям пользователя: Применять и интерпретировать результаты могут только специалисты, разбирающиеся в программировании и (или) имеющие другие специализированные технические навыки
Зависимость от зарубежных/открытых библиотек и инструментов: Больше половины используемых библиотек не являются отечественными
Документация к модели: Представлены инструкции по применению модели и ожидаемый результат
Решение моделью актуальных отраслевых задач (применимо для моделей, не носящих исследовательский характер): Модель имеет потенциал применения в 2 или более отраслях
Метрики качества машинного обучения: Результаты работы модели значительно улучшают исходный процесс или превосходят среднеотраслевые
Новизна модели: Аналоги отсутствуют
Стабильность: Качество работы модели сохраняется
Робастность: Наблюдается допустимое снижение качества
Автономность: Модель способна самостоятельно получать и применять необходимые результаты
Опытная эксплуатация: Модель тестировалась в математических симуляциях (имитационные, агентные модели и т. д.) с подтверждением эффективности
Масштаб применимости: Число потенциальных пользователей превышает 5 или модель можно применять в 2 и более отраслях
Обоснованность потребляемых вычислительных ресурсов: Оптимальное потребление вычислительных ресурсов
На каких условиях предоставляется доступ к ML-модели: Покупка лицензии