Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

Методы узла «Интерпретация» позволяют объяснить как отдельные признаки и элементы модели влияют на целевую переменную.

Рекомендуется устанавливать узел «Фильтр» перед узлом «Интерпретация» для отбора наблюдений, которые необходимо интерпретировать. Большое количество наблюдений значительно увеличивает время расчета.

Список параметров узла представлен в таблице (Таблица 42).
Якорь_Ref91753962_Ref91753962Таблица 42 — ниже.


Scroll Title
title-positiontop
title-alignmentright
titleПараметры узла «Интерпретация»

Параметр

Возможные значения и ограничения

Описание

Название

Ручной ввод
Ограничений на значение нет

Название узла, которое будет отображаться в интерфейсе

Описание

Ручной ввод
Ограничений на значение нет

Описание узла

Тип интерпретации

Раскрывающийся список со следующими значениями:

  • LIME
  • PD
  • SHAP
  • ICE

Данный параметр задет тип интерпретации. Предусмотрены следующие методы:

  • LIME – Локальные интерпретируемые объяснения модели
  • PD – Частичная зависимость
  • SHAP – Аддитивные объяснения Шэпли
  • ICE – Индивидуальные условные ожидания

Каждый из указанных методов интерпретации имеет свои параметры и результаты.anchor_Toc91717093_Toc91717093 Якорь_Toc91750031_Toc91750031

  • Метод LIME (локально интерпретируемое объяснение модели).

Данный метод строит модель линейной регрессии, чтобы аппроксимировать предсказания исходной неинтерпретируемой модели локально, а не глобально.
Для этого создается новый набор данных из наблюдений, которые находятся вокруг выбранного для интерпретации наблюдения. Затем этот новый набор данных используется для обучения интерпретируемой линейной модели.
Коэффициенты этой линейной регрессии позволяют оценить важность и направление влияния каждого из предикторов при построении прогноза для выбранного наблюдения.
Список параметров метода LIME представлен в таблице (Таблица 43).
Якорь_Ref91753997_Ref91753997Таблица 43 — ниже.


Scroll Title
title-positiontop
title-alignmentright
titleПараметры метода LIME

Параметр

Возможные значения и ограничения

Описание

Количество признаков

Ручной ввод целочисленного значения
По умолчанию — 5

Данный параметр задает количество признаков

Размер выборки

Ручной ввод целочисленного значения
По умолчанию — 5000

Данный параметр задает размер выборки

Количество объясняемых классов

Ручной ввод целочисленного значения
По умолчанию — 0

Данный параметр задает количество объясняемых классов

Seed

Ручной ввод числового значения
По умолчанию — 42

Начальное числовое значение для генератора случайных чисел

Результаты выполнения метода:
В окне с результатами во вкладке Выбор наблюдений необходимо указать наблюдение для интерпретации. Во вкладках Графические результаты и Табличные результаты будут отображены список объяснений, отражающих вклад каждой функции в прогноз выборки данных в виде графиков и таблицы соответственно (Рисунок 149). Это обеспечивает локальную интерпретируемость, а также позволяет определить, какие изменения характеристик окажут наибольшее влияние на прогноз.

Якорь_Ref91757816
_Ref91757816Рисунок 149 — Пример графических и табличных результатов метода LIME

...

  • Метод PD.

График частичной зависимости (Partial Dependence Plots – PDP) показывает, как меняется средний прогноз при изменении одного из предикторов.
Алгоритм работы метода PD: выбирается переменная и непрерывно изменяется ее значение. На график наносятся эти значения переменной и соответствующее среднее значение прогноза по выборке. Таким образом получается график зависимости прогнозируемых результатов от значений переменной.
Данный график частичной зависимости может показать, является ли отношение между целью и признаком линейным, монотонным или более сложным. Например, при применении к модели линейной регрессии графики частичной зависимости всегда показывают линейную зависимость.
Список параметров метода PD представлен в Таблица 44таблице ниже.
Якорь_Ref91756960_Ref91756960 Якорь_Ref92790967_Ref92790967Таблица 44 —


Scroll Title
title-positiontop
title-alignmentright
titleПараметры метода PD

Параметр

Возможные значения и ограничения

Описание

Размер выборки

Ручной ввод целочисленного значения
По умолчанию — 5000

Данный параметр задает размер выборки

Количество бинов

Ручной ввод целочисленного значения
По умолчанию — 5

Данный параметр задает количество бинов

Квантили

Таблица со значениями левого и правого квантилей

Для редактирования значений квантилей необходимо выбрать ссылку Редактировать. В открывшемся окне задать новые значения квантилей.

Seed

Ручной ввод числового значения
По умолчанию — 42

Начальное числовое значение для генератора случайных чисел

Полный биннинг

Чекбокс

Выбор данного чекбокса указывает на необходимость полного биннинга

Результаты выполнения метода:
В окне с результатами во вкладке Графические результаты выбрать предиктор и класс, чтобы график отразил связь между предиктором и прогнозом (Рисунок 150).



Якорь_Ref91758871_Ref91758871
Рисунок 150 — Пример графических результатов метода PD

...

  • _Toc91750033Метод SHAP (Shapley Additive Explanation).

SHAP value показывает средний вклад каждого предиктора в формирование прогноза для наблюдения, выбранного для интерпретации. Усреднение делается по всевозможным комбинациям всех остальных предикторов.
Алгоритм расчета SHAP values: Для каждого возможного упорядочивания признаков берутся все признаки, стоящие перед i-м признаком, и считается величина (прирост эффективности от добавления признака i в комбинацию признаков), равная разности между фактическим прогнозом и прогнозом с учетом текущего набора значений признака. После чего полученные значения усредняются по всем упорядочиваниям. Это означает, что SHAP values описывают ожидаемый прирост выходного значения модели при добавлении i-го признака в текущем примере.
Список параметров метода SHAP представлен в таблице (Таблица 45).
Якорь_Ref91757002_Ref91757002Таблица 45 — ниже.


Scroll Title
title-positiontop
title-alignmentright
titleПараметры метода SHAP

Параметр

Возможные значения и ограничения

Описание

Размер выборки

Ручной ввод целочисленного значения
По умолчанию — 100

Данный параметр задает размер выборки

Количество перестановок

Ручной ввод целочисленного значения
По умолчанию — 10

Данный параметр задает количество перестановок


Результаты выполнения метода:
В окне с результатами во вкладке Выбор наблюдений необходимо указать наблюдение для интерпретации. Во вкладках Графические результаты и Табличные результаты будут отображены список объяснений, отражающих вклад каждой функции в прогноз выборки данных в виде графиков и таблицы соответственно.

Рисунок 151 — Пример графических и табличных результатов метода SHAP

...

  • _Toc91750034Метод ICE — Индивидуальные условные ожидания.

...

Список параметров метода ICE представлен в Таблица 46таблице ниже.
Якорь_Ref91757072_Ref91757072 Якорь_Ref92791087_Ref92791087Таблица 46 —


Scroll Title
title-positiontop
title-alignmentright
titleПараметры метода ICE

Параметр

Возможные значения и ограничения

Описание

Размер выборки

Ручной ввод целочисленного значения
По умолчанию — 5000

Данный параметр задает размер выборки

Количество бинов

Ручной ввод целочисленного значения
По умолчанию — 5

Данный параметр задает количество бинов

Квантили

Таблица со значениями левого и правого квантилей

Для редактирования значений квантилей необходимо выбрать ссылку Редактировать. В открывшемся окне задать новые значения квантилей.

Seed

Ручной ввод числового значения
По умолчанию — 42

Начальное числовое значение для генератора случайных чисел

Полный биннинг

Чекбокс

Выбор данного чекбокса указывает на необходимость полного биннинга

Результаты выполнения метода:
В окне с результатами во вкладке Графические результаты выбрать предиктор и класс, чтобы график отразил связь между предиктором и значением (Рисунок 152).



anchor
_Ref92789731_Ref92789731Рисунок 152 — Пример графических результатов метода ICE