Методы узла «Интерпретация» позволяют объяснить как отдельные признаки и элементы модели влияют на целевую переменную.
Рекомендуется устанавливать узел «Фильтр» перед узлом «Интерпретация» для отбора наблюдений, которые необходимо интерпретировать. Большое количество наблюдений значительно увеличивает время расчета.
Список параметров узла представлен в таблице ниже.
Параметр | Возможные значения и ограничения | Описание |
---|---|---|
Название | Ручной ввод | Название узла, которое будет отображаться в интерфейсе |
Описание | Ручной ввод | Описание узла |
Тип интерпретации | Раскрывающийся список со следующими значениями:
| Данный параметр задет тип интерпретации. Предусмотрены следующие методы:
|
Каждый из указанных методов интерпретации имеет свои параметры и результаты.
- Метод LIME (локально интерпретируемое объяснение модели).
Данный метод строит модель линейной регрессии, чтобы аппроксимировать предсказания исходной неинтерпретируемой модели локально, а не глобально.
Для этого создается новый набор данных из наблюдений, которые находятся вокруг выбранного для интерпретации наблюдения. Затем этот новый набор данных используется для обучения интерпретируемой линейной модели.
Коэффициенты этой линейной регрессии позволяют оценить важность и направление влияния каждого из предикторов при построении прогноза для выбранного наблюдения.
Список параметров метода LIME представлен в таблице ниже.
Параметр | Возможные значения и ограничения | Описание |
---|---|---|
Количество признаков | Ручной ввод целочисленного значения | Данный параметр задает количество признаков |
Размер выборки | Ручной ввод целочисленного значения | Данный параметр задает размер выборки |
Количество объясняемых классов | Ручной ввод целочисленного значения | Данный параметр задает количество объясняемых классов |
Seed | Ручной ввод числового значения | Начальное числовое значение для генератора случайных чисел |
Результаты выполнения метода:
В окне с результатами во вкладке Выбор наблюдений необходимо указать наблюдение для интерпретации. Во вкладках Графические результаты и Табличные результаты будут отображены список объяснений, отражающих вклад каждой функции в прогноз выборки данных в виде графиков и таблицы соответственно (рисунок ниже). Это обеспечивает локальную интерпретируемость, а также позволяет определить, какие изменения характеристик окажут наибольшее влияние на прогноз.
- Метод PD.
График частичной зависимости (Partial Dependence Plots – PDP) показывает, как меняется средний прогноз при изменении одного из предикторов.
Алгоритм работы метода PD: выбирается переменная и непрерывно изменяется ее значение. На график наносятся эти значения переменной и соответствующее среднее значение прогноза по выборке. Таким образом получается график зависимости прогнозируемых результатов от значений переменной.
Данный график частичной зависимости может показать, является ли отношение между целью и признаком линейным, монотонным или более сложным. Например, при применении к модели линейной регрессии графики частичной зависимости всегда показывают линейную зависимость.
Список параметров метода PD представлен в таблице ниже.
Параметр | Возможные значения и ограничения | Описание |
---|---|---|
Размер выборки | Ручной ввод целочисленного значения | Данный параметр задает размер выборки |
Количество бинов | Ручной ввод целочисленного значения | Данный параметр задает количество бинов |
Квантили | Таблица со значениями левого и правого квантилей | Для редактирования значений квантилей необходимо выбрать ссылку Редактировать. В открывшемся окне задать новые значения квантилей. |
Seed | Ручной ввод числового значения | Начальное числовое значение для генератора случайных чисел |
Полный биннинг | Чекбокс | Выбор данного чекбокса указывает на необходимость полного биннинга |
Результаты выполнения метода:
В окне с результатами во вкладке Графические результаты выбрать предиктор и класс, чтобы график отразил связь между предиктором и прогнозом.
- Метод SHAP (Shapley Additive Explanation).
SHAP value показывает средний вклад каждого предиктора в формирование прогноза для наблюдения, выбранного для интерпретации. Усреднение делается по всевозможным комбинациям всех остальных предикторов.
Алгоритм расчета SHAP values: Для каждого возможного упорядочивания признаков берутся все признаки, стоящие перед i-м признаком, и считается величина (прирост эффективности от добавления признака i в комбинацию признаков), равная разности между фактическим прогнозом и прогнозом с учетом текущего набора значений признака. После чего полученные значения усредняются по всем упорядочиваниям. Это означает, что SHAP values описывают ожидаемый прирост выходного значения модели при добавлении i-го признака в текущем примере.
Список параметров метода SHAP представлен в таблице ниже.
Параметр | Возможные значения и ограничения | Описание |
---|---|---|
Размер выборки | Ручной ввод целочисленного значения | Данный параметр задает размер выборки |
Количество перестановок | Ручной ввод целочисленного значения | Данный параметр задает количество перестановок |
Результаты выполнения метода:
В окне с результатами во вкладке Выбор наблюдений необходимо указать наблюдение для интерпретации. Во вкладках Графические результаты и Табличные результаты будут отображены список объяснений, отражающих вклад каждой функции в прогноз выборки данных в виде графиков и таблицы соответственно.
- Метод ICE — Индивидуальные условные ожидания.
График индивидуального условного ожидания (ICE) показывает, как меняется прогноз модели на одном или нескольких наблюдениях при изменении одного из предикторов. Однако, в отличие от PDP, который показывает средний эффект входной характеристики, график ICE визуализирует зависимость прогноза от характеристики для каждой выборки отдельно с одной строкой на выборку.
Список параметров метода ICE представлен в таблице ниже.
Параметр | Возможные значения и ограничения | Описание |
---|---|---|
Размер выборки | Ручной ввод целочисленного значения | Данный параметр задает размер выборки |
Количество бинов | Ручной ввод целочисленного значения | Данный параметр задает количество бинов |
Квантили | Таблица со значениями левого и правого квантилей | Для редактирования значений квантилей необходимо выбрать ссылку Редактировать. В открывшемся окне задать новые значения квантилей. |
Seed | Ручной ввод числового значения | Начальное числовое значение для генератора случайных чисел |
Полный биннинг | Чекбокс | Выбор данного чекбокса указывает на необходимость полного биннинга |
Результаты выполнения метода:
В окне с результатами во вкладке Графические результаты выбрать предиктор и класс, чтобы график отразил связь между предиктором и значением.