Почему измерение «достоверности» имеет значение для интерпретации моделей ИИ

Интерпретация НИКОГДА не будет хорошей, если она НЕ отражает поведение модели.

Схема

Мотивирующий пример в классификации последовательностей с помощью BERT
Что такое «верность»?
Простой пример измерения верности

Мотивирующий пример

Предположим, что мы обучили модель BERT на наборе данных классификации анализа настроений. После оценки модель правильно классифицирует следующую входную последовательность в класс «1» (положительный), т.е.

Теперь нам интересно узнать, как наша модель принимает решение по этому конкретному образцу. В частности, мы хотим знать, какие токены приводят к решению модели. Мы хотим присвоить оценку важности каждому токену.

Мы используем два распространенных метода интерпретации: LIME и Интегрированные градиенты (IG), чтобы получить интерпретации этого конкретного экземпляра классификации (x, f(x)). После некоторых вычислений мы получаем две серии оценок важности. Для простоты мы выделяем только самые важные токены, определяемые каждым методом интерпретации.

Теперь у нас есть две разные интерпретации! Какая из интерпретаций кажется вам «лучшей»? Интерпретация, которая выглядит «хорошей», на самом деле может быть ПЛОХОЙ! Интерпретация НИКОГДА не будет хорошей, если она НЕ отражает поведение модели. Здесь «верность» решает эту проблему.

Что такое «верность»?

Якови и Голдберг. (2020),

«Верность» относится к тому, насколько точно она (интерпретация) отражает истинный процесс рассуждений модели.

Другими словами, верная интерпретация должна рассматривать маркеры, на которых модель основывает свое решение, как более «важные», чем те маркеры, которые редко влияют на решение модели.

Далее мы представляем простой метод измерения достоверности приведенных выше интерпретаций.

Простой пример измерения верности

Показатели достоверности, основанные на удалении, являются наиболее распространенными методами оценки показателей достоверности. (Серрано и Смит, 2019 г.; Арья и др., 2019 г.; ДеЯнг и др., 2020 г.; Хризостому и Алетрас, 2021 г.). Они выводятся из изменений в поведении модели, когда важные токены удаляются, как правило, в порядке убывания важности. Вот их предположение:

Важный токен действительно «важный» только в том случае, если выходные данные модели резко меняются после его удаления.

Используя подход, основанный на удалении, простой способ измерить достоверность состоит в том, чтобы рассчитать изменение вероятности вывода модели по отношению к предсказанному классу при удалении наиболее важного токена:

Удалите самые важные токены

2. Рассчитайте изменения вероятности выхода модели и сравните изменения

Теперь мы видим, что «понять» для модели важнее, чем «удивительно». Интерпретация IG лучше!

На самом деле, «как измерить верность» по-прежнему является предметом исследований. В последние годы было предложено множество показателей достоверности.

Краткое содержание

Введем понятие достоверности интерпретации модели на примерах.
Мы не должны судить о качестве интерпретации человеческим глазом. Достоверность является одним из объективных способов измерения качества интерпретации.
Многие показатели достоверности используют подход, основанный на удалении.

Рекомендации

Повышение достоверности объяснений, основанных на внимании, с помощью информации для конкретной задачи для классификации текста. (Хрисостому и Алетрас, 2021 г.)
Можно ли интерпретировать внимание? (Серрано и Смит, 2019 г.)
ERASER: эталон для оценки рационализированных моделей НЛП. (ДеЯнг и др., 2020 г.)
Одно объяснение не подходит всем: инструментарий и систематика методов объяснимости ИИ. (Арья и др., 2019 г.)
На пути к достоверно интерпретируемым системам НЛП: как нам определить и оценить достоверность? (Якови и Голдберг, 2020 г.)

Новые материалы

Конфигурация Gulp для WordPress - Часть II

Здесь мы переходим ко второй части руководства по настройке Gulp для оптимальной разработки WordPress. Если вы пропустили первую часть, где мы установили все модули, необходимые для задач,..

LACTF — сеть/метавселенная

В lactf я смог решить задачу веб/метавселенной. Ниже приведен исходный код, предоставленный здесь Из исходного кода видно, что флаг — это отображаемое имя администратора...

GraphQL — Язык запросов — Часть 1

Первое, что нужно знать: GraphQL — это спецификация (как она должна работать и выглядеть), а не реализация. GraphQL не нужно устанавливать, вы реализуете его с помощью серверной библиотеки,..

Будущее машинного обучения в Индии

Будучи связанным с интенсивно развивающимся языком, непрерывные технологические достижения наверняка поразят сектор машинного обучения, который вот-вот сформирует долгосрочную перспективу машинного..

Сравнение Clojure IDE — Emacs/Cider и IDEA/Cursive

Введение Недавно я редактировал сообщение в блоге, в котором брал интервью у жителей Метосинии относительно их любимых редакторов Clojure . Было довольно интересно увидеть, что используется..

Строки, регулярные выражения и шаблонные литералы — Часть 1 | Понимание ES6

Строки, несомненно, являются одним из самых важных типов данных в любом языке программирования. Строки есть практически в каждом языке программирования, и научиться их эффективному..

7 признаков того, что вы все еще начинающий веб-разработчик

В этой статье я расскажу о 7 признаках того, что вы все еще начинающий веб-разработчик. Это вещи, в которые время от времени могут впадать даже опытные разработчики, поэтому не беспокойтесь,..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Web Development Software Development Python Coding Deep Learning React AI Software Engineering Java Nodejs Front End Development Algorithms Typescript Computer Science Data Tutorial Tech NLP Development CSS Javascript Tips Neural Networks Programming Languages Angular Productivity Developer Github Reactjs HTML Data Visualization ChatGPT Python Programming Startup DevOps