Дерево принятия решений: определение вероятности найма кандидатов
Здесь наша цель заключается в следующем: следуя по дереву решений,
определить вероятность найма каждого из трех кандидатов.- «Кандидат 1»: образование есть, опыт работы - 2 года.
- «Кандидат 2»: образования нет, опыт работы - 2 года.
- «Кандидат 3»: образование есть, опыт работы - 1 год.
Первый кандидат проходит через корневой узел и следует по верхней ветке к узлу «Опыт работы». Там он выбирает ветку «Опыт работы 1- 3 года»,
что приводит к вероятности найма в 33 % (1 случай найма против 2 случаев отказа).
Второй кандидат также проходит через корневой узел,
но его вероятность найма равна 0 %.Третий кандидат проходит через корневой узел и идет по верхней ветке к узлу «Опыт работы». Далее он выбирает ветку «Опыт работы более 3 лет»,
и таким образом его вероятность найма составляет 100 %.Далее мы определяем
минимально возможный порог той вероятности, при которой кандидатуры будут вообще рассматриваться, –
например, 80 %. Теперь специалисту необходимо просеять всех кандидатов через этот фильтр и отправить на рассмотрение рекрутерам лишь тех, у кого вероятность быть принятыми на должность составляет 80 % и выше по результатам скоринга.
В заключение
Безусловно, метод «Дерево решений» не является единственным инструментом для моделирования и прогнозирования решений, но у него есть несколько значительных преимуществ. Главным из них является простота в интерпретации: даже человек без аналитического опыта легко поймет логику принятия решений, заложенную в этом методе. Это понимание способствует повышению доверия к системе и результатам её работы.
Другим важным преимуществом метода является возможность работы с разнообразными данными. Деревья принятия решений могут эффективно обрабатывать как числовую, так и категориальную информацию, что позволяет использовать их как для задач классификации, так и регрессии.
Отмечу и ограничение. Глубокие деревья, особенно те, которые содержат много уровней,
могут стать трудными для интерпретации и понимания.