В прошлой статье мы погрузились в оценку самых популярных AI продуктов.
По итогам ручного тестирования и попытки автоматизации по выбранным критериям был сделан вполне себе ожидаемый вывод о невозможности применения одних и тех же метрик к оценке задач разного рода.
Поэтому было принято решение ознакомиться с основными метриками для оценки качества ответов AI продуктов.
Такими метриками стали: Precision, Recall, Specificity и Confusion matrix, а также MAP и MRR.
Для чего такие метрики нужны?
Читать далее