Общая статистика

Также смотрите 
"Методика оценки качества блэклистов"

Общая статистика

Статистика обновляется каждую среду по результатам этапа просчета, в соответствии с техническим регламентом предоставления услуг с 12:00 до 15:00 мск (GMT+3).

Дата расчета статистики
Дата просчета статистики
2017-12-06 05:52:47
 

Известных доменов в системе
Параметр Значение
Количество известных доменов, в том числе:1647167692
доменов 2-го уровня418354970
доменов 3-го и выше уровня1228812722
 

Количество однозначно оцененных доменов
Подсистема оценивания Количество оцененных доменов
Оценено автоматикой9735509
Оценено экспертами250006
Оценено одновременно и автоматикой, и экспертами81944
 

Пояснения к таблице: Автоматика делит домены на три группы:

  • однозначно не порнографический сайт
  • сайт в зоне сомнения
  • однозначно порнографический сайт

Домен считается оцененным автоматикой, если она способна выдвинуть однозначную гипотезу о принадлежности сайта. Сайты, находящиеся в зоне сомнения оцененными не считаются.

Эксперты оценивают сайты по расширенному списку категорий (см. Определения категорий), включающему как однозначные (Porn, Childporn, Not Porn), так и промежуточные категории (Adult, Sex Shops, Sex Education, Sex Health, Not Enough Content).  

Одновременно оцененным считается сайт, относительно которого автоматика выставила однозначную оценку, а эксперт отнес к любой из существующих категорий. От этого числа в дальнейшем считается процент ошибок первого и второго рода.

Оценка качества блэклистов
Тип ошибки Процент ошибки
Процент ошибок первого рода (false positive)4.7556868
Процент ошибок второго рода (false negative)1.3899736

Пояснения к таблице: Оценка качества блэклистов происходит на основании сравнения результатов оценивания автоматической подсистемы и экспертных оценок. Подразумевается, что эксперт оценивает сайт правильно. Несовпадение оценок может приводить к двум типам ошибок:

  • Ошибка первого рода (ложное срабатывание) - в нашем случае это процент легитимных сайтов, которые автоматика оценила как содержащие порнографический контент.
  • Ошибка второго рода (пропуск события) - в нашем случае это количество порнографических сайтов, которые подсистема автоматического оценивания не смогла распознать и оценила как не содержащие порнографического контента.
Подробнее читайте статью "Методика оценки качества блэклистов"