Используемая терминология

Словарь терминов

В проекте используются следующие понятия:

URL - Единый указатель ресурсов (англ. URL - Uniform (или Universal) Resource Locator) - единообразный локатор (определитель местонахождения) ресурса. URL - это стандартизированный способ записи адреса ресурса в сети Интернет. Подробнее...

Белый список (от англ. whitelist) - уайтлист - механизм ограничения доступа на основании списка объектов, запрещает доступ ко всем объектам, кроме указанных в списке.

Блэклист (от англ. blacklist или block list) - черный список - механизм ограничения доступа на основании списка объектов, который разрешает доступ ко всем объектам, кроме перечисленных в списке. См. также Белый список.

Единообразный (similar) домен - это домен второго уровня, контент которого подпадает под ту же категорию, под которую подпадают все домены третьего и выше уровня, размещенные на нем. Понятие единообразный домен позволяет значительно сокращать размеры блэклистов. Максимальный эффект возникает при оценке тематических социальных сетей, блог-платформ и в иных схожих случаях. Единообразность домена определяется исключительно экспертом.

Домен верхнего (первого) уровня (англ. top-level domain — TLD) — в иерархии системы доменных имён (DNS) самый высокий уровень после корневого домена (англ. root domain). Является начальной точкой отсчёта (справа налево), с которой начинается доменное имя в Интернете.

Пример: 
http:// (www или домен(ы) n-го уровня) . домен 2-го уровня . домен верхнего (первого) уровня . /

Доменное имя второго уровня (англ. second-level domain (SLD)) — часть доменного имени, отделенная точкой от следующего сразу за ней домена первого уровня. Так например, в доменном имени wikipedia.org частица wikipedia является доменом второго уровня. 

Запаркованный сайт (парковка, parked site) - сайт, не имеющий своего собственного уникального контента, и содержащий (обычно) рекламные ссылки. Владелец такого сайта получает доход от переходов посетителей по ссылкам. Существуют компании, специализирующиеся на создании и поддержании сетей запаркованных доменов (http://parking.nic.ru/, http://www.sedoparking.com и прочие). Примеры: http://www.wanhailine.com/http://www.worldcup2006.com/.

Категория сайта - тематика, соответствующая определению категории (см. Определения категорий). Выделяется две группы категорий:

  • однозначные (strict) - четко, строго определяемые категории - используются для оценивания сайта как рейтером, так и экспертной системой
    • Porn - порнография
    • Not Porn - не порнография
  • неоднозначные - промежуточные категории - используются для оценивания только рейтером.
    • Adult - сайты для взрослых
    • Sex Shop - магазины товаров для секса
    • Sex education - образовательные сайты сексуальной направленности
    • Sex Health - медицинские сайты сексуальной направленности
    • Not Enough Content - скрытая "техническая" категория, подразумевающая недостаточность содержаний для отнесения сайта к какой-либо категории.

Эксперты оценивают сайты по всему множеству категорий, автоматика - только по однозначным категориям.

Ошибка первого рода - понятие, используемое для оценки качества статистических гипотез, интерпретируется как ложное срабатывание критерия. В нашем случае под ошибкой первого рода мы понимаем ситуацию, когда сайт не содержащий порнографических материалов, оценивается автоматикой как порнографический.

Ошибка второго рода - понятие, используемое для оценки качества статистических гипотез, интерпретируется как пропуск события. В нашем случае под ошибкой второго рода мы понимаем ситуацию, когда сайт содержащий порнографические материалы, оценивается автоматикой как не порнографический.

Порнография - непосредственное, вульгарно-натуралистическое изображение или словесное описание половых органов и полового акта, имеющее целью сексуальное возбуждение.

Рейт - оценка, выставленная человеком (рейтером), либо автоматической экспертной системой.

Рейтер - аналитик, эксперт, просматривающий сайты и относящий их к определенным категориям.

Домен верхнего (первого) уровня (англ. top-level domain — TLD) — в иерархии системы доменных имён (DNS) самый высокий уровень после корневого домена (англ. root domain). Является начальной точкой отсчёта (справа налево), с которой начинается доменное имя в Интернете.

Пример: 

http:// (www или домен(ы) n-го уровня) . домен 2-го уровня . домен верхнего (первого) уровня . /

Доменное имя второго уровня (англ. second-level domain (SLD)) — часть доменного имени, отделенная точкой от следующего сразу за ней домена первого уровня. Так например, в доменном имени wikipedia.org частица wikipedia является доменом второго уровня.