Как Яндекс XML начисляет баллы для возможности пользования своим API? Какие факторы на это влияют?
Считается, что баллы Яндекс XML начисляются по количеству страниц в индексе поисковой системы. Чем больше страниц проиндексировал поисковый робот, тем больше баллов появится у администратора сайта (передаст он их кому-нибудь или оставит себе — это уже другой вопрос).
А может быть что-то ещё добавляет баллы? — подумали мы и проверили, как на «XML баллы» влияют:
- количество проиндексированных страниц (чтобы лишний раз убедиться, что это так),
- возраста домена,
- индекс цитирования (тИЦ),
- присутствие в Яндекс.Каталоге.
Мы проводили исследование на 103 сайтах. Для начала давайте поглядим, что же из себя представляет выборка, которую мы подготовили. Получились такие графики:
Что мы видим:
- Подтверждается зависимость количества баллов Яндекс.XML от количества страниц в индексе.
- Возраст сайта не на количество баллов Яндекс.XML (на количество страниц — тоже).
- С тИЦ и Яндекс.Каталогом — как-то не очень понятно
Обратите внимание, мы здесь использовали логарифмическую шкалу (10-100-1000, а не 10-20-30).
Регрессионная модель
Мы с 10-й попытки смогли найти нужные символы, чтобы составить эту красивую модель:
\[\hat{Score} = \hat{\beta_0} + \hat{\beta_1}Age + \hat{\beta_2}YandexCatalog + \hat{\beta_3}YandexIndex + \hat{\beta_5}YandexCitation\]
А ещё Евгений Летов долго требовал поиграть в ней шрифтами.
Какие переменные значимы?
На 5% уровне значимы:
- Количество страниц в индексе. Каждая проиндексированная страничка дает примерно 0,3 XML-балла.
- тИЦ. Каждый дополнительный балл тИЦ добавляет 0,6 XML-балла.
Возраст сайта и присутствие в Яндекс.Каталоге роли не сыграли.
«Ха! Всё равно вы что-нибудь да пропустили!»
Да, мы могли что-то пропустить. Поэтому провели RESET-тест Рамсея, который создан как раз для таких случаев.
На нашей выборке p-value составил 0.95 — поэтому на данной выборке нет оснований полагать, что мы действительно что-то упустили.
Итог (Что делать?)
Приоритетные направления деятельности любителей Яндекс.XML:
- Увеличивать тИЦ ваших ресурсов.
- Загонять индекс побольше страниц.
P.S. 103 сайта — это довольно маленькая выборка. Кто его знает, может быть всё совсем не так — ведь мы «игрались» только с опекаемыми нами сайтами, в которых реальное количество страниц примерно соответствует количеству проиндексированных.
Если вы хотите помочь нашему исследованию стать точнее, можете отправлять списки вида «сайт» — «количество баллов» на почту letov@promoexpert.pro.
P.P.S. При подготовке материала ни один SEO’шник не пострадал (разве что от скуки).