Seo

Техническое SEO: полное руководство с чего начать — индексация, Core Web Vitals, schema.org, hreflang

14 мин чтения

Hand-sketched набор аналитических иконок с графиками лупами и аватарами

Техническое SEO — оптимизация технической инфраструктуры сайта, чтобы поисковые роботы могли найти, просканировать, проиндексировать и корректно ранжировать ваши страницы. В отличие от контентного SEO (что пишет страница) и off-page SEO (кто на неё ссылается), техническое SEO отвечает за доступность и корректность обработки: может ли Googlebot зайти на сайт, правильно ли интерпретирует canonical, видит ли мобильную версию, загружается ли LCP быстрее 2.5 секунд. Без крепкого технического фундамента лучший контент не получает трафика — Google либо не индексирует его, либо не доверяет из-за медленной загрузки, либо индексирует дубли вместо оригинала.

Эта статья — полное руководство по technical SEO для начинающих: от crawling/indexing до Core Web Vitals, schema.org и hreflang. Пошаговая логика построена от фундамента (видит ли вас Google) до тонкой оптимизации (rich snippets, international targeting). Если вы запускаете новый сайт — пройдите все секции подряд; если у вас есть существующий и вы проводите аудит — пользуйтесь как чек-листом.

Что такое техническое SEO и чем отличается от других направлений

SEO делится на три уровня:

УровеньЧто оптимизируетПримеры
Техническое SEOИнфраструктуруCrawling, indexing, CWV, schema, hreflang, sitemap
On-page (content) SEOКонтент и HTMLTitle/meta, заголовки, ключевые слова, внутренняя перелинковка, текст
Off-page SEOАвторитетBacklinks, бренд-упоминания, social signals, PR

Техническое SEO — предпосылка: без него content и off-page не работают. Лучший гайд про SaaS-аналитику с 50 беклинками не получит трафика, если canonical указывает на удалённую страницу, или сайт блокируется через Disallow: / в robots.txt. Обратно, идеальное техническое SEO без контента и backlinks тоже не даёт трафика — это именно фундамент, на котором строится остальное.

Распределение влияния (приблизительное, на конкурентных нишах):

  • Техническое SEO — 25-30% (легко испортить всё)
  • Контентное SEO — 35-40% (определяет на какие запросы вообще ранжируетесь)
  • Off-page (backlinks) — 30-35% (определяет позицию в пределах ниши)
  • Brand и поведенческие сигналы — 5-10%

Как работает поисковая система: crawling, indexing, ranking

Google работает в три этапа:

Crawling → Indexing → Ranking
   ↓          ↓          ↓
Найти     Сохранить  Показать
  1. Crawling (сканирование). Googlebot обходит интернет, переходя по ссылкам. Точки входа: известные URL из предыдущих обходов, sitemap.xml, ссылки с других сайтов. Бот загружает HTML, рендерит JavaScript (через Chromium), находит новые ссылки — далее рекурсивно.
  2. Indexing (индексация). Google анализирует контент: парсит текст, структурированные данные, мета-теги, выявляет дубли через canonical, определяет язык. Если страница прошла фильтры качества — добавляется в индекс. Если содержит noindex, или является дублем без canonical — исключается.
  3. Ranking (ранжирование). Когда пользователь делает запрос, Google подбирает из индекса релевантные страницы и ранжирует их по ~200 факторам (релевантность, авторитет, поведенческие сигналы, техническое качество).

Техническое SEO влияет на первые два этапа: доступность для crawling и принятие в индекс. Если техническая часть сломана, content и backlinks не имеют значения — Google просто не видит страницу.

Crawling: как сделать сайт доступным для роботов

Robots.txt — инструкция для роботов

Файл по адресу https://example.com/robots.txt говорит роботам, что можно и нельзя сканировать:

User-agent: *
Disallow: /admin/
Disallow: /cart/
Disallow: /search/
Allow: /

User-agent: GPTBot
Disallow: /

Sitemap: https://example.com/sitemap.xml

Базовые правила:

  • User-agent: * — для всех ботов. Можно настраивать отдельно для Googlebot, Bingbot, GPTBot (OpenAI), ClaudeBot (Anthropic).
  • Disallow: /path/ — запретить сканирование. Поддерживает wildcard * и $.
  • Allow: /path/ — явно разрешить (важно для исключения из широкого Disallow).
  • Sitemap: — указать URL карты сайта.

Важное ограничение: robots.txt блокирует сканирование, но не индексацию. Если на заблокированную URL ведут внешние ссылки, она появится в индексе (без сниппета) как «No information available». Для гарантированного исключения — noindex мета-тег.

Проверка синтаксиса — через наш Robots.txt Tester.

Sitemap.xml — карта сайта для Google

Sitemap.xml — XML-файл со списком URL, которые вы хотите проиндексировать. Помогает Google быстрее находить новые страницы и приоритизировать crawl budget.

Базовый формат:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/</loc>
    <lastmod>2026-05-07</lastmod>
    <changefreq>weekly</changefreq>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>https://example.com/article/seo-guide/</loc>
    <lastmod>2026-05-07</lastmod>
  </url>
</urlset>

Лучшие практики:

  • Включайте только canonical-URL с 200-статусом, без noindex, без redirect.
  • Обновляйте <lastmod> при реальных изменениях контента — Google использует это для приоритизации обхода.
  • <changefreq> и <priority> — Google их в основном игнорирует, но не вредят.
  • Лимит — 50 000 URL или 50 МБ на один файл. Для бóльших сайтов — sitemap index, ссылающийся на десятки sitemap-файлов.
  • Отдельные sitemap для разных типов контента: sitemap-posts.xml, sitemap-products.xml, sitemap-images.xml, sitemap-videos.xml — помогает в диагностике.
  • Подайте sitemap в Google Search Console → Sitemaps. Slow-индексируемые сайты получают ускорение.

Архитектура сайта и внутренняя перелинковка

Глубина страницы (сколько кликов от home до страницы) — критический crawl-фактор. Лучшая практика: все важные страницы на 3 клика от home (home → category → article). Если статья на 5+ кликах, Googlebot может её не сканировать неделями.

Принципы:

  • Hub-spoke структура. Pillar-страница с обзором темы (hub) → 5-15 spoke-статей с deep-dive. Hub линкует на все spoke, spoke линкуют обратно на hub и на 2-3 соседние spoke.
  • Breadcrumbs на всех страницах с BreadcrumbList schema — даёт Google понять иерархию + красивые крошки в сниппете.
  • Контекстные внутренние ссылки из тела статьи, не только из navigation. Каждая статья должна иметь 5-15 internal links на связанные материалы.
  • Анкоры осмысленные, не «click here» — это сигнал релевантности.

Indexing: как гарантировать, что страницы попадают в индекс

Index Coverage report в Google Search Console

Главный отчёт для технического SEO — GSC → Pages. Страницы разделены на:

  • Indexed — в поиске.
  • Not indexed с подкатегориями:
    • Discovered – currently not indexed — Google знает URL, но не сканировал. Часто — низкое качество или crawl budget.
    • Crawled – currently not indexed — сканировал, но решил не индексировать. Контент воспринят как низкокачественный или дубль.
    • Page with redirect — 301/302 на другой URL.
    • Duplicate without user-selected canonical — дубль, Google сам выбрал canonical (часто не тот, что вы хотели).
    • Excluded by 'noindex' tag — явно исключено вами.
    • Blocked by robots.txt — заблокировано.
    • Soft 404 — страница возвращает 200, но выглядит как 404 (нет контента).

Целевой показатель для здорового сайта: >80% важных URL в Indexed, <20% в Not indexed.

Noindex meta-тег

Для гарантированного исключения страницы из индекса:

<meta name="robots" content="noindex, follow">

follow позволяет Google переходить по ссылкам со страницы (передавать link equity дальше), noindex — не индексировать саму страницу. Типичное применение: пагинация (/blog/page/2/), результаты фильтров, тестовые страницы, thank-you-after-purchase.

Canonical-теги — борьба с дублями

<link rel="canonical" href="https://example.com/page/"> в <head> говорит Google, какая URL основная среди дублей. Без canonical Google может проиндексировать дубль (например, /page/?utm_source=email) и распылить link equity.

Критические сценарии:

  1. E-commerce фильтры. ?color=red&size=L создаёт сотни комбинаций URL с тем же товаром — все указывают canonical на основную.
  2. Параметры трекинга. ?utm_*, ?fbclid, ?gclid от рекламы.
  3. HTTP vs HTTPS и www vs non-www. Выбираете одну версию как canonical и ставите 301 с остальных.
  4. Пагинация. /page/2/ имеет canonical на /page/2/ (self-referencing), не на первую страницу.
  5. Гостевая публикация. Если публикуете свою статью на чужом сайте — попросите canonical на ваш оригинал.

Ошибки:

  • Canonical на 404 или noindex-страницу.
  • Canonical на другой язык (нужен hreflang, не canonical).
  • Несколько canonical-тегов на одной странице.
  • Canonical на не-индексируемую версию URL.

Core Web Vitals: скорость как ranking-фактор

С 2021 года Core Web Vitals — официальный ranking-фактор Google. В 2026 без CWV в зелёной зоне невозможно ранжироваться на конкурентных запросах.

Три метрики CWV

МетрикаЧто измеряетЗелёная зонаЖёлтаяКрасная
LCP (Largest Contentful Paint)Время до отрисовки самого большого элемента<2.5с2.5-4с>4с
INP (Interaction to Next Paint)Задержка отклика на взаимодействие<200мс200-500мс>500мс
CLS (Cumulative Layout Shift)Кумулятивный сдвиг макета<0.10.1-0.25>0.25

INP заменил FID в марте 2024. INP более строгий: измеряет все взаимодействия (FID — только первое), включает время обработки + рендеринг.

Как улучшить LCP

LCP-элементом обычно является hero-изображение или заголовок above the fold. Шаги:

  1. Оптимизировать изображения. WebP/AVIF вместо JPEG/PNG. Размер под реальный viewport (responsive srcset). Lazy load для не-LCP изображений.
  2. CDN. Cloudflare, Bunny, Fastly — приближают контент к пользователю.
  3. Server-side rendering. SPA с client-side rendering = медленный LCP. Next.js, Astro, Hugo — быстрые.
  4. Preload критических ресурсов. <link rel="preload" href="hero.webp" as="image">.
  5. TTFB <600мс. Быстрый сервер — фундамент. Hosting на cheapest shared hosting часто даёт TTFB 1-2с — и LCP уже не впишется в 2.5с.
  6. Compression. Brotli > gzip. Включается на nginx/Apache уровне.

Как улучшить INP

INP — про responsiveness JavaScript:

  1. Уменьшить JS bundle. Code splitting, tree shaking, lazy load компонентов.
  2. Убрать long tasks. Разбить тяжёлые вычисления на chunks через setTimeout или requestIdleCallback.
  3. React/Vue оптимизация. useMemo, React.memo, virtual scrolling для больших списков.
  4. Web Workers для тяжёлых CPU-задач (графика, парсинг).
  5. Убрать third-party скрипты. Google Tag Manager не входит в бюджет — он синхронно блокирует main thread.

Как улучшить CLS

CLS — про визуальную стабильность:

  1. Width/height для изображений и видео. Без них браузер не знает размера и сдвигает контент после загрузки.
  2. Резервировать пространство под рекламу и embeds. min-height на контейнере, даже если реклама не загрузилась.
  3. Не вставлять контент над существующим. Cookie-banner внизу вместо сверху, lazy-load nicht над viewport.
  4. Web fonts с font-display: optional или swap + preload самых важных шрифтов.
  5. Skeleton screens вместо пустой белой страницы во время загрузки.

Проверка CWV: PageSpeed Insights (lab data + real Chrome UX Report) и GSC → Core Web Vitals report.

Mobile-first indexing

С 2019 года Google использует мобильную версию сайта для ранжирования. Если у вас десктопная версия богаче мобильной (больше текста, больше функций) — Google всё равно смотрит на mobile.

Чек-лист готовности:

  1. Сайт проходит Mobile-Friendly Test Google.
  2. Контент и структурированные данные идентичны между desktop и mobile.
  3. Изображения имеют корректные alt и width/height.
  4. Шрифт ≥14px без необходимости зума.
  5. Кнопки и tap-targets ≥48×48px.
  6. Viewport meta-тег: <meta name="viewport" content="width=device-width, initial-scale=1">.
  7. Без horizontal scroll.
  8. Нет блокированных ресурсов (CSS, JS) для мобильного Googlebot.

Современный подход — responsive design (один HTML, адаптивные CSS-стили). Отдельные мобильные домены (m.example.com) — устаревшая практика с кучей проблем (canonical, hreflang, дубли).

HTTPS и безопасность

Flat-иллюстрация монитора с SSL-надписью шляпой детектива и навесным замком со щитом

С 2014 HTTPS — ranking-фактор Google. С 2018 Chrome помечает HTTP-сайты как «Not secure». В 2026 — HTTPS обязателен.

Базовые требования:

  1. SSL-сертификат — Let’s Encrypt бесплатно, автоматическое обновление каждые 90 дней.
  2. 301 redirect с HTTP → HTTPS всех URL.
  3. HSTS заголовокStrict-Transport-Security: max-age=31536000; includeSubDomains; preload — браузер заставляет HTTPS даже для первого запроса.
  4. Без mixed content — все ресурсы (images, scripts, styles) на HTTPS.
  5. TLS 1.2+ — старые версии TLS 1.0/1.1 deprecated.

Проверка — Mozilla Observatory и SSL Labs Test.

Schema.org структурированные данные

Flat-иллюстрация облака монитора планшета и телефона с галочками и шестернями

Schema.org — словарь для разметки контента, помогающий Google показывать rich snippets (звёзды рейтинга, FAQ-блок, цена, время приготовления). Формат — JSON-LD в <script type="application/ld+json"> (рекомендованный Google).

Топ-10 самых полезных типов

  1. Article / NewsArticle / BlogPosting — для редакционного контента, даёт рейтинг автора.
  2. FAQPage — Q&A блок под сниппетом, +30-50% CTR (как в этой статье).
  3. HowTo — шаги в сниппете (с 2023 показываются только на мобильных в отдельных категориях).
  4. Product — цена, рейтинг, наличие для e-commerce.
  5. BreadcrumbList — хлебные крошки в сниппете вместо URL.
  6. Organization / LocalBusiness — для Knowledge Panel и Google Maps.
  7. Recipe — время, ингредиенты, рейтинг для кулинарных сайтов.
  8. Event — дата, место для ивентов.
  9. VideoObject — для индексации видео в Google Videos.
  10. WebSite с Sitelinks Search Box — отдельная поисковая форма в сниппете бренда.

Пример FAQPage schema

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "FAQPage",
  "mainEntity": [{
    "@type": "Question",
    "name": "Что такое техническое SEO?",
    "acceptedAnswer": {
      "@type": "Answer",
      "text": "Оптимизация технической инфраструктуры сайта..."
    }
  }]
}
</script>

Проверка — Google Rich Results Test и наш Schema Generator.

Hreflang для многоязычных сайтов

Если у вас сайт на нескольких языках (например, UK + RU + EN), hreflang говорит Google, какую версию показать каждому пользователю. Без hreflang может показаться русская версия украинскому пользователю или слияние дублей.

Базовая структура

В <head> каждой страницы:

<link rel="alternate" hreflang="uk" href="https://example.com/uk/page/">
<link rel="alternate" hreflang="ru" href="https://example.com/ru/page/">
<link rel="alternate" hreflang="en" href="https://example.com/en/page/">
<link rel="alternate" hreflang="x-default" href="https://example.com/en/page/">

Критические правила

  1. Реципрокность. Каждая языковая версия должна ссылаться на все остальные, включая себя. Если UK-страница линкует на RU, но RU не линкует обратно на UK — Google игнорирует hreflang.
  2. Абсолютные URL с протоколом https://.
  3. Корректные коды. ISO 639-1 для языка (uk, ru, en) + ISO 3166-1 для региона (en-US, en-GB, pt-BR). НЕ uk-UA по стандарту — uk достаточно, потому что язык сам по себе является региональным. Однако pt-BR (бразильский) и pt-PT (европейский) — критические разделения.
  4. x-default — fallback версия для неизвестных языков.
  5. Альтернативы расположения: <link> в <head> HTML, HTTP-заголовок Link: (для PDF), или в sitemap.xml.

Проверка

  • Наш Hreflang Generator — создаёт корректный код.
  • GSC → International Targeting → Language report.
  • Ahrefs Site Audit — секция Hreflang Issues.

URL-структура

Хорошие URL — короткие, описательные, без параметров сессии. Принципы:

  • Слова, не ID. /seo/technical-guide/ лучше чем /p?id=12345.
  • Дефисы, не подчёркивания. Google трактует seo-guide как 2 слова, seo_guide — как 1.
  • lowercase. Избегайте mixed case — создаёт дубли (case-sensitive на большинстве серверов).
  • Без stop words. /seo-guide/ лучше чем /the-seo-guide/.
  • Стабильные структуры. Изменение URL = потеря ranking. Если изменение неизбежно — обязательный 301 redirect.
  • HTTPS обязательно.
  • Trailing slash. Выберите один вариант (/page/ или /page) и придерживайтесь последовательно.

Типичные ошибки технического SEO

  1. Robots.txt блокирует весь сайт. Disallow: / после рестейджинга — классическая катастрофа. Всегда проверяйте через GSC → URL Inspection после релиза.
  2. Canonical на 404 или другой язык. Проверить через Screaming Frog или наш Meta Tag Checker.
  3. Sitemap.xml содержит redirect-URL или noindex-страницы. Говорит Google «индексируй это» и сразу «не индексируй» — запутывает.
  4. Дубли без canonical. Параметры URL, фильтры, sort, mobile/desktop версии — создают тысячи дублей.
  5. Mixed content на HTTPS. Картинки/скрипты с http:// на https:// странице — браузер блокирует + Google не доверяет.
  6. Hreflang без реципрокности. UK→RU без RU→UK — Google игнорирует все hreflang.
  7. Большой JS bundle и отсутствие SSR. SPA без server-side rendering = медленный LCP, проблемы с indexing JS-контента.
  8. Отсутствие schema.org на критических страницах. Теряете rich snippets и CTR.
  9. Crawl traps. Календари-pagination с бесконечными URL /calendar/2099/12/, фасетная навигация без ограничений — съедают crawl budget.
  10. Soft 404. Страница возвращает 200, но контент пустой или «Page not found». Google считает это низкокачественным сигналом.

Инструменты для технического SEO

Бесплатные (must-have)

  • Google Search Console — главный инструмент. Index coverage, Crawl errors, CWV, Mobile usability, hreflang, Sitemaps, URL Inspection.
  • PageSpeed Insights — LCP/INP/CLS и советы по оптимизации.
  • Mobile-Friendly Test и Rich Results Test — быстрая проверка одного URL.
  • Lighthouse в Chrome DevTools — полный аудит с performance/accessibility/SEO.
  • Bing Webmaster Tools — отдельный индекс Bing/DuckDuckGo + IndexNow API.

Платные (для больших сайтов)

  • Screaming Frog SEO Spider — desktop crawler, $259/год.
  • Ahrefs Site Audit — cloud crawler с трекингом ошибок во времени.
  • Semrush Site Audit — альтернатива Ahrefs.
  • Sitebulb — desktop crawler с хорошими визуализациями.

Наши онлайн-инструменты

Готовый пошаговый чек-лист — SEO Audit Checklist и Website Launch Checklist.

Чек-лист технического аудита

Топ-15 пунктов для первой проверки нового или существующего сайта:

  • GSC подключён, sitemap подан.
  • Index Coverage — >80% важных URL в Indexed.
  • Robots.txt не блокирует важные разделы.
  • Sitemap.xml содержит только canonical-URL с 200-статусом.
  • Canonical-теги на всех страницах (self-referencing минимум).
  • HTTPS на всём сайте без mixed content + 301 с HTTP.
  • HSTS заголовок установлен.
  • Mobile-Friendly Test проходит.
  • Core Web Vitals в зелёной зоне (LCP <2.5с, INP <200мс, CLS <0.1).
  • 404-ошибки минимизированы, redirect-цепочки <2 хопа.
  • Hreflang корректный (для мультиязычных) — реципрокный, валидные коды.
  • Schema.org на всех типах страниц (Article, FAQPage, BreadcrumbList минимум).
  • URL-структура — слова вместо ID, дефисы, lowercase.
  • Глубина страниц — важные контентные страницы на 3 клика от home.
  • TTFB <600мс, Brotli compression, CDN.

Техническое SEO + аналитика: измерять что оптимизировали

Техническое SEO без измерения = работа вслепую. Подключите:

  • Google Search Console — органический трафик, позиции, impressions, CWV, indexing.
  • Google Analytics 4 — поведение пользователей на сайте, конверсии, attribution.
  • Google Tag Manager — для управления аналитикой без правок кода.
  • PageSpeed Insights API + еженедельные снапшоты CWV — трекать регрессии после релизов.

Без аналитики вы не увидите, что обновление сайта уменьшило INP на 100мс или что 301 redirect растерял 30% трафика.

Связанные ресурсы на сайте

Глоссарий:

Инструменты:

Чек-листы:

Руководства:

Часто задаваемые вопросы (FAQ)

Что такое техническое SEO простыми словами?

Оптимизация технической инфраструктуры сайта, чтобы поисковые роботы Google могли найти, просканировать, проиндексировать и корректно ранжировать ваши страницы. В отличие от контентного и off-page SEO, technical SEO отвечает за доступность и корректность обработки.

Что проверить в первую очередь при техническом аудите?

Топ-10: GSC Index Coverage, robots.txt, sitemap.xml, canonical, HTTPS, Mobile-friendly test, CWV, 404/5xx ошибки, hreflang, schema.org. Закрытие этих пунктов — минимальный фундамент.

Что такое Core Web Vitals?

Три метрики Google: LCP (<2.5с — скорость самого большого элемента), INP (<200мс — задержка отклика, заменил FID), CLS (<0.1 — стабильность макета). Официальный ranking-фактор с 2021.

Как работает robots.txt?

Текстовый файл по https://example.com/robots.txt, инструктирующий ботов. Блокирует сканирование, не индексацию — для исключения из индекса нужен noindex meta-тег.

Что такое canonical-тег?

<link rel="canonical" href="https://..."> в <head> говорит Google, какая URL основная среди дублей. Критично для e-commerce фильтров, UTM-параметров, пагинации.

Как настроить hreflang?

Для каждой языковой версии в <head> — ссылки на все остальные версии включая себя (реципрокность), абсолютные URL, валидные коды ISO + x-default fallback.

Что такое mobile-first indexing?

С 2019 Google использует мобильную версию сайта для ранжирования. Современный подход — responsive design с идентичным контентом между desktop и mobile.

Какие типы schema.org самые полезные?

Article, FAQPage, BreadcrumbList, Product, Organization, HowTo, Recipe, Event, VideoObject, WebSite с Sitelinks Search Box. Формат — JSON-LD.

Сколько страниц Google может просканировать?

Crawl budget. Для маленьких сайтов (<1000 URL) — не проблема. Для больших (10k+) — критический параметр. Увеличивается через быстрый сервер, отсутствие 404, sitemap с lastmod, backlinks.

Какие инструменты нужны?

Бесплатные must-have: GSC, PageSpeed Insights, Mobile-Friendly Test, Rich Results Test, Lighthouse, Bing Webmaster Tools. Платные: Screaming Frog ($259/год), Ahrefs Site Audit, Semrush.