Техническое SEO: полное руководство с чего начать — индексация, Core Web Vitals, schema.org, hreflang
![]()
Техническое SEO — оптимизация технической инфраструктуры сайта, чтобы поисковые роботы могли найти, просканировать, проиндексировать и корректно ранжировать ваши страницы. В отличие от контентного SEO (что пишет страница) и off-page SEO (кто на неё ссылается), техническое SEO отвечает за доступность и корректность обработки: может ли Googlebot зайти на сайт, правильно ли интерпретирует canonical, видит ли мобильную версию, загружается ли LCP быстрее 2.5 секунд. Без крепкого технического фундамента лучший контент не получает трафика — Google либо не индексирует его, либо не доверяет из-за медленной загрузки, либо индексирует дубли вместо оригинала.
Эта статья — полное руководство по technical SEO для начинающих: от crawling/indexing до Core Web Vitals, schema.org и hreflang. Пошаговая логика построена от фундамента (видит ли вас Google) до тонкой оптимизации (rich snippets, international targeting). Если вы запускаете новый сайт — пройдите все секции подряд; если у вас есть существующий и вы проводите аудит — пользуйтесь как чек-листом.
Что такое техническое SEO и чем отличается от других направлений
SEO делится на три уровня:
| Уровень | Что оптимизирует | Примеры |
|---|---|---|
| Техническое SEO | Инфраструктуру | Crawling, indexing, CWV, schema, hreflang, sitemap |
| On-page (content) SEO | Контент и HTML | Title/meta, заголовки, ключевые слова, внутренняя перелинковка, текст |
| Off-page SEO | Авторитет | Backlinks, бренд-упоминания, social signals, PR |
Техническое SEO — предпосылка: без него content и off-page не работают. Лучший гайд про SaaS-аналитику с 50 беклинками не получит трафика, если canonical указывает на удалённую страницу, или сайт блокируется через Disallow: / в robots.txt. Обратно, идеальное техническое SEO без контента и backlinks тоже не даёт трафика — это именно фундамент, на котором строится остальное.
Распределение влияния (приблизительное, на конкурентных нишах):
- Техническое SEO — 25-30% (легко испортить всё)
- Контентное SEO — 35-40% (определяет на какие запросы вообще ранжируетесь)
- Off-page (backlinks) — 30-35% (определяет позицию в пределах ниши)
- Brand и поведенческие сигналы — 5-10%
Как работает поисковая система: crawling, indexing, ranking
Google работает в три этапа:
Crawling → Indexing → Ranking
↓ ↓ ↓
Найти Сохранить Показать
- Crawling (сканирование). Googlebot обходит интернет, переходя по ссылкам. Точки входа: известные URL из предыдущих обходов, sitemap.xml, ссылки с других сайтов. Бот загружает HTML, рендерит JavaScript (через Chromium), находит новые ссылки — далее рекурсивно.
- Indexing (индексация). Google анализирует контент: парсит текст, структурированные данные, мета-теги, выявляет дубли через canonical, определяет язык. Если страница прошла фильтры качества — добавляется в индекс. Если содержит
noindex, или является дублем без canonical — исключается. - Ranking (ранжирование). Когда пользователь делает запрос, Google подбирает из индекса релевантные страницы и ранжирует их по ~200 факторам (релевантность, авторитет, поведенческие сигналы, техническое качество).
Техническое SEO влияет на первые два этапа: доступность для crawling и принятие в индекс. Если техническая часть сломана, content и backlinks не имеют значения — Google просто не видит страницу.
Crawling: как сделать сайт доступным для роботов
Robots.txt — инструкция для роботов
Файл по адресу https://example.com/robots.txt говорит роботам, что можно и нельзя сканировать:
User-agent: *
Disallow: /admin/
Disallow: /cart/
Disallow: /search/
Allow: /
User-agent: GPTBot
Disallow: /
Sitemap: https://example.com/sitemap.xml
Базовые правила:
User-agent: *— для всех ботов. Можно настраивать отдельно дляGooglebot,Bingbot,GPTBot(OpenAI),ClaudeBot(Anthropic).Disallow: /path/— запретить сканирование. Поддерживает wildcard*и$.Allow: /path/— явно разрешить (важно для исключения из широкого Disallow).Sitemap:— указать URL карты сайта.
Важное ограничение: robots.txt блокирует сканирование, но не индексацию. Если на заблокированную URL ведут внешние ссылки, она появится в индексе (без сниппета) как «No information available». Для гарантированного исключения — noindex мета-тег.
Проверка синтаксиса — через наш Robots.txt Tester.
Sitemap.xml — карта сайта для Google
Sitemap.xml — XML-файл со списком URL, которые вы хотите проиндексировать. Помогает Google быстрее находить новые страницы и приоритизировать crawl budget.
Базовый формат:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/</loc>
<lastmod>2026-05-07</lastmod>
<changefreq>weekly</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>https://example.com/article/seo-guide/</loc>
<lastmod>2026-05-07</lastmod>
</url>
</urlset>
Лучшие практики:
- Включайте только canonical-URL с 200-статусом, без noindex, без redirect.
- Обновляйте
<lastmod>при реальных изменениях контента — Google использует это для приоритизации обхода. <changefreq>и<priority>— Google их в основном игнорирует, но не вредят.- Лимит — 50 000 URL или 50 МБ на один файл. Для бóльших сайтов — sitemap index, ссылающийся на десятки sitemap-файлов.
- Отдельные sitemap для разных типов контента:
sitemap-posts.xml,sitemap-products.xml,sitemap-images.xml,sitemap-videos.xml— помогает в диагностике. - Подайте sitemap в Google Search Console → Sitemaps. Slow-индексируемые сайты получают ускорение.
Архитектура сайта и внутренняя перелинковка
Глубина страницы (сколько кликов от home до страницы) — критический crawl-фактор. Лучшая практика: все важные страницы на 3 клика от home (home → category → article). Если статья на 5+ кликах, Googlebot может её не сканировать неделями.
Принципы:
- Hub-spoke структура. Pillar-страница с обзором темы (hub) → 5-15 spoke-статей с deep-dive. Hub линкует на все spoke, spoke линкуют обратно на hub и на 2-3 соседние spoke.
- Breadcrumbs на всех страницах с BreadcrumbList schema — даёт Google понять иерархию + красивые крошки в сниппете.
- Контекстные внутренние ссылки из тела статьи, не только из navigation. Каждая статья должна иметь 5-15 internal links на связанные материалы.
- Анкоры осмысленные, не «click here» — это сигнал релевантности.
Indexing: как гарантировать, что страницы попадают в индекс
Index Coverage report в Google Search Console
Главный отчёт для технического SEO — GSC → Pages. Страницы разделены на:
- Indexed — в поиске.
- Not indexed с подкатегориями:
Discovered – currently not indexed— Google знает URL, но не сканировал. Часто — низкое качество или crawl budget.Crawled – currently not indexed— сканировал, но решил не индексировать. Контент воспринят как низкокачественный или дубль.Page with redirect— 301/302 на другой URL.Duplicate without user-selected canonical— дубль, Google сам выбрал canonical (часто не тот, что вы хотели).Excluded by 'noindex' tag— явно исключено вами.Blocked by robots.txt— заблокировано.Soft 404— страница возвращает 200, но выглядит как 404 (нет контента).
Целевой показатель для здорового сайта: >80% важных URL в Indexed, <20% в Not indexed.
Noindex meta-тег
Для гарантированного исключения страницы из индекса:
<meta name="robots" content="noindex, follow">
follow позволяет Google переходить по ссылкам со страницы (передавать link equity дальше), noindex — не индексировать саму страницу. Типичное применение: пагинация (/blog/page/2/), результаты фильтров, тестовые страницы, thank-you-after-purchase.
Canonical-теги — борьба с дублями
<link rel="canonical" href="https://example.com/page/"> в <head> говорит Google, какая URL основная среди дублей. Без canonical Google может проиндексировать дубль (например, /page/?utm_source=email) и распылить link equity.
Критические сценарии:
- E-commerce фильтры.
?color=red&size=Lсоздаёт сотни комбинаций URL с тем же товаром — все указывают canonical на основную. - Параметры трекинга.
?utm_*,?fbclid,?gclidот рекламы. - HTTP vs HTTPS и www vs non-www. Выбираете одну версию как canonical и ставите 301 с остальных.
- Пагинация.
/page/2/имеет canonical на/page/2/(self-referencing), не на первую страницу. - Гостевая публикация. Если публикуете свою статью на чужом сайте — попросите canonical на ваш оригинал.
Ошибки:
- Canonical на 404 или noindex-страницу.
- Canonical на другой язык (нужен hreflang, не canonical).
- Несколько canonical-тегов на одной странице.
- Canonical на не-индексируемую версию URL.
Core Web Vitals: скорость как ranking-фактор
С 2021 года Core Web Vitals — официальный ranking-фактор Google. В 2026 без CWV в зелёной зоне невозможно ранжироваться на конкурентных запросах.
Три метрики CWV
| Метрика | Что измеряет | Зелёная зона | Жёлтая | Красная |
|---|---|---|---|---|
| LCP (Largest Contentful Paint) | Время до отрисовки самого большого элемента | <2.5с | 2.5-4с | >4с |
| INP (Interaction to Next Paint) | Задержка отклика на взаимодействие | <200мс | 200-500мс | >500мс |
| CLS (Cumulative Layout Shift) | Кумулятивный сдвиг макета | <0.1 | 0.1-0.25 | >0.25 |
INP заменил FID в марте 2024. INP более строгий: измеряет все взаимодействия (FID — только первое), включает время обработки + рендеринг.
Как улучшить LCP
LCP-элементом обычно является hero-изображение или заголовок above the fold. Шаги:
- Оптимизировать изображения. WebP/AVIF вместо JPEG/PNG. Размер под реальный viewport (responsive
srcset). Lazy load для не-LCP изображений. - CDN. Cloudflare, Bunny, Fastly — приближают контент к пользователю.
- Server-side rendering. SPA с client-side rendering = медленный LCP. Next.js, Astro, Hugo — быстрые.
- Preload критических ресурсов.
<link rel="preload" href="hero.webp" as="image">. - TTFB <600мс. Быстрый сервер — фундамент. Hosting на cheapest shared hosting часто даёт TTFB 1-2с — и LCP уже не впишется в 2.5с.
- Compression. Brotli > gzip. Включается на nginx/Apache уровне.
Как улучшить INP
INP — про responsiveness JavaScript:
- Уменьшить JS bundle. Code splitting, tree shaking, lazy load компонентов.
- Убрать long tasks. Разбить тяжёлые вычисления на chunks через
setTimeoutилиrequestIdleCallback. - React/Vue оптимизация.
useMemo,React.memo, virtual scrolling для больших списков. - Web Workers для тяжёлых CPU-задач (графика, парсинг).
- Убрать third-party скрипты. Google Tag Manager не входит в бюджет — он синхронно блокирует main thread.
Как улучшить CLS
CLS — про визуальную стабильность:
- Width/height для изображений и видео. Без них браузер не знает размера и сдвигает контент после загрузки.
- Резервировать пространство под рекламу и embeds.
min-heightна контейнере, даже если реклама не загрузилась. - Не вставлять контент над существующим. Cookie-banner внизу вместо сверху, lazy-load nicht над viewport.
- Web fonts с
font-display: optionalилиswap+ preload самых важных шрифтов. - Skeleton screens вместо пустой белой страницы во время загрузки.
Проверка CWV: PageSpeed Insights (lab data + real Chrome UX Report) и GSC → Core Web Vitals report.
Mobile-first indexing
С 2019 года Google использует мобильную версию сайта для ранжирования. Если у вас десктопная версия богаче мобильной (больше текста, больше функций) — Google всё равно смотрит на mobile.
Чек-лист готовности:
- Сайт проходит Mobile-Friendly Test Google.
- Контент и структурированные данные идентичны между desktop и mobile.
- Изображения имеют корректные
altиwidth/height. - Шрифт ≥14px без необходимости зума.
- Кнопки и tap-targets ≥48×48px.
- Viewport meta-тег:
<meta name="viewport" content="width=device-width, initial-scale=1">. - Без horizontal scroll.
- Нет блокированных ресурсов (CSS, JS) для мобильного Googlebot.
Современный подход — responsive design (один HTML, адаптивные CSS-стили). Отдельные мобильные домены (m.example.com) — устаревшая практика с кучей проблем (canonical, hreflang, дубли).
HTTPS и безопасность

С 2014 HTTPS — ranking-фактор Google. С 2018 Chrome помечает HTTP-сайты как «Not secure». В 2026 — HTTPS обязателен.
Базовые требования:
- SSL-сертификат — Let’s Encrypt бесплатно, автоматическое обновление каждые 90 дней.
- 301 redirect с HTTP → HTTPS всех URL.
- HSTS заголовок —
Strict-Transport-Security: max-age=31536000; includeSubDomains; preload— браузер заставляет HTTPS даже для первого запроса. - Без mixed content — все ресурсы (images, scripts, styles) на HTTPS.
- TLS 1.2+ — старые версии TLS 1.0/1.1 deprecated.
Проверка — Mozilla Observatory и SSL Labs Test.
Schema.org структурированные данные

Schema.org — словарь для разметки контента, помогающий Google показывать rich snippets (звёзды рейтинга, FAQ-блок, цена, время приготовления). Формат — JSON-LD в <script type="application/ld+json"> (рекомендованный Google).
Топ-10 самых полезных типов
- Article / NewsArticle / BlogPosting — для редакционного контента, даёт рейтинг автора.
- FAQPage — Q&A блок под сниппетом, +30-50% CTR (как в этой статье).
- HowTo — шаги в сниппете (с 2023 показываются только на мобильных в отдельных категориях).
- Product — цена, рейтинг, наличие для e-commerce.
- BreadcrumbList — хлебные крошки в сниппете вместо URL.
- Organization / LocalBusiness — для Knowledge Panel и Google Maps.
- Recipe — время, ингредиенты, рейтинг для кулинарных сайтов.
- Event — дата, место для ивентов.
- VideoObject — для индексации видео в Google Videos.
- WebSite с Sitelinks Search Box — отдельная поисковая форма в сниппете бренда.
Пример FAQPage schema
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "FAQPage",
"mainEntity": [{
"@type": "Question",
"name": "Что такое техническое SEO?",
"acceptedAnswer": {
"@type": "Answer",
"text": "Оптимизация технической инфраструктуры сайта..."
}
}]
}
</script>
Проверка — Google Rich Results Test и наш Schema Generator.
Hreflang для многоязычных сайтов
Если у вас сайт на нескольких языках (например, UK + RU + EN), hreflang говорит Google, какую версию показать каждому пользователю. Без hreflang может показаться русская версия украинскому пользователю или слияние дублей.
Базовая структура
В <head> каждой страницы:
<link rel="alternate" hreflang="uk" href="https://example.com/uk/page/">
<link rel="alternate" hreflang="ru" href="https://example.com/ru/page/">
<link rel="alternate" hreflang="en" href="https://example.com/en/page/">
<link rel="alternate" hreflang="x-default" href="https://example.com/en/page/">
Критические правила
- Реципрокность. Каждая языковая версия должна ссылаться на все остальные, включая себя. Если UK-страница линкует на RU, но RU не линкует обратно на UK — Google игнорирует hreflang.
- Абсолютные URL с протоколом
https://. - Корректные коды. ISO 639-1 для языка (
uk,ru,en) + ISO 3166-1 для региона (en-US,en-GB,pt-BR). НЕuk-UAпо стандарту —ukдостаточно, потому что язык сам по себе является региональным. Однакоpt-BR(бразильский) иpt-PT(европейский) — критические разделения. - x-default — fallback версия для неизвестных языков.
- Альтернативы расположения:
<link>в<head>HTML, HTTP-заголовокLink:(для PDF), или в sitemap.xml.
Проверка
- Наш Hreflang Generator — создаёт корректный код.
- GSC → International Targeting → Language report.
- Ahrefs Site Audit — секция Hreflang Issues.
URL-структура
Хорошие URL — короткие, описательные, без параметров сессии. Принципы:
- Слова, не ID.
/seo/technical-guide/лучше чем/p?id=12345. - Дефисы, не подчёркивания. Google трактует
seo-guideкак 2 слова,seo_guide— как 1. - lowercase. Избегайте mixed case — создаёт дубли (case-sensitive на большинстве серверов).
- Без stop words.
/seo-guide/лучше чем/the-seo-guide/. - Стабильные структуры. Изменение URL = потеря ranking. Если изменение неизбежно — обязательный 301 redirect.
- HTTPS обязательно.
- Trailing slash. Выберите один вариант (
/page/или/page) и придерживайтесь последовательно.
Типичные ошибки технического SEO
- Robots.txt блокирует весь сайт.
Disallow: /после рестейджинга — классическая катастрофа. Всегда проверяйте через GSC → URL Inspection после релиза. - Canonical на 404 или другой язык. Проверить через Screaming Frog или наш Meta Tag Checker.
- Sitemap.xml содержит redirect-URL или noindex-страницы. Говорит Google «индексируй это» и сразу «не индексируй» — запутывает.
- Дубли без canonical. Параметры URL, фильтры, sort, mobile/desktop версии — создают тысячи дублей.
- Mixed content на HTTPS. Картинки/скрипты с
http://наhttps://странице — браузер блокирует + Google не доверяет. - Hreflang без реципрокности. UK→RU без RU→UK — Google игнорирует все hreflang.
- Большой JS bundle и отсутствие SSR. SPA без server-side rendering = медленный LCP, проблемы с indexing JS-контента.
- Отсутствие schema.org на критических страницах. Теряете rich snippets и CTR.
- Crawl traps. Календари-pagination с бесконечными URL
/calendar/2099/12/, фасетная навигация без ограничений — съедают crawl budget. - Soft 404. Страница возвращает 200, но контент пустой или «Page not found». Google считает это низкокачественным сигналом.
Инструменты для технического SEO
Бесплатные (must-have)
- Google Search Console — главный инструмент. Index coverage, Crawl errors, CWV, Mobile usability, hreflang, Sitemaps, URL Inspection.
- PageSpeed Insights — LCP/INP/CLS и советы по оптимизации.
- Mobile-Friendly Test и Rich Results Test — быстрая проверка одного URL.
- Lighthouse в Chrome DevTools — полный аудит с performance/accessibility/SEO.
- Bing Webmaster Tools — отдельный индекс Bing/DuckDuckGo + IndexNow API.
Платные (для больших сайтов)
- Screaming Frog SEO Spider — desktop crawler, $259/год.
- Ahrefs Site Audit — cloud crawler с трекингом ошибок во времени.
- Semrush Site Audit — альтернатива Ahrefs.
- Sitebulb — desktop crawler с хорошими визуализациями.
Наши онлайн-инструменты
- Robots.txt Tester — проверка синтаксиса и блокировок.
- Hreflang Generator — генерация корректного кода.
- Meta Tag Checker — быстрая проверка title/description/canonical.
- Schema Generator — JSON-LD для топ типов.
- SERP Preview — как будет выглядеть сниппет в Google.
Готовый пошаговый чек-лист — SEO Audit Checklist и Website Launch Checklist.
Чек-лист технического аудита
Топ-15 пунктов для первой проверки нового или существующего сайта:
- GSC подключён, sitemap подан.
- Index Coverage — >80% важных URL в Indexed.
- Robots.txt не блокирует важные разделы.
- Sitemap.xml содержит только canonical-URL с 200-статусом.
- Canonical-теги на всех страницах (self-referencing минимум).
- HTTPS на всём сайте без mixed content + 301 с HTTP.
- HSTS заголовок установлен.
- Mobile-Friendly Test проходит.
- Core Web Vitals в зелёной зоне (LCP <2.5с, INP <200мс, CLS <0.1).
- 404-ошибки минимизированы, redirect-цепочки <2 хопа.
- Hreflang корректный (для мультиязычных) — реципрокный, валидные коды.
- Schema.org на всех типах страниц (Article, FAQPage, BreadcrumbList минимум).
- URL-структура — слова вместо ID, дефисы, lowercase.
- Глубина страниц — важные контентные страницы на 3 клика от home.
- TTFB <600мс, Brotli compression, CDN.
Техническое SEO + аналитика: измерять что оптимизировали
Техническое SEO без измерения = работа вслепую. Подключите:
- Google Search Console — органический трафик, позиции, impressions, CWV, indexing.
- Google Analytics 4 — поведение пользователей на сайте, конверсии, attribution.
- Google Tag Manager — для управления аналитикой без правок кода.
- PageSpeed Insights API + еженедельные снапшоты CWV — трекать регрессии после релизов.
Без аналитики вы не увидите, что обновление сайта уменьшило INP на 100мс или что 301 redirect растерял 30% трафика.
Связанные ресурсы на сайте
Глоссарий:
Инструменты:
Чек-листы:
- SEO Audit Checklist — полный пошаговый аудит.
- Website Launch Checklist — перед релизом нового сайта.
- GA4 Setup Checklist — настройка аналитики.
Руководства:
Часто задаваемые вопросы (FAQ)
Что такое техническое SEO простыми словами?
Оптимизация технической инфраструктуры сайта, чтобы поисковые роботы Google могли найти, просканировать, проиндексировать и корректно ранжировать ваши страницы. В отличие от контентного и off-page SEO, technical SEO отвечает за доступность и корректность обработки.
Что проверить в первую очередь при техническом аудите?
Топ-10: GSC Index Coverage, robots.txt, sitemap.xml, canonical, HTTPS, Mobile-friendly test, CWV, 404/5xx ошибки, hreflang, schema.org. Закрытие этих пунктов — минимальный фундамент.
Что такое Core Web Vitals?
Три метрики Google: LCP (<2.5с — скорость самого большого элемента), INP (<200мс — задержка отклика, заменил FID), CLS (<0.1 — стабильность макета). Официальный ranking-фактор с 2021.
Как работает robots.txt?
Текстовый файл по https://example.com/robots.txt, инструктирующий ботов. Блокирует сканирование, не индексацию — для исключения из индекса нужен noindex meta-тег.
Что такое canonical-тег?
<link rel="canonical" href="https://..."> в <head> говорит Google, какая URL основная среди дублей. Критично для e-commerce фильтров, UTM-параметров, пагинации.
Как настроить hreflang?
Для каждой языковой версии в <head> — ссылки на все остальные версии включая себя (реципрокность), абсолютные URL, валидные коды ISO + x-default fallback.
Что такое mobile-first indexing?
С 2019 Google использует мобильную версию сайта для ранжирования. Современный подход — responsive design с идентичным контентом между desktop и mobile.
Какие типы schema.org самые полезные?
Article, FAQPage, BreadcrumbList, Product, Organization, HowTo, Recipe, Event, VideoObject, WebSite с Sitelinks Search Box. Формат — JSON-LD.
Сколько страниц Google может просканировать?
Crawl budget. Для маленьких сайтов (<1000 URL) — не проблема. Для больших (10k+) — критический параметр. Увеличивается через быстрый сервер, отсутствие 404, sitemap с lastmod, backlinks.
Какие инструменты нужны?
Бесплатные must-have: GSC, PageSpeed Insights, Mobile-Friendly Test, Rich Results Test, Lighthouse, Bing Webmaster Tools. Платные: Screaming Frog ($259/год), Ahrefs Site Audit, Semrush.
Теги
Похожие статьи
Robots.txt Tester — проверка правил сканирования
Бесплатный онлайн-тестер robots.txt: проверяет разрешение на сканирование URL для 16 поисковых и AI-ботов (Googlebot, Bingbot, GPTBot, ClaudeBot), показывает правило и строку.
SeoТехническое SEO: с чего начать
Пошаговое руководство по техническому SEO: индексация, скорость сайта, мобильная адаптивность и структурированные данные
ToolsHreflang Generator — генератор тегов для мультиязычных сайтов
Бесплатный генератор hreflang-тегов в 3 форматах: HTML link, XML sitemap, HTTP-заголовок. Поддержка 30 языков и 32 стран, x-default, валидация reciprocal-ссылок.