Що перевірити в першу чергу при технічному аудиті сайту?

Топ-10 пріоритетів для першої перевірки: (1) **Index Coverage** у Google Search Console — скільки сторінок проіндексовано vs виключено; (2) **Robots.txt** — чи не блокує важливі розділи; (3) **Sitemap.xml** — чи поданий у GSC і коректно генерується; (4) **Canonical-теги** — чи правильні і не вказують на дублі; (5) **HTTPS** — чи весь сайт на SSL без mixed content; (6) **Mobile-friendly test** — чи проходить тест Google; (7) **Core Web Vitals** у GSC і PageSpeed Insights — LCP/INP/CLS у зеленій зоні; (8) **404 і 5xx помилки** — Crawl errors у GSC; (9) **Hreflang** для мультимовних сайтів — синтаксис коректний, реципрокність є; (10) **Schema.org** — чи валідується через Rich Results Test. Закриття цих 10 пунктів — мінімальний фундамент перед будь-якою контентною роботою.

Що таке Core Web Vitals і як їх покращити?

Core Web Vitals (CWV) — три метрики Google для вимірювання якості користувацького досвіду: (1) **LCP (Largest Contentful Paint)** — час до відмалювання найбільшого елемента, ціль <2.5с. Покращення: оптимізувати hero-зображення (WebP/AVIF, lazy load для не-LCP), CDN, server-side rendering замість клієнтського; (2) **INP (Interaction to Next Paint)** — затримка відгуку на взаємодію (клік, тап), ціль <200мс. Замінив FID у березні 2024. Покращення: зменшити JavaScript, прибрати long tasks, оптимізувати React/Vue rendering; (3) **CLS (Cumulative Layout Shift)** — кумулятивний зсув макету, ціль <0.1. Покращення: задавати width/height для зображень і відео, резервувати простір під рекламу і embeds, не вставляти контент над існуючим. Перевірка: PageSpeed Insights (lab data) + GSC Core Web Vitals report (real user data з Chrome UX Report). Без CWV у зеленій зоні в 2026 році ранжування суттєво страждає на конкурентних запитах.

Як працює robots.txt і навіщо він потрібен?

Robots.txt — текстовий файл за адресою `https://example.com/robots.txt`, що інструктує пошукових роботів, які URL вони можуть або не можуть сканувати. Базова структура: `User-agent: *` (для всіх ботів) + `Disallow: /admin/` (заборонити сканувати) + `Allow: /` (дозволити решту) + `Sitemap: https://example.com/sitemap.xml` (вказати карту). **Важливі обмеження:** robots.txt блокує **сканування**, але не **індексацію** — якщо на заблоковану URL ведуть зовнішні посилання, вона все одно з'явиться в індексі (без сніпета) як «No information available». Для гарантованого виключення з індексу використовуйте `noindex` мета-тег на самій сторінці. Інші важливі директиви: `Crawl-delay` (пауза між запитами, ігнорується Googlebot), `User-agent: GPTBot` (заборонити OpenAI), `User-agent: ClaudeBot` (заборонити Anthropic). Перевірка синтаксису — через [наш Robots.txt Tester](/tools/robots-tester/).

Що таке canonical-тег і коли він критично важливий?

Canonical-тег ` ` у ` ` сторінки вказує Google, яка URL є **основною** серед дублів. Без canonical Google може індексувати дубль (наприклад, `/page/?utm_source=email`) замість оригіналу і розпорошувати link equity. Критичні сценарії: (1) **E-commerce фільтри** — `?color=red&size=L` створює сотні комбінацій URL з тим самим товаром, всі вказують canonical на основну; (2) **Параметри трекінгу** — `?utm_*`, `?fbclid`, `?gclid` від реклами; (3) **HTTP vs HTTPS і www vs non-www** — обираєте одну версію як canonical; (4) **Пагінація** — раніше Google рекомендував `rel=prev/next`, з 2019 ця підтримка припинена, тепер canonical на /page/2/ вказує на /page/2/ (self-referencing); (5) **Мультидоменна публікація** — гостьовий пост на чужому сайті з canonical на ваш оригінал. Помилки: canonical на 404, canonical на noindex-сторінку, canonical на іншу мову (треба hreflang, не canonical).

Як налаштувати hreflang для багатомовного сайту?

Hreflang — атрибут ` `, що вказує Google мовні і регіональні версії однієї і тієї ж сторінки. Без правильного hreflang Google може показати російську версію українському користувачу або змішати дублі. Базова структура у ` ` (приклад для UK + RU + EN): ` ` + ` ` + ` ` + ` ` (fallback). **Критичні правила:** (1) **Реципрокність** — кожна мовна версія має посилатися на всі інші, включно з собою; (2) **Абсолютні URL** з протоколом `https://`; (3) **Коректні коди** ISO 639-1 для мови + ISO 3166-1 для регіону (`en-US`, `en-GB`, `pt-BR`); (4) **x-default** для дефолтної версії, якщо мова користувача не підтримується. Перевірка — через [наш Hreflang Generator](/tools/hreflang-generator/) і Hreflang report у GSC.

Що таке mobile-first indexing і як до нього підготуватися?

Mobile-first indexing — політика Google з 2019 року: для ранжування використовується **мобільна версія сайту**, не десктопна. Якщо у вас окремі версії (`m.example.com` або інша HTML на мобілці), Google може не побачити контент, який є тільки на десктопі. Сучасний підхід — **responsive design** (один HTML, адаптивні CSS-стилі під екран). Чек-лист готовності: (1) Сайт проходить **Mobile-Friendly Test** Google; (2) Контент і структуровані дані ідентичні між desktop і mobile; (3) Зображення мають коректні alt і width/height; (4) Шрифт ≥14px без необхідності зуму; (5) Кнопки і tap-targets ≥48×48px; (6) Viewport meta-тег ` `; (7) Без horizontal scroll; (8) Немає блокованих ресурсів (CSS, JS) для мобільного Googlebot. Перевірка — Mobile Usability report у GSC.

Які типи schema.org структурованих даних найкорисніші?

Schema.org — словник структурованих даних, що допомагає пошуковим системам розуміти контент і показувати **rich snippets** у результатах. Топ-10 найкорисніших типів: (1) **Article / NewsArticle / BlogPosting** — для редакційного контенту, дає рейтинг автора; (2) **FAQPage** — Q&A блок під сніпетом, +30-50% CTR (як у цій статті); (3) **HowTo** — кроки у сніпеті (з 2023 показуються тільки на мобільних в окремих категоріях); (4) **Product** — ціна, рейтинг, наявність для e-commerce, має включати Offer і AggregateRating; (5) **BreadcrumbList** — хлібні крихти у сніпеті замість URL; (6) **Organization / LocalBusiness** — для Knowledge Panel і Google Maps; (7) **Recipe** — час, інгредієнти, рейтинг для кулінарних сайтів; (8) **Event** — дата, місце для івентів; (9) **VideoObject** — для індексації відео в Google Videos; (10) **WebSite** з Sitelinks Search Box — окрема пошукова форма у сніпеті бренду. Формат — JSON-LD у ` `, рекомендований Google. Перевірка через [Rich Results Test](https://search.google.com/test/rich-results) і [наш Schema Generator](/tools/schema-generator/).

Скільки сторінок Google може просканувати на моєму сайті щодня?

Це називається **crawl budget** — кількість URL, які Googlebot готовий просканувати за певний період. Для маленьких сайтів (<1000 URL) це не проблема — Google легко обходить весь сайт. Для великих (10k+) — критичний параметр. Crawl budget визначається двома факторами: (1) **Crawl rate limit** — технічна можливість сайту (швидкість серверу, відсутність 5xx-помилок); (2) **Crawl demand** — інтерес Google до сайту (популярність, частота оновлень, авторитет домена). Як збільшити: прискорити сервер (TTFB 2 хопи), консолідувати дублі через canonical, видалити неякісний контент (noindex thin pages), оновлювати sitemap.xml з lastmod, отримувати backlinks. Перевірка — Crawl Stats report у GSC (старий звіт, але працює): показує запити/день, KB/день, response time. Якщо Google сканує лише 10% сайту щодня — більшість оновлень бачить з затримкою у тижні.

Які інструменти потрібні для технічного SEO-аудиту?

Безкоштовні (must-have): (1) **Google Search Console** — головний інструмент, показує що індексує Google, помилки сканування, CWV, hreflang, mobile usability; (2) **PageSpeed Insights** — LCP/INP/CLS і поради з оптимізації; (3) **Mobile-Friendly Test** і **Rich Results Test** — швидка перевірка одного URL; (4) **Lighthouse** у Chrome DevTools — повний аудит з performance/accessibility/SEO; (5) **Bing Webmaster Tools** — окремий індекс Bing/DuckDuckGo. Платні (для великих сайтів): (6) **Screaming Frog SEO Spider** — desktop crawler, $259/рік за необмежений craw; (7) **Ahrefs Site Audit** — cloud crawler з трекінгом помилок у часі; (8) **Semrush Site Audit** — альтернатива Ahrefs з фокусом на ринкових даних; (9) **Sitebulb** — desktop crawler з гарними візуалізаціями. Наші онлайн-інструменти для one-off перевірок: [Robots.txt Tester](/tools/robots-tester/), [Hreflang Generator](/tools/hreflang-generator/), [Meta Tag Checker](/tools/meta-tag-checker/), [Schema Generator](/tools/schema-generator/), [SERP Preview](/tools/serp-preview/).

Технічне SEO: повний посібник з чого почати — індексація, Core Web Vitals, schema.org, hreflang

Q: Що таке технічне SEO простими словами?

Технічне SEO — це оптимізація технічної інфраструктури сайту, щоб пошукові роботи Google могли знайти, просканувати, проіндексувати і коректно ранжувати ваші сторінки. На відміну від контентного SEO (що пише сторінка) і off-page SEO (хто на неї посилається), технічне SEO відповідає за **доступність і коректність обробки**: чи може Googlebot зайти на сайт, чи правильно інтерпретує canonical, чи бачить мобільну версію, чи завантажується сторінка швидше 2.5 секунд. Без міцного технічного фундаменту найкращий контент не отримує трафіку — Google або не індексує його, або не довіряє через повільне завантаження, або індексує дублі замість оригіналу. Technical SEO — це 30% впливу на органічний трафік: зробивши його правильно, ви відкриваєте можливість для контенту і backlinks ранжуватися.

Q: Як працює robots.txt і навіщо він потрібен?

Robots.txt — текстовий файл за адресою `https://example.com/robots.txt`, що інструктує пошукових роботів, які URL вони можуть або не можуть сканувати. Базова структура: `User-agent: *` (для всіх ботів) + `Disallow: /admin/` (заборонити сканувати) + `Allow: /` (дозволити решту) + `Sitemap: https://example.com/sitemap.xml` (вказати карту). **Важливі обмеження:** robots.txt блокує **сканування**, але не **індексацію** — якщо на заблоковану URL ведуть зовнішні посилання, вона все одно з'явиться в індексі (без сніпета) як «No information available». Для гарантованого виключення з індексу використовуйте `noindex` мета-тег на самій сторінці. Інші важливі директиви: `Crawl-delay` (пауза між запитами, ігнорується Googlebot), `User-agent: GPTBot` (заборонити OpenAI), `User-agent: ClaudeBot` (заборонити Anthropic). Перевірка синтаксису — через [наш Robots.txt Tester](/tools/robots-tester/).

Q: Що таке canonical-тег і коли він критично важливий?

Canonical-тег ` ` у ` ` сторінки вказує Google, яка URL є **основною** серед дублів. Без canonical Google може індексувати дубль (наприклад, `/page/?utm_source=email`) замість оригіналу і розпорошувати link equity. Критичні сценарії: (1) **E-commerce фільтри** — `?color=red&size=L` створює сотні комбінацій URL з тим самим товаром, всі вказують canonical на основну; (2) **Параметри трекінгу** — `?utm_*`, `?fbclid`, `?gclid` від реклами; (3) **HTTP vs HTTPS і www vs non-www** — обираєте одну версію як canonical; (4) **Пагінація** — раніше Google рекомендував `rel=prev/next`, з 2019 ця підтримка припинена, тепер canonical на /page/2/ вказує на /page/2/ (self-referencing); (5) **Мультидоменна публікація** — гостьовий пост на чужому сайті з canonical на ваш оригінал. Помилки: canonical на 404, canonical на noindex-сторінку, canonical на іншу мову (треба hreflang, не canonical).

Q: Як налаштувати hreflang для багатомовного сайту?

Hreflang — атрибут ` `, що вказує Google мовні і регіональні версії однієї і тієї ж сторінки. Без правильного hreflang Google може показати російську версію українському користувачу або змішати дублі. Базова структура у ` ` (приклад для UK + RU + EN): ` ` + ` ` + ` ` + ` ` (fallback). **Критичні правила:** (1) **Реципрокність** — кожна мовна версія має посилатися на всі інші, включно з собою; (2) **Абсолютні URL** з протоколом `https://`; (3) **Коректні коди** ISO 639-1 для мови + ISO 3166-1 для регіону (`en-US`, `en-GB`, `pt-BR`); (4) **x-default** для дефолтної версії, якщо мова користувача не підтримується. Перевірка — через [наш Hreflang Generator](/tools/hreflang-generator/) і Hreflang report у GSC.

Q: Що таке mobile-first indexing і як до нього підготуватися?

Mobile-first indexing — політика Google з 2019 року: для ранжування використовується **мобільна версія сайту**, не десктопна. Якщо у вас окремі версії (`m.example.com` або інша HTML на мобілці), Google може не побачити контент, який є тільки на десктопі. Сучасний підхід — **responsive design** (один HTML, адаптивні CSS-стилі під екран). Чек-лист готовності: (1) Сайт проходить **Mobile-Friendly Test** Google; (2) Контент і структуровані дані ідентичні між desktop і mobile; (3) Зображення мають коректні alt і width/height; (4) Шрифт ≥14px без необхідності зуму; (5) Кнопки і tap-targets ≥48×48px; (6) Viewport meta-тег ` `; (7) Без horizontal scroll; (8) Немає блокованих ресурсів (CSS, JS) для мобільного Googlebot. Перевірка — Mobile Usability report у GSC.

Q: Які типи schema.org структурованих даних найкорисніші?

Schema.org — словник структурованих даних, що допомагає пошуковим системам розуміти контент і показувати **rich snippets** у результатах. Топ-10 найкорисніших типів: (1) **Article / NewsArticle / BlogPosting** — для редакційного контенту, дає рейтинг автора; (2) **FAQPage** — Q&A блок під сніпетом, +30-50% CTR (як у цій статті); (3) **HowTo** — кроки у сніпеті (з 2023 показуються тільки на мобільних в окремих категоріях); (4) **Product** — ціна, рейтинг, наявність для e-commerce, має включати Offer і AggregateRating; (5) **BreadcrumbList** — хлібні крихти у сніпеті замість URL; (6) **Organization / LocalBusiness** — для Knowledge Panel і Google Maps; (7) **Recipe** — час, інгредієнти, рейтинг для кулінарних сайтів; (8) **Event** — дата, місце для івентів; (9) **VideoObject** — для індексації відео в Google Videos; (10) **WebSite** з Sitelinks Search Box — окрема пошукова форма у сніпеті бренду. Формат — JSON-LD у ` `, рекомендований Google. Перевірка через [Rich Results Test](https://search.google.com/test/rich-results) і [наш Schema Generator](/tools/schema-generator/).

Q: Скільки сторінок Google може просканувати на моєму сайті щодня?

Це називається **crawl budget** — кількість URL, які Googlebot готовий просканувати за певний період. Для маленьких сайтів (<1000 URL) це не проблема — Google легко обходить весь сайт. Для великих (10k+) — критичний параметр. Crawl budget визначається двома факторами: (1) **Crawl rate limit** — технічна можливість сайту (швидкість серверу, відсутність 5xx-помилок); (2) **Crawl demand** — інтерес Google до сайту (популярність, частота оновлень, авторитет домена). Як збільшити: прискорити сервер (TTFB 2 хопи), консолідувати дублі через canonical, видалити неякісний контент (noindex thin pages), оновлювати sitemap.xml з lastmod, отримувати backlinks. Перевірка — Crawl Stats report у GSC (старий звіт, але працює): показує запити/день, KB/день, response time. Якщо Google сканує лише 10% сайту щодня — більшість оновлень бачить з затримкою у тижні.

Q: Які інструменти потрібні для технічного SEO-аудиту?

Безкоштовні (must-have): (1) **Google Search Console** — головний інструмент, показує що індексує Google, помилки сканування, CWV, hreflang, mobile usability; (2) **PageSpeed Insights** — LCP/INP/CLS і поради з оптимізації; (3) **Mobile-Friendly Test** і **Rich Results Test** — швидка перевірка одного URL; (4) **Lighthouse** у Chrome DevTools — повний аудит з performance/accessibility/SEO; (5) **Bing Webmaster Tools** — окремий індекс Bing/DuckDuckGo. Платні (для великих сайтів): (6) **Screaming Frog SEO Spider** — desktop crawler, $259/рік за необмежений craw; (7) **Ahrefs Site Audit** — cloud crawler з трекінгом помилок у часі; (8) **Semrush Site Audit** — альтернатива Ahrefs з фокусом на ринкових даних; (9) **Sitebulb** — desktop crawler з гарними візуалізаціями. Наші онлайн-інструменти для one-off перевірок: [Robots.txt Tester](/tools/robots-tester/), [Hreflang Generator](/tools/hreflang-generator/), [Meta Tag Checker](/tools/meta-tag-checker/), [Schema Generator](/tools/schema-generator/), [SERP Preview](/tools/serp-preview/).

Hand-sketched набір аналітичних іконок з графіками лупами і аватарами

Технічне SEO — оптимізація технічної інфраструктури сайту, щоб пошукові роботи могли знайти, просканувати, проіндексувати і коректно ранжувати ваші сторінки. На відміну від контентного SEO (що пише сторінка) і off-page SEO (хто на неї посилається), технічне SEO відповідає за доступність і коректність обробки: чи може Googlebot зайти на сайт, чи правильно інтерпретує canonical, чи бачить мобільну версію, чи завантажується LCP швидше 2.5 секунд. Без міцного технічного фундаменту найкращий контент не отримує трафіку — Google або не індексує його, або не довіряє через повільне завантаження, або індексує дублі замість оригіналу.

Ця стаття — повний посібник по technical SEO для початківців: від crawling/indexing до Core Web Vitals, schema.org і hreflang. Покрокова логіка побудована від фундаменту (чи бачить вас Google) до тонкої оптимізації (rich snippets, international targeting). Якщо ви запускаєте новий сайт — пройдіть всі секції підряд; якщо у вас є існуючий і ви проводите аудит — користуйтеся як чек-лістом.

Що таке технічне SEO і чим відрізняється від інших напрямків

SEO ділиться на три рівні:

Рівень	Що оптимізує	Приклади
Технічне SEO	Інфраструктуру	Crawling, indexing, CWV, schema, hreflang, sitemap
On-page (content) SEO	Контент і HTML	Title/meta, заголовки, ключові слова, внутрішня перелінковка, текст
Off-page SEO	Авторитет	Backlinks, бренд-згадки, social signals, PR

Технічне SEO — передумова: без нього content і off-page не працюють. Найкращий гайд про SaaS-аналітику з 50 беклінками не отримає трафіку, якщо canonical вказує на видалену сторінку, або сайт блокується через Disallow: / у robots.txt. Зворотно, ідеальне технічне SEO без контенту і backlinks теж не дає трафіку — це саме фундамент, на якому будується решта.

Розподіл впливу (приблизний, на конкурентних нішах):

Технічне SEO — 25-30% (легко зіпсувати все)
Контентне SEO — 35-40% (визначає на які запити взагалі ранжуєтесь)
Off-page (backlinks) — 30-35% (визначає позицію в межах ніші)
Brand і поведінкові сигнали — 5-10%

Як працює пошукова система: crawling, indexing, ranking

Google працює у три етапи:

Crawling → Indexing → Ranking
   ↓          ↓          ↓
Знайти    Зберегти   Показати

Crawling (сканування). Googlebot обходить інтернет, переходячи по посиланнях. Точки входу: відомі URL з попередніх обходів, sitemap.xml, посилання з інших сайтів. Бот завантажує HTML, рендерить JavaScript (через Chromium), знаходить нові посилання — далі рекурсивно.
Indexing (індексація). Google аналізує контент: парсить текст, структуровані дані, мета-теги, виявляє дублі через canonical, визначає мову. Якщо сторінка пройшла фільтри якості — додається в індекс. Якщо містить noindex, або є дублем без canonical — виключається.
Ranking (ранжування). Коли користувач робить запит, Google підбирає з індексу релевантні сторінки і ранжує їх за ~200 факторами (релевантність, авторитет, поведінкові сигнали, технічна якість).

Технічне SEO впливає на перші два етапи: доступність для crawling і прийняття в індекс. Якщо технічна частина зламана, content і backlinks не мають значення — Google просто не бачить сторінку.

Crawling: як зробити сайт доступним для роботів

Robots.txt — інструкція для роботів

Файл за адресою https://example.com/robots.txt каже роботам, що можна і не можна сканувати:

User-agent: *
Disallow: /admin/
Disallow: /cart/
Disallow: /search/
Allow: /

User-agent: GPTBot
Disallow: /

Sitemap: https://example.com/sitemap.xml

Базові правила:

User-agent: * — для всіх ботів. Можна налаштовувати окремо для Googlebot, Bingbot, GPTBot (OpenAI), ClaudeBot (Anthropic).
Disallow: /path/ — заборонити сканування. Підтримує wildcard * і $.
Allow: /path/ — явно дозволити (важливо для виключення з широкого Disallow).
Sitemap: — вказати URL мапи сайту.

Важливе обмеження: robots.txt блокує сканування, але не індексацію. Якщо на заблоковану URL ведуть зовнішні посилання, вона з’явиться в індексі (без сніпета) як «No information available». Для гарантованого виключення — noindex мета-тег.

Перевірка синтаксису — через наш Robots.txt Tester.

Sitemap.xml — карта сайту для Google

Sitemap.xml — XML-файл зі списком URL, які ви хочете проіндексувати. Допомагає Google швидше знаходити нові сторінки і пріоритизувати crawl budget.

Базовий формат:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/</loc>
    <lastmod>2026-05-07</lastmod>
    <changefreq>weekly</changefreq>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>https://example.com/article/seo-guide/</loc>
    <lastmod>2026-05-07</lastmod>
  </url>
</urlset>

Найкращі практики:

Включайте тільки canonical-URL з 200-статусом, без noindex, без redirect.
Оновлюйте <lastmod> при реальних змінах контенту — Google використовує це для пріоритизації обходу.
<changefreq> і <priority> — Google їх в основному ігнорує, але не шкодять.
Ліміт — 50 000 URL або 50 МБ на один файл. Для більших сайтів — sitemap index, що посилається на десятки sitemap-файлів.
Окремі sitemap для різних типів контенту: sitemap-posts.xml, sitemap-products.xml, sitemap-images.xml, sitemap-videos.xml — допомагає в діагностиці.
Подайте sitemap у Google Search Console → Sitemaps. Slow-індексовані сайти отримують прискорення.

Архітектура сайту і внутрішня перелінковка

Глибина сторінки (скільки кліків від home до сторінки) — критичний crawl-фактор. Найкраща практика: усі важливі сторінки на 3 кліки від home (home → category → article). Якщо стаття на 5+ кліках, Googlebot може її не сканувати тижнями.

Принципи:

Hub-spoke структура. Pillar-сторінка з оглядом теми (hub) → 5-15 spoke-статей з deep-dive. Hub лінкує на всі spoke, spoke лінкують назад на hub і на 2-3 сусідні spoke.
Breadcrumbs на всіх сторінках з BreadcrumbList schema — дає Google зрозуміти ієрархію + красиві крихти у сніпеті.
Контекстні внутрішні посилання з тілу статті, не тільки з navigation. Кожна стаття має мати 5-15 internal links на пов’язані матеріали.
Анкори осмислені, не «click here» — це сигнал релевантності.

Indexing: як гарантувати, що сторінки потрапляють в індекс

Index Coverage report у Google Search Console

Головний звіт для технічного SEO — GSC → Pages. Сторінки розділені на:

Indexed — у пошуку.
Not indexed з підкатегоріями:
- Discovered – currently not indexed — Google знає URL, але не сканував. Часто — низька якість або crawl budget.
- Crawled – currently not indexed — сканував, але вирішив не індексувати. Контент сприйнятий як низькоякісний або дубль.
- Page with redirect — 301/302 на іншу URL.
- Duplicate without user-selected canonical — дубль, Google сам обрав canonical (часто не той, що ви хотіли).
- Excluded by 'noindex' tag — явно виключено вами.
- Blocked by robots.txt — заблоковано.
- Soft 404 — сторінка повертає 200, але виглядає як 404 (немає контенту).

Цільовий показник для здорового сайту: >80% важливих URL у Indexed, <20% у Not indexed.

Noindex meta-тег

Для гарантованого виключення сторінки з індексу:

<meta name="robots" content="noindex, follow">

follow дозволяє Google переходити по посиланнях зі сторінки (передавати link equity далі), noindex — не індексувати саму сторінку. Типове застосування: пагінація (/blog/page/2/), результати фільтрів, тестові сторінки, thank-you-after-purchase.

Canonical-теги — боротьба з дублями

<link rel="canonical" href="https://example.com/page/"> у <head> каже Google, яка URL є основною серед дублів. Без canonical Google може індексувати дубль (наприклад, /page/?utm_source=email) і розпорошувати link equity.

Критичні сценарії:

E-commerce фільтри. ?color=red&size=L створює сотні комбінацій URL з тим самим товаром — всі вказують canonical на основну.
Параметри трекінгу. ?utm_*, ?fbclid, ?gclid від реклами.
HTTP vs HTTPS і www vs non-www. Обираєте одну версію як canonical і ставите 301 з решти.
Пагінація. /page/2/ має canonical на /page/2/ (self-referencing), не на першу сторінку.
Гостьова публікація. Якщо публікуєте свою статтю на чужому сайті — попросіть canonical на ваш оригінал.

Помилки:

Canonical на 404 або noindex-сторінку.
Canonical на іншу мову (треба hreflang, не canonical).
Кілька canonical-тегів на одній сторінці.
Canonical на не-індексовану версію URL.

Core Web Vitals: швидкість як ranking-фактор

З 2021 року Core Web Vitals — офіційний ranking-фактор Google. У 2026 без CWV у зеленій зоні неможливо ранжуватися на конкурентних запитах.

Три метрики CWV

Метрика	Що вимірює	Зелена зона	Жовта	Червона
LCP (Largest Contentful Paint)	Час до відмалювання найбільшого елемента	<2.5с	2.5-4с	>4с
INP (Interaction to Next Paint)	Затримка відгуку на взаємодію	<200мс	200-500мс	>500мс
CLS (Cumulative Layout Shift)	Кумулятивний зсув макету	<0.1	0.1-0.25	>0.25

INP замінив FID у березні 2024. INP більш суворий: вимірює всі взаємодії (FID — тільки першу), включає час обробки + рендеринг.

Як покращити LCP

LCP-елементом зазвичай є hero-зображення або заголовок above the fold. Кроки:

Оптимізувати зображення. WebP/AVIF замість JPEG/PNG. Розмір під реальний viewport (responsive srcset). Lazy load для не-LCP зображень.
CDN. Cloudflare, Bunny, Fastly — приближають контент до користувача.
Server-side rendering. SPA з client-side rendering = повільний LCP. Next.js, Astro, Hugo — швидкі.
Preload критичних ресурсів. <link rel="preload" href="hero.webp" as="image">.
TTFB <600мс. Швидкий сервер — фундамент. Hosting на cheapest shared hosting часто дає TTFB 1-2с — і LCP вже не впишеться у 2.5с.
Compression. Brotli > gzip. Включається на nginx/Apache рівні.

Як покращити INP

INP — про responsiveness JavaScript:

Зменшити JS bundle. Code splitting, tree shaking, lazy load компонентів.
Прибрати long tasks. Розбити важкі обчислення на chunks через setTimeout або requestIdleCallback.
React/Vue оптимізація. useMemo, React.memo, virtual scrolling для великих списків.
Web Workers для важких CPU-задач (графіка, парсинг).
Прибрати third-party скрипти. Google Tag Manager не входить у бюджет — він синхронно блокує main thread.

Як покращити CLS

CLS — про візуальну стабільність:

Width/height для зображень і відео. Без них браузер не знає розміру і пересуває контент після завантаження.
Резервувати простір під рекламу і embeds. min-height на контейнері, навіть якщо реклама не завантажилася.
Не вставляти контент над існуючим. Cookie-banner унизу замість зверху, lazy-load nicht над viewport.
Web fonts з font-display: optional або swap + preload найважливіших шрифтів.
Skeleton screens замість порожньої білої сторінки під час завантаження.

Перевірка CWV: PageSpeed Insights (lab data + real Chrome UX Report) і GSC → Core Web Vitals report.

Mobile-first indexing

З 2019 року Google використовує мобільну версію сайту для ранжування. Якщо у вас десктопна версія багатша за мобільну (більше тексту, більше функцій) — Google все одно дивиться на mobile.

Чек-лист готовності:

Сайт проходить Mobile-Friendly Test Google.
Контент і структуровані дані ідентичні між desktop і mobile.
Зображення мають коректні alt і width/height.
Шрифт ≥14px без необхідності зуму.
Кнопки і tap-targets ≥48×48px.
Viewport meta-тег: <meta name="viewport" content="width=device-width, initial-scale=1">.
Без horizontal scroll.
Немає блокованих ресурсів (CSS, JS) для мобільного Googlebot.

Сучасний підхід — responsive design (один HTML, адаптивні CSS-стилі). Окремі мобільні домени (m.example.com) — застаріла практика з купою проблем (canonical, hreflang, дублі).

HTTPS і безпека

Flat-ілюстрація монітора з SSL-надписом капелюх детектива і навісним замком зі щитом

З 2014 HTTPS — ranking-фактор Google. З 2018 Chrome помічає HTTP-сайти як «Not secure». У 2026 — HTTPS обов’язковий.

Базові вимоги:

SSL-сертифікат — Let’s Encrypt безкоштовно, автоматичне оновлення кожні 90 днів.
301 redirect з HTTP → HTTPS усіх URL.
HSTS заголовок — Strict-Transport-Security: max-age=31536000; includeSubDomains; preload — браузер змушує HTTPS навіть для першого запиту.
Без mixed content — усі ресурси (images, scripts, styles) на HTTPS.
TLS 1.2+ — старі версії TLS 1.0/1.1 deprecated.

Перевірка — Mozilla Observatory і SSL Labs Test.

Schema.org структуровані дані

Flat-ілюстрація хмари монітора планшета і телефона з галочками та шестернями

Schema.org — словник для розмітки контенту, що допомагає Google показувати rich snippets (зірки рейтингу, FAQ-блок, ціна, час приготування). Формат — JSON-LD у <script type="application/ld+json"> (рекомендований Google).

Топ-10 найкорисніших типів

Article / NewsArticle / BlogPosting — для редакційного контенту, дає рейтинг автора.
FAQPage — Q&A блок під сніпетом, +30-50% CTR (як у цій статті).
HowTo — кроки у сніпеті (з 2023 показуються тільки на мобільних в окремих категоріях).
Product — ціна, рейтинг, наявність для e-commerce.
BreadcrumbList — хлібні крихти у сніпеті замість URL.
Organization / LocalBusiness — для Knowledge Panel і Google Maps.
Recipe — час, інгредієнти, рейтинг для кулінарних сайтів.
Event — дата, місце для івентів.
VideoObject — для індексації відео в Google Videos.
WebSite з Sitelinks Search Box — окрема пошукова форма у сніпеті бренду.

Приклад FAQPage schema

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "FAQPage",
  "mainEntity": [{
    "@type": "Question",
    "name": "Що таке технічне SEO?",
    "acceptedAnswer": {
      "@type": "Answer",
      "text": "Оптимізація технічної інфраструктури сайту..."
    }
  }]
}
</script>

Перевірка — Google Rich Results Test і наш Schema Generator.

Hreflang для багатомовних сайтів

Якщо у вас сайт на кількох мовах (наприклад, UK + RU + EN), hreflang каже Google, яку версію показати кожному користувачу. Без hreflang може показатися російська версія українському користувачу або злиття дублів.

Базова структура

У <head> кожної сторінки:

<link rel="alternate" hreflang="uk" href="https://example.com/uk/page/">
<link rel="alternate" hreflang="ru" href="https://example.com/ru/page/">
<link rel="alternate" hreflang="en" href="https://example.com/en/page/">
<link rel="alternate" hreflang="x-default" href="https://example.com/en/page/">

Критичні правила

Реципрокність. Кожна мовна версія має посилатися на всі інші, включно з собою. Якщо UK-сторінка лінкує на RU, але RU не лінкує назад на UK — Google ігнорує hreflang.
Абсолютні URL з протоколом https://.
Коректні коди. ISO 639-1 для мови (uk, ru, en) + ISO 3166-1 для регіону (en-US, en-GB, pt-BR). НЕ uk-UA за стандартом — uk достатньо, бо мова сама по собі є регіональною. Однак pt-BR (бразильська) і pt-PT (європейська) — критичні розділення.
x-default — fallback версія для невідомих мов.
Альтернативи розташування: <link> у <head> HTML, HTTP-заголовок Link: (для PDF), або в sitemap.xml.

Перевірка

Наш Hreflang Generator — створює коректний код.
GSC → International Targeting → Language report.
Ahrefs Site Audit — секція Hreflang Issues.

URL-структура

Гарні URL — короткі, описові, без параметрів сесії. Принципи:

Слова, не ID. /seo/technical-guide/ краще за /p?id=12345.
Дефіси, не підкреслення. Google трактує seo-guide як 2 слова, seo_guide — як 1.
lowercase. Уникайте mixed case — створює дублі (case-sensitive на більшості серверів).
Без stop words. /seo-guide/ краще за /the-seo-guide/.
Стабільні структури. Зміна URL = втрата ranking. Якщо зміна неминуча — обов’язковий 301 redirect.
HTTPS обов’язково.
Trailing slash. Виберіть один варіант (/page/ або /page) і дотримуйтеся послідовно.

Типові помилки технічного SEO

Robots.txt блокує весь сайт. Disallow: / після рестейджингу — класична катастрофа. Завжди перевіряйте через GSC → URL Inspection після релізу.
Canonical на 404 або іншу мову. Перевірити через Screaming Frog або наш Meta Tag Checker.
Sitemap.xml містить redirect-URL або noindex-сторінки. Каже Google «індексуй це» і одразу «не індексуй» — заплутує.
Дублі без canonical. Параметри URL, фільтри, sort, mobile/desktop версії — створюють тисячі дублів.
Mixed content на HTTPS. Картинки/скрипти з http:// на https:// сторінці — браузер блокує + Google не довіряє.
Hreflang без реципрокності. UK→RU без RU→UK — Google ігнорує всі hreflang.
Великий JS bundle і відсутність SSR. SPA без server-side rendering = повільний LCP, проблеми з indexing JS-контенту.
Відсутність schema.org на критичних сторінках. Втрачаєте rich snippets і CTR.
Crawl traps. Календарі-pagination з нескінченними URL /calendar/2099/12/, фасетна навігація без обмежень — з’їдають crawl budget.
Soft 404. Сторінка повертає 200, але контент порожній або «Page not found». Google вважає це низькоякісним сигналом.

Інструменти для технічного SEO

Безкоштовні (must-have)

Google Search Console — головний інструмент. Index coverage, Crawl errors, CWV, Mobile usability, hreflang, Sitemaps, URL Inspection.
PageSpeed Insights — LCP/INP/CLS і поради з оптимізації.
Mobile-Friendly Test і Rich Results Test — швидка перевірка одного URL.
Lighthouse у Chrome DevTools — повний аудит з performance/accessibility/SEO.
Bing Webmaster Tools — окремий індекс Bing/DuckDuckGo + IndexNow API.

Платні (для великих сайтів)

Screaming Frog SEO Spider — desktop crawler, $259/рік.
Ahrefs Site Audit — cloud crawler з трекінгом помилок у часі.
Semrush Site Audit — альтернатива Ahrefs.
Sitebulb — desktop crawler з гарними візуалізаціями.

Наші онлайн-інструменти

Robots.txt Tester — перевірка синтаксису і блокувань.
Hreflang Generator — генерація коректного коду.
Meta Tag Checker — швидка перевірка title/description/canonical.
Schema Generator — JSON-LD для топ типів.
SERP Preview — як виглядатиме сніпет у Google.

Готовий пошаговий чек-лист — SEO Audit Checklist і Website Launch Checklist.

Чек-лист технічного аудиту

Топ-15 пунктів для першої перевірки нового або існуючого сайту:

GSC підключений, sitemap поданий.
Index Coverage — >80% важливих URL у Indexed.
Robots.txt не блокує важливі розділи.
Sitemap.xml містить тільки canonical-URL з 200-статусом.
Canonical-теги на всіх сторінках (self-referencing мінімум).
HTTPS на всьому сайті без mixed content + 301 з HTTP.
HSTS заголовок встановлений.
Mobile-Friendly Test проходить.
Core Web Vitals у зеленій зоні (LCP <2.5с, INP <200мс, CLS <0.1).
404-помилки мінімізовані, redirect-ланцюги <2 хопи.
Hreflang коректний (для мультимовних) — реципрокний, валідні коди.
Schema.org на всіх типах сторінок (Article, FAQPage, BreadcrumbList мінімум).
URL-структура — слова замість ID, дефіси, lowercase.
Глибина сторінок — важливі контентні сторінки на 3 кліки від home.
TTFB <600мс, Brotli compression, CDN.

Технічне SEO + аналітика: вимірювати що оптимізували

Технічне SEO без вимірювання = робота наосліп. Підключіть:

Google Search Console — органічний трафік, позиції, impressions, CWV, indexing.
Google Analytics 4 — поведінка користувачів на сайті, конверсії, attribution.
Google Tag Manager — для управління аналітикою без правок коду.
PageSpeed Insights API + щотижневі снапшоти CWV — трекати регресії після релізів.

Без аналітики ви не побачите, що оновлення сайту зменшило INP на 100мс або що 301 redirect розгубив 30% трафіку.

Пов’язані ресурси на сайті

Глосарій:

Інструменти:

Чек-листи:

SEO Audit Checklist — повний пошаговий аудит.
Website Launch Checklist — перед релізом нового сайту.
GA4 Setup Checklist — налаштування аналітики.

Посібники:

Часті запитання (FAQ)

Що таке технічне SEO простими словами?

Оптимізація технічної інфраструктури сайту, щоб пошукові роботи Google могли знайти, просканувати, проіндексувати і коректно ранжувати ваші сторінки. На відміну від контентного і off-page SEO, technical SEO відповідає за доступність і коректність обробки.

Що перевірити в першу чергу при технічному аудиті?

Топ-10: GSC Index Coverage, robots.txt, sitemap.xml, canonical, HTTPS, Mobile-friendly test, CWV, 404/5xx помилки, hreflang, schema.org. Закриття цих пунктів — мінімальний фундамент.

Що таке Core Web Vitals?

Три метрики Google: LCP (<2.5с — швидкість найбільшого елемента), INP (<200мс — затримка відгуку, замінив FID), CLS (<0.1 — стабільність макету). Офіційний ranking-фактор з 2021.

Як працює robots.txt?

Текстовий файл за https://example.com/robots.txt, що інструктує ботів. Блокує сканування, не індексацію — для виключення з індексу треба noindex meta-тег.

Що таке canonical-тег?

<link rel="canonical" href="https://..."> у <head> каже Google, яка URL основна серед дублів. Критично для e-commerce фільтрів, UTM-параметрів, пагінації.

Як налаштувати hreflang?

Для кожної мовної версії в <head> — посилання на всі інші версії включно з собою (реципрокність), абсолютні URL, валідні коди ISO + x-default fallback.

Що таке mobile-first indexing?

З 2019 Google використовує мобільну версію сайту для ранжування. Сучасний підхід — responsive design з ідентичним контентом між desktop і mobile.

Які типи schema.org найкорисніші?

Article, FAQPage, BreadcrumbList, Product, Organization, HowTo, Recipe, Event, VideoObject, WebSite з Sitelinks Search Box. Формат — JSON-LD.

Скільки сторінок Google може просканувати?

Crawl budget. Для маленьких сайтів (<1000 URL) — не проблема. Для великих (10k+) — критичний параметр. Збільшується через швидкий сервер, відсутність 404, sitemap з lastmod, backlinks.

Які інструменти потрібні?

Безкоштовні must-have: GSC, PageSpeed Insights, Mobile-Friendly Test, Rich Results Test, Lighthouse, Bing Webmaster Tools. Платні: Screaming Frog ($259/рік), Ahrefs Site Audit, Semrush.