1. Proč Google váš web „nečte“ tak, jak si myslíte
Google nepracuje jako člověk, který otevře stránku a okamžitě vidí celý obsah. Nejprve musí URL objevit, pak ji stáhnout, pochopit HTML, případně vykreslit JavaScript a teprve potom rozhodnout, co zaindexuje. Každý z těchto kroků může selhat nebo se výrazně zpomalit. V praxi to znamená, že i kvalitní obsah může zůstat mimo index, pokud je web technicky nepřehledný.
Nejčastější problém není „Google nás nemá rád“, ale kombinace drobných technických chyb: blokované zdroje, pomalý server, kanonikalizace na špatné URL, duplicitní varianty nebo obsah, který se načítá až po interakci uživatele. U větších webů se navíc přidává crawl budget – Google neproleze všechno, pokud mu to neulehčíte.
Podle zkušeností z praxe bývá největší rozdíl mezi weby, které indexace „bolí“, a těmi, které fungují dobře, ve třech oblastech: čistá architektura webu, technická dostupnost obsahu a jasné signály, co má být indexované. To je základ, na kterém stojí i moderní SEO pro AI odpovědi a semantic search.
2. Zkontrolujte, jestli Google vůbec vidí stejný obsah jako uživatel
První krok je jednoduchý: ověřte, co Google skutečně dostává. V Google Search Console použijte nástroj Kontrola URL a podívejte se na:
- poslední procházení a stav indexace,
- zobrazený a testovaný HTML kód,
- vykreslenou stránku po renderingu,
- blokované zdroje a zjištěné problémy.
Velmi často se stává, že uživatel vidí plnou stránku, ale Google v renderované verzi vidí jen prázdný shell, loading spinner nebo část obsahu. To je typické u webů postavených na SPA bez server-side renderingu nebo bez správného prerenderingu. Pokud je text, product listing nebo FAQ načítán až přes JavaScript, Google ho sice někdy zvládne vykreslit, ale ne vždy včas a ne vždy spolehlivě.
Praktický test: otevřete stránku v prohlížeči, vypněte JavaScript a podívejte se, co zůstane v HTML. Pokud tam není hlavní obsah, máte problém. Další rychlý test je nástroj URL Inspection v Search Console a externě třeba Rich Results Test nebo Schema Markup Validator, které ukážou, zda jsou důležitá data skutečně v kódu.
U e-shopů je častý problém s filtrováním a parametry URL. Google pak indexuje stovky variant téhož produktu nebo naopak nevidí důležité kategorie, protože se k nim dostane přes složitou navigaci až po několika kliknutích. V takové situaci je potřeba řešit interní prolinkování a pravidla pro indexaci parametrů, ne jen „přidat sitemapu“.
3. Technické bariéry, které Google zpomalují nebo matou
Googlebot má omezené zdroje. Když mu server odpovídá pomalu, přidáváte mu práci a snižujete šanci, že se vrátí často. U webů s TTFB nad 800 ms už bývá vidět zhoršení crawl efektivity, u rozsáhlejších webů i pokles frekvence procházení. Není to absolutní hranice, ale dobrý orientační signál.
Nejčastější technické překážky:
- pomalejší server a vysoké TTFB – špatný hosting, přetížený WordPress, neoptimalizovaná databáze,
- chybné robots.txt – blokované CSS, JS nebo důležité sekce webu,
- noindex na špatných stránkách – často po migraci nebo vývoji,
- kanonické URL vedoucí jinam – Google pak ignoruje stránku, kterou chcete indexovat,
- řetězce přesměrování – zbytečné 301/302 hops,
- duplicitní verze – http/https, www/non-www, parametry, trailing slash,
- JavaScript závislý obsah – bez SSR nebo hydratačních problémů.
Z technického hlediska je ideální, když je hlavní obsah dostupný v čistém HTML hned při prvním načtení. U moderních frameworků, jako je Next.js, to znamená preferovat server-side rendering nebo statické generování tam, kde to dává smysl. U WordPressu zase hlídat počet pluginů, kvalitu hostingu, caching a databázové dotazy. Web, který se načítá pomalu pro uživatele, je obvykle pomalý i pro crawlera.
Velkou roli hrají i Core Web Vitals, zejména LCP a INP. Pokud je hlavní obsah stránky vykreslen pozdě, Google i uživatel získávají horší signál o kvalitě stránky. V praxi doporučuji sledovat nejen laboratorní data z Lighthouse, ale i reálná data z Chrome UX Report a Search Console. Laboratorní měření často ukáže problém dřív, ale reálná data rozhodují o tom, co uživatelé skutečně zažívají.
4. Ulehčete Googlebotovi cestu: architektura, interní odkazy a sitemap
Dobrá indexace začíná architekturou webu. Pokud se důležitý obsah nachází až na páté úrovni kliknutí, Google ho najde hůř a méně často. Ideální je, když se klíčové stránky dostanou z homepage nebo silné kategorie maximálně na dvě až tři kliknutí. U obsahových webů fungují tematické clustery, kde je jedna hlavní stránka a kolem ní podpůrné články propojené interními odkazy.
Interní odkazy jsou jeden z nejpodceňovanějších signálů. Pomáhají předat autoritu, ale hlavně ukazují, co je důležité. Text odkazu by měl být popisný, ne „čtěte více“. Pokud máte stránku o technickém SEO, odkazujte na ni z článků o indexaci, crawl budgetu nebo Core Web Vitals přirozenými anchor texty.
Sitemap XML není náhrada dobré architektury, ale kontrolní nástroj. Měla by obsahovat jen kanonické, indexovatelné URL s odpovídajícím stavem 200. Na velkých webech rozdělte sitemapu podle typů obsahu, například:
- produkty,
- kategorie,
- články,
- lokality,
- video nebo obrázkový obsah.
Pokud sitemap obsahuje URL s noindexem, přesměrováním nebo chybou 404, je to signál chaosu. Search Console sice upozorní na některé problémy, ale ne všechny. Doporučuji pravidelný audit přes crawler jako Screaming Frog, Sitebulb nebo Ahrefs Site Audit. U rozsáhlejších webů je dobré sledovat i poměr interních odkazů na důležité stránky versus zbytečný „link juice“ rozptýlený po archivních a málo hodnotných URL.
5. Strukturovaná data a sémantika: aby Google chápal význam, ne jen text
Google dnes neřeší jen klíčová slova, ale vztahy mezi entitami, tématy a záměrem uživatele. Pokud mu chcete práci usnadnit, musíte mu dát jasné signály. K tomu slouží structured data a dobře navržená sémantická struktura obsahu. Schema markup není kouzelná zkratka k vyšším pozicím, ale pomáhá vyhledávači pochopit, co je článek, produkt, FAQ, recenze, organizace nebo lokální pobočka.
Nejpraktičtější typy schema pro běžný web:
- Organization a LocalBusiness pro značku a lokální SEO,
- BreadcrumbList pro lepší navigační kontext,
- Article nebo BlogPosting pro obsahové stránky,
- Product, Offer a AggregateRating pro e-commerce,
- FAQPage tam, kde otázky a odpovědi skutečně existují v obsahu.
Důležité je, aby data v markup odpovídala viditelnému obsahu. Pokud označíte stránku jako FAQ, ale otázky nejsou na stránce vidět, riskujete ignoraci nebo problém při validaci. U AI vyhledávání je navíc zásadní, aby byl obsah jednoznačný, fakticky správný a dobře strukturovaný. ChatGPT, Perplexity nebo Google AI Overviews často pracují s úryvky, které jsou snadno interpretovatelné. To znamená krátké definice, jasné nadpisy, tabulky, seznamy a konzistentní terminologii.
Pro kontrolu schema používejte Schema.org, Rich Results Test a Google Search Console. U větších projektů se vyplatí i vlastní monitoring validace v CI/CD, aby se chyby ve strukturovaných datech nepropadly do produkce po každém deployi.
6. Co dělat hned teď: rychlý audit na 60 minut
Pokud chcete zjistit, kde přesně Google naráží, vezměte si jeden důležitý URL vzor a projděte tento postup:
- v Search Console zkontrolujte stav indexace a vykreslenou verzi stránky,
- otestujte stránku bez JavaScriptu a ověřte, zda je hlavní obsah v HTML,
- spusťte crawl ve Screaming Frog a najděte noindex, canonical, 3xx, 4xx a duplicity,
- zkontrolujte robots.txt a sitemap.xml,
- změřte TTFB, LCP a INP na reálných datech,
- projděte interní odkazy na klíčové stránky,
- ověřte schema markup a shodu s viditelným obsahem.
Nejrychlejší zlepšení obvykle přinese odstranění technických blokací, zjednodušení architektury a přesunutí důležitého obsahu do HTML, které je dostupné hned. U nových webů se vyplatí už při návrhu myslet na crawl budget, renderování a sémantickou strukturu. U starších webů je zase klíčové pravidelně měřit, co Google skutečně vidí, a nechat technické SEO běžet jako součást provozu, ne jako jednorázový projekt.
Jestli má Google váš web číst snadno, musí dostat jasnou mapu, rychlý přístup a jednoznačné signály. V době AI vyhledávání to platí dvojnásob, protože modely i vyhledávače preferují obsah, který je technicky čistý, srozumitelný a dobře propojený. Kdo tohle podcení, nenechá Google „nečíst“ jen stránku, ale často celý webový ekosystém.
