SEO Audit krok za krokem


Obsah []

SEO audit (SEO analýza) je jedním ze základních kamenů úspěšného webu a často jedním z prvních kroků (vedle analýzy klíčových slov), který SEO specialisté na nově přebraných projektech provádí.

Ve zkratce jde o audit technických a obsahových prvků webu, identifikaci problémových míst, která by mohla vést ke zvýšení organické návštěvnosti, a návrh jejich řešení.

Faktorů a problémových míst, které je dobré na webu kontrolovat, je mnoho. Níže si pro inspiraci uvedeme některé důležitější z nich tak, abyste si dokázali jednoduchý SEO audit vlastního webu udělat svépomocí.

Úvodní kontrola stavu webu

Jde o získání základních informací o webu, jeho indexaci a způsobilosti k tomu, aby generoval návštěvnost z vyhledávačů:

Kontrola indexace

Obsah, který není zaindexovaný, vyhledávače nezobrazují ve výsledcích vyhledávání, a proto nemůže generovat jakoukoli návštěvnost. Indexace je tedy prvním a tím nejdůležitějším základním podkladem pro úspěch webu a jakékoli překážky v ní mohou mít velký dopad na návštěvnost webu z vyhledávačů.

Asi nejjednodušším způsobem, jak zjistit kolik zhruba zaindexovaných stránek web vyhledávače používají, je operátor site:. Pomocí jeho kombinace s doménou si můžete jednoduše ověřit počet zaindexovaných stránek. Do vyhledávače tedy vložíte například:
site:marketingminer.com

Ve výstupu vás zajímá metrika počtu výsledků vyhledávání. Pokud je počet výsledků vyhledávání výrazně nižší (nebo i mnohonásobně vyšší), než je očekávaný počet indexovatelných stránek (lze porovnávat s počtem produktů, odhadovaným počtem kategorií, článků, apod.) nebo pokud se počet zaindexovaných stránek mezi dvěma vyhledávači (Google vs Seznam) výrazně liší, je to indikace problému s indexací webu.

Druhou (a přesnější) možností, jak zkontrolovat počet indexovaných stránek webu, je podívat se do Google Search Console. Konkrétně do sekce Stav indexu, která zobrazuje dlouhodobý průběh zaindexovaných stránek webu. Do Google Search Console je ale nejprve potřeba dostat přístup.

Ukázka sekce Stav indexu v Google Search Console
Ukázka sekce Stav indexu v Google Search Console

O tom, jak zjistit, jaké konkrétní stránky nejsou zaindexované a jak s takovými výstupy pracovat, jsme natočili video:

Kontrola indexace stránek

Pokud chcete kontrolovat indexaci konkrétní stránky, lze použít operátor info: v kombinaci s URL. Tento operátor umožňuje kontrolovat, zda vyhledávače indexují specifickou URL. Příklad použití:
info:https://www.marketingminer.com/cs

V rámci indexovanosti stránek se můžete dostat víceméně do 4 stavů:

  1. URL není zaindexovaná a ani nemá být, což je správně (admin stránky, pokročilejší filtry apod.).
  2. URL je zaindexovaná a má být, což je také správně (jakýkoli indexovatelný obsah).
  3. URL by neměla být zaindexovaná a je. V takovém případě je potřeba na stránku nasadit direktivu pro roboty noindex, která zakazuje robotům indexovat takovou stránku. Při příštím průchodu stránkou tak robot URL z indexu vyřadí.
  4. URL by měla být zaindexovaná a není. V takovém případě se buď robot ještě na stránku nedostal (je třeba hledat problémy v interním prolinkování) nebo na ní nenalezl dostatečně zajímavý obsah (je třeba jej rozšířit).

Podobně jako při kontrole indexace ve vyhledávači Google, můžete kontrolovat i indexaci ve vyhledávači Seznam. Ten podporuje jak operátor info:, tak site:. U operátoru site: ale ve výsledcích vyhledávání nezobrazuje počet výsledků vyhledávání, což můžete obejít tím, že na konec URL výsledků vyhledávání přidáte parametr &format=rss. URL pak může vypadat například takto:

https://search.seznam.cz/?q=marketing+miner&format=rss

V tomto formátu naleznete počet výsledků vyhledávání uvnitř tagu <opensearch:totalResults>.

Další podrobnosti ohledně procházení a indexace vašeho webu můžete pro Seznam hledat i v jeho nástroji Seznam Webmaster Tools.

Kontrola existence vstupních stránek

Jedním ze základů SEO auditu je i kontrola toho, zda se uživatelé, kteří chodí na web, nedostávají na chybové stránky. Ať už jde o příchozí návštěvníky z vyhledávačů, tak o jakékoli jiné kanály. Většinou v tomto ohledu přichází klient o nemalé peníze a ani o tomto problému neví.

Jak k něčemu takovému vůbec může dojít? V případě fulltextového vyhledávání může jít například o URL, které jste vyřadili z provozu a nepřesměrovali na novou verzi. Do doby, dokud ji vyhledávač znovu neprojde a nezjistí, že stránka vrací stavový kód 404 (což může občas trvat), se stránka nachází mezi výsledky vyhledávání. Stejně tak v případě PPC kampaní, kde určitá podstránka již neexistuje nebo zadavatel udělá překlep v URL vstupní stránky.

O tom, jak zkontrolovat, zda na web přichází návštěvníci skrze neexistující stránky, jsme natočili video:

Kontrola existence vstupních stránek

Unifikace používaných URL na doméně

Funguje web na URL s www i bez www? Používá uživatelsky přívětivé URL? Vypisují se parametry URL při filtraci v jednotném pořadí nikoli podle toho, jak si je uživatel zvolil? Toto všechno jsou otázky, které mohou být klíčové pro to, aby vyhledávač dokázal efektivně procházet a indexovat obsah webu.

Jednotná verze URL

Web by měl ideálně běžet na jedné verzi URL, používající stejný protokol. Vyzkoušejte si vložit do prohlížeče následující verze vaší domény:

  • http://domena.tld
  • https://domena.tld
  • http://www.domena.tld
  • https://www.domena.tld
Všechny tyto verze by vás měly přesměrovat na jednu konečnou. Stejně tak je dobré si kontrolovat, zda je přesměrována i stránka /index.php nebo /index.html. Z pohledu SEO je víceméně jedno, o jakou z nich jde. V ideálním případě by mělo jít o verzi URL na https, tedy používající SSL certifikát. Primárně ale jde o to, aby se všechny tyto verze URL přesměrovávaly (pomocí 301, tedy trvalého přesměrování) na jednu konečnou URL.

Pokud funguje více verzí, je třeba je sjednotit pomocí přesměrování na tu nejpoužívanější. K identifikaci toho, která z těchto verzí je nejpoužívanější se dá použít nástroj Google Analytics, kde v přehledu nejčastěji zobrazených stránek lze použít výpis dat podle hostname.

Ukázka zobrazení stránek podle hostname v Google Analytics
Ukázka zobrazení stránek podle hostname v Google Analytics

Další věcí, kterou je dobré si hlídat, je lomítko na konci URL. Všechny vaše stránky by měly správně používat buď vždy verzi s lomítkem na konci URL, nebo bez lomítka a sekundární verzi přesměrovávat na tu primární, aby nevznikaly zbytečné duplicity.

Používání uživatelsky přívětivých URL

Co je pro vás čitelnější a řekne vám více o obsahu?

Tato verze URL?
https://www.domena.tld/product.php?productId[]=fjewl5325&active=1

Nebo tato verze?
https://www.domena.tld/notebook/thinkpad-x1

URL je jednou z věcí, které uživatel na první pohled vidí ve výsledcích vyhledávání a může částečně ovlivnit jeho rozhodování o tom, na jaký výsledek klikne. Obecně platí, že čím je URL méně zanořená a lépe dosažitelná v rámci interního prolinkování, tím je autoritativnější.

Pokud na webu používáte URL podobnou první verzi, je nasnadě takové URL přestat používat. Tím neříkám zahodit všechny staré URL a vše přesměrovat na novou verzi. Pokud mají tyto URL velkou historickou hodnotu a návštěvnost z vyhledávačů, je téměř vždy lepším řešením ponechat je na URL, kde jsou a soustředit se na to, aby nový obsah již vznikal na uživatelsky přívětivých URL.

Pořadí parametrů při filtraci obsahu

Ať už jde o filtrace v rámci kategorie eshopu nebo filtraci článků, je pravidlem, že pořadí parametrů v URL (značka, barva, velikost,...) by mělo být vždy zachováno. Tedy v případě, kdy uživatel zvolí nejprve značku Adidas a velikost 10 a URL bude vypadat:
https://www.domena.tld/znacka/adidas/velikost/10/

Pak v případě, že by nejprve zvolil velikost 10 a až poté značku Adidas, nesmí URL vypadat následovně:
https://www.domena.tld/velikost/10/znacka/adidas/

Ale musí být zachováno pořadí parametrů tak, jak bylo původně, tedy:
https://www.domena.tld/znacka/adidas/velikost/10/

V případě, že pořadí parametrů určuje to, v jaké sekvenci je uživatel zvolil, vytváří web obrovské množství indexovatelných URL s duplicitním obsahem.

Získání podkladů pro analýzu

Než se pustíte do analýzy technických nebo obsahových faktorů, je třeba mít vždy po ruce kvalitní podklady, se kterými budete znát dosah navrhovaných změn a na kterých můžete ověřit své teze.

Každý projekt s sebou nese i vlastní datové podklady, specifické k danému projektu. Pokud se budeme bavit o základních podkladech, které by měly být dostupné u každého projektu. Jedná se o:

Přístup do analytického nástroje pro měření návštěvnosti

Nejpoužívanějším je nástroj Google Analytics, případně se u některých projektů setkáte s nástroji jako Omniture nebo Matomo (dříve Piwik).

V těchto nástrojích můžete analyzovat informace o uživatelích webu, zdrojích, které je vodí, klíčových slovech a vstupních stránkách. Stejně jako mnoho dalších pohledů, které vám nabídnou.

Přístup do analytického nástroje je naprostý základ v případě, že chcete analyzovat současný stav webu a chování jeho uživatelů, stejně jako stanovovat KPI nebo dopady případných úprav webu.

Analytické nástroje vyhledávačů

Vyhledávači vytváří vlastní nástroje, které mohou pomoci webmasterům s tím, jak jejich stránky vnímá robot vyhledávače. Tyto podklady mohou pomoct se stanovením problémů při procházení webu (chyby procházení,...), upozorňováním na důležité problémy (problémy s indexací, penalizace...) a při tvorbě kvalitního obsahu z pohledu vyhledávače.

Pro jednotlivé vyhledávače jde o následující nástroje:

Vyhledávač Nástroj
Google Google Search Console
Seznam Seznam Webmaster Tools
Bing Bing Webmaster Tools
Yandex Yandex Webmaster

V rámci SEO auditu je potřeba mít přístup vždy ke všem nástrojům takových vyhledávačů, které v cílových trzích klienta hrají roli. Pro český trh tak může například jít o Google Search Console (ideálně s plným přístupem), Seznam Webmaster Tools a v některých případech i o Bing Webmaster Tools.

Reklamní systémy

Reklamní systémy jako Google Ads (dříve AdWords) nebo Sklik mohou být skvělým zdrojem informací o klíčových slovech, jejich výkonu, potenciálních partnerských webech a mnohém dalším.

Proto je dobré buď si nechat zřídit přístup do těchto nástrojů a mít tak možnost z nich čerpat data nebo mít styčnou osobu, která je vám schopna požadovaná data z daných nástrojů vyexportovat.

Access log

Access log je studnice informací o chování jak uživatelů, tak robotů vyhledávačů. Vzniká ve chvíli, kdy se pošle požadavek na nějaký zdroj serveru. Tento požadavek s podrobnostmi se uloží jako nový řádek právě do logu.

Ukázka jak se zaznamenává log
Ukázka jak se zaznamenává log

Díky tomu se dají logy (často opravdu velké soubory) analyzovat a do hloubky tak pochopit, jak se chová konkrétní uživatel/robot na vašem webu.

Logy se používají například ke kontrole průchodu robotů vyhledávačů webem nebo k identifikaci, zda již nějakou konkrétní URL robot prošel.

Technické faktory

Obsah je možná král, ale k tomu, aby se na něj vyhledávač vůbec dostal a uznal jej jako vhodný pro používání ve výsledcích vyhledávání, je potřeba mít v pořádku technické faktory webu.

Existence robots.txt a sitemap.xml

Mnoho specialistů bere existenci souborů robots.txt a sitemap.xml jako modlu, která je potřeba u každého webu. Není to ale pravda. V případě, že neexistuje soubor robots.txt, robot vyhledávače se k obsahu webu chová jednoduše tak, jako by bylo vše povoleno k procházení. Chybou by bylo pouze to, pokud by soubor robots.txt vracel chybu. Sitemap zase není nic extra důležitého v případě, že jde o malý web (do 100 indexovatelných stránek).

S velikostí projektu ale priorita těchto souborů roste, jelikož upravuje jejich chování při průchodu webem a může vést k rychlejší indexaci prioritního obsahu.

Kam umístit soubory robots.txt a sitemap.xml

Zkontrolujte tedy, jestli na vašem webu existuje soubor robots.txt, který se nachází hned za doménou, tedy na URL:
domena.tld/robots.txt

Roboti vyhledávačů jinde tento soubor hledat nebudou. Ujistěte se, že se v souboru robots.txt nachází blokace (řádky s Disallow:) alespoň na administraci a sekce, ke kterým nechcete, aby se vyhledávač dostal.

Stejně tak jako řádek s odkazem na sitemap, který by měl vypadat následovně:
Sitemap: https://www.domena.tld/odkaz-na-sitemap.xml

Na dané URL by měla být buď validní sitemap nebo sitemap index, což je v podstatě rozcestník na další sitemap webu. Sitemap index se používá v případě, že má web více než 50 000 URL. Do té doby není třeba rozdělovat strukturu webu do více sitemap. Přečtěte si více o tom, jak mohou sitemap a sitemap index vypadat.

Obrázková a video sitemap

V případě, že se na vašem webu nachází originální a kvalitní obrázkový nebo video obsah, je dobré sitemap rozšířit i o tyto zdroje. Nejde o vytváření samostatné sitemap, ale o doplnění těchto zdrojů do již existující sitemap k příslušným stránkám.

Zdroje:

Rychlost načtení webu

Rychlost načtení webu se v posledních letech stává středem pozornosti v mnohých odvětvích online marketingu a vývoje. Uživatelé se čím dál více přesouvají na mobilní zařízení a zvyšují se jejich požadavky na dobu k získání požadovaného obsahu.

Na tuto situaci samozřejmě reagují i vyhledávače. Rychlost načtení webu jako taková je možná marginálním signálem při řazení výsledků vyhledávání, ale zasahuje do mnoha dalších (jako dwell time...) a může tak mít razantní dopad na vaše pozice ve vyhledávačích. Nehledě na to, že zrychlení načtení webu má pozitivní dopady i na uživatelskou spokojenost na vašich stránkách.

Jak si zkontrolovat, za jak dlouho se váš web načte

Asi nejjednodušší detailnější kontrolou rychlosti vlastního webu může být přímo váš prohlížeč. Konkrétně Google Chrome poskytuje takzvané DevTools, do kterých se dostanete stisknutím buď F12 nebo CTRL+SHIFT+I.

V záložce Network si pak můžete nastavit simulaci různých prostředí, připojení a mnoho dalších vychytávek a poté pomocí obnovení stránky spustit analýzu rychlost načtení.

O tom, jak s DevTools testovat rychlost načtení webu více do hloubky, naleznete článek a videonávod zde.

Chrome DevTools
Chrome DevTools

V DevTools doporučuji testovat načtení stránky na různých zařízeních, z různých připojení, s vypnutou cache a zapnutými screenshoty z průběhu načítání, které vám řeknou více o tom, jak stránku vidí uživatel v průběhu načtení.

Dalšími nástroji, kterými můžete po vložení URL jednoduše analyzovat její rychlost načtení jsou:

První dva zmiňované dávají detailní informace o průběhu načtení a navrhují, jak rychlost načtení optimalizovat. V případě WebPageTest pak doporučuji nastavit zemi, ze které se má testovat, na zemi, ze které jsou vaši cíloví zákazníci.

Poslední zmiňovaný (PageSpeed Insights) je nástroj od Google, který místo měření rychlosti načtení webu, rovnou hledá potenciál ke zrychlení načtení. Ve svých výstupech nyní používá i informace z Chrome UX report o rychlosti načtení, konkrétně o FCP (First Contentful Paint) a DCL (DOM Content Loaded), což jsou data přímo z prohlížečů návštěvníků vašich stránek, agregovaná Googlem. Tuto metriku zároveň Google oficiálně potvrdil, jako jeden z aktivně používaných faktorů při řazení výsledků vyhledávání.

Chrome UX report je tak pro nás důležitým zdrojem podkladů. Kdo by si chtěl udělat detailnější report vlastního webu, může použít následující odkaz do DataStudio, ke kterému byl vytvořen konektor, přebírající z těchto reportů data:
https://g.co/chromeuxdash

Výstupem pak může být například následující report:
https://datastudio.google.com/open/1YEX-8zRSrgjwrbJl7qCW19mgLCx5m9A2

Rychlost načtení webu Marketing Miner podle Chrome UX reports
Rychlost načtení webu Marketing Miner podle Chrome UX reports

Posledním a neméně důležitým zástupcem při analýze rychlosti načtení webu, je nástroj Lighthouse, ke kterému jsme nedávno sepsali komplexní návod.

Hromadná kontrola rychlosti načtení

V případě, že chcete hromadně zkontrolovat rychlost načítání celé sitemap nebo více podstránek, je možné použít PageSpeed miner v sekci URL minerů.

Na co se dívat a na co si dávat pozor

Kromě toho, jak si změřit rychlost načtení, je ale důležitější, na co si dávat pozor. V případě celkové doby načtení stránky je skvělé vejít se do 1,5 sekundy. Od 3 sekund výše již uživatel ztrácí pozornost nebo může odcházet v době načítání stránky.

Rychlost načtení stránky bez cache je skvělá informace, ale nezapomínejte i na dobu načtení při přechodu mezi stránkami. Stejně tak se nedívejte pouze na celkovou dobu načtení. Mnohem lépe vypovídajícím hodnotícím faktorem rychlosti načtení je Speed Index.

Z pohledu SEO je pro nás ještě zajímavá jedna metrika a tou je doba odezvy serveru. Tedy doba, po které server začne odesílat data. Jedná se o přibližnou dobu, kterou potřebuje robot vyhledávače k tomu, aby si stáhl zdrojový kód stránky. Čím rychleji se dostane ke zdrojovému kódu stránek, tím rychleji a efektivněji dokáže web procházet a indexovat tak jeho obsah.

Co je dobré dělat proto, aby se vaše stránky rychle načítaly

  • Cachujte zdroje (především obrázky), které můžete.
  • Mějte zapnutou GZIP kompresi.
  • Používejte atribut srcset pro zobrazení obrázků v adekvátních velikostech jednotlivých zařízení. I při jeho použití ale ponechávejte v atributu src odkaz na nejlepší verzi obrázku (Seznambot neindexuje obrázky v atributu srcset).
  • Optimalizujte velikost obrázků pomocí bezztrátové komprese.
  • Pokud cílíte na mezinárodní návštěvnost, používejte CDN, která zrychlí odezvu webu ze vzdálenějších částí světa.
  • Pokud je třeba na stránce zobrazit mnoho větších obrázků, používejte lazy loading, díky kterému se uživateli obrázek zobrazí až ve chvíli, kdy ho dostane do viewportu. V případě použití lazy loadingu nezapomínejte obrázek uvést do <noscript> verze zdrojového kódu, aby se k němu vyhledávače dostaly a mohly jej zaindexovat.
  • V případě responzivního webu zvažte, zda je třeba pro mobilní zařízení načítat všechny styly a scripty, které načítá desktop verze webu. Pokud ne, je dobré ošetřit načtení těchto zdrojů pouze na specifických zařízeních.

AMP a Facebook instant articles

Jiným řešením pro mobilní verzi webu jsou iniciativy od gigantů Google a Facebooku. Těmi jsou buď AMP (Accelerated Mobile Pages) nebo Facebook Instant Articles. Z dostupných informací je z těchto dvou řešení zatím mnohem více používané AMP od Google.

Jedná se o open-source projekty, které mají jasně vymezené možnosti pro vývojáře, díky kterým se musí držet určitých mantinelů, zaručujících rychlé načtení takového webu.

Google zároveň takové stránky označuje ve výsledcích vyhledávání bleskem a přednačítá první z nich tak, že jej vloží do stránky uživateli jako iframe. Tím se dá docílit téměř okamžité reakce a zobrazení obsahu po kliknutí na výsledek na vyhledávání, což může mít pozitivní dopad na uživatelskou zkušenost.

Pro uživatele redakčního systému Wordpress je převod článku do AMP otázkou stažení a zapnutí pluginu:
https://cs.wordpress.org/plugins/amp/

Implementace na webu od základů jak AMP, tak i Facebook Instant Articles je ale mnohem složitější prací.

Jak vám implementace AMP pomůže v rámci SEO? Především díky zrychlení načtení vašich stránek, což může mít dopady jak na uživatelské chování, ale působí také jako jeden z hodnotících faktorů vyhledávače Google. V případě implementace AMP se navíc váš obsah může dostat do Top stories (výpis aktuálních článků v mobilní verzi výsledků vyhledávání Google) nebo může váš výsledek vyhledávání být označen bleskem.

Jak může vypadat AMP výsledek vyhledávání
Ukázka jak může vypadat AMP výsledek vyhledávání

Separace mobilní verze obsahu

Máte responzivní, který se přizpůsobuje různým zařízením? Pak z pohledu SEO nemáte v rámci separace mobilní verze obsahu co řešit. Pokud se ale vaše mobilní verze vyskytuje na jiné URL, než je URL verze desktopové, pak je třeba tyto verze správně vyhledávači označit, aby je nebral jako duplicity.

Pokud tedy máte mobilní verzi na jiné URL, než desktopovou, přidejte ji do hlavičky zdrojového kódu:
<link rel="canonical" href="https://www.example.com/page">
Jedná se o canonical, který vede na desktop verzi obsahu.

Naopak na desktopové verzi přidejte do hlavičky zdrojového kódu:

<link rel="alternate" media="only screen and (max-width: 640px)"
href="http://m.example.com/page">

Jedná sa o rel="alternate" s odkazem, vedoucím na mobilní verzi obsahu s určením rozlišení, od jakého se mobilní verze obsahu používá.

Tímto způsobem říkáte vyhledávači na mobilu, kde se nachází desktopová verze jeho obsahu a naopak na desktopu, kde se nachází mobilní verze stejného obsahu.

Blíže se o problematice separace mobilní a desktopové verze, můžete dočíst v článku od Google.

Separace jazykových verzí obsahu

Podobně jako u separace mobilní a desktopové verze obsahu, je potřeba řešit i různé jazykové a lokačně přizpůsobené verze obsahu webu, pokud se nacházejí na samostatných URL. Na základě správné separace jazykových verzí obsahu mohou vyhledávače uživatelům zobrazovat příslušnou jazykovou verzi obsahu ve výsledcích vyhledávání.

Toho docílíte tím, že do hlavičky zdrojového kódu URL každé jazykové verze přidáte odkaz na její alternativy v jiných jazycích i na sebe samotnou. Například na URL: https://www.marketingminer.com/cs je třeba do hlavičky zdrojového kódu nasadit následující:

#Kanonizace URL na sebe samou
<link rel="canonical" href="https://www.marketingminer.com/cs" />

#Odkazy na alternativní jazykové verze
<link rel="alternate" href="https://www.marketingminer.com/cs" hreflang="cs" />
<link rel="alternate" href="https://www.marketingminer.com/en" hreflang="en" />
<link rel="alternate" href="https://www.marketingminer.com/de" hreflang="de" />
<link rel="alternate" href="https://www.marketingminer.com/sk" hreflang="sk" />
#x-default, který určuje, jaká jazyková verze se má zobrazit ve výsledcích vyhledávání v případě, že web nemá příslušnou jazykovou verzi země a jazyku uživatele
<link rel="alternate" hreflang="x-default" href="https://www.marketingminer.com/en" />

To znamená, že je doporučeno používat canonical, vedoucí na danou verzi obsahu, poté odkaz na všechny jazykové verze obsahu (včetně té, na které se uživatel nachází). Krom nich je potřeba uvést i x-default hreflang, jenž určuje jazykovou verzi, kterou má vyhledávač zobrazovat ve výsledcích vyhledávání uživatelům, kteří neodpovídají ani jedné z existujících jazykových alternativ.

Kromě jazyka obsahu se dá specifikace hreflang rozšířit i o stát, kterému jazyková alternativa odpovídá. Tedy například odlišit verze obsahu, který je ve shodném jazyce, ale určený publiku z jiných zemí. Toho docílíte doplněním země ve formátu ISO 3166-1. Samotný odkaz na takovou jazykovou alternativu může vypadat následovně:

<link rel="alternate" href="https://www.marketingminer.com/cs" hreflang="cs-cz" />

Druhou možností, jak jazykové verze od sebe korektně separovat, je zanést odkazy na další jazykové verze přímo do sitemap. Jak takové řešení může v sitemap vypadat?

<url>
<loc>https://www.marketingminer.com/cs</loc>
<xhtml:link
rel="alternate"
hreflang="en"
href="https://www.marketingminer.com/en"/>
<xhtml:link
rel="alternate"
hreflang="sk"
href="https://www.marketingminer.com/sk"/>
<xhtml:link
rel="alternate"
hreflang="de"
href="https://www.marketingminer.com/de"/>
</url>

Třetí možností je pak poslat informaci o alternativní jazykové verzi přímo skrze záhlaví HTTP, které může vypadat následovně:

Link: <https://www.marketingminer.com/cs>; rel="alternate"; hreflang="cs",
<https://www.marketingminer.com/en>; rel="alternate"; hreflang="en",
<https://www.marketingminer.com/sk>; rel="alternate"; hreflang="sk",
<https://www.marketingminer.com/de>; rel="alternate"; hreflang="de"

K hromadné kontrole validity nasazené separace jazykových verzí poté můžete použít Hreflang checker.

Nasazení strukturovaných dat

Strukturovaná data jsou strojově čitelná data pomáhající lépe pochopit informace a entity objevující se na URL. Někteří roboti vyhledávačů s těmito daty pracují a dokážou tak lépe pochopit kontext obsahu i význam některých jeho částí, což se může promítnout do výsledků vyhledávání v podobě různých snippetů (hvězdičky, událost, obrázek...).

Strukturovaná data můžeme implementovat mnoha způsoby. Nejpoužívanější jsou ale následující typy označení:

Podpora formátů označení napříč vyhledávači

JSON-LD Microdata RDFa
Google
Seznam ✓ (ukládá) ✓ (ukládá) ✓ (ukládá)
Bing

Od vyhledávače Seznam máme oficiálně potvrzeno, že strukturovaná data z URL parsuje a stahuje, ale prozatím téměř nepoužívá (kromě breadcrumb). Už ale fakt, že tato data ukládá, potvrzuje, že v nich vidí do budoucna hodnotu a bude je nejspíše používat ve svých výstupech jednou také.

Seznam oficiálně podporovaných schémat vyhledávačem Google:
https://developers.google.com/search/docs/guides/mark-up-content

K tomu, aby roboti dopředu znali strukturu a význam označení, je třeba knihovna, popisující jednotlivá schémata. Takových knihoven je mnoho (a kdokoli si může založit svoji), ale nejpoužívanějšími a podporovanými ze strany vyhledávačů, jsou Schema.org a OpenGraph.

Schema.org

Schema.org je společným úsilím o zlepšení webu vytvořením schématu strukturovaných schémat dat, podporovaného největšími vyhledávači světa (Google, Bing, Yahoo a Yandex).

Tuto knihovnu schémat můžete užívat jako asi nejlepší podklad pro přehled označení, která můžete používat. Naleznete ji na:
https://schema.org/

Zde naleznete výpis všech podporovaných schémat:
https://schema.org/docs/full.html

Strukturovaná data nejsou věc, která by se měla řešit jako jedna z prvních, když se bavíme o úpravách na základě SEO auditu. Na druhou stranu, když už máte odladěny základní věci jako jsou duplicity, vytvořené všechny důležité vstupní stránky na základě analýzy klíčových slov, jsou to strukturovaná data, která vám pomohou být o krok před konkurencí. Můžete díky nim zvýšit míru prokliku z výsledků vyhledávání a dlouhodobě Googlu pomáhat s chápáním obsahu a směrovat nás k sémantickému webu. (Martin Šimko)

OpenGraph

OpenGraph protocol nabízí schéma meta dat, které lze umístit do hlavičky zdrojového kódu. Tato meta data poté přejímají jednotlivé sociální sítě a dokážou tak na základě nich zobrazit upravený a bohatší náhled obsahu na URL, což může mít za dopad navýšení počtu interakcí ze strany uživatelů.

Jak může taková implementace OpenGraph vypadat?

<meta property="og:title" content="Marketing Miner"/>
<meta property="og:type" content="website"/>
<meta property="og:url" content="https://www.marketingminer.com/cs"/>
<meta property="og:description" content="Data mining nástroj pro online marketéry, který šetří čas i peníze SEO a PPC specialistům, eshopům a webdesignérům."/>
<meta property="og:site_name" content="Marketing Miner"/>

O tom, jaká meta data se hodí nasazovat pro různé typy obsahu, pojednává komplexně tento článek:
https://moz.com/blog/meta-data-templates-123

Ošetření stránkování

Stránkování slouží k rozdělení výpisu obsahu v případě, kdy obsahuje velké množství položek. Typicky se jedná o nějakou kategorii s výpisem článků nebo filtraci obsahu (například výpis článků apod.).

K tomu, aby vyhledávače pochopily, že se jedná o stránkování, že obsah kategorie patří k sobě a že má procházet i URL zanořené ve stránkování, je třeba správně stránkování ošetřit.

Asi nejlepším způsobem, jak něco takového udělat, je umístit do hlavičky zdrojového kódu odkaz na následující a předchozí stránku pomocí rel="next" a rel="prev". Taková implementace může vypadat následovně:

<link rel="prev" href="https://www.marketingminer.com/cs/blog">
<link rel="next" href="https://www.marketingminer.com/cs/blog/3">

Tímto způsobem vyhledávači říkáte, že další stránka v rámci stránkování této kategorie se nachází na URL https://www.marketingminer.com/cs/blog/3 a předchozí na https://www.marketingminer.com/cs/blog.

Druhým způsobem, jak robota vyhledávače o stránkování informovat, je poslat tuto informaci v HTTP hlavičce, což může vypadat následovně:

Link: <https://www.marketingminer.com/cs/blog/; rel="prev">
Link: <https://www.marketingminer.com/cs/blog/3; rel="next">

Problémem tohoto řešení je fakt, že Seznambot tento formát ošetření stránkování nepodporuje. Proto je vhodné ještě pro user-agent: Seznambot, tedy pro robota vyhledávače Seznam.cz, do hlavičky zdrojového kódu uvádět od druhé stránky stránkování direktivu noindex, follow (neindexuj tento obsah, ale procházej jej).

Skvělý článek o tom, jak stránkování řešit, napsal na svém blogu Pavel Ungr:
https://blog.bloxxter.cz/jak-spravne-na-strankovani-z-pohledu-seo/

Ošetření filtrace

Filtrace může být dobrým služebníkem, ale také velmi zlým pánem, pokud není správně vyřešena. Pomocníkem z důvodu, že dokáže pokrýt velké množství klíčových slov, zlým pánem proto, že z ní může být černá díra při procházení webu vyhledávačem.

Základními prvky kvalitní filtrace z pohledu SEO je:

  • Filtrace mění nadpis a titulek podle filtrovaného obsahu.
  • Filtry, které chcete indexovat, obsahují přímo v kódu odkaz na danou filtraci a vyhledávače se tak skrze filtraci dokážou dostat na jednotlivé stránky s filtrovaným obsahem.
  • Filtry zaškrtnuté v různém pořadí vytváří vždy jednu a tu samou URL (ve které se nemění pořadí zaškrtnutých parametrů).
  • Násobná filtrace (dvě a více zaškrtnutých filtrací v rámci jednoho segmentu filtru) je blokována pomocí robots.txt, aby vyhledávače nemohly procházet všechny variace filtrů. Těch mohou být i na malém webu miliardy.

Téma filtrace eshopu komplexně rozebírá Pavel Ungr v této přednášce:

Pavel Ungr: Filtrace pro vyhledávače

Odstranění největších překážek při procházení webu

Při analýze největších překážek při procházení webu je dobré mít přístup do access logu, ale i bez tohoto přístupu se dají zjevné problémy nalézt při průchodu webem nebo jeho kontrolou skrze nástroj Screaming Frog (případně lze použít Xenu, Sitebulb nebo Spotibo).

Analýza a optimalizace průchodu vyhledávače webem dává smysl především u rozsáhlejších webových stránek, kde může vést k rychlejší indexaci nového (nebo hodně zanořeného) obsahu, snížení vytížení, které vyhledávač na server vytváří a tedy i k nárůstu organické návštěvnosti.

Mezi činnosti, které můžete v rámci analýzy největších překážek při procházení webu dělat, patří například:

  • Identifikace parametrů v interním prolinkování, které nemění obsah nebo je nechcete indexovat (řazení v kategorii, některé filtrace,...). U takových parametrů/filtrů můžete blokovat procházení v souboru robots.txt.
  • Analýza sekce Parametry adres URL, která odhalí parametry URL, které vyhledávač Google nejvíce prochází. Pokud mezi nimi naleznete takové, které nechcete, aby procházel, opět je vhodné blokovat jejich procházení v souboru robots.txt.
  • Hledání takzvaných spider traps. Tedy míst, kde se může robot hodně zacyklit. K tomu můžete použít výše zmiňovaný Screaming Frog a hledat především zacyklená přesměrování, parametry v URL, související s uživatele (?session= apod.), chybné relativní odkazy a další.

Obsahové faktory

Obsahové faktory se týkají vizuální reprezentace a kvality obsahu na webu. Tvoří hlavní hodnotu webu jako takového, jelikož přinášejí uživateli požadované informace.

Architektura obsahu a interní prolinkování

Ač si to hodně lidí neuvědomuje, špatně navržená architektura může mít negativní dopady jak na chování uživatelů na webu, tak na návštěvnost z vyhledávačů. Dobře navržená logická struktura obsahu je naprostým základem pro efektivní navigaci uživatelů. Z pohledu SEO má zároveň dopady na distribuci takzvaného link juice mezi jednotlivými stránkami.

Co je link juice? Představte si ho jako určitou formu autority (nebo priority), která se přelévá z jedné stránky na druhou. Každá stránka má svou autoritu, založenou na autoritě odkazů, které na ni směřují (ať už externí, nebo interní) a tuto hodnotu zase distribuuje dál skrze interní a externí odkazy na ni.

Architektura obsahu určuje, na které stránky v rámci interního prolinkování půjde této hodnoty nejvíce. Logicky výše postavené stránky v hierarchii ve většině případů dostávají více link juice a proto jsou z pohledu vyhledávačů i autoritativnější.

Za účelem analýzy distribuce link juice skrze webovou stránku a identifikací potenciálních potíží se provádí analýza a vizualizace interního prolinkování, jejíž grafický výstup může vypadat například následovně:

Vizualizace interního prolinkování webu
Vizualizace interního prolinkování webu

Na ni se dá poté zkoumat, zda je architektura navržena správně, jestli na sebe odkazuje dostatečně relevantní obsah a jaká je distribuce link juice uvnitř webu. Pro správný návrh architektury je potřeba, kromě analýzy interního prolinkování, mít k dispozici i analýzu klíčových slov a na základě jejích výstupů reflektovat v architektuře to, co lidé hledají.

Z pohledu vyhledávačů je krom link juice důležitá i metrika click-depth. Ta vyjadřuje počet kliků (přechodů skrze interní odkazy), které musíte na stránce udělat, abyste se k požadovanému obsahu dostali. Více o této metrice a potvrzení ze strany Google v tomto článku.

Prvky správně navržené architektury:

  • Z jakékoli URL by se mělo dát jednoduše dostat na její alternativy obsahu (podobné články, podobné kategorie,...) a na nadřazenou URL v rámci architektury webu.
  • Používejte drobečkovou navigaci a mějte ji správně označenou strukturovanými daty, aby ji mohly zobrazovat i vyhledávače ve svých výsledcích vyhledávání.
  • Snažte se držet strukturu navigace logickou a co nejpřímější. Méně kategorií a lepší filtrace/strukturace je často klíčem k tomu, jak nenutit uživatele příliš přemýšlet.
  • Při zmínkách uvnitř obsahu o jiných sekcích (produktech, filtracích, kategoriích) používejte odkazy na tyto sekce, aby se mohl uživatel na jeden klik dostat na požadovaný obsah.
  • Odkazujte se v rámci interního prolinkování na co možná nejrelevantnější obsah z webu (nejpodobnější články...). Toto téma podrobně popisuje článek na webu nástroje HubSpot: Topic Clusters: The Next Evolution of SEO.
Důležité je pro tuto část mít podklady z analýzy klíčových slov. Pokud pro web nebyla dříve vyhotovena, doporučil bych ji klientovi k SEO auditu zpracovat. Bez těchto pokladů totiž nemusí být závěry a doporučení zcela přesné. Často se stává, že web se postupem času rozroste o další části (služby/produkty), takže i aktualizace analýzy klíčových slov je čas od času užitečná. (Miroslav Rojek)

Čitelnost obsahu

Úžasný obsah ještě sám o sobě neznamená, že ho lidé budou číst. Pohodlnost při čtení vašeho obsahu může rozhodovat o tom, jestli uživatel dočte obsah do konce nebo zda se přihlásí k newsletteru. Z pohledu SEO může mít čitelnost obsahu vliv na chování uživatele na stránce a rozhodovat o tom, zda se nevrátí zpět do výsledků vyhledávání (krátký dwell time). Proto je dobré udržovat vaše písmo v obsahových sekcích dobře čitelné.

Prvky dobře čitelného obsahu:

  • Velikost písma. Pro dobře čitelný text se doporučuje používat velikost písma kolem 12-16pt (přibližně 16-22px) v závislosti na zařízení uživatele.
  • Kontrast písma a pozadí. Při volbě barvy písma je třeba zvolit takovou, která bude na daném pozadí opravdu dobře čitelná. Ke kontrole kontrastu můžete použít tento nástroj.
  • Styly určené pro tisknutí obsahu. Že už dnes nikdo obsah netiskne? A co takhle uživatelé, kteří si chtějí stáhnout váš obsah v PDF nebo do čtečky? Upozornění: Pro tisknutelnou verzi nevytvářejte zbytečně vlastní URL (například s parametrem ?print) a pokud už, tak ji nenechávejte procházet roboty vyhledávačů.
  • Délka řádku by se měla by pohybovat kolem 50-80 znaků a svislé mezery mezi řádky kolem 1,5 násobku velikosti písma. Uživatel tak dokáže jednoduše udržet pozornost na řádku a neztrácet se mezi řádky.
  • Výběr písma (fontu). Měl by se orientovat podle jeho čitelnosti. Závisí na něm doba čtení obsahu, jelikož se každé písmo čte trošku jinak pohodlně. Podívejte se na výsledky zahraničního výzkumu. Stejný článek lišící se pouze písmem, může prodloužit dobu čtení až dvojnásobně.
  • Držte své stránky přehledné. V Evropě je většinou zvykem, že se menu nachází buď v záhlaví nebo na levé straně. Filtrace většinou na levé straně nebo nad vypsaným obsahem. Stejně tak je dobrým zvykem, že každý obsah reprezentuje jeden hlavní nadpis (h1), který věcně popisuje, o čem obsah je.
  • Inspirujte se. Skvělým příkladem práce s čitelností obsahu je web Medium.com a články na něm.

Viditelnost důležitého obsahu

Skrytý obsah na desktopové verzi, který je dostupný až po uživatelské interakci (proklik na záložku...) má pro Google nižší hodnotu než obsah, který je na první pohled viditelný. Je proto důležité, aby na desktopové verzi obsahu byl na první pohled viditelný prioritní obsah a do záložek se dostával pouze obsah neprioritní.

Na mobilních zařízeních je tomu jinak, jelikož se počítá s tím, že na nižších rozlišeních je i méně prostoru a z hlediska UX dává smysl skrývat některé prvky. Proto na mobilní verzi obsahu má pro Google skrytý obsah stejnou hodnotu jako ten viditelný.

Pro vyhledávač Seznam je hodnota skrytého textu jak na mobilním, tak na desktopovém zařízení stejná.

Video s vysvětlením, jak se vyhledávače chovají ke skrytému obsahu, můžete nalézt zde:

Vyhledávače a skrytý obsah

E.A.T. (Expertise, Authority, Trust)

Tři slova, která se především v poslední době projevují jako jeden z důležitých hodnotících faktorů Google.

Níže naleznete rozepsány nosné prvky každého z nich a na co si dávat pozor:

Odbornost (Expertise)

  • Jak odborný je obsah, který píšete?
  • Věří mu vaši uživatelé?
  • Je na první pohled poznat autor obsahu a bližší informace o něm?

Autorita (Authority)

  • Jak autoritativní je web, na kterém je obsah umístěn? Jak autoritativní jsou weby, které se na tento obsah odkazují?
  • Je obsah na webu podložený důvěryhodnými zdroji (odkazy)?
  • Jaký autor napsal obsah? A jaká jsou jeho další díla a jejich kvalita?

Důvěryhodnost (Trust)

  • Jak dobře web chrání informace o uživateli (HTTPS...)?
  • Je na webu nějaká forma kontaktu na jeho vlastníka nebo autora obsahu?
  • Je obsah aktuální? Aktualizuje jej autor podle novinek v oboru?

Tyto faktory jsou důležité především u stránek, které spadají do tzv. YMYL (your money, your life), tedy webových stránek, které se svým obsahem dotýkají zdraví nebo peněz uživatele.

Optimalizace obrázků

Obrázkové vyhledávání v současnosti (konec roku 2018) představuje přibližně 26 % všech vyhledávání na světě. To znamená, že každé čtvrté vyhledávání nekončí na fulltextové reprezentaci výsledků, ale na zobrazení obrázků.

To podtrhuje důležitost optimalizace obrázků, jakožto součásti každého SEO auditu. Co v rámci optimalizace obrázků můžete udělat:

  • Ujistěte se, že používáte unikátní obrázky (nikoli z fotobank) v dostatečné kvalitě a rozlišení.
  • Používejte atribut alt k popisu toho, co je na obrázku. Pomůže to vyhledávači odhalit, co se na obrázku nachází a nevidomým čtenářům získat představu o tom, co na obrázku je.
  • Používejte atribut title v případě, že chcete nějak upřesnit lidem, kteří najedou myší na obrázek, význam daného obrázku.
  • Používejte atribut srcset a vytvořte obrázek ve více velikostech. Díky tomuto atributu můžete uživateli zobrazovat obrázek ve velikosti, optimalizované pro jeho zařízení. Atribut srcset je dobré kombinovat i s atributem src, jelikož některé vyhledávače (například Seznam) indexují obrázky pouze z atributu src.
  • Dávejte si pozor, aby textový obsah v okolí obrázku byl relevantní vůči tomu, co na obrázku nachází.
  • Označujte obrázky pomocí strukturovaných dat a předejte tak vyhledávačům v jednoduše zpracovatelné formě bližší informace o lokaci, ze které byl obrázek pořízen nebo o jeho autorovi.
  • Používejte nástroje pro optimalizaci a kompresi obrázku, díky kterým můžete při zachování kvality obrázku zmenšit jeho velikost a tedy i data, která musí uživatel stáhnout při načtení stránky. Mezi takové nástroj patří například Optimizilla nebo Compressor.io.
  • Pojmenovávejte obrázky podle toho, co se na nich nachází. Jako oddělovač slov zvolte buď pomlčku nebo podtržítko.
  • Umístěte obrázky do sitemap.
  • Používejte obrázky z obsahu v OpenGraph meta datech, čímž dostanete obrázek při sdílení na sociálních sítích do náhledu.
  • Zvolte správný formát obrázku (JPG pro fotografie, GIF pro pohyblivé obrázky,...).

Výstup SEO auditu

Správným výstupem SEO auditu by měla být nejen identifikace možných problémových míst webu, ale i konkrétní návrh řešení těchto problémů ideálně v podobě zadání pro vývojáře. Formáty předání jsou různé, ale nejčastěji jde o PDF soubor nebo soubor zadání/úkolů, připravených v nástroji, který klient používá pro zadávání práce pro programátory a další zodpovědné osoby.

Součástí výstupu by mělo být také určení priority nalezených problémů. Ne všechny problémy mají stejnou váhu a náročnost, a proto je potřeba si stanovit jasné workflow při zapracování změn.

Se SEO audity je největší potíž v tom, že máme spousty skvělých výstupů, které se ale nikdy nerealizují. Neměli bychom zapomínat na to, že cílem auditu je ne ty chyby odhalit a navrhnout řešení, ale hlavně chyby odstranit. A to by měl být náš hlavní úkol a cíle jakéhokoliv SEO auditu. (Pavel Ungr)

Ukázky SEO auditů

Co by to bylo za návod bez ukázky toho, jak může taková analýza klíčových slov vypadat:

Pavel Ungr

Výstup Ke stažení
Výstup auditu PDF
Příloha k analýze XLSX
Pavel Ungr logo

Popis služby


Včeliště

Výstup Ke stažení
Výstup auditu PDF
Včeliště logo

Popis služby

Líbí se ti článek? Sdílej s přáteli!     To se mi líbí Tweet Google +

Komentáře



Filip Podstavec

Marketing Miner byl původně nástrojem, který jsem používal pro zefektivnění své denní práce a důležitých podkladů pro své rozhodování. Touto cestou jej hodlám vést i do budoucna a pracovat na možnosti jednoduchého každodenního využívání dat mezi odborníky

Filip Podstavec


Podobné články

Analýza klíčových slov krok za krokem


 Filip Podstavec


  18 minut čtení
  19. 5. 2018.

Chci přečíst 

Efektivní link prospecting s Marketing Minerem ve 4 krocích


 Gabka Koščová


  12 minut čtení
  30. 10. 2017.

Chci přečíst 

Inspirace od předních SEO specialistů na rok 2018


 Filip Podstavec


  15 minut čtení
  21. 1. 2018.

Chci přečíst 




Komentáře




Že ses ještě nerozhodl?

Nevadí, můžeš si nás zdarma a jednoduše otestovat.