pondělí 17. května 2010

Jak na sitemap.xml a robots.txt

Jak na sitemap.xml a robots.txt

Poslední dobou se na fóru probírá možnost tvorby sitemapy pro vyhledavače. K čemu to je dobré?
Tak tímto způsobem lze popohnat vyhledáváč, aby rychleji indexoval nové stránky. Pro Google se odkaz na mapu vkládá do Nástroje pro webmastery. V případě Seznamu se vloží odkaz na sitemapu do robots.txt, robot seznamu s touto informací umí pracovat a nabídnutý soubor zpracuje a zaindexuje.  Je to zkrátka velmi efektivní způsob jak dát vyhledávačům najevo, že na Vašem eshopu proběhly změny.

Teď trochu odbočím od návodu jak to udělat a co nastavit. 

Trochu mě mrzí svéřepost adminů, že nechtějí možnost generování sitemapy integrovat do systému. Jaké by to mělo výhody? Odpověď je jednoduchá. Uživatelsky by to bylo jednoduché na obsluhu, člověk by zadal generovat sitemapu a ta by se automaticky generovala. S tím, že by byla pevně daná URL souboru. Můj osobní názor na věc je ten, že doprogramování této funkce je jednoduché. Nicméně zatím jsme ve fázi, že administratoři nám předhazují možnost generování souboru prostřednictvím online služby http://www.xml-sitemaps.com. Je to krkolomné a pro většinu lidí vlastně k ničemu, neboť výpis obsahuje jen 500 položek. Nad tento počet je nutné zaplatit nemalý poplatek. Dále se na fóru objevila zmínka o nástroji A1 Sitemap Generator. Jedná se o shareware, tedy plná verze je k dispozici 30 dní a pak se opět musí zaplatit polatek.
Tady je nutné říct, že v žádném případě nestačí vygenerovat soubor sitemap a je to v pohodě. Soubor se musí generovat pokaždé, pokud na změnu přibyla byť jen jediná stránka. Tedy stránka, kterou chcete nechat indexovat. Takže 30 dní neřeší vůbec nic. 
Teď budu spekulovat, ale teoreticky, pokud si nástrojem A1 Sitemap Generator vygeneruji sitemap a za 30 dní už tu možnost mít nebudu, tak může dojít k situaci, pokud odkaz na sitemap budu mít vložen v Nástroje pro webmastery, že Google mi už nebude indexovat nové stránky, protože podle informací, které jsem mu poskytl, žádné nové stránky nemám. Neboť sitemap už jsem po uplynutí 30 dnu neaktualizoval. Ale můžu se mýlit. 


Takze jak na to?

Popsán bude nástroj A1 Sitemap Generator, protože umožnuje indexovat celý obsah eshopu. Blbé na tom je, že jeho používání je omezenona 30 dní. Ale pro začátek to bude stacit. Na stránce http://www.microsystools.com/products/sitemap-generator/language-packs.php si stáhnete aktuální verzi programu. Tady je další slabina, že pro generování mapy je nutné si do počítače instalovat sw třetí strany! Stahovany soubor je velký 2,3 MB.

Po nezbytné instalaci, která je jednoduchá, v postatě stačí souhlasit s obchodními podmínkami a následně klikat na tlačítko NEXT, se vám zobrazí právě nainstalovaný program.

1. Na záložce Scan Website vložte do pole doménu Vašeho eshopu
2. Stiskněte tl. Start scan
3. Nyní čekejte, než program dokončí analýzu Vašeho eshopu (délka scanu je závislá na rychlosti Vašeho připojení)

4. Po neuvěřitelně dlouhé době je scan dokončen
5. Přejděte na záložku Create Sitemap a stiskněte Build Now
6. Program mapu vygeneruje a automaticky přejde na záložku View files
7. Nyní je mapa vygenerována a máte ji v dokumentech ve složce Microsys\Sitemap Generator 2\temp\sitemap.xml

Nyní je nutné mapu dostat na eshop, takže

1. Přejděte do administrace eshopu na záložku Moduly a následně na Správce souborů
2. Vytvořte v administraci složku sitemap
3. Přejděte do složky sitemap a zadejte Nahrání a následně Vybrat soubory. Vyberte z dokumentů soubor sitemap.xml
4. Po uploadu souboru ověřte funkčnost odkazu. Mělo by to být v tomto tvaru http://www.vasedomena.cz/fotky7085/sitemap/sitemap.xml
5. Adresář fotky7085 jsem měl nastavený defaultně, možná se bude lišit v každém eshopu, zjistíte to tak, že v administraci ve Správci souborů se podíváte do horizontálního menu správce a pod nápisem Označená složka by měla být složka vypsána.



Ted je nutné dát existenci sitemapy najevo vyhledávačum. V případě Googlu je to jednoduché, děla se to přes stránky Nástroj pro správce webu. Na záložce nastavení je položka odeslat sitemap. Tam zadatáte adresu domeny zmíněnou v bodu 4.


Seznam se na existenci sitemapy upozorňuje v souboru robots.txt a to zadáním následujícího řádku:
Sitemap: http://www.vasedomena.cz/fotky7085/sitemap/sitemap.xml (upravte dle Vaší domény)


Teď zbývá popsat nastavení souboru robots.txt, pokud jej tedy už nemáte upravený:
1. V administraci eshopu přejděte do Nastavení a následně na záložku robots.txt
2. Do pole vložte tento zápis:
User-agent: *
Allow:
a nyní přidejte Váší sitemapu, tak, že celý obasah souboru robots.txt bude vypadat takto:


User-agent: *
Allow:
Sitemap: http://www.vasedomena.cz/fotky7085/sitemap/sitemap.xml

3. Zadejte Uložit a je hotovo. O víc se už starat nemusíte.


Co z tohoto plyne?
Cele je to složité, komplikované, zdlouhavé. Prostě takto se to dělat nemá. Ale jiný způsob zatím není. :(

2 komentáře:

donna glamour řekl(a)...

Super děkuji, nebýt tohohle článku asi bych to nikdy sama nezvládla.... ty nevíš jaké poklady tu píšeš a jak moc nám všem pomáháš... jen nepřestávej!

Klára řekl(a)...

Tak jsem se do toho pustila. Celý to chápu, ale zaseknu se na tom, když v administraci vlezu do toho správce souborů a chci tam dát vložit ten sitemap tak mi to napíše, že byly vybrány neplatné soubory a zkuste to znovu a prostě s tím nehnu. V čem může být chyba?