Jak blokovat vyhledávače (s obrázky)

Obsah:

Jak blokovat vyhledávače (s obrázky)
Jak blokovat vyhledávače (s obrázky)

Video: Jak blokovat vyhledávače (s obrázky)

Video: Jak blokovat vyhledávače (s obrázky)
Video: How to Open ODS File OpenDocument in Excel 2021 2024, Smět
Anonim

Vyhledávače jsou vybaveny roboty, známými také jako pavouci nebo roboti, které procházejí a indexují webové stránky. Pokud se váš web nebo stránka vyvíjí nebo obsahuje citlivý obsah, možná budete chtít blokovat roboty procházení a indexování vašeho webu. Naučte se blokovat celé webové stránky, stránky a odkazy pomocí souborů robots.txt a blokovat konkrétní stránky a odkazy pomocí značek html. Pokračujte v čtení, abyste zjistili, jak blokovat konkrétním robotům přístup k vašemu obsahu.

Kroky

Metoda 1 ze 2: Blokování vyhledávačů pomocí souborů robots.txt

576315 1
576315 1

Krok 1. Pochopte soubory robots.txt

Soubor robots.txt je prostý textový soubor nebo ASCII, který informuje pavouky vyhledávačů o tom, k čemu mají na vašem webu přístup. Soubory a složky uvedené v souboru robots.txt nemusí být procházeny a indexovány pavouky vyhledávače. Soubor robots.txt můžete potřebovat, pokud:

  • Chcete zablokovat konkrétní obsah z pavouků vyhledávačů.
  • Vyvíjíte živé stránky a nejste připraveni na to, aby je prohledávali a indexovali pavouci vyhledávačů
  • Chcete omezit přístup k renomovaným robotům.
576315 2
576315 2

Krok 2. Vytvořte a uložte soubor robots.txt

Chcete -li soubor vytvořit, spusťte editor prostého textu nebo editor kódu. Uložte soubor jako: robots.txt. Název souboru musí být malý.

  • Nezapomeňte na „s“.
  • Při ukládání souboru zvolte příponu „'.txt”'. Pokud používáte Word, vyberte možnost „Prostý text“.
576315 3 1
576315 3 1

Krok 3. Napište úplný soubor robots.txt

Pomocí nástroje „full-disallow“robots.txt je možné zablokovat procházení a indexování každého renomovaného pavouka vyhledávače. Do textového souboru napište následující řádky:

    Uživatelský agent: * Zakázat: /

  • Použití souboru „robots.txt s úplným zákazem“se důrazně nedoporučuje. Když robot, jako je Bingbot, přečte tento soubor, nebude indexovat váš web a vyhledávač nezobrazí váš web.
  • Uživatelští agenti: toto je další výraz pro vyhledávače nebo roboty
  • *: hvězdička znamená, že kód platí pro všechny agenty uživatele
  • Zakázat: /: lomítko označuje, že celý web je pro roboty zakázán
576315 4 1
576315 4 1

Krok 4. Napište soubor robots.txt s podmíněným povolením

Místo blokování všech robotů zvažte blokování konkrétních pavouků z určitých oblastí vašeho webu. Mezi běžné příkazy podmíněného povolení patří:

  • Blokovat konkrétního robota: nahraďte hvězdičky vedle Uživatelský agent s googlebot, googlebot-novinky, googlebot-image, bingbot, nebo teoma.
  • Blokovat adresář a jeho obsah:

    User-agent: * Disallow: /sample-directory /

  • Blokovat webovou stránku:

    Uživatelský agent: * Zakázat: /private_file.html

  • Blokovat obrázek:

    Uživatelský agent: googlebot-image Disallow: /images_mypicture.jpg

  • Blokovat všechny obrázky:

    Uživatelský agent: googlebot-image Disallow: /

  • Blokovat konkrétní formát souboru:

    Uživatelský agent: * Zakázat: /p*.gif$

576315 5
576315 5

Krok 5. Povzbuďte roboty k indexování a procházení vašeho webu

Mnoho lidí chce místo blokování uvítat pavouky vyhledávačů, protože chtějí indexovat celý svůj web. Abyste toho dosáhli, máte tři možnosti. Nejprve se můžete odhlásit z vytváření souboru robots.txt-když robot soubor robots.txt nenajde, bude pokračovat v procházení a indexování celého vašeho webu. Za druhé, můžete vytvořit prázdný soubor robots.txt-robot najde soubor robots.txt, rozpozná, že je prázdný, a bude pokračovat v procházení a indexování vašeho webu. Nakonec můžete napsat soubor robots.txt s plným povolením. Použijte kód:

    Uživatelský agent: * Zakázat:

  • Když si robot, jako je například googlebot, přečte tento soubor, bez obav navštíví celý váš web.
  • Uživatelští agenti: toto je další výraz pro vyhledávače nebo roboty
  • *: hvězdička znamená, že kód platí pro všechny agenty uživatele
  • Zakázat: příkaz blank disallow označuje, že jsou přístupné všechny soubory a složky
576315 6
576315 6

Krok 6. Uložte soubor txt do kořenového adresáře vaší domény

Jakmile napíšete soubor robots.txt, uložte změny. Nahrajte soubor do kořenového adresáře vašeho webu. Pokud je například vaše doména www.vasadomena.com, umístěte soubor robots.txt na www.vasadomena.com/robots.txt.

Metoda 2 ze 2: Blokování vyhledávačů pomocí metaznaček

576315 7
576315 7

Krok 1. Pochopte metaznačky robotů HTML

Meta tag robots umožňuje programátorům nastavit parametry pro roboty nebo pavouky vyhledávačů. Tyto značky se používají k blokování robotů v indexování a procházení celého webu nebo jen jeho částí. Tyto značky můžete také použít k zablokování konkrétního pavouka vyhledávače v indexování vašeho obsahu. Tyto značky se zobrazují v záhlaví souboru HTML.

Tuto metodu běžně používají programátoři, kteří nemají přístup do kořenového adresáře webové stránky

576315 8
576315 8

Krok 2. Blokování robotů z jedné stránky

Je možné zablokovat všechny roboty z indexování stránky nebo z následování odkazů na stránky. Tato značka se běžně používá, když je vyvíjen živý web. Jakmile je web dokončen, důrazně doporučujeme tuto značku odebrat. Pokud značku neodstraníte, vaše stránka nebude indexována ani ji nebude možné vyhledávat prostřednictvím vyhledávačů.

  • Můžete blokovat roboty v indexování stránky a v následování některého z odkazů:
  • Můžete zablokovat všechny roboty v indexování stránky:
  • Můžete blokovat všechny roboty z odkazů na stránku:
576315 9
576315 9

Krok 3. Umožněte robotům indexovat stránku, ale ne podle jejích odkazů

Pokud robotům povolíte indexovat stránku, stránka bude indexována; pokud zabráníte pavoukům ve sledování odkazů, cesta odkazu z této konkrétní stránky na jiné stránky se přeruší. Do záhlaví vložte následující řádek kódu:

576315 10
576315 10

Krok 4. Nechte vyhledávače sledovat odkazy, ale ne indexovat stránku

Pokud robotům povolíte sledovat odkazy, cesta odkazu z této konkrétní stránky na jiné stránky zůstane taktní; pokud je omezíte v indexování stránky, vaše webová stránka se v indexu nezobrazí. Do záhlaví vložte následující řádek kódu:

576315 11
576315 11

Krok 5. Blokovat jeden odchozí odkaz

Chcete -li skrýt jeden odkaz na stránce, vložte rel tag v tagu odkazu. Tuto značku můžete použít k blokování odkazů na jiných stránkách, které vedou na konkrétní stránku, kterou chcete zablokovat.

    Vložte odkaz na blokovanou stránku

576315 12
576315 12

Krok 6. Blokujte konkrétního pavouka vyhledávače

Namísto blokování všech robotů z vaší webové stránky možná budete chtít zabránit tomu, aby jeden robot procházel a indexoval stránku. Chcete -li toho dosáhnout, nahraďte „„ robot “v metaznačce názvem konkrétního robota. Mezi příklady patří: googlebot, googlebot-novinky, googlebot-image, bingbot, a teoma.

576315 13
576315 13

Krok 7. Povzbuďte roboty, aby procházeli a indexovali vaši stránku

Pokud chcete zajistit, aby vaše stránka byla indexována a aby byly dodržovány její odkazy, můžete vložit následný souhlas meta „robot“ označte do záhlaví. Použijte následující kód:

Doporučuje: