해리슨 블로그

Blokowanie crawlera bota OpenAI (GPT)

  • Język oryginalny: Koreański
  • Kraj: Wszystkie krajecountry-flag
  • TO

Utworzono: 2024-07-27

Utworzono: 2024-07-27 23:29

OpenAI (GPT) prowadzi działalność za pośrednictwem robota indeksującego (crawler bota).

Zasadniczo GPT również musi zbierać dane, aby móc się uczyć i ulepszać, dlatego korzysta z indeksowania (crawlingu), ale...

na początku wykorzystywał dane z Wikipedii i wiadomości z różnych agencji prasowych, a także prowadził wiele innych robotów indeksujących, co wzbudziło kontrowersje. Obecnie oficjalnie korzysta z GPTBot, który – zgodnie z zasadami robots.txt – przerywa indeksowanie, jeśli jest to zablokowane.


Na przykład, w pliku robots.txt

można zablokować tylko GPTBot, a

jeśli chcemy zezwolić na GPTSearch, a jednocześnie zablokować GPTBot, należy wpisać następujące dane:

W odpowiedni sposób wykorzystując te informacje, można zablokować nieuprawnione indeksowanie przez GPT.

Komentarze0