Assunto
- #robots.txt
- #crawler
- #OpenAI
- #ChatGPT
- #GPT
Criado: 2024-07-27
Criado: 2024-07-27 23:29
O OpenAI (GPT) opera bots de rastreamento.
Basicamente, o GPT também precisa coletar dados para continuar aprendendo e melhorando, por isso ele realiza rastreamento, mas...
nos estágios iniciais, ele usava dados da Wikipédia e notícias de várias empresas de mídia, além de operar um grande número de rastreadores, o que causou controvérsia. No entanto, atualmente, ele opera oficialmente o GPTBot, que respeita o arquivo robots.txt e interrompe a coleta de dados se for bloqueado.
Conteúdo relacionado: https://platform.openai.com/docs/bots
Por exemplo, se você escrever no arquivo robots.txt:
apenas o GPTBot será bloqueado, e
o GPTSearch, que foi lançado recentemente, será permitido. Para bloquear o GPTBot e permitir o GPTSearch, você pode fazer o seguinte:
Utilizando as partes necessárias adequadamente, você pode bloquear o rastreamento não autorizado pelo GPT.
Comentários0