OpenAI: веб-сайты могут запретить обучение ChatGPT на их контенте

Для этого владельцу сайта нужно отключить поисковому роботу GPTBot доступ к сайту или его частям через файл Robots.txt либо заблокировать IP бота. Как это сделать — компания рассказала в блоге.

Если сайт не запретил сканирование своего контента, данные могут применяться для обучения GPT. Open AI отмечает, что дополнительно фильтрует данные, убирая оттуда:

— Источники под пейволом
— Личные данные, которые позволяют опознавать юзеров
— Информацию, которая нарушает политики компании

Ранее Интернет-пользователи уже пробовали придумать для бота «стоп-слово», которое запрещало бы обучать ИИ на конкретном контенте. Например, для DevianArt это был тэг «NoAI».

От