OpenAI представил веб-краулер в рамках подготовки к выходу GPT-5

Компания OpenAI представила инструмент для поиска информации в Интернете под названием «GPTBot», предназначенный для расширения возможностей будущих моделей GPT.

OpenAI представил веб-краулер в рамках подготовки к выходу GPT-5

По словам представителей компании, данные, собранные с помощью GPTBot, могут повысить точность модели и расширить ее возможности, что станет значительным шагом в развитии языковых моделей на основе ИИ.

Веб-краулеры играют ключевую роль в индексации контента на просторах Интернета. Известные поисковые системы, такие как Google и Bing, полагаются на этих ботов, чтобы наполнить результаты поиска релевантными веб-страницами.

GPTBot от OpenAI будет иметь четкую цель: собирать общедоступные данные, тщательно избегая источников, содержащих платные сайты, сбор персональных данных или контент, противоречащий политике OpenAI.

Владельцы сайтов имеют возможность запретить GPTBot ползать по своим сайтам, просто введя команду «disallow» в стандартный файл сервера. Таким образом, владельцы сайтов получают контроль над тем, какие фрагменты их содержимого доступны для краулера.

Заявление OpenAI последовало сразу за подачей компанией заявки на торговую марку «GPT-5», которая, как ожидается, придет на смену существующей модели GPT-4.

Заявка, поданная в Бюро по патентам и товарным знакам США 18 июля, предусматривает использование «GPT-5» в системах искусственного интеллекта для работы с человеческой речью и текстом, преобразования аудио в текст, распознавания голоса и синтеза речи.

Однако, несмотря на то, что заявка на товарный знак GPT-5 вызвала ажиотаж среди энтузиастов ИИ, генеральный директор OpenAI Сэм Альтман предостерег от преждевременных ожиданий. Альтман сообщил, что компания еще далека от начала обучения GPT-5, поскольку перед началом процесса необходимо провести обширный аудит безопасности.

В последнее время деятельность OpenAI не обходится без споров. Возникли вопросы, связанные с практикой сбора данных, в частности, с вопросами авторского права и согласия.

В июне японский регулятор конфиденциальности выпустил предупреждение в адрес OpenAI по поводу несанкционированного сбора данных. В начале этого года Италия временно запретила использование ChatGPT из-за предполагаемых нарушений законодательства Европейского союза о защите персональных данных.

В настоящее время OpenAI и Microsoft также сталкиваются с коллективным иском, поданным 16 истцами, которые утверждают, что частная информация, полученная в ходе взаимодействия с пользователями ChatGPT, была получена без соответствующего согласия.

Если эти обвинения окажутся правдивыми, OpenAI и Microsoft могут быть признаны нарушителями Закона о компьютерном мошенничестве и злоупотреблениях — юридического прецедента, имеющего отношение к делам о веб-скреппинге.

Поскольку OpenAI продолжает расширять границы технологий искусственного интеллекта, ей необходимо преодолевать эти проблемы, чтобы обеспечить ответственное и этичное развитие искусственного интеллекта.

  • Другие новости