Huawei, OnePlus, Oppo, Vivo, Xiaomi, Бренды

Обучение Apple искусственному интеллекту сталкивается с негативной реакцией, поскольку крупные издатели отказываются от него

Назик Абдрахманов

2 сентября, 2024

Неужели темпы развития искусственного интеллекта Apple вот-вот рухнут? Все большее число новостных агентств и социальных платформ говорят «нет» веб-сканерам технологического гиганта, жаждущим данных.

На протяжении десятилетий эти цифровые боты незаметно собирали информацию из Интернета, передавая ее всем — от поисковых систем до моделей искусственного интеллекта. Но поскольку ИИ стал более мощным, ставки возросли. Теперь издатели проводят черту на песке, требуя контроля над своим контентом и бросая вызов амбициям Apple в области искусственного интеллекта.

Веб-сканер Apple, Applebot, изначально был разработан для поддержки таких функций, как Siri и Spotlight. Однако недавно компания взяла на себя еще одну важную роль: сбор данных для обучения базовым моделям искусственного интеллекта Apple, или тому, что компания называет «Apple Intelligence». Эти данные включают в себя текст, изображения и другой контент.

Чтобы успокоить издателей, Apple представила Applebot-Extended — инструмент, который позволяет владельцам веб-сайтов отказаться от обучения искусственному интеллекту. Итак, хотя такая возможность существует, многие издатели ею пользуются. Обновив файлы robots.txt, они могут заблокировать Applebot (и других сканеров) доступ к их контенту.

Что такое Robots.txt?

Robots.txt — это файл, используемый владельцами веб-сайтов для контроля того, какие боты могут получить доступ к их контенту. Издатели все чаще используют его, чтобы запретить ИИ-ботам очищать их веб-сайты для получения обучающих данных. Это связано с опасениями по поводу авторских прав и потенциального неправомерного использования их контента.

Хотя robots.txt — относительно простой инструмент, в эпоху искусственного интеллекта он стал более сложным. В связи с быстрым появлением новых агентов искусственного интеллекта издателям может быть сложно поддерживать актуальность своих списков блокировки. В результате многие обращаются к сервисам, которые автоматически обновляют файлы robots.txt.

Обратная реакция

Поскольку файлы robots.txt общедоступны, это означает, что каждый может видеть, какие стороны отказываются от обучения Apple в области искусственного интеллекта, что именно и сделал Wired.

Оказывается, некоторые средства массовой информации, такие как The New York Times, например, открыто критиковали подход Apple к отказу от участия. Газета, которая подает в суд на OpenAI за нарушение авторских прав, утверждает, что издателям не следует отказываться от участия с самого начала; вместо этого веб-сканерам необходимо получить разрешение на получение доступа к медиа-контенту.

В число других популярных веб-сайтов, отказавшихся от участия, также входят Instagram, Facebook, Tumblr, Craigslist, The Financial Times, The Atlantic, Vox Media, сеть USA Today и материнская компания WIRED, Condé Nast.

Итак, что дальше? Будет ли Apple вынуждена переосмыслить свою стратегию в области искусственного интеллекта? Или он найдет способ успокоить издателей и продолжить свои амбиции, основанные на данных? Битва за контроль над цифровой золотой жилой Интернета еще далека от завершения.