То, что некоторые считают цифровой библиотекой Александрии, находится под угрозой потери ценных свитков. Крупные средства массовой информации блокируют возможность сохранения веб-страниц с помощью Wayback Machine Интернет-архива, чтобы не дать гигантам искусственного интеллекта обучать модели на основе снимков старых статей.
Технологические компании могут обойти законы об авторском праве, используя Wayback Machine в качестве обходного пути для обучения языковым моделям своего контента (включая, возможно, рецепты). Марк Грэм, директор Wayback Machine, подчеркивает, что цифровой архив имеет средства контроля, позволяющие ограничить злоупотребление автоматизацией ИИ и предотвратить крупномасштабное извлечение данных.
Издатели могут архивировать свои материалы, но третья сторона хранит более достоверную версию историй, которая может привлечь средства массовой информации к ответственности, когда она будет проверена после публикации.
Ничего нового: в прошлом году Reddit запретил Wayback Machine добывать данные из-за аналогичных опасений по поводу искусственного интеллекта. Архив также потерял много информации, когда сайты федерального правительства были закрыты.
Все еще работает: сообщается, что Грэм ведет переговоры о восстановлении доступа к материалам, а более 100 работников СМИ подписали письмо в поддержку Wayback. — DL
Этот отчет был первоначально опубликован Morning Brew.
В 2001 году Fortune впервые созвала «Самых умных людей, которых мы знаем», объединив генеральных директоров и основателей, строителей и инвесторов, мыслителей и предпринимателей. С тех пор Fortune Brainstorm Tech стала местом, где сталкиваются смелые идеи. С 8 по 10 июня мы вернемся в Аспен, где все началось, чтобы отметить 25-летие Brainstorm. Зарегистрируйтесь сейчас.

