Atlassian вводит сбор метаданных клиентов для ИИ с 17 августа
Начиная с августа текущего года Atlassian запускает процесс сбора данных своих клиентов для обучения собственных моделей искусственного интеллекта. Под действие новых правил подпадают 300 тысяч пользователей облачных продуктов компании, включая Jira и Confluence. По замыслу разработчиков, использование этих массивов данных позволит ИИ точнее интерпретировать запросы, эффективнее классифицировать контент и оптимизировать агентские рабочие процессы.
Классификация собираемых данных
Компания намерена извлекать из пользовательского контента два типа данных: метаданные и внутрисервисную информацию. В категорию метаданных входят показатели читабельности и сложности документов в Confluence, семантическая близость страниц, а также рабочие метрики: стори-пойнты задач в Jira, даты завершения спринтов и параметры SLA в Jira Service Management. Иными словами, это статистика, описывающая структуру и жизненный цикл задач.
Внутрисервисные данные (in-app data) представляют собой непосредственно пользовательский контент: заголовки и текст страниц Confluence, описания и комментарии к тикетам в Jira, а также кастомные названия статусов, рабочих процессов и даже собственные названия эмодзи. Такие данные компания планирует использовать для «обучения» нейросетей паттернам успешного выполнения многоэтапных задач.
Ограничения и условия отказа
Для пользователей планов Free, Standard и Premium сбор метаданных является обязательным — возможность отказаться от этого не предусмотрена. Представители Atlassian заявляют, что перед попаданием в обучающую выборку информация проходит деидентификацию: из нее удаляются сведения, прямо указывающие на конкретных лиц, например, имена и адреса электронной почты. Срок хранения таких агрегированных данных составляет до семи лет. Позиция компании заключается в том, что длительный период накопления позволяет выявлять долгосрочные тренды и поведенческие закономерности для улучшения пользовательского опыта.
С внутрисервисными данными ситуация иная: пользователи планов Free и Standard могут отказаться от их сбора, хотя по умолчанию эта опция включена. Для владельцев тарифов Premium и Enterprise, напротив, предусмотрен «opt-out» по умолчанию — их данные не будут использоваться, пока они сами явно не активируют соответствующую настройку. Если коротко, то «порог входа» в программу сбора данных зависит от уровня подписки и типа информации.
Исключения из правил
Ряд категорий клиентов полностью выведен из-под действия новых правил «вклада в данные» (data contribution). Это касается пользователей Atlassian Government Cloud, Atlassian Isolated Cloud, а также тех, кто использует собственные ключи шифрования (BYOK). Кроме того, от сбора данных освобождаются компании, чья деятельность регулируется нормами HIPAA, и некоторые государственные или финансовые организации, где действуют жесткие требования к безопасности данных.
Регламент вступления в силу
Обновленные условия сбора данных вступят в силу 17 августа. Для тех, кто решит выйти из программы или прекратить использование продуктов Atlassian, предусмотрен регламент удаления информации: соответствующие данные должны быть исключены из наборов для обучения в течение 30 дней, а переобучение моделей, которые были построены на базе этих данных, должно завершиться в течение 90 дней. Важно учитывать, что до 17 августа 2026 года при расторжении текущего контракта новые настройки сбора данных применяться не будут.