Все еще анонимный
В новом техническом документе Apple Machine Learning Research, озаглавленном «Понимание совокупных тенденций в Apple Intelligence с использованием дифференцированной конфиденциальности», Apple изложила новые планы по объединению анализа данных с пользовательскими данными и генерацией синтетических данных для улучшения обучения моделей, лежащих в основе многих функций Apple Intelligence.
Некоторые реальные данные
До сих пор Apple обучала свои модели на основе чисто синтетических данных, которые пытаются имитировать реальные данные, но есть ограничения. Например, в Genmoji использование Apple синтетических данных не всегда указывает на то, как реальные пользователи взаимодействуют с системой. Из статьи:
«Например, понимание того, как работают наши модели, когда пользователь запрашивает Genmoji, содержащие несколько объектов (например, “динозавр в ковбойской шляпе”), помогает нам улучшить ответы на такого рода запросы».
По сути, если пользователь авторизуется, система может опросить устройство, чтобы узнать, просматривало ли оно сегмент данных. Однако ваш телефон не отвечает данными; вместо этого он отправляет обратно зашумленный и анонимный сигнал, которого, по-видимому, достаточно для распознавания модели Apple.
Процесс несколько отличается для моделей, которые работают с более длинными текстами, такими как инструменты для написания текстов и резюме. В этом случае Apple использует синтетические модели, а затем отправляет представление этих синтетических моделей пользователям, которые выбрали data analytics.
Затем на устройстве система выполняет сравнение, которое, по-видимому, сравнивает эти представления с образцами недавних электронных писем.
«Эти наиболее часто выбираемые синтетические вложения затем могут быть использованы для создания обучающих или тестовых данных, или мы можем выполнить дополнительные этапы обработки для дальнейшего уточнения набора данных».
Лучший результат
Это сложный процесс. Однако ключевым моментом является то, что Apple применяет дифференцированную защиту всех пользовательских данных, что представляет собой процесс добавления помех, который не позволяет связать эти данные с реальным пользователем.
Тем не менее, все это не работает, если вы не подключитесь к программе Apple Data Analytics, что обычно происходит при первой настройке вашего iPhone, iPad или MacBook.
Это не подвергает риску ваши данные или конфиденциальность, но такое обучение должно привести к созданию более совершенных моделей и, как мы надеемся, к улучшению работы Apple Intelligence на вашем iPhone и других устройствах Apple.
Это также может означать более разумные изменения и обобщения.