Директор з продукту Meta Кріс Кокс зізнався, що компанія використовує призначений для користувача контент соцмереж для навчання своїх ШІ-моделей.
Кокс уточнив, що для навчання генератора зображень за текстовими запитами використовують загальнодоступні фотографії та текст з Instagram і Facebook.
“Ми не тренуємося на особистих даних, ми не тренуємося на даних, якими люди діляться зі своїми друзями, ми тренуємося на публічних даних”, – заявив він.
Раніше Meta розглядала можливість купівлі видавництва Simon & Schuster, щоб отримати більше даних для навчання ШІ. Інші розробники також перебувають у пошуках якісних датасетів. Наприклад, OpenAI уклала угоди про співпрацю з кількома ЗМІ, щоб ліцензувати їхній контент для розробки ШІ-моделей.