Ілон Маск, який стояв біля витоків стартапу OpenAI, заявив, що фахівці в галузі штучного інтелекту зіткнулися з новими складнощами. За його словами, у світі закінчилися дані для навчання нейромереж, причому сталося це ще минулого року.
За оцінкою Маска, вирішити цю проблему можуть тільки синтетичні дані – особливий тип інформації, яку ШІ генерує самостійно в процесі свого навчання. Мільярдер зазначив, що з їхньою допомогою нейромережі зможуть “самі оцінювати себе і проходити цей процес самонавчання”.
Проблема браку даних для навчання ШІ обговорюється не вперше. Колишній головний науковий співробітник OpenAI Ілля Суцкевер теж вважає, що майбутнє – за синтетичними даними. Він передбачив, що на відміну від нинішнього ШІ, який часто зіставляє шаблони на основі того, що модель бачила раніше, майбутні системи ШІ зможуть розв’язати проблеми крок за кроком у спосіб, що нагадує процес мислення.
При цьому техногіганти, серед яких є OpenAI й Microsoft, вже активно використовують синтетичні дані, щоб навчати свої флагманські моделі. За оцінками аналітиків Gartner, 60% даних, що використовуються в цьому напрямку, спеціально згенерували. При цьому є ризики, що ШІ-моделі через такий підхід можуть стати більш упередженими й обмеженими, оскільки спеціально створений для навчання контент неминуче базується на вже наявних матеріалах.