Розробники Google представили фреймворк SEED RL, що дозволяє скоротити витрати на навчання ШІ хмарним розподілом на тисячі віддалених машин, пише Hightech +.
Це відкриє доступ початківцям стартапам до складних і дорогих технологій машинного навчання, які колись були по доступні тільки великим компаніям і лабораторіям. Так, за даними дослідження Університету Вашингтона за 2019 рік, два тижні навчання ШІ коштують в середньому 25 тисяч доларів.
Елемент навчання SEED RL масштабується на тисячі ядер, а число агентів – на тисячі машин. Алгоритм V-trace передпачає розподіл дій, а R2D2 – вибирає дію на основі його передбаченої цінності.
Для оцінки SEED RL розробники використовували кілька популярних варіантів: середу Arcade Learning Environment, системи DeepMind Lab і Google Research Football. Їм вдалося вирішити раніше невирішену задачу Google Research Football і домогтися 2,4 млн кадрів в секунду з 64 ядрами Cloud TPU. Це новий рекорд в порівнянні з минулим досягненням розподіленого агента.
Результати SEED RL показують значне прискорення навчання, а оскільки цей підхід значно дешевше, ніж використання графічних процесорів, то і вартість експериментів істотно знижується. Автори дослідження вважають, що завдяки SEED RL навчання з підкріпленням отримало можливість використовувати потенціал акселераторів нарівні з іншими методами глибокого навчання.
Фото: Reuters