Вчені з Каліфорнійського університету в Берклі, Стенфордського університету та Університету Карнегі-Меллона розробили універсальну модель Octo для управління роботами-маніпуляторами.
На відміну від мовних моделей, подібних до ChatGPT, хороших універсальних моделей для робототехніки поки що немає. Octo дає змогу роботам виконувати широкий спектр завдань, наприклад, піднімати предмети, закривати шухляди або витирати столи.
Модель заснована на тому ж типі нейронних мереж, що і ChatGPT, – трансформаторах. Її головна відмінність – масштаб даних для навчання і гнучкість. Її навчали на найбільшому наборі траєкторій маніпуляцій роботів із відкритого набору даних Open X-Embodiment.
Дослідники перевірили Octo на дев’яти різних роботах, розроблених у їхніх університетах. Модель успішно керувала роботами, дозволяючи їм виконувати різні завдання, навіть якщо під час навчання вона не бачила даних із сенсорів цих роботів.