Топ Гик

У пошуках «золотого датасету»: OpenAI збирає реальні робочі завдання для тренування майбутніх ІІ-агентів

OpenAI звертається до сторонніх підрядників із проханням завантажувати реальні робочі завдання та файли з поточних або попередніх місць роботи. Ці матеріали планують використовувати для оцінки ефективності моделей наступного покоління. Про це свідчать документи OpenAI та компанії Handshake AI, що працює з навчальними даними, з якими ознайомилося видання Wired.

Ініціатива є частиною ширшої стратегії зі створення так званої «людської бази» — еталонного рівня виконання завдань людьми, з яким порівнюватимуть результати ІІ-моделей. У вересні OpenAI запустила новий процес оцінювання, що дозволяє напряму зіставляти роботу штучного інтелекту з діяльністю професіоналів у різних галузях.

У компанії зазначають, що такий підхід є одним із ключових показників прогресу на шляху до AGI — системи штучного інтелекту, здатної перевершувати людину в більшості економічно значущих завдань.

«Ми залучили фахівців із різних професій, щоб зібрати реальні робочі завдання, змодельовані на основі того, чим люди займалися у своїй повсякденній роботі. Це дозволяє оцінити, наскільки добре ІІ-моделі справляються з подібними задачами», — йдеться в одному з внутрішніх документів OpenAI.

Підрядникам пропонують брати фрагменти тривалої або складної роботи, виконаної в межах професійної діяльності, і перетворювати їх на окремі завдання. Кожен приклад має містити конкретний результат, а не опис: це може бути документ Word або PDF, презентація PowerPoint, таблиця Excel, зображення чи навіть репозиторій коду.

Водночас OpenAI допускає використання вигаданих прикладів, спеціально створених для демонстрації того, як людина могла б діяти в певній ситуації. Такий підхід дозволяє моделювати сценарії, які складно або неможливо отримати з реальних даних.

OpenAI та Handshake AI відмовилися коментувати деталі проєкту.

Опубліковані матеріали дають уявлення про одну зі стратегій, за допомогою яких провідні ІІ-лабораторії готують свої моделі до роботи в реальному середовищі. OpenAI, Anthropic і Google активно залучають велику кількість підрядників для створення якісних навчальних даних, на яких і базується розвиток ІІ-агентів, здатних автоматизувати корпоративні та професійні процеси.

Exit mobile version