жінка за ноутбуком

Через зростання витрат на ШІ Microsoft, Uber і Nvidia запроваджують обмеження та квоти на використання інструментів

Американські технологічні корпорації зіткнулися з необхідністю термінового перегляду бюджетів через різке зростання операційних витрат на утримання ШІ-агентів. Як повідомляє Axios, одна з найбільших світових компаній витратила 500 мільйонів доларів на використання нейромережі Claude від Anthropic протягом одного місяця. Виявилося, що це сталось через відсутність встановлених лімітів на використання сервісу співробітниками в рамках корпоративної підписки.


Приклади фінансових ризиків

  • Один із клієнтів Google Cloud отримав рахунок на 18 тисяч доларів замість запланованого бюджету в 7 доларів.
  • Створювач проєкту OpenClaw разом із командою з трьох осіб витратив 1,3 мільйона доларів на токени OpenAI API за 30 днів.

Зміни в політиці ІТ-гігантів

На тлі таких фінансових ризиків керівництво ІТ-гігантів починає змінювати внутрішню політику:

  • Microsoft зобов’язала інженерів, які працюють над Windows, Microsoft 365, Outlook і Teams, повністю припинити використання Claude Code і перенести всі проєкти в Microsoft Copilot до кінця червня 2026 року.
  • В Uber технічний директор Правін Неппаллі Нага повідомив про повне вичерпання бюджету на Claude Code, який спочатку був розрахований на весь 2026 рік. З початку року частка інженерів компанії, які використовують цей інструмент, зросла з 32% до 84%. Однак операційний директор Uber Ендрю Макдональд констатував, що нейромережі поки що не приносять очікуваної віддачі, а зростаючі витрати на ШІ-агентів все важче виправдати.
  • У квітні віце-президент Nvidia Брайан Катанзаро підтвердив, що витрати на обчислювальні потужності для нейромереж у його підрозділі вже перевищують витрати на заробітну плату фахівців.

Причини аномального споживання ресурсів

Аналітики пов’язують аномальне споживання ресурсів з:

  • технічними особливостями ШІ-агентів (сучасні агентні системи здатні витрачати в 1000 разів більше токенів, ніж стандартні мовні моделі, завдяки постійній генерації запитів з об’ємним контекстом),
  • людським фактором.

Колишній головний фахівець з ШІ в Microsoft Софія Веластегі зазначила, що співробітники схильні автоматизувати не ті завдання, які комерційно вигідні бізнесу, а ті, які їм особисто неприємно виконувати. Наприклад, були зафіксовані випадки марного витрачання корпоративних токенів, коли інженери використовували нейромережі для запитів про прогноз погоди.

Крім того, генеральний директор Micro1 Алі Ансарі повідомив про поширення практики «токенмаксингу», коли працівники штучно збільшують обсяг використання ШІ для підвищення свого внутрішнього рейтингу. В Amazon це вже призвело до відмови від системи оцінки співробітників на основі активності роботи з нейромережами.


Нові заходи контролю

У відповідь на ці виклики фінансові відділи впроваджують жорсткі протоколи контролю:

  • доступ до ШІ обмежується залежно від ролі співробітника,
  • вводяться квоти на щомісячні витрати,
  • надаються рекомендації щодо повторного використання відповідей.

Зміни на стороні провайдерів

Зміни відбуваються і на стороні провайдерів:

  • Google перейшла на нову систему розрахунку лімітів для Gemini, де вартість залежить від складності завдання та тривалості діалогу.
  • Це вже призвело до випадків, коли один запит на генерацію відео повністю вичерпував п’ятигодинний ліміт платної підписки Google AI Pro.