Китайська DeepSeek випускає нову ШІ-модель V4 на тлі прискорення гонки ШІ

Назар

3 місяці ago

Китайська компанія в галузі штучного інтелекту DeepSeek представила попередню версію своєї нової великої мовної моделі V4, оскільки світова гонка у сфері ШІ набирає обертів. Минулого року DeepSeek стала однією з найпильніше відстежуваних компаній у галузі ШІ після того, як у січні 2025 року випустила моделі, які, за всім виглядом, забезпечували високу продуктивність за нижчих витрат, ніж багато американських конкурентів, передає euronews.com.

Стартап з Ханчжоу випустив модель у двох варіантах: DeepSeek V4-Pro та DeepSeek V4-Flash. V4-Pro — більша модель, розрахована на більш вимогливі завдання, тоді як V4-Flash — полегшена версія, розроблена для швидшої реакції та зниження витрат на її роботу.

«У тестах на знання про світ DeepSeek V4-Pro суттєво випереджає інші відкриті моделі та лише трохи поступається топовій закритій моделі Gemini-3.1-Pro», — заявили в DeepSeek.

У компанії повідомили, що нова модель ШІ підтримує **«контекст довжиною в один мільйон токенів»*, тобто здатна сприймати набагато об’ємніші запити — наприклад, довгі документи або код — перед тим, як сформувати відповідь.

У сфері ШІ «довжина контексту» означає обсяг тексту, вимірюваний у токенах, який модель може враховувати за один раз. Ширше вікно контексту дозволяє моделі обробляти довші запити та включати більше інформації в кожну відповідь, пояснюють в IBM.

«Ласкаво просимо в епоху економічного контексту на 1 мільйон токенів», — заявили в компанії в анонсі на платформі відкритого ШІ Hugging Face.

У DeepSeek додали, що V4 забезпечує «світовий рівень при роботі з довгим контекстом за різко знижених витрат на обчислення та пам’ять».

Компанія порівняла V4-Pro з конкуруючими моделями OpenAI, Anthropic та Google, хоча в ряді тестів вищі результати показала Gemini-3.1-Pro від Google.

Нову модель можна використовувати з популярними ШІ-агентами, такими як Claude Code, OpenClaw та OpenCode, що дозволяє розробникам застосовувати її для завдань з розробки програмного забезпечення поза фірмовим чат-ботом DeepSeek.

Відома більш відкритим підходом порівняно з конкурентами, які використовують закриті моделі ШІ, DeepSeek також виклала V4 на Hugging Face — модель можна вільно завантажувати, тестувати та адаптувати.

Китайський стартап привернув увагу наприкінці 2024 року завдяки своїй відкритій моделі V3, яка здивувала галузь ШІ високою продуктивністю за нижчої вартості та роботою на менш потужних чіпах, ніж у багатьох американських конкурентів, включаючи OpenAI та Google.

Глобальна гонка ШІ

Компанія привернула увагу в усьому світі в січні 2025 року, коли випустила R1 — модель ШІ для логічних міркувань, яка, за її твердженням, була дешевшою та не поступалася за якістю великим мовним моделям ChatGPT від конкуруючої OpenAI.

Однак у низці країн минулого року державним установам заборонено користуватися DeepSeek, серед них Італія, США та Південна Корея, посилаючись на міркування національної безпеки.

У 2025 році Німеччина також заборонила DeepSeek в магазинах додатків Apple та Google, вказавши на незаконну передачу даних користувачів до Китаю.

Вихід V4 відбувся через день після того, як американський гігант ШІ OpenAI представив свою найновішу модель GPT-5.5, яку назвав «найрозумнішою та найінтуїтивнішою» на сьогодні.

Випуск також відбувся через день після того, як Білий дім звинуватив Китай у крадіжці інтелектуальної власності американських лабораторій ШІ в промислових масштабах за допомогою тисяч підставних акаунтів.

OpenAI, Anthropic та Google попередили цього року, що китайські компанії в галузі ШІ, включаючи DeepSeek, здійснюють атаки з вилучення моделей (model extraction attacks, MEA), інакше звані «дистиляцією».

Цей метод передбачає, що більшій моделі задають тисячі питань, збирають її відповіді та використовують їх, щоб навчити нову, компактнішу модель «думати» аналогічним чином.