DeepSeek Coder

Продукт
Разработчики: DeepSeek
Дата премьеры системы: июнь 2024 г
Отрасли: Информационные технологии
Технологии: Средства разработки приложений

Содержание

2025: Применение злоумышленниками для написания кода с целью атаки через Python Package Index

Группа Supply Chain Security департамента Threat Intelligence экспертного центра Positive Technologies (PT ESC) обнаружила и предотвратила вредоносную кампанию в репозитории пакетов Python Package Index (PyPI). Атака нацелена на разработчиков, ML-специалистов и обычных пользователей, которые хотели бы интегрировать DeepSeek в свои системы. Об этом Positive Technologies сообщили 3 февраля 2025 года. Подробнее здесь.

2024: Анонс продукта

В середине июня 2024 года китайский стартап в области искусственного интеллекта DeepSeek анонсировал DeepSeek Coder V2 — открытую модель для программирования. Утверждается, что она превосходит по производительности такие закрытые аналоги, как GPT-4 Turbo, Claude 3 Opus и Gemini 1.5 Pro.

Первая версия DeepSeek Coder насчитывала 33 млрд параметров, поддерживала 86 языков программирования и имела контекстное окно на 16 тыс. токенов. Модель DeepSeek Coder V2 превосходит решение первого поколения по ключевым характеристикам: она использует 338 языков программирования, а размер контекстного окна увеличен до 128 тыс. токенов.

Скриншот DeepSeek Coder V2

При тестировании в бенчмарках MBPP+, HumanEval и Aider, предназначенных для оценки возможностей больших языковых моделей (LLM) по генерации кода и решению проблем, DeepSeek Coder V2 набрала 76,2, 90,2 и 73,7 балла соответственно, опередив большинство других моделей, включая GPT-4 Turbo, Claude 3 Opus, Gemini 1.5 Pro, Codestral и Llama-3 70B. Высокая производительность также продемонстрирована в тестах, предназначенных для оценки математических возможностей модели (MATH и GSM8K). Единственной моделью, которой удалось превзойти DeepSeek Coder V2, оказалась GPT-4o, получившая более высокие оценки в HumanEval, LiveCode Bench, MATH и GSM8K.В «Т1» — большое укрупнение. TAdviser составил карту активов холдинга 12.7 т

Таких высоких показателей компания DeepSeek смогла добиться благодаря подходу «смесь экспертов» (Mixture of Experts, MoE), который подразумевает, что при отправке запроса запускается только часть общей модели, а не вся. Кроме того, было выполнено дополнительное обучение базовой модели DeepSeek V2 на 6 трлн токенов, включающих программный код и математические данные из GitHub и CommonCrawl. В результате, модель с 16 или 236 млрд параметров может активировать только 2,4 или 21 млрд «экспертных» параметров для эффективного решения поставленной задачи.[1]

Примечания



СМ. ТАКЖЕ (1)


Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Солар (Solar) (47)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (15)
  Форсайт (13)
  Unlimited Production (Анлимитед Продакшен, eXpress) (12)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (11)
  Другие (433)

  Солар (Solar) (6)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  РЖД-Технологии (3)
  Robin (Робин) (3)
  Другие (23)

  Unlimited Production (Анлимитед Продакшен, eXpress) (5)
  Солар (Solar) (4)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2)
  Axiom JDK (Аксиом) (2)
  Наносемантика (Nanosemantics Lab) (1)
  Другие (13)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4)
  Актив (Актив-софт) (2)
  Нота (Холдинг Т1) (2)
  Effective Technologies (Эффектив Технолоджис) (2)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (2)
  Другие (24)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1)
  Уральский центр систем безопасности (УЦСБ) (1)
  Другие (0)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Солар (Solar) (2, 49)
  Microsoft (41, 47)
  Oracle (49, 26)
  Hyperledger (Open Ledger Project) (1, 23)
  IBM (33, 18)
  Другие (666, 359)

  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 6)
  Солар (Solar) (1, 6)
  Мобильные ТелеСистемы (МТС) (1, 4)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 4)
  Форсайт (1, 3)
  Другие (15, 24)

  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 5)
  Солар (Solar) (1, 4)
  Мобильные ТелеСистемы (МТС) (2, 3)
  Axiom JDK (Аксиом) (2, 2)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 2)
  Другие (13, 13)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 4)
  Мобильные ТелеСистемы (МТС) (1, 4)
  Яндекс (Yandex) (1, 3)
  Python Software Foundation (1, 3)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 3)
  Другие (19, 25)

  Уральский центр систем безопасности (УЦСБ) (1, 1)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 1)
  Мобильные ТелеСистемы (МТС) (1, 1)
  Другие (0, 0)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Solar appScreener (ранее Solar inCode) - 49
  Hyperledger Fabric - 23
  Windows Azure - 20
  FIS Platform - 16
  EXpress Защищенный корпоративный мессенджер - 16
  Другие 364

  Solar appScreener (ранее Solar inCode) - 6
  EXpress Защищенный корпоративный мессенджер - 6
  МТС Exolve - 4
  РЖД и Робин: Облачная фабрика программных роботов - 3
  Форсайт. Мобильная платформа (ранее HyperHive) - 3
  Другие 14

  EXpress Защищенный корпоративный мессенджер - 5
  Solar appScreener (ранее Solar inCode) - 4
  МТС Exolve - 2
  Axiom JDK (ранее Liberica JDK до 2022) - 2
  Docker Платформа распределённых приложений - 1
  Другие 13

  МТС Exolve - 4
  Yandex AI Studio - 3
  EXpress Защищенный корпоративный мессенджер - 3
  Python - 3
  Eftech.Factory - 2
  Другие 18

  МТС Exolve - 1
  УЦСБ: Apsafe Облачная платформа для непрерывного анализа защищенности приложений - 1
  Другие 0