SUMMER STYLE
-
Телевизор Samsung QE55Q70CAU 96,057.00 Br
-
Телевизор Asano 24LH7011T 10,323.00 Br
-
Телевизор TCL 43P7K 36,012.00 Br
-
Телевизор LG 65UT80006LA 69,502.00 Br
Китайский ИИ-стартап Moonshot AI, создавший популярного чат-бота Kimi, на этой неделе представил большую языковую модель с открытым исходным кодом Kimi K2. Она бросает вызов передовым аналогам от OpenAI и Anthropic, обеспечивая особенно высокий уровень производительности в сфере написания программного кода и выполнении задач автономных ИИ-агентов.
Языковая модель Kimi K2 с 1 трлн параметров, из которых 32 млрд активные, построена на основе подхода «смесь экспертов» (Mixture of Experts). Это означает, что при обработке запроса запускается только часть общей модели, за счёт чего повышается скорость работы и эффективность алгоритма. Стартап выпустил сразу две версии ИИ-модели: базовый вариант для исследователей и разработчиков, а также версию Kimi K2-Instruct с возможностью настройки, оптимизированную для чат-ботов и автономных агентов.
Отличительной особенностью новой модели является её оптимизация под возможности ИИ-агентов: способность автономно использовать инструменты, писать и выполнять программный код, а также выполнять сложные многоэтапные задачи без вмешательства человека. В ходе контрольных тестов Kimi K2 достиг точности 65,8 % в тесте разработки программного обеспечения SWE-bench Verified. Это лучше результата большинства альтернатив с открытым исходным кодом и сопоставимо с показателями проприетарных моделей.
Показатели производительности Kimi K2 указывают на то, что руководству OpenAI и Anthropic следует обратить внимание на этот алгоритм. Дело в том, что Kimi K2-Instruct не просто конкурирует с ИИ-моделями крупных компаний, но и систематически превосходит их в решении задач, которые имеют важное значение для корпоративных клиентов.
В одном из наиболее актуальных тестов на написание программного кода LiveCodeBench алгоритм Kimi K2 достиг точности 53,7 %, что значительно лучше результатов DeepSeek–V3 (46,9 %) и GPT-4.1 (44,7 %). Что ещё более впечатляет, так это результат в тесте MATH-500, где Kimi K2 набрал 97,4 %, а GPT-4.1 только 92,4 %. Это может указывать на то, что Moonshot AI сделала фундаментальное открытие в математических рассуждениях, которое ускользнуло от более крупных и хорошо финансируемых конкурентов.
Стоит учесть, что Moonshot добивается столь впечатляющих результатов, имея в активе значительно меньше ресурсов и средств, чем есть у крупных компаний. К примеру, OpenAI тратит сотни миллионов долларов на то, чтобы постепенно улучшать свои ИИ-модели. Похоже, что Moonshot удалось найти более эффективный подход для достижения аналогичного результата. Последствия этого могут выйти далеко за рамки простого хвастовства. Корпоративные заказчики давно ждут появления ИИ-систем, которые действительно могли бы выполнять сложные рабочие задачи, а не просто создавать яркие демонстрации. Результаты тестирования Kimi K2 говорят о том, что добиться этого, вероятно, удастся уже скоро.
В технической документации Moonshot есть деталь, которая может оказаться более важной, чем результаты тестирования нового алгоритма. Речь идёт об оптимизаторе MuonClip, который позволил осуществить процесс обучения ИИ-модели с триллионом параметров без каких-либо сбоев.
Это не просто инженерное достижение, а, возможно, сдвиг парадигмы. Нестабильность обучения стала скрытым препятствием при разработке больших языковых моделей. Компании вынуждены проводить дорогостоящее дообучение, внедрять меры безопасности и мириться с неоптимальной производительностью, чтобы сделать процесс обучения стабильнее.
Экономические последствия могут быть не менее впечатляющими. Если MuonClip окажется универсальным, то используемый компанией метод обучения ИИ-моделей может значительно сократить затраты на вычислительные мощности. В отрасли, где затраты на обучение измеряются десятками миллионов долларов, даже незначительный прирост эффективности может дать необходимые конкурентные преимущества.
Стоит отметить, что решение Moonshot сделать исходный код Kimi K2 открытым и параллельно с этим предоставлять доступ к API алгоритма по конкурентоспособной цене демонстрирует глубокое понимание динамики рынка. Тариф Moonshot с оплатой в $0,15 за миллион вводимых токенов и $2,50 за миллион генерируемых токенов значительно ниже, чем у OpenAI и Anthropic. При этом ИИ-модель китайского стартапа предлагает сопоставимую, а в ряде случаев и превосходящую производительность. Важным стратегическим шагом является двойная доступность: корпоративные клиенты могут задействовать API для немедленного развёртывания сервиса, а уже после этого перейти на автономные алгоритмы для оптимизации затрат или повышения уровня соответствия требованиям.
Это может создать проблемы для крупных ИИ-компаний. Если они будут соответствовать тарифам Moonshot, то снизится их прибыль. Если же они не сделают этого, то будут рисковать потерять клиентов, которые захотят перейти на использование более дешёвой ИИ-модели, сравнимой по производительности. В данном случае статус модели с открытым кодом не является чем-то вроде благотворительности, это осознанный шаг для привлечения клиентов. Каждый разработчик, который скачает Kimi K2 и будет экспериментировать с алгоритмом, становится потенциальным корпоративным клиентом Moonshot. В это же время, каждое внесённое сообществом улучшение снижает затраты компании на разработку.
Демонстрации Moonshot показывают, что искусственный интеллект постепенно становится более полезным. К примеру, при анализе заработной платы Kimi K2 не просто отвечал на вопросы о данных, а автономно выполнял 16 операций для проведения статистического анализа и генерации интерактивной визуализации. Демонстрация с планированием концертов в Лондоне потребовала использования 17 инструментов на разных платформах — поиск, календарь, электронная почта, авиабилеты, бронирование жилья и ресторанов. Причём это были не подготовленные менеджерами презентации, а реальные демонстрации того, как искусственный интеллект выполняет сложные многоступенчатые задачи автономно.
Это отличается от того, как работают нынешние ИИ-помощники, которые преуспевают в разговорах, но испытывают трудности при выполнении задач. В то время как конкуренты работают над тем, чтобы сделать речь своих чат-ботов более похожей на человеческую, Moonshot уделяет приоритетное внимание тому, чтобы делать алгоритмы более полезными. Это важно, поскольку предприятиям нужен не ИИ, способный пройти тест Тьюринга, а ИИ, способный эффективно выполнять производственные задачи.
Настоящий прорыв заключается не в какой-то единой возможности, а в слаженной работе множества инструментов и сервисов. Предыдущие варианты ИИ-агентов требовали тщательной проработки, планирования рабочего процесса и постоянного контроля со стороны человека. Похоже, что Kimi K2 способен автономно справляться с когнитивными нагрузками, связанными с дроблением задач, выбором инструментов для их решения и исправлением ошибок.
В отличие от предыдущих «убийц GPT», которые преуспели в узких областях, но не имели вариантов практического применения, Kimi K2 демонстрирует высокую компетентность в широком спектре задач. Алгоритм может писать программный код, решать математические задачи, использовать различные инструменты и выполнять сложные рабочие задачи. В это же время алгоритм доступен для модификации и экспериментов, за счёт чего его развитие может проходить быстрее.