В конце декабря DeepSeek запустила бесплатную многоязычную модель с открытым исходным кодом, заявив, что она была разработана всего за два месяца и обошлась менее чем в 6 миллионов долларов - это гораздо меньшие затраты, чем те, которые требуют западные аналоги. На прошлой неделе компания выпустила логическую модель, которая, как сообщается, также превзошла последнюю версию OpenAI во многих сторонних тестах.
На прошлой неделе DeepSeek выпустила модель рассуждений, которая, как сообщается, превзошла последнюю модель OpenAI во многих сторонних тестах.
Эти события вызвали вопросы о суммах, которые крупные технологические компании инвестируют в модели искусственного интеллекта и центры обработки данных.
«DeepSeek явно не имеет доступа к таким вычислительным мощностям, как американские гиперскейлеры, и каким-то образом смог разработать модель, которая выглядит весьма конкурентоспособной», — отметил Шрини Паджури, аналитик по полупроводникам в Raymond James.
Паджури также отметил, что одним из положительных последствий является то, что DeepSeek может привлечь ещё больше внимания со стороны американских гиперскейлеров, которые являются крупными игроками в сфере вычислительной инфраструктуры, такими как Amazon и Microsoft. Эти компании могут использовать своё преимущество в доступе к графическим процессорам (GPU), чтобы выделиться среди более дешёвых вариантов. GPU являются ключевой частью инфраструктуры, необходимой для обучения огромных моделей искусственного интеллекта. Nvidia является лидером на рынке графических процессоров.