DeepSeek идет дальше «открытых весов»: компания готовится опубликовать исходный код своей ИИ-модели

DeepSeek идет дальше «открытых весов»: компания готовится опубликовать исходный код своей ИИ-модели

Китайская компания DeepSeek, которая в прошлом месяце удивила мир ИИ выпуском своей модели под лицензией MIT, готовит новый прорыв в области открытости. Начиная со следующей недели, компания планирует выпустить 5 репозиториев с исходным кодом в рамках своей инициативы «Open Source Week».

В отличие от OpenAI, чья модель ChatGPT остается полностью закрытой, DeepSeek делает ставку на прозрачность. Ранее компания уже предоставила доступ к «открытым весам» — данным о связях между миллиардами симулированных нейронов модели, что позволяет разработчикам точно настраивать параметры под свои задачи.

Важно отметить, что для получения статуса действительно открытого ИИ по определению Open Source Institute (OSI) от 2024 года, необходимо раскрыть не только веса модели, но и код для ее обучения, а также достаточно подробную информацию о тренировочных данных.

Интересно, что конкуренты тоже движутся в сторону открытости: xAI Илона Маска выпустила открытый код Grok 1 в марте и обещает открыть Grok 2 в ближайшие недели. Однако Grok 3 останется проприетарным и доступным только для подписчиков X Premium.

Источник новости и обложки: arstechnica.com