DeepSeek周一更新了一个实际性的东说念主工智能模子,并称之为迈向新一代架构的中间体式。
DeekSeek在Hugging Face上发布帖子,玄虚了DeepSeek-V3.1-Exp平台,并证传说该平台引入一种名为DeepSeek Sparse Attention的“稀少细心力机制”,该公司还默示正在与芯片制造商衔尾开荒该模子。
本年早些本领,DeepSeek的R1模子以其精妙的算法惊骇硅谷,如今该公司正勉力于开荒新址品。最新版块在V3.1的基础上,引入旨在探索和优化东说念主工智能进修和启动的机制。该公司清楚,此举的标的是对长文本的进修和推理成果进行探索性的优化和考证。
与其他AI初创公司同样,DeepSeek也试图通过降价来吸援用户。该公司称,将把开荒者调用DeepSeek API的资本缩小50%以上。
包袱裁剪:李桐