Deepseek-Coder-V2 —— 与 GPT 4o 同级别的开源编程大模型

This topic created in 691 days ago, the information mentioned may be changed or developed.

发布了好几天 V2 上竟然没有讨论贴，来发一把，这是个好模型。

重点：

236B MoE ，激活参数约 33B 。
在各编码基准测试中与 GPT 4o 水平相当或更高（包括非常新的、难以污染的基准测试）。
官网 API 价格：1 元 / 百万输入 Tokens ； 2 元 / 百万输出 Tokens ，非常廉价。
除了编码，其他逻辑能力也很强。
开放权重，允许商业用途

体验： https://chat.deepseek.com/ （左侧代码助手）
GitHub： https://github.com/deepseek-ai/DeepSeek-Coder-V2
技术报告： https://github.com/deepseek-ai/DeepSeek-Coder-V2/blob/main/paper.pdf
权重： https://huggingface.co/deepseek-ai/DeepSeek-Coder-V2-Instruct

除了 236B 的完全体还有一个 Lite 版，16B 参数，大约激活 2B ，支持代码补全等，挺适合个人电脑跑： https://huggingface.co/deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct

Deepseek-Coder-V2

GPT-4o

开源

12 replies • 2025-02-10 18:40:28 +08:00

yinmin

Jun 22, 2024 via iPhone

deepseek coder v2 在计算机领域的确很强，和 gpt4 有一拼，而且 api 价格超级便宜

nomagick

Jun 22, 2024

80G*8 required....

cJ8SxGOWRH0LSelC

Jun 22, 2024

确实不错，问了几个 quarkus native 编译的问题，都回答正确了。

Tink

PRO

Jun 22, 2024

用的逆向的，确实牛逼

crackidz

Jun 22, 2024

当然是在偷偷的用啊...DeepSeek Coder 刚出来的时候就挺惊艳的

hljhbing

Jun 22, 2024

我是怎么把 Deepseek-Coder-V2 看成 Docker-Compose-V2 的😰

Vitta

Jun 22, 2024

Here, we provide some examples of how to use DeepSeek-Coder-V2-Lite model. If you want to utilize DeepSeek-Coder-V2 in BF16 format for inference, 80GB*8 GPUs are required.

XMV2e4PmK5F85h17

Jun 22, 2024 via iPhone

为啥不用免费的 4O

viWww0vvxmolvY5p

Jun 22, 2024

API 还没有开放。

viWww0vvxmolvY5p

Jun 22, 2024

@mway deepseek-chat 和 deepseek-coder 后端模型已更新为 DeepSeek-V2 和 DeepSeek-Coder-V2 ，无需修改模型名称即可访问。
原来是这样

adrianzhang

Jun 22, 2024

我用 AnythingLLM ，使用其他模型都可以，就是这两个报错，报 llama 内核崩溃。
你知道该怎么用吗？ Ollama 装在一个台式机上，配 3060 12G 显卡，128GB 内存。

tycholiu

Feb 10, 2025

国内提供 API 的这家不错 https://ppinfra.com ，性价比也高。点我的链接 https://ppinfra.com/user/register?invited_by=P0KD6O 注册，我们双方都能拿到赠送的 5000 万 Token 使用量。