DeepSeek 发布了推理模型 R1-Lite-Preview

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 468 天前的主题，其中的信息可能已经有所发展或是发生改变。

看 V2 好像没人提发一下这个新闻 https://api-docs.deepseek.com/zh-cn/news/news1120

使用： https://chat.deepseek.com/

省流：

类似 o1-mini 的模型，能输出思考过程并反复推理，官方给出的 benchmark 在部分领域打败了 o1-preview
目前每天可用 50 次据称未来会完整开源基座模型 R1
实际体验目前不支持上传文件解析，感觉下来确实是聪明了一些不过 token 消耗也很恐怖：比较一下 1.11 和 1.8 数字大小那个思维过程就要写篇小作文。个人认为完整模型如果开源的话，确实会成为 LLM 的搅局者，想起来上半年李彦宏说开源模型会越来越落后有点贻笑大方了。

DeepSeek

R1-Lite-Preview

开源

6 条回复 • 2024-11-22 12:39:02 +08:00

cat9life

2024 年 11 月 21 日

看起来很有意思，支持 api 了吗

zhmouV2

2024 年 11 月 21 日

@cat9life #1 目前还不支持

cookii

2024 年 11 月 21 日 via Android

支持 deepseek ，国产里面算好用的

PositionZero

2024 年 11 月 21 日

过度思考太严重了，问了一道数学题思考五分钟，花了 15000 tokens ，同样问题 gpt-4o 不思考也能做对。不过确实很厉害，不知道 kimi 的 k0-math 什么水平

A1st0n

2024 年 11 月 22 日

感觉 deepseek 在代码问答还不是如 ChatGPT 免费版

linglingfa

2024 年 11 月 22 日

国内的诸多模型我也都一直在尝试和测试。

应该来说，Deepseek 算是代码能力相对比较优秀的一款国产大模型。

不方便注册 openai 或者 claude 的朋友，也可以考虑让 deepseek 来帮你。

当然，缺点也有，就是 deepseek 出代码的速度相对较慢。

有时候写的代码行数(字数) 一多的话，就看着 deepseek 一个字母一个字母的给你输出，那种感觉真酸爽。特别是当你习惯了 ChatGPT 和 claude 的代码输出之后。