houshuu 最近的时间轴更新
houshuu
ONLINE

houshuu

V2EX 第 91590 号会员,加入于 2015-01-13 17:17:38 +08:00
今日活跃度排名 6821
5 G 28 S 69 B
全栈工程师

日常工作技术栈: Go, Lua, React, Svelte, Java, Kotlin, Python, Rust
机器学习相关: NumPy, Pandas, SciPy, PyTorch, Jax, DGL, LightGBM, XGBoost

偶尔用用: C/C++, Swift, Vue
DeepSeek V3
Local LLM  •  houshuu  •  18 天前  •  最后回复来自 houshuu
22
Neovim 中如何配置 TypeScript 支持?
Vim  •  houshuu  •  2023-08-18 23:33:53 PM  •  最后回复来自 houshuu
10
🌈 缝合了一个新的 Gruvbox 的 Starship 主题
  •  1   
    分享创造  •  houshuu  •  2023-08-19 23:10:58 PM  •  最后回复来自 yellooow
    8
    Arc 没有书签实在是过于硬伤了
    Arc  •  houshuu  •  2023-12-13 15:39:00 PM  •  最后回复来自 gefangshuai
    6
    找一个机器学习工程师帮忙实现模型
    外包  •  houshuu  •  2020-08-12 11:29:50 AM
    3.20 求印度车
    无要点  •  houshuu  •  2020-03-20 02:25:55 AM
    1Password 免费上车
  •  4   
    无要点  •  houshuu  •  2018-11-22 16:11:58 PM  •  最后回复来自 qinshu
    162
    houshuu 最近回复了
    15 小时 55 分钟前
    回复了 ysy950803 创建的主题 OpenAI 如果两个模型互相蒸馏,最终是什么结果?
    模型的结构是可以做成不同大小,不同结构的,所以在不同项目上的表现也大概率有差异。训练时本身的随机性也会导致不同初始状态的网络产生差异,那么相互学习就能够从其余网络中把这些优秀的特性汇集过来。蒸馏不是抄作业答案而是把目标模型当作老师学习,逐渐让自己能够达到老师水平的感觉。是可以用算法设计把不如自己的部分无视掉的,相互学习相当于好几个学生互相切磋琢磨的过程,理论上是能提高的,大概 5 年前这个概念也是相当火爆
    开的工资比刚毕业的大学生都低,还要有三年经验。
    体感这种岗位至少 700 万,有点带团队经验的少说 850 起
    1 天前
    回复了 abcfreedom 创建的主题 生活 海底捞员工间会互相说“辛苦了”
    在日本职场常年习惯了这种招呼,有一说一就算是形式上的东西有时候潜移默化的,是有点安慰人的作用的。
    就和早上和邻居打打招呼一样的,给人一种群居感。
    6 天前
    回复了 ne6rd 创建的主题 职场话题 中年想去日本,求指点迷津
    在日本 10 来年了,见过的日企技术岗位 1000 万+的说实话极少数(<10%),大部分人能到个 700w 就算不错了,工作时间长点的到个 800-900w 。要么就是做管理岗位空间大不少。主要是 IT 和国内的地位不太一样,不算是高薪行业,还是金融房地产大商社比较赚。

    体感税前收入:400w-600w 新卒开发 600w-900w 普通开发 900w-1200w Manager 1000w-2000w 开发部长
    和国内差不多,薪资范围 A ~ B 你默认是 A 就行了
    直接请了 6 个工作日假
    9 天前
    回复了 Suger828 创建的主题 程序员 如何进行大模型知识蒸馏
    很多年没干蒸馏了,不知道现在还是不是这样。
    软目标的设置终究是为了更多的得到当前概率分布和目标概率分布的差值,那么在这个基础上如果能有另外手段来计算两个回答间的散度即可,不需要一定要有个确定的目标。
    机器学习手法有很多假设性的东西,设定一个公式自圆其说很多时候就行了。比如我直觉上第一个想到的,用另外一个模型把学生信号和教师信号语义分别分解到另外一个统一空间内,然后算下距离啥的。
    蒸馏也算个老东西了,llm 蒸馏可能搞不来但其他视觉模型啥的以前个人都是可以搞的
    10 天前
    回复了 Rust2015 创建的主题 前端开发 webstorm 和 vscode,你选哪个:
    vscode 下面一堆测试相关的插件都是疏于维护的状态,之前记得用 vitest 插件都无法点击运行按钮单独执行单元测试。vue 插件也经常更新出很奇怪的卡顿问题。私下用用还行,公司业务代码用 vscode 很给自己找罪受。
    相比之下,neovim 和 webstorm 至少商业代码必要侧身环节的支持没啥问题,也够快。vscode 的 lsp 基本都有其他编辑器的完整移植,就算是前端开发体验现在其实优势很小了。
    webstorm 我记得还有自己独有的 parser ,有些时候 lsp 解析不出来,webstorm 内置的解析却能正确找到 symbol 。
    最后最重要的是 refactoring 的体验,只要是重构项目,我基本只用 jetbrains 系。多文件的 import 修改,重构时可选的 exclude ,comment 同时更新等等,过于方便了。
    18 天前
    回复了 houshuu 创建的主题 Local LLM DeepSeek V3
    @huanggua 看这个,我已经给出了我的配置

    https://www.v2ex.com/t/1101942
    @thisdanielhu 估计是不支持流式传输吧
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1754 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 16:23 · PVG 00:23 · LAX 08:23 · JFK 11:23
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.