gbin
V2EX  ›  阅读

Agent Harness 阅读小组纳新(招 2 人)

  •  
  •   gbin · May 25 · 755 views

    背景介绍

    我之前有过几次阅读小组的经验(参考 t/1138988 DDD 、t/1111500 Agent Harness ),最近在做 AI Agent 相关的工作,想沿着 Harness Engineering 这条线深读几篇论文。

    刚啃完《 Agentic Harness Engineering 》( arXiv:2604.25850 ,复旦+北大+奇迹智峰),论文核心思想:在模型能力趋同的时代,决定 coding agent 表现上限的是围绕模型搭建的工具链( harness )。10 轮自动迭代从 69.7% 涨到 77.0%( Terminal-Bench 2 ),超过人工调了几个月的 Codex-CLI 。

    接下来的计划(阅读小组投票选举)

    前沿论文

    1. Meta-Harness (arXiv:2603.28052) — Stanford ,AHE 同期工作
    2. SkillRL (arXiv:2602.08234) — skill 自进化
    3. SkillClaw (arXiv:2604.08377) — skill 集体进化

    工程实践

    1. Anthropic Harness Design — Anthropic harness 经验
    2. OpenAI Harness Engineering — skill library 和工具进化的奠基/扩展工作

    预计 6-8 周左右,根据进度灵活调整。

    形式

    • 时间:周一至周五晚上 8:00 PM - 9:00 PM Shanghai
    • 平台:MS Teams 会议
    • 形式:一读三问(分节阅读 / 有不懂的地方需要讨论吗 / 有重点内容需要分享吗 / 有需要总结吗)
    • 不强制参与,有事跳过,但希望意志力强一点

    补充说明

    1. 招 2 个人,目前已经有 4 位成员,每次最多 6 人,有 3 人参与当天即可继续阅读
    2. 要求 8:00-9:00 PM 这个时段稳定有空,对不加班的业界朋友友好
    3. 有 AI Agent 相关工作经验或兴趣最佳

    感兴趣的朋友微信联系 cHlsb24ucGVuZ0BnbWFpbC5jb20=

    Supplement 1  ·  May 26
    本次活动人员已满,感谢参与,未报名成功的期待下次参与,谢谢。
    No Comments Yet
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   855 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 36ms · UTC 20:10 · PVG 04:10 · LAX 13:10 · JFK 16:10
    ♥ Do have faith in what you're doing.