keakon 最近的时间轴更新
keakon's repos on GitHub
Go · 39 人关注
golog
Super fast, unstructured logging in Go.
Python · 34 人关注
Doodle
A blog system based on Python 2.7 and Redis.
2 人关注
NaiveProxy
一个不占用内存的 Chrome 代理扩展。
Kotlin · 1 人关注
ClashMetaForAndroid
A rule-based tunnel for Android.
Python · 1 人关注
etag-middleware
A middleware to handle ETag for Starletter or FastAPI.
Python · 1 人关注
fastapi-skeleton
A web application template of FastAPI with best practice.
Python · 0 人关注
delayed
A simple but robust task queue.
0 人关注
enable-copy
0 人关注
go-delayed
A simple but robust task queue.
Go · 0 人关注
go-utils
Python · 0 人关注
gunicorn
gunicorn 'Green Unicorn' is a WSGI HTTP Server for UNIX, fast clients and sleepy applications.
Python · 0 人关注
huey
a little task queue for python
Go · 0 人关注
hysteria
Hysteria is a powerful, lightning fast and censorship resistant proxy.
0 人关注
mihomo
A simple Python Pydantic model for Honkai: Star Rail parsed data from the Mihomo API.
Python · 0 人关注
redis-shard
Redis sharding client library
0 人关注
seahub
The web end of seafile server.
Python · 0 人关注
selectors2
Backported, durable, and portable selectors designed to replace the standard library selectors module.
Go · 0 人关注
shard
0 人关注
sing
Do you hear the people sing?
Go · 0 人关注
sing-quic
quic-go API wrapper and QUIC based protocol implementations
Go · 0 人关注
sql-builder
Go · 0 人关注
sql-to-struct
Python · 0 人关注
starlette
The little ASGI framework that shines. 🌟
Python · 0 人关注
tornado
Tornado is an open source version of the scalable, non-blocking web server and tools that power FriendFeed.
Python · 0 人关注
uvicorn
The lightning-fast ASGI server. 🦄
Python · 0 人关注
white
A fork of the Black formatter but prefers single quotes.
keakon

keakon

V2EX 第 2704 号会员,加入于 2010-11-01 02:41:26 +08:00
今日活跃度排名 16234
Garnet 真比 Redis 快吗?
Redis  •  keakon  •  89 天前  •  最后回复来自 haython
15
PyPI 维护超过 7 小时了
Python  •  keakon  •  120 天前  •  最后回复来自 Dynesshely
2
如何在输入大写字母时,用数字键选词?
中州韻  •  keakon  •  137 天前  •  最后回复来自 keakon
2
Safari 真的比 Chrome 占用更少的资源么?
macOS  •  keakon  •  112 天前  •  最后回复来自 toutaikkj
30
官翻机和资源机的真实来源是什么?
MacBook Pro  •  keakon  •  72 天前  •  最后回复来自 jakeyfly
20
拼多多的 M1 Pro 怎样?
MacBook Pro  •  keakon  •  175 天前  •  最后回复来自 LiFExxl
24
[珠海 or 远程]有靠谱的公司招 Python 开发吗? 8 年工作经验
求职  •  keakon  •  2017-07-05 11:19:12 AM  •  最后回复来自 Irenelee
12
怎么屏蔽 H5?
问与答  •  keakon  •  2015-07-14 15:41:38 PM  •  最后回复来自 CodeingBoy
8
空格跳转到回复框很反吃货啊
V2EX  •  keakon  •  2013-09-02 20:59:33 PM  •  最后回复来自 chairuosen
3
keakon 最近回复了
2 天前
回复了 cowcomic 创建的主题 程序员 LLama3.1 的申请被拒了
@kenvix 算错了,800 GB 。
2 天前
回复了 cowcomic 创建的主题 程序员 LLama3.1 的申请被拒了
@afxcn 正常的机器跑不起来,半精度 405B 需要超过 8TB 显存,100 多张 A100 80G ,大概 1 千万人民币吧。
@DIMOJANG numpy 是有的
单纯是因为 cv2 没有写 docstring ,只是转发到 c 的接口而已。
双 4090 用 vllm 部署 qwen2:72b-int4 ,最低大概要 42GB 显存。占满 48GB 显存的情况下,32 并发下大概每秒 300 tokens 。
用 ollama 部署,大概要 40GB 显存。2 并发大概每秒 30 tokens ,再增加并发性能反而下降。
但是具体到单个请求,只有 15 tokens/s 的样子,大概是 gpt-4o 的 1/4 。
友情提醒,最好换个框架,不然每秒几十个订单可能就扛不住了。

然后通知是什么场景呢?用户刷卡时,pos 机发到 server 端,处理完通知么?这个不是秒级就完成了么,还需要轮询?
23 天前
回复了 yodhcn 创建的主题 程序员 有 CORS 还需要 CSRF token 吗?
这 2 者作用不一样啊,CORS 是跨域的安全设置,你没跨域使用 xhr 、fetch 时不受影响。
计算挺奇怪的,60 万用户全在一分钟内访问,这是主动发起的,还是定时任务啊?

平时还能有 1000 qps ,他们是有多闲,每 10 分钟都会查询一次…

说实话你这问题靠扩容没法解决,比如 8:59 时还是 1000 qps ,假设 1 台机器刚好。9:00 突然到 1 万 qps ,立刻再起 9 台机器,启动要半分钟,同步数据几分钟,然后发现 qps 回到 1000 了,它们又可以下线了。
就是问 3 个模型,然后让一个模型根据 3 个回答来汇总成一个回答
https://github.com/win4r/MoA/blob/main/utils.py#L154
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1131 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 25ms · UTC 23:41 · PVG 07:41 · LAX 16:41 · JFK 19:41
Developed with CodeLauncher
♥ Do have faith in what you're doing.