V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
sniperking1234
V2EX  ›  程序员

网络流量数据的存储有什么好的方案或者存储选型吗?

  •  
  •   sniperking1234 · 250 天前 · 1060 次点击
    这是一个创建于 250 天前的主题,其中的信息可能已经有所发展或是发生改变。

    现在项目上有需求,需要把 pcap 包解析并存储到系统中,并支持用户按照一些关键属性进行搜索,比如按照 ip 、端口、域名之类的属性去搜索。因为每种网络协议的格式都不一样,存储的结构也不同,所以用什么数据库、什么样的格式存储现在还没有敲定,求助大家有没有好的方法或者经验去存储网络数据包

    9 条回复    2023-08-24 19:06:48 +08:00
    opengps
        1
    opengps  
       250 天前
    太大了,存储能力跟不上网络能力,你这不是向数据库应用发起挑战,你这是向存储速度发起挑战了
    sniperking1234
        2
    sniperking1234  
    OP
       250 天前
    @opengps 网络流量不是全量和实时采集的,数据倒是没那么多,目前主要问题是存储不知道怎么存,因为需求要从所有流量中进行筛选
    proxychains
        3
    proxychains  
       250 天前
    pps 有多少? 机房最近也打算做流量记录和审计.
    计划用 kafka+clickohuse
    sniperking1234
        4
    sniperking1234  
    OP
       250 天前
    @proxychains 还没有 pps 的概念,我们是通过下发任务,采集回传 pcap 包,解析入库这个流程。你用 clickhouse 的话是打算一个协议一个表吗
    proxychains
        5
    proxychains  
       250 天前
    @sniperking1234 打算直接存对象, 一个表吧.
    clickhouse 做完分片副本和索引查起来还可以

    layer:L2, SrcMAC: xxxxx, DstMAC:xxx
    layer:L3, SrcIp: xxx, DstIp:xxx, SrcPort:xxx, DstIp:xx, protocol: tcp
    ...
    只是这样规划, 还没在测试环境做.
    815979670
        6
    815979670  
       250 天前
    单机的话 clickhouse 是个不错的选择,如果分布式的话 可以考虑一下 百度的 Apache Doris ,ClickHouse 分布式不太友好 但单机 ClickHouse 更好一些
    sniperking1234
        7
    sniperking1234  
    OP
       250 天前
    @proxychains 这是把所有的协议中出现的字段都列出来做成个大宽表吗
    sniperking1234
        8
    sniperking1234  
    OP
       250 天前
    @815979670 多谢建议,我去调研看看
    proxychains
        9
    proxychains  
       250 天前 via Android
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2571 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 12:26 · PVG 20:26 · LAX 05:26 · JFK 08:26
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.