V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
dizzylight
V2EX  ›  奇思妙想

1pb 数据保存 500 年无丢失

  •  
  •   dizzylight · 124 天前 via iPhone · 7291 次点击
    这是一个创建于 124 天前的主题,其中的信息可能已经有所发展或是发生改变。

    手头很多资料包括视频、照片、文档。在想这些数据资产怎样保存才可以传世 现在有没有技术方案。有没有人打算花 1w 块钱去实现这个?

    90 条回复    2023-02-15 16:09:40 +08:00
    lailailee
        1
    lailailee  
       124 天前   ❤️ 8
    刻在石头上
    StuPYX
        3
    StuPYX  
       124 天前 via iPhone
    咋这么大,这么大搞不了吧
    ltkun
        4
    ltkun  
       124 天前 via Android
    1w 1pb 要知道现在存 1pb 至少要 10w 吧
    lhbc
        5
    lhbc  
       124 天前
    你先算下 1 万块能买多大的硬盘,更不用说保存 500 年
    把预算提到一千万以上再来谈这个问题吧
    dizzylight
        6
    dizzylight  
    OP
       124 天前 via iPhone
    @lailailee 老祖宗的智慧 石头最靠谱
    dizzylight
        7
    dizzylight  
    OP
       124 天前 via iPhone
    @ltkun 以后硬盘肯定降价啊
    march1993
        8
    march1993  
       124 天前   ❤️ 13
    找一个 250 光年之外的大黑洞,当作引力反射镜,把 1PB 调制到无线电波,打出去,500 年后能回收。500 年对宇宙来说 p 都不是
    finab
        9
    finab  
       124 天前
    相当于一年花 20 块的 1pb 空间存储服务,谁干都亏本。短期存还行,长期至少要存 3 份拷贝,还得定期检查维护
    8355
        10
    8355  
       124 天前
    咱们换一个思路先看看是否可行
    1 万块钱的预算能不能把任何一样东西原样保存 500 年不损坏
    或者往前导目前有没有挖到一个 500 年前的古董没有损坏的
    asmoker
        11
    asmoker  
       124 天前   ❤️ 31
    那只能在雄-安建机房了,那边是千 年大 计
    dizzylight
        12
    dizzylight  
    OP
       124 天前 via iPhone
    由此引出一个问题 现如今如此海量的数据是否具有可持续性? 人的大部分活动最终都会被历史遗忘。
    gabkfivyfbst
        13
    gabkfivyfbst  
       124 天前
    记得三体里,地球毁灭前,人类发现最靠谱的方式还是刻在石头上
    perfectlife
        14
    perfectlife  
       124 天前
    @dizzylight 这个逻辑不对,你是要现在实现,考虑以后硬盘的价格就不合适,况且硬盘保存 500 年感觉费劲,机械和固态都会受材质的物理特性影响
    Tilie
        15
    Tilie  
       124 天前
    把 1pb 分散到重要的“互联网基础设施”里,代代相传
    luckbbs
        16
    luckbbs  
       124 天前
    这些数据对后人有价值吗
    allenzhangSB
        17
    allenzhangSB  
       124 天前
    @dizzylight 你都考虑以后硬盘降价了, 那你现在问个啥
    dizzylight
        18
    dizzylight  
    OP
       124 天前 via iPhone
    @luckbbs 数据不是最宝贵的资产吗 商业 101
    dizzylight
        19
    dizzylight  
    OP
       124 天前 via iPhone
    @allenzhangSB 提前准备,钱不是大问题。
    occupied
        20
    occupied  
       124 天前
    1pb 的数据只对你有价值,如果能有 1kb 的数据对后人有价值的话就算厉害了
    dizzylight
        21
    dizzylight  
    OP
       124 天前 via iPhone
    @occupied 先不谈价值问题 能否实现打个问号
    jamosLi
        23
    jamosLi  
       124 天前
    500 年后人存不存在都是两说。技术上就是最便宜磁带,然后硬盘,光盘。硬盘已经基本走到物理极限单盘十多 T 吧。然后就是建一座机房和存储介质的存储时效的物理特性做抗争了。
    光盘是塑料的打的坑,塑料应该比较难在数据级顶 500 年。磁带,磁盘都是掉电,消磁了。
    现在的磁带 10 刀 1T ,硬盘 1 万 100T 。
    剩下自己算吧。
    ExplodingFKL
        24
    ExplodingFKL  
       124 天前
    @march1993 好家伙,这要多大功率才能将衰减降到可控范围内
    dianso
        25
    dianso  
       124 天前
    我试过自己的需求,发现至少需要 N 万左右。

    后来放弃了,找人定制了 M2 板子,120W ,能插拔 16 根 M2 2280 固态。

    其中 8 个存数据 8 个备份。
    debuggerx
        26
    debuggerx  
       124 天前
    怎么保证人类还能存续 500 年?
    dream10201
        27
    dream10201  
       124 天前
    1w 块,说句不好听的,想屁吃。你去请个石匠把它刻在石头上也不止 1w 啊。
    mxT52CRuqR6o5
        28
    mxT52CRuqR6o5  
       124 天前
    @dizzylight 那你可以等几百年后硬盘价格降下来再去做『 1pb 数据保存 500 年无丢失』的工作
    dizzylight
        29
    dizzylight  
    OP
       124 天前 via iPhone
    @mxT52CRuqR6o5 降到 500G 能实现?
    piku
        30
    piku  
       124 天前 via Android
    就事论事,数据长期存储不是寻找一种能长期保存的介质,而是采用一定的手段将数据存储延续。目前经济可靠的保存方法是磁带,假设一次备份可以保存至少 50 年,那么在 50 年内重新读取更换新的介质再重新保存一次就是了。也可能未来有更经济可靠的存储介质呢。
    存储不是问题,有人维护这些存储才是问题。
    lhbc
        31
    lhbc  
       124 天前
    “以后硬盘肯定降价”
    你不如跟你老板说等过 500 年人均工资一千万一个月了再给你发工资
    dizzylight
        32
    dizzylight  
    OP
       124 天前 via iPhone
    @piku 需要维护的存储代价大就是问题啊 以后数据必然越来越多 老的数据都要丢掉?
    piku
        33
    piku  
       124 天前 via Android
    @dizzylight 老数据终究会泯灭在历史长河里 不说别的 前阵子要找一些老照片 就找不到
    blankmiss
        34
    blankmiss  
       124 天前
    1w 块钱在做什么梦 买硬盘也买不起 买磁带虽然也便宜 但是好像也买不了 1PB 而且磁带机也贵的一批
    BeautifulSoap
        35
    BeautifulSoap  
       124 天前 via Android   ❤️ 2
    lz 和 ls 很多人都在想怎么存,却没人去想怎么读。存是技术问题,而读不只是技术问题

    读涉及到软件和硬件。顺便跟你们说一下,一些老旧格式才几十年就基本没法读取了(因为系统淘汰,格式淘汰等各种原因)。比如说美国登月技术丢失这事,不去考虑阴谋论,很重要的一个原因应该和项目管理系统老旧,旧的文件格式无法读取有关。再比如看看一些公司的老项目,里面那些文档和附件,如果没有专门人维护的话,相关人员不在之后那基本就成黑盒了,可能怎么打开都没人知道(比如一个名为 data.bin 的文件没有说明你知道怎么开吗?)
    当然,你也许会说积极转码。但是转码这事搞过的的都知道有多坑,转码转到后来一片乱码,调参不好画质损失事小,遇到以前那种隔行扫描视频画面撕裂之类的你根本意料不到
    为了解决长时间尺度下格式读取问题,国家图书馆档案馆都是有专门人和公司来做的。而你的子孙别说孙子了,可能你儿子那一代开始就对电脑一窍不通是个电脑盲。让他们管理你那堆数据真的是不确定性太大。历史上几代人连个家谱都管理不好丢失的比比皆是,更何况是电子载体

    至于硬件方面的读,软驱就是给最好的例子,可能再过个十几二十年,图吧佬都组不出一个能驱动软驱的电脑了

    so ,几 pd 的事情真就别想了,挑出真心重要的照片打印出来,多打几份,挑个环境好点的地方放那,估计传给 50 年估计没问题
    whileFalse
        36
    whileFalse  
       124 天前   ❤️ 2
    @dizzylight “以后硬盘肯定降价啊” 那你不如 500 年后再来问这个问题,哦不行,以后钱还贬值了呢
    yousabuk
        37
    yousabuk  
       124 天前 via iPhone   ❤️ 2
    刻到王八壳上
    securityCoding
        38
    securityCoding  
       124 天前
    年轻人思想很开阔的啊,500 年前是明武宗朱厚照 233
    yvkino
        39
    yvkino  
       124 天前
    刻在稳定金属片上,多弄几份放到太空保存
    cue
        40
    cue  
       124 天前 via iPhone
    一万块钱,给你老婆买个包都不够,而且最多背半年。
    wdhwg001
        41
    wdhwg001  
       124 天前 via iPhone
    蓝光 m-disc 是玻璃碳,是号称千年存储,表面随便刮花暴晒高低温之后都可以简单修复,可以计算一下需要多少 m-disc 。
    xtreme1
        42
    xtreme1  
       124 天前
    @BeautifulSoap
    第一个说到点子上的. 存纯文本还行, 其它的, 500 年以后的硬件根本跑不起来你存的这些玩意的解码器
    cnkuner
        43
    cnkuner  
       124 天前
    1 万块钱都不够把“1 万块钱”保存 500 年的。
    meeop
        44
    meeop  
       124 天前
    不考虑人为破坏的话,最简单和低成本方案是打印下来,打印成纯文本和照片,或者编码成 base64 打印下来(base64 解码方法也要打印)
    注意用激光打印或者碳粉油墨
    最后抽真空或者油浸保存在塑料罐子里
    zhaogaz
        45
    zhaogaz  
       124 天前
    所以你啥资料值得存 500 年呢,我就好奇问问。。。
    jamosLi
        46
    jamosLi  
       124 天前
    @xtreme1 500 年东西现在复制不了的东西可能有,但是不多。失传的主要原因是工艺失传,不是技术能力不足。nasa 那就是一个谜一样的问题,鬼知道互相的打算是什么。能存就能读。pb 级别没有纳米制程,那就是帝王工程,秦始皇也完成不了。
    Tengdw
        47
    Tengdw  
       124 天前
    把信息保存一亿年左右的方法,他们强调,这是目前已知的唯一可行的方法,它就是——”罗辑把拐杖高举过头,白发长须舞动着,看上去像分开红海的摩西,庄严地喊道,“把字刻在石头上!”
    jamosLi
        48
    jamosLi  
       124 天前
    @meeop 你猜猜看 1pb 的数据到底有多少。2000 到公元世纪前所有的书加起来也不一定有 100T 。1pb=1024tb
    goophy
        49
    goophy  
       124 天前   ❤️ 1
    @march1993 这个靠谱,是不是该先对着太阳发,放大一下 :)
    justfindu
        50
    justfindu  
       124 天前
    存档超大数据保存目前都是推的蓝光盘 然后 1w 实在是太少太少了
    justfindu
        51
    justfindu  
       124 天前
    @justfindu #50 然后还需要定期几十年翻一次盘
    yukiww233
        52
    yukiww233  
       124 天前
    1w 你买最便宜的存储介质都不一定够 1pb 的,还想要 500 年。。。
    “奇思妙想”节点也该基于现实吧,没经过思考的提问和讨论有啥意义
    max1
        53
    max1  
       124 天前   ❤️ 1
    @lailailee 你是看过三体的
    cpstar
        54
    cpstar  
       124 天前
    磁带,单盘 30TB ,价格 1000 。做好保存环境,500 年不是问题。但是一万的预算就有点。
    Planarians
        55
    Planarians  
       124 天前 via Android
    磁带啊 埋到北极 忘了哪个 YouTuber 就这样做的
    moonkiller
        56
    moonkiller  
       124 天前
    @lhbc 有比硬盘更便宜的存储介质,比如蓝光光盘,貌似光盘比硬盘保存寿命还久一些
    cedoo22
        57
    cedoo22  
       124 天前
    有能把光困住的东西吗?
    人造黑洞? 造一个 微型黑洞, 把数据转换成光信号,把光信号困住, 需要的时候取, 理论上可以无限久?
    yufeng0681
        58
    yufeng0681  
       124 天前
    再等等, 等蛋白质可以用于存储了,价格就能便宜下来, 存储量和存储时间都能达标。
    nicoljiang
        59
    nicoljiang  
       124 天前
    如果重要的数据自然有人帮忙续命;
    如果是不重要的数据,那不叫丢失,叫淘汰。
    shuxhan
        60
    shuxhan  
       124 天前
    @dizzylight 用现有硬件来思考未来是否能留存本身就是不合理的,未来必定会出现能更长久存储的容器这点事毋庸置疑的,就像秦朝时人能想到硬盘存东西吗?都是记录在竹简上。所以 op 不必担心,只需要注意短时间保存无措就行了,未来可以更新自己的存储方案,一劳永逸的方案是不存在的,顶多坚持二三十年
    libook
        61
    libook  
       124 天前
    @dizzylight #12 当今绝大部分数据是没有保存价值的,有价值的数据自然会被保存和传承下去。比如国服魔兽的存档,永久关服了就会被丢弃了。
    esxlin
        62
    esxlin  
       124 天前
    @libook 同意观点,有价值的东西除非天灾,都会被延续下来。优秀的技术积累、但判断是否有价值站在历史的进程上就不好说了
    ytmsdy
        63
    ytmsdy  
       124 天前
    存不是问题,主要问题是读!
    回头看看当年的磁盘,磁盘里面的数据估计还是好的。但是找不到能够读取出来的设备!
    shibushi233
        64
    shibushi233  
       124 天前
    蓝光还行,随着技术的进步。。可以考虑用这个
    wu67
        65
    wu67  
       124 天前
    还 500 年? 绝大部分人在 50 年后就会想着要留清白在人间了
    meeop
        66
    meeop  
       124 天前
    @jamosLi 按照目前打印机打印密度,一张 a4 大约能打印 8m 数据(黑白),1G 数据大约一本书的厚度,1pb 就是 1 百万本书
    这么算下来大约需要一个中型图书馆放资料,大概花费 100w 能搞定
    vipzhicheng
        67
    vipzhicheng  
       124 天前
    大胆假设,小心求证,我觉得是可能的,但是先不要想 1pb ,先想 1kb, 1mb 怎么存500年,之后再慢慢迭代吧。

    我的方案是:和人工智能整合,人工智能负责读写,另外存储技术和压缩技术必须更新,目前有两个思路,一个是存储密度更大的材料,另一个是生物学方向比如记录在 DNA 上,如果是存储材料的方案,需要教会人工智能生产这种材料,也就是让AI来维护这份存储,当然还需要考虑能源问题,太阳能或者核能,如果是DNA的方案,那可以考虑让存储数据可以被遗传,当然遗传的是高度压缩的版本,解压解码还是需要AI来进行,另外考虑到人类繁衍特性,需要让全人类的基因参与存储,冗余备份,这样可以保证在人类群体数量不低于一个阈值之前,一定可以还原出原来的数据。
    work220602
        68
    work220602  
       124 天前
    500 后现在的技术都过时了
    bjzhush
        69
    bjzhush  
       124 天前
    500 年,从秦始皇到唐太宗,从成吉思汗到朱元璋,一直到皇太极,都没有你牛逼!!!
    因为他们开国也就维持了三百年!!
    孙猴子压在五行山下也就压了五百年!!
    就连韩磊,理想也就是向天再借五百年!!
    哈哈!
    HugoChao
        70
    HugoChao  
       124 天前
    五百年这么久,一劳永逸是不可能的了,要安排好后人世世代代传下去
    netnr
        71
    netnr  
       124 天前 via Android   ❤️ 1
    500 年格局小了,千年光盘 M-DISC
    passall
        72
    passall  
       124 天前
    这不是很简单的事情吗? 给我 1W 我就可以帮你解决。
    xiangyuecn
        73
    xiangyuecn  
       124 天前
    孙子:1MB 都嫌多 😂

    1GB 的零碎文件,自己看了都嫌弃
    FishGrazier
        74
    FishGrazier  
       124 天前 via Android
    问 NASA ,他们把人类的资料存在了一张金制光盘上,跟着旅行者一号飞出了太阳系,数据至少能保存十亿年
    optional
        75
    optional  
       124 天前
    @dianso 可以分享下吗,16 个 m2
    missqso
        76
    missqso  
       124 天前
    1pb 此刻现在存下来,只是写下来,1 万能搞定吗?还 500 年,天文数字。
    HeyWeGo
        77
    HeyWeGo  
       124 天前 via Android
    普通人,一辈子的数据,16tb 足够了
    vazo
        78
    vazo  
       124 天前
    把数据喂给 AI
    w3cll
        79
    w3cll  
       124 天前
    让数据自我“繁衍”,不迭代,假设这个“繁衍”周期 100 年 1 次,所以你只需要设定让它“繁衍”5 次即可。
    mxT52CRuqR6o5
        80
    mxT52CRuqR6o5  
       124 天前 via Android
    @dizzylight 之前看到过一个靠区块链&矿工意图达到永续存储的项目,但具体有多可靠我也不好说
    Weixiao0725
        81
    Weixiao0725  
       124 天前
    github 送到南极了已经,你可以参考下
    techmale
        82
    techmale  
       123 天前
    可以了解下通过 DNA 存储数据
    - [Microsoft and UW demonstrate first fully automated DNA data storage](
    )
    - [How we can store digital data in DNA | Dina Zielinski](
    )
    techmale
        83
    techmale  
       123 天前
    通过 DNA 是可见时间内 能实现你的目的,
    但对于「现在有没有技术方案」中的「现在」可能要再等很久啦
    Polyhedr0n
        84
    Polyhedr0n  
       123 天前
    +1 Github 南极存储的方法。数据印在微缩胶片上
    sakujo
        85
    sakujo  
       123 天前
    你是打算传给谁啊
    jamosLi
        86
    jamosLi  
       123 天前
    @meeop #66 搞笑呢?你的书是几米厚的?即便是汉语这种一个字占两个字节的文字,你搜一下 1g 大概多少字行不行?但凡看过比尔盖茨微软软盘和书本的宣传画也不至于如此。
    1g 大约 5.3 亿汉字。。。
    acherkrau
        87
    acherkrau  
       123 天前
    刻光盘,放北极
    wangyzj
        88
    wangyzj  
       123 天前
    存成实体二维码
    PbCopy111
        89
    PbCopy111  
       123 天前
    装一套,备份一套,每十年增加一次备份。
    Fxshiny
        90
    Fxshiny  
       115 天前
    刻在石头上。
    关于   ·   帮助文档   ·   博客   ·   nftychat   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1082 人在线   最高记录 5634   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 93ms · UTC 18:20 · PVG 02:20 · LAX 11:20 · JFK 14:20
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.