V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  xiri  ›  全部回复第 22 页 / 共 85 页
回复总数  1682
1 ... 18  19  20  21  22  23  24  25  26  27 ... 85  
2020-07-21 17:36:11 +08:00
回复了 Colorful 创建的主题 Python 关于爬虫几个问题请教
@xiri 每次写入数据之前判断数据是否已经存在

另外,如果是你爬取一个网站的很多页面的话,每次把爬过了的链接存起来,后面不再爬这些链接就行了
2020-07-21 17:34:41 +08:00
回复了 Colorful 创建的主题 Python 关于爬虫几个问题请教
windows 有计划任务,跟 linux 下的 crontab 相对
至于重复数据的问题,你都玩爬虫了,去重不是基本操作吗?每次写入数据之前数据是否已经存在,数据量比较大的话可以试试 redis 的布隆过滤器
主题设置里面找到 scroll_to_more,设为 false 就行了
不过我的版本还停留在 7.1.2,不知道这个设置项还在不在
@codehz 我也觉得,现在结束进程重新启动后就没问题了
补充:我刚刚试了一下手动重建索引(帮助-小工具-索引管理),cpu 占用甚至没什么波动,除此之外我也想不到一个邮件客户端能有什么占用 cpu 的功能了
@howellz 用胶片是为了能够长久保存,其他的介质(硬盘、磁带啥的)根本无法把数据保存这么久,这个项目用的是一种特制的胶片,据说在常温下能保存 750 年,在低温干燥的条件下能保存 2000 年以上
@howellz 基本上去年一年内活跃的公有仓库都备份了,他那个条件的覆盖范围很广的,很多人反映自己放博客的仓库都被备份了(被备份了的用户主页上会出现一个 Arctic Code Vault Contributor 的徽章)

https://archiveprogram.github.com/faq/

On February 2, 2020 we took a snapshot of all of GitHub’s public repositories that have been active within recent months.

The archive will include every repo with any commits between the announcement at GitHub Universe on November 13, 2019 and February 2, 2020,

every repo with at least 1 star and any commits from the year before the snapshot (02/02/2019 - 02/02/2020),

and every repo with at least 250 stars.

Plus, gh-pages for any repository that meets the aforementioned criteria.
2020-07-17 11:07:56 +08:00
回复了 leimao 创建的主题 GitHub GitHub 新出了一个徽章“Arctic Code Vault Contributor”
@leimao 不是的,看官方说明,满足以下条件的就算
https://archiveprogram.github.com/faq/

On February 2, 2020 we took a snapshot of all of GitHub’s public repositories that have been active within recent months.

The archive will include every repo with any commits between the announcement at GitHub Universe on November 13, 2019 and February 2, 2020,

every repo with at least 1 star and any commits from the year before the snapshot (02/02/2019 - 02/02/2020),

and every repo with at least 250 stars.

Plus, gh-pages for any repository that meets the aforementioned criteria.
2020-07-17 10:42:45 +08:00
回复了 binggg 创建的主题 程序员 看看有没有获得 Github 「北极开源贡献者」 称号
嗯?我也有
2020-07-09 13:53:15 +08:00
回复了 crella 创建的主题 问与答 Python 的 import 的对象类型问题
@xiri v 站回复会把缩进吃掉,,,上面的回复中的代码前两行定义了一个函数 x,然后 y=x,最后加上括号,用 y()来调用
2020-07-09 13:51:44 +08:00
回复了 crella 创建的主题 问与答 Python 的 import 的对象类型问题
如果这里 z 不为字符串,那么应该怎样向 import()传入参数使得 z 能被赋值?

这个问题,你不知道 python 可以像下面这样搞吗?
def x():
print("hello")
y=x
y()
2020-07-09 13:01:17 +08:00
回复了 1024jannie 创建的主题 推广 DNSPod 四数字+club 8 块钱 速度薅!
没啥用的,club 域名 Gandi 最近免费送
@xiri 没看到第一句话,原来已经找过客服了,抱歉,,,,,,
但是我上面回复的那种情况我真的见过很多。
我发现很多人遇到问题都是靠自己猜 /自己觉得是怎样,有官方的咨询处理渠道从来不用
为什么不发工单问一下呢
squash 一下,把前面的 commit 全部合并
2020-07-06 16:07:53 +08:00
回复了 Exp 创建的主题 分享发现 百度网盘的触手又延长了。。。
“在文件管理器此电脑页面中都会出现百度网盘的图标。每次安装完成之后都得费事儿修改注册表把它去掉”
这个不是在百度网盘的设置里面就可以关掉吗?为啥要修改注册表
2020-07-05 23:51:12 +08:00
回复了 ylual 创建的主题 问与答 Rss 阅读器排版问题
自己写 CSS 啊,RSS 拿到的内容是不带样式的
2020-07-05 19:07:52 +08:00
回复了 wdhwg001 创建的主题 全球工单系统 在?为什么 B 站 App 会用 Taptic Engine 播重低音?
1 ... 18  19  20  21  22  23  24  25  26  27 ... 85  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1475 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 43ms · UTC 17:21 · PVG 01:21 · LAX 10:21 · JFK 13:21
Developed with CodeLauncher
♥ Do have faith in what you're doing.