V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  songxin  ›  全部回复第 1 页 / 共 2 页
回复总数  25
1  2  
2019-08-22 18:19:58 +08:00
回复了 jxmuestc 创建的主题 职场话题 成都女硕士, 5 年+工作经验,职场困惑
这么爽的环境不接点私活,不好吧?
2019-05-14 15:48:52 +08:00
回复了 lovezww2011 创建的主题 推广 一个失败的独立开发者
不要太灰心,成功的道路是曲折的。
2018-10-31 15:00:51 +08:00
回复了 beryl 创建的主题 职场话题 工作中话不多,不会故意讨巧领导,如何提升个人影响力?
领导自己都混的不咋地,你还想巴结领导给你升个职啊?洗洗睡了。
不错的主意,后端 java 可以支持
2018-06-25 19:01:53 +08:00
回复了 songxin 创建的主题 分享创造 使用 Nginx 反向代理百度爬虫支持 Github Pages 收录
@codehz 图片之前放七牛的,后面被恶意刷了几千 G 流量。
webhook 简单看了下,就是进行一个 Git 操作后触发相应的通知机制,请求一个指定的 url。
但是这样的话你又需要一个东西来接收处理这个 webhook 请求。

另外,基于服务考虑,比如你这个工具后续要给成千上万的人使用,nginx 和 webhook 哪种方式更简单?
基于资源考虑,也不太可能将每个人的仓库都做一个镜像。

当然你自己的机器,怎么玩都可以,但是并不是每个人都有自己的机器。
此贴就此略过了,以后不在回复。
2018-06-24 09:11:31 +08:00
回复了 baixuepiao 创建的主题 职场话题 有了解蚂蚁金服外包的 v 友吗?
不要去,时间或者生命宝贵。
2018-06-24 08:21:00 +08:00
回复了 songxin 创建的主题 分享创造 使用 Nginx 反向代理百度爬虫支持 Github Pages 收录
@msg7086 这样的话我要维护两份数据了。而且有图片占容量较大。
2018-06-23 20:47:45 +08:00
回复了 songxin 创建的主题 分享创造 使用 Nginx 反向代理百度爬虫支持 Github Pages 收录
@ihancheng 可以把你的设置截个图,我有空帮看下,现在有点忙。
2018-06-23 16:21:13 +08:00
回复了 songxin 创建的主题 分享创造 使用 Nginx 反向代理百度爬虫支持 Github Pages 收录
@Dawnki 嗯,可以试试,不行就直接用我这个,至少目前不出大问题,我的 vps 不会换,linode 的 froment 机房,180ms 左右。
2018-06-23 07:50:31 +08:00
回复了 songxin 创建的主题 分享创造 使用 Nginx 反向代理百度爬虫支持 Github Pages 收录
@swkl86 我建议你先看看我前面的回复。还有,为什么用了 VPS 就不应该用 pages ?有是更好的替代品吗?
至少我觉得用 github 的 pages 或者 issues 来写点博客,记点东西是很方便的。
2018-06-23 07:48:09 +08:00
回复了 songxin 创建的主题 分享创造 使用 Nginx 反向代理百度爬虫支持 Github Pages 收录
@swkl86.。。。。
回到几年前,结果依旧。。。
2018-06-22 17:39:51 +08:00
回复了 songxin 创建的主题 分享创造 使用 Nginx 反向代理百度爬虫支持 Github Pages 收录
@yuluofanchen 收录不了。。。不信试试
2018-06-22 12:15:55 +08:00
回复了 songxin 创建的主题 分享创造 使用 Nginx 反向代理百度爬虫支持 Github Pages 收录
@kera0a 去学习了解下 DNS 和 Nginx 吧,我之前也搞很久。
2018-06-22 12:14:52 +08:00
回复了 songxin 创建的主题 分享创造 使用 Nginx 反向代理百度爬虫支持 Github Pages 收录
@MonoLogueChi 是的,我这个东西只是帮大家的 github pages 能够让百度抓取,其他的没任何影响。
DNS 里面要加一条线路类型为百度的 A 记录,地址填我的 VPS 的 ip。
当然,我的 VPS 挂了,被攻击了,这也会有风险,因为对百度爬虫来说,站点更换 ip 对 SEO 有非常大影响,就看有没人信任,想用,仅此而已。

我只是提供一种解决 github pages 被百度收录的方法,顺带提供一个小工具。
自有 VPS 和 Nginx 的可以自己这么干,就不用这个了。
2018-06-22 12:05:56 +08:00
回复了 songxin 创建的主题 分享创造 使用 Nginx 反向代理百度爬虫支持 Github Pages 收录
@BFDZ 真的假的?你百度直接抓 bfdz.github.io 没返回 403 ?
2018-06-22 12:05:20 +08:00
回复了 songxin 创建的主题 分享创造 使用 Nginx 反向代理百度爬虫支持 Github Pages 收录
@kera0a 这里域名肯定改成你自己的啊,DNS 里面肯定要加百度的线路解析,指向到 VPS 的外网 ip 就行了。
2018-06-22 12:02:38 +08:00
回复了 songxin 创建的主题 分享创造 使用 Nginx 反向代理百度爬虫支持 Github Pages 收录
可能是我没交代清楚,问题是:百度无法收录 github pages,因为 github 对百度爬虫的访问直接给 403。
之前的解决方法是:1.使用 coding 做镜像; 2.使用 vps 部署镜像站点,用 Nginx 反向代理避免一个 80 端口被占用;
3.使用 CDN。
这些方法都有些缺陷,coding.net 很恶心必须要主页贴 logo,vps 部署镜像要保证同步的问题还要搞各种依赖环境,CDN 没搞过不好说。

这个方式就是只需要 Nginx 就可以了,伪造 user agent 让百度爬虫自己去抓,这样玩的人多了可能后续 github 会有一些反制措施,因为百度爬虫这东西非常不友好,不遵循 robots,每天爬取频次过高等。
1  2  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1248 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 25ms · UTC 23:58 · PVG 07:58 · LAX 15:58 · JFK 18:58
Developed with CodeLauncher
♥ Do have faith in what you're doing.