V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Alias4ck  ›  全部回复第 13 页 / 共 27 页
回复总数  537
1 ... 9  10  11  12  13  14  15  16  17  18 ... 27  
噢你还要查找文本内容啊 那配合 go 写的 fzf 完美了 不过 doc 、docx 、xls 、xlsx 这些都是 OLE file format 你得自己写解析器了 pdf 就更加麻烦了 可能里面有图片、表格等或者 latex 公式,就我所了解的 pdf 解析工具来看 都不太行
不过最近 meta 开源了一个识别论文 pdf 的模型和工具 https://github.com/facebookresearch/nougat
第一时间我想到了 find 的替代品 fd 不过是 rust 写的
2023 年 8 月 31 日
回复了 0littleboy 创建的主题 程序员 生物存在的意义是什么?(午休时的奇思妙想)
生物存在的意义 最基本的也就是繁衍生存
然而作为人类,因为自然语言的表达,人类诞生了很多不同方向上的意义 ,教育、文化、科学等
你想在自然语言上理解和解释这个问题 他某种意义上也是你想要的意义,
但是自然语言其实也无法完整的表达出它的意义, 它本质上也是无意义的
2023 年 8 月 30 日
回复了 lingyan190 创建的主题 程序员 求沉浸式翻译的代替品
relingo/monica
2023 年 8 月 23 日
回复了 luomao 创建的主题 程序员 关于人脸识别项目的技术选型
自己折腾 我用这两个 whisper.cpp 或者 fast-whisper
2023 年 8 月 21 日
回复了 lx271896700133 创建的主题 程序员 老哥们,提交代码,用 Commitlint 吗?
我觉得统一规范挺好的啊 你为公司工作按照规范来为啥是浪费时间?
2023 年 8 月 21 日
回复了 realNewBee 创建的主题 Python Python 做后端,相对于 Java 或者 go 来说,到底差在哪?
@chaleaochexist 开团了什么叫所谓的开源项目,django 本来就是开源的,您的意思它是不开源的? https://github.com/django/django
牧羊犬不是最合理的嘛
2023 年 8 月 19 日
回复了 chensuiyi 创建的主题 程序员 fnMap,更好用的 vscode 侧边栏函数列表插件
@rioshikelong121 挺多的吧, 云存储不要钱的吗?类似这种 ![img]( https://i.imgur.com/oA2cqae.jpg)
2023 年 8 月 18 日
回复了 realNewBee 创建的主题 Python Python 做后端,相对于 Java 或者 go 来说,到底差在哪?
在 python 这个区关于语言的争论
让我想到了一位游戏开发作者 Jonathan_Blow (他是 braid 和 the witness 的作者
他为了解决 c++开发游戏中的复杂性,开发了一门编程语言 jai
性能和开发速度 有的时候你真的很难抉择
另外我有个问题,v2ex 是用什么语言开发的?
2023 年 8 月 16 日
回复了 NikiLauda 创建的主题 程序员 mac 桌面应用排布问题
这不就是窗口管理器吗 我推荐 yabai
2023 年 8 月 15 日
回复了 chai2010 创建的主题 程序员 国产编程语言趋势
一个没用过 我有个疑问🤔️
这些真的能用在实际的环境中吗 感觉都是玩具
2023 年 8 月 15 日
回复了 ltltfuture 创建的主题 程序员 公共 Git 代码库如何管理敏感信息?
之前瞟过一样,才发现是 aws 的哈哈😄😄
2023 年 8 月 15 日
回复了 ltltfuture 创建的主题 程序员 公共 Git 代码库如何管理敏感信息?
我记得 有类似的 security 项目
https://github.com/awslabs/git-secrets
2023 年 8 月 12 日
回复了 ggp1ot2 创建的主题 程序员 B 站那种 @一下 就给你总结视频内容的账号是咋做的?
一直发评论不会被限制 1: 他有一个账号池 有一个不行了就切换到别的帐号上了 2:同 url 视频内容会有缓存

另外说一点,它这个还是基于在视频有字幕的情况下会很快,如果没有字幕的话
你得自己生成字幕 而且如果视频很长的话 会很费时间 虽然有一些开源模型比如 whisper 可以 stt ,
但是也是吃 gpu/cpu 资源的,成本会收不回来哈哈
所以 b 站我也没看到有人在几个小时的视频下总结哈哈
2023 年 8 月 12 日
回复了 ggp1ot2 创建的主题 程序员 B 站那种 @一下 就给你总结视频内容的账号是咋做的?
最快的轮子实现方式应该是用 langchain

https://python.langchain.com/docs/integrations/document_loaders/bilibili
1 ... 9  10  11  12  13  14  15  16  17  18 ... 27  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2483 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 31ms · UTC 15:59 · PVG 23:59 · LAX 08:59 · JFK 11:59
♥ Do have faith in what you're doing.