V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ivyliner  ›  全部回复第 1 页 / 共 17 页
回复总数  336
1  2  3  4  5  6  7  8  9  10 ... 17  
1 天前
回复了 heimoshuiyu 创建的主题 分享创造 自建 PC 端的语音输入工具
看着不错, 上下文增强识别结果是怎么做的?
3 天前
回复了 kirieievk 创建的主题 问与答 有什么视频翻译上字幕工具吗?
@emberzhang #2 YPlayer 的界面其实和 IINA 比较像, 最开始我想要做一个实时字幕和翻译的 APP (功能终于已经实现), 所以最开始的 UI 设计是参考 IINA 的. 我看了一下 whisper transcription , 功能确实不错, 我猜测它的底层模型就是 whisper. 因为 whisper 中文的效果不是特别好, YPlayer 对中文做了优化, 所以还是有自己独到的优势的, 欢迎对比反馈.
3 天前
回复了 kirieievk 创建的主题 问与答 有什么视频翻译上字幕工具吗?
@kirieievk [YPlayer]( https://www.engineerdraft.com/yplayer/) 应该可以满足你的需求, 支持买断制, 感兴趣可以试试, 有需求欢迎反馈.
感谢 @mouli 贴心汇总, 补充一下 macOS App
[BeMyEars]( https://apps.apple.com/cn/app/be-my-ears-live-caption/id1577662679?l=en-GB&mt=12) macOS app, on-device live caption and translation from streaming media (Youtube, Zoom, micrsoft team etc.) | **20% OFF** (46.99$ -> 37.49$) on Lifetime Premium, until Dec 3

iOS app
[YPlayer]( https://apps.apple.com/cn/app/yplayer-live-translate-player/id1542569291?l=en-GB): transcribe and translate video into subtitles | **20% OFF** on Lifetime Premium, until Dec 3 |
这个问题感觉就是为我准备的,
可以试试我开发的 YPlayer : https://www.engineerdraft.com/yplayer/
和 BeMyEars https://www.engineerdraft.com/bemyears/
其中你的场景里面 YPlayer 就够用了, 把视频拖进去, 就可以生成字幕, 还能实时翻译.
BeMyEars 适合流媒体场景, 比如直播等.
29 天前
回复了 CNN 创建的主题 Apple M4 mini 发热过后索然无味
看标题我还要以为是 mini 发热, 原来是你发热.
29 天前
回复了 snuglove 创建的主题 DevOps 各位 Linux 运维的巨佬工作用 mac 吗
嗯, 我不谦虚, 我就是运维巨佬, mac, windows, linux 我都可以用.
平时我用 mac. iTerm2 + chrome 够用了.
32 天前
回复了 pdog18 创建的主题 macOS 有没有 macOS 上支持的「隔空手势」工具?
什么场景下需要这个东西 ? 我可以考虑做一个.
@naminokoe #8 有个 macOS App: BeMyEars, 对系统的语言没有要求, 还可以实时翻译
@sitdownkevin, 我对这个方向挺感兴趣的, 其实目前苹果就有这方面的技术, 但是我仔细想想好像引用常见也不多或者特别明确. 你有什么使用的场景了可以分享一下吗 ?
46 天前
回复了 UWoodman 创建的主题 程序员 请教下有什么好的 STT(语音转写)方案吗
我对这方面研究还挺多的.
在英文会议场景中, 需求主要有 2 类.
1. 实时识别, 需要能进行流式处理
2. 录音之后识别

场景 1: 目前好像就 BeMyEars 可以做到, 而且还有翻译功能
场景 2:
飞书妙记, 每个月 300 分钟免费额度, 满足需求 2, 需要自己提前录音.
whisper, 需要自己折腾一下命令行或者其它的工具, 缺点对中文不够友好, 需要 large 模型效果才比较可以
funasr 还是不错, 缺点是没有标点
SenseVoice 比如 funasr 好, 需要自己折腾一下命令行
vosk-api 中文不够好, 上一代的产品不推荐.
seamless_communication 大而全, 效果不好, 很重, 不推荐
azure cognitive api: 付费, 挺贵的. 要自己写程序调用 api
sherpa 需要自己折腾命令
夹带私货: 我的 App: YPlayer 搜索下载即可使用, 中文转录效果比 whisper 好, 英文的话, 就是用 whisper.
113 天前
回复了 sleepybear1113 创建的主题 macOS 来说说 Mac 比起 Windows 笔记本好在哪里
@sleepybear1113 #121 其实你也意识到, 但是你没有说出来. 我替你说吧: "Mac 性价比那么低, 为啥还那么多人用 Mac"
核心其实还是钱的问题, 不同人对钱的感受是不一样的.
所以我举例比亚迪和宾利, 就是要突出钱的因素, 有的人觉得贵, 有的人觉得值.
"相同价格 1w 我 Windows 能有 32+1T ,写代码开浏览器都不会抠抠搜搜了"
这里你给自己框了一个限制, 预算是 1w 要怎样怎样, 然后去看啥型号(联想, 戴尔, 惠普) 看各种评测视频, 折腾了好几天, 终于买了个一台电脑.
对有些人来说, 他的想法可能是我想要写代码写着爽, 我需要什么配置能满足, 然后到苹果官网, 选一个性能好的机器, 付钱完事, 30 分钟搞定.
说这些不是要表明自己有钱炫优越感之类的, 是经过各种事情(比如我认识一个人花了 5k 块钱买个一个锅, 她自己觉得很开心) 慢慢就能理解, 不同人的体验感受标准是不一样的, 有些东西你觉得不值, 别人可能觉得值, 所以这个世界有那么多品类的东西, 核心是在满足不同人的需求.
113 天前
回复了 sleepybear1113 创建的主题 macOS 来说说 Mac 比起 Windows 笔记本好在哪里
@sleepybear1113 哈哈 "工作不是为了买 Mac 而买 Mac ,是更要考虑自己的体验,相同价格 1w 我 Windows 能有 32+1T ,写代码开浏览器都不会抠抠搜搜了。如果按照你说的买个 Mac 来体验,那么 32+1T 对我来说可能是有点贵了,如果说发现和 Windows 对比提升没啥,那我觉得这个亏没必要吃。"
不同人的体验不一样, 你可能觉得买个性价比高的东西体验好
有的人可能花点钱买个省心的体验好.
举个不恰当的例子"你买辆比亚迪车子也能开, 为啥有人要去买宾利? "
所以讨论这个问题其实没有啥意义, 你觉得自己理智, 其实也不理智.
每个人都活在自己的偏见中, 每个人的决策都不一样.
113 天前
回复了 sleepybear1113 创建的主题 macOS 来说说 Mac 比起 Windows 笔记本好在哪里
1. 系统干净, App 默认设置没有广告, 我觉得我的注意力非常宝贵
2. 不打游戏
3. 不折腾, 中年人没有那么多时间折腾系统的那些破事.
114 天前
回复了 proxytoworld 创建的主题 GitHub Copilot 后悔年度付费 copilot 了
@proxytoworld https://support.github.com/tickets/personal/0 提一个 ticket ask refund, Github 会把剩下天数的钱退给你的, 我上周刚退款了.
怎么通过苹果审核的? 我记得苹果是不允许这种可以擦除东西的 App 上架, 有去水印的嫌疑.
@10RR @nix1024 @buzz2d0 我看 Sakura 应该已经不更新了, 我花了点时间写了 Falling, 你可以试试, 支持 M 芯片.
https://apps.apple.com/cn/app/falling-lovely-desktop-effect/id6639612868?l=en-GB&mt=12
1  2  3  4  5  6  7  8  9  10 ... 17  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2727 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 36ms · UTC 12:53 · PVG 20:53 · LAX 04:53 · JFK 07:53
Developed with CodeLauncher
♥ Do have faith in what you're doing.