1
sakujo 2023-04-23 23:03:51 +08:00
是不是聪明一点的小爱音响?那倒是挺不错的
|
2
Jackyxiaoc OP @sakujo 是的,用来哄哄小朋友什么的,练习下英文对话啥的,看上去还不错。
|
3
sakujo 2023-04-23 23:26:35 +08:00
@Jackyxiaoc #2 有点意思 不过如果问它有用的信息它会胡说八道啊 这样没办法当语音助手了
|
4
lloovve 2023-04-23 23:50:33 +08:00 via iPhone
你能保证稳定才行,树莓派太贵,直接上 esp32
|
5
demen 2023-04-23 23:51:10 +08:00
其实交互过程感觉挺难受,你问一个问题之后几十上百字的内容用语音播放来听取?平时我们微信聊天看到超过 10s 的语音都有点翻白眼了吧
|
6
viWww0vvxmolvY5p 2023-04-23 23:58:51 +08:00
有兴趣
|
7
luckjoe680 2023-04-24 00:06:36 +08:00 via Android
问题是 小爱音箱就能办到了…也用不了 300 啊…
|
8
musi 2023-04-24 08:06:53 +08:00 via iPhone
太贵了,为啥不用手机?
|
9
Tink 2023-04-24 08:23:07 +08:00
树莓派太贵了
|
10
Tink 2023-04-24 08:24:36 +08:00 2
这个价格不如买黑板的初代小爱音箱,破解 ssh 后 劫持语音转到 c hatgpt
|
11
jimbray 2023-04-24 08:26:03 +08:00
@demen 同意,之前用手机实现了一下语音问答,问一句,答得太多了,用语音播放有点难受,换成文字一下就看完了。纯问答我觉得没有什么意思。
|
12
yuchenxing 2023-04-24 08:45:28 +08:00
怎么搞
|
13
hoky 2023-04-24 08:52:51 +08:00 via iPhone
为什么不直接用闲置的手机?
iPhone 用 Siri Android 用 Tasker 我都试过玩过一阵子 后来因为直连 openai 响应慢玩的不多了 |
14
totoro625 2023-04-24 08:55:34 +08:00
iPhone 安装 OpenCat: https://apps.apple.com/app/opencat/id6445999201
填入 api key ,开启高级版,并开启 Siri 支持 任意支持 Siri 的 iPhone/apple watch 均可用 Siri 调用 chatgpt 进行对话 |
15
Biluesgakki 2023-04-24 09:20:00 +08:00
如何做到流式传输结果 传回来一个字读一个字呢。不然的话响应时间太长了,需要等到全部返回结果才开始读
|
16
timeance 2023-04-24 10:07:28 +08:00
1. 树莓派的方案太贵
2. 硬件部分,基本功能调通,麦克风如何降噪拾音等 3. 软件部分怎么完善,例如 prompt ,唤醒和本地识别语音指令等 ... 想法挺好的,要是真有完善的方案 会买一个来玩 |
17
yfmir 2023-04-24 10:36:15 +08:00
就目前这 api 的连接环境来看还是算了吧
|
18
littleBink 2023-04-24 10:40:42 +08:00
gpt 大部分回答都很长且书面,需要测试大量的 prompt 来优化
|
19
aeli 2023-04-24 11:10:36 +08:00
反应速度现在还不太行,GPT3 的回答虽然快,也要 1-2 秒,然后再转成语音发声,延迟会感觉比较明显的卡顿。
GPT4 就不用说了,能正常时间内给你返回就不容易了 |
20
zagfai 2023-04-24 11:31:53 +08:00
可以接入米家就行,我不需要很智能,当然,我能给出传感器数据能帮我判断我是不是睡醒,自动开关窗帘,判断我啥时候会回家自动帮我开空调,那也不错。
|
21
ropzislaw 2023-04-24 11:53:17 +08:00 via Android
这个 idea 我也有过,最后被劝退了
1. 需求多了生产线怎么弄,如何保证自己的生产线成本低 2 延迟和输出延迟 3 实时数据缺失 |
22
Jackyxiaoc OP @mway 感谢。
@luckjoe680 小爱的智能水平和 chatgpt 不太一样。 @lloovve 感谢,我研究下。 @musi 在家常驻使用比较舒服。 @Tink 确实是个好办法,感谢。 @yuchenxing 我研究下路径,如果可以的话,一起拼个单,组好了大家用,成本就下来了。 @hoky 还是得有稳定的通道。 @totoro625 长时间接着电源的小音箱在家小朋友什么的好玩。感谢,我研究下。 @Biluesgakki 流式的话,这个得研究下。大概 10 个字一读会不会好点。 @timeance 感谢支持,我研究下。 @yfmir 估计得内置一个通道才行。 @aeli 目前看是的。看看有没有更好的解决方案。 @zagfai 如果更智能应该是个更好的体验。 @ropzislaw 只是一个初步想法,天猫精灵的话二手成本是挺低的。如果单纯是树莓派的解决方案,树莓派也不会很贵。延迟这个通道可以解决。实时数据的话,可以导入谷歌的。 感谢各位大佬们的建议。 |
23
tags 2023-04-24 13:51:38 +08:00
不错不错,可以先在 linux 虚拟机上把系统搭起来,后面用啥硬件平台可以再说
|
24
Socrazy 2023-04-24 13:55:45 +08:00
Siri 上用了,其实很无聊,简单问题还行,太长的听起来很累
|
25
freetree 2023-04-24 13:57:41 +08:00 via Android
华强北听到了你的呼求😁
|
26
yulgang 2023-04-24 14:01:28 +08:00
想法不错,但是树莓派成本有点高。。
|
28
yulgang 2023-04-24 14:05:14 +08:00
如果你能开源的话,大家喜欢,可能会衍生出多个版本,不过一定会有人用你的开源代码拿去赚钱。😂
|
29
Jackyxiaoc OP |
30
dangyuluo 2023-04-24 16:09:58 +08:00
直接用 Siri 就可以接入 ChatGPT 了
|
31
Jackyxiaoc OP @dangyuluo 不知道咸鱼上 300 的 6s 能不能跑,如果可以的话,也是不错的选择。
|
32
cloudzqy 2023-04-24 17:31:36 +08:00
这种自己走微软云文字转语音的,一般用什么方案识别关键字然后开始对话呀,如果一直开着的话,微软云也挺贵的。
|
33
westoy 2023-04-24 17:39:57 +08:00
做公开服务成本太高了吧
京东的那个叮咚音箱都倒闭了....... |
34
zapper 2023-04-24 17:42:12 +08:00
看了一下(可能是生成的)产品介绍。发现好像没说如何正确地拾音给 chatgpt
所谓悲观者常常正确,乐观者往往成功。如果能接入插件将绝杀 |
35
tags 2023-04-24 17:44:54 +08:00
唤醒词本地离线模型就能跑
|
36
Jackyxiaoc OP |
37
webdesigner 2023-04-24 19:23:27 +08:00 via iPhone
从我使用 gpt 连接 siri 的体验来看,这个项目做出来体验会很差。api 目前要么用 sse 逐字输出,要么牺牲响应时间等待全部结果。逐字输出文字转语音效果会很差,一个一个字朗读。等待全部结果在朗读,用户响应时间特别长,你无法想象当你问完一个问题,就得等待十几秒钟来告诉你答案。如果这个方案可行,大厂早就整出来了。
|
39
wellqq 2023-04-24 21:26:45 +08:00 via Android
按你目前的阶段,感觉离成品还有一些路要走,不过有出来体验好我会买,有众筹通知一下
|
40
fresco 2023-04-25 00:10:37 +08:00 via iPhone
一直在找能语音对话的 app ,这个想法不错,成本低点就好了
|
41
luckjoe680 2023-04-25 07:21:45 +08:00 via Android
@Jackyxiaoc 你可以看看 现在 chatgpt 现在已经有大佬接入小爱了 而且还很方便=.=
|
42
Jackyxiaoc OP @webdesigner 确实,可能还需要看看有没有更好的方案啦。
@wellqq 好的,谢谢支持。 @fresco 嗯嗯,谢谢。 @luckjoe680 如果有大佬折腾出来卖成品的话就不折腾了,等我看看,之前没看到。感谢提醒。 |
43
aeli 2023-04-25 10:06:05 +08:00
如果说成品的话,找 amaon 的音箱,它家的很容易开发改第三方,YouTube 上有人放出来教程改 ChatGPT 的
|
44
Smackgg 2023-04-25 10:46:33 +08:00
小爱 小度 自己写一个插件不就做到了?小度六七十块钱就能买到
|
45
xuelu520 2023-04-25 11:25:50 +08:00
需要短平快的对话,gpt 一大堆文字,给你转成语音,太难受了
|
46
xinyana 2023-04-25 12:43:34 +08:00 via Android
墙的问题怎么搞定?内置墙?
|
47
xsen 2023-04-25 14:09:17 +08:00
现在 chatgpt 的模型,只适合用来替代搜索引擎、客服类似的
用来做 ai 助理(语音对话)是真不合适,长篇大论、废话太多 |
49
cloudzqy 2023-04-25 14:27:29 +08:00
@webdesigner 这种可以折中一下,识别到标点符号断句就开始读,一句一句读,比小爱音箱什么的肯定慢,但是应该没十几秒。
|
50
luobogooooo 2023-04-25 22:43:13 +08:00
笑到了,哈哈哈
|
51
hoopan 2023-04-26 09:39:35 +08:00
家里有台待机的 NAS ,增加个麦克风、音响,是不是也能搞成 AI 音箱。
有基于 chatgpt 的语音助手开源服务端吗? |
52
swxk521 2023-04-26 23:36:53 +08:00
|
53
unii23i 2023-04-27 11:49:35 +08:00
这个真的很需要!我经常和天猫精灵对线
|
54
zsrex 2023-05-08 15:32:18 +08:00
这个我感兴趣,之前折腾了一下 wukong-robot ,但 ubuntu 的系统太难搞了,可能我没有这个基础。
|
55
smjbwyhhhh 204 天前
这么多 DIY 教程,怎么就是没有一个拿出来卖的啊。。。。。
|