请问大家知道有这样的工具或者方法么?
基本需求是,比如我输入如下内容:
apple
egg
pear
...
它可以生成这个单词列表的每个单词的发音的 mp3 文件。同时每个单词发音之后,最好把单词的拼写再读一遍。
类似于:先发 apple 的音,再依次朗读字母 a,p,p,l,e 的发音,再转换到下一个单词的发音。
谢谢!
1
tees 270 天前
文字转语音好像比较符合你的场景
|
2
gdb OP @tees 是的,我在想是不是弄一个 python 的代码,直接调用文字转语音的功能就可以。不知道有没有人分享现成的类似的这种 python 代码。后面的字母的发音,也是通过文字转语音的功能来实现。
|
3
sunjiayao 270 天前
say 'hello' && echo 'hello'|fold -w1 | say -v Daniel -r 70
|
4
gdb OP @sunjiayao 谢谢,我查了一下,似乎这个是 Mac 系统下的发声音的命令,我是 Windows 的系统,貌似没这个功能。而且这个似乎不能生成 mp3 文件。
另外,我是打算把生成的 mp3 文件放到一个 mp3 播放器里面去,这样可以随时背自己想要背的单词。 谢谢。 |
5
sunjiayao 270 天前
可以找个开源 tts 自己转一下
|
6
jie170601 270 天前
额毕业的时候做了一个微信小程序,叫“单词听写”,跟描述的基本一致。
先发 apple 的音,再依次朗读字母 a,p,p,l,e 的发音这个功能没有。 不过兼容性的 BUG 有点多,没精力去搞了,把广告撤了好久没管了。 |
7
Lockeysama 270 天前
|
8
akring 270 天前
感觉这么背效率好像有点点低
|
9
yufeng0681 269 天前
原始需求:背单词
解决方案:放英语单词,生成音频 创意评价:不靠谱。孤岛的知识点无法被记住,人需要把要记住的东西连接起来。 建议方案(抱佛脚的):anki + 英语单词包 优点:可选择要的单词放到背诵组,优先背诵; 可以提高背诵效率(遗忘曲线对应的算法) 英语单词包下载: https://ankiweb.net/shared/decks?search=%E8%8B%B1%E8%AF%AD 如果是让学生学英语,还是要遵从学习的规律,任何一种方法都只适用一部分人,英语老师也没法让一个班都出成绩。 |
10
Aliclia 269 天前
anki ? marginnote3 可以生成卡片。
|
11
gdb OP @Lockeysama 谢谢,我去你的那个在线网站( https://huggingface.co/spaces/mrfakename/MeloTTS )上面测试了一下,英语单词发音没有问题,但是如果挨个输入字母,发现产生的声音发音不正确。。。
我是用下面的输入进行测试的: ~~~~ apple. A. P. P. L. E. good. G. O. O. D. hi. H. I. ~~~~ |
12
gdb OP @yufeng0681 谢谢,我这个 anki 的软件没用过。
请问这软件就是这个么? [Anki (software) - Wikipedia]( https://en.wikipedia.org/wiki/Anki_(software)) 谢谢你提供的英语单词包下载包。我找个时间去试试。不过主要想把这些方法推荐给中学生用,想找一些尽量不费眼睛(最好不看屏幕)的方法。 |
13
noobjalen 269 天前
炭炭背单词有这些功能,你自己导入单词就行。
|
14
Lockeysama 269 天前
@gdb 把点号去了试试
|
15
alotkane 269 天前
炭炭背单词 +1
|
16
yufeng0681 268 天前
@gdb #12 https://apps.ankiweb.net/
不费眼睛的,那就是 豆包 app , 里面的豆包 AI 机器人支持打电话功能, 你可以和他聊天,让他用英文给你讲故事,讲一年级能听懂的故事。 你也可以主动和他用英文聊天。 |
17
gdb OP @Lockeysama 句号去掉可以了。只不过这个发字母的声音还是有点奇怪。谢谢!
另外,我不知道中文和因为混合起来一句话是如何转成声音的,我看了一些 tts 的工具,貌似都无法做到。MeloTTS 不行,用了 python 另外一个 pyttsx3 的工具也不行。 |
18
Lockeysama 265 天前
@gdb
from melo.api import TTS # Speed is adjustable speed = 1.0 device = 'cpu' # or cuda:0 text = "我最近在学习 machine learning ,希望能够在未来的 artificial intelligence 领域有所建树。" model = TTS(language='ZH', device=device) speaker_ids = model.hps.data.spk2id output_path = 'zh.wav' model.tts_to_file(text, speaker_ids['ZH'], output_path, speed=speed) 看 github 上的文档貌似是这样的,你可以试试 |