V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Acorns
V2EX  ›  程序员

开源高性能语音识别服务器

  •  
  •   Acorns · 1 天前 · 1520 次点击

    SpeakSense ASR Server: 高性能语音识别服务器实现

    大家好!今天给大家介绍一个基于 OpenAI Whisper 的高性能语音识别服务器实现 - SpeakSense ASR Server 。这是一个使用 Rust 开发的完整解决方案,支持多平台部署,并提供了灵活的 API 接入方式。 项目地址:GitHub - Whisper ASR Server

    🌟 主要特性

    1. 双模式 API 支持

    • gRPC 服务:支持流式语音识别,适合实时转写场景
    • REST API:提供完整的任务管理接口,包括:
      • 任务创建(支持 URL 和本地文件)
      • 任务状态查询
      • API 密钥管理

    2. 强大的任务调度系统

    • 自动音频文件下载
    • 异步转写处理
    • HTTP 回调通知
    • 完整的任务生命周期管理

    3. 全平台支持

    • 🍎 MacOS ( Metal 加速)
    • 🐧 Linux ( CUDA 加速)
    • 🪟 Windows ( CUDA 加速)

    4. 企业级特性

    • 内置身份认证系统
    • 可配置的任务队列
    • 灵活的存储方案
    • 支持微服务架构

    🚀 为什么选择 Whisper ASR Server ?

    1. 高性能

      • 使用 Rust 语言开发,确保最佳性能
      • 支持硬件加速( CUDA/Metal )
      • 优化的任务调度系统
    2. 易于部署

      • 提供 Docker 支持
      • 简单的环境变量配置
      • 详细的部署文档
    3. 开发者友好

      • 完整的 API 文档
      • 提供客户端示例
      • 支持多种接入方式
    4. 生产环境可用

      • 内置认证机制
      • 可靠的错误处理
      • 支持横向扩展

    🔧 快速开始

    只需几个简单步骤即可部署:

    # 1. 克隆仓库
    git clone https://github.com/yourusername/whisper-asr-server.git
    
    # 2. 下载模型
    ./script/download-ggml-model.sh
    
    # 3. 构建项目(支持多种模式)
    cargo build --release  # 标准版本
    cargo build --release --features cuda  # CUDA 支持版本
    cargo build --release --features metal  # Metal 支持版本( MacOS )
    

    💡 应用场景

    • 音视频内容自动字幕生成
    • 会议记录自动转写
    • 语音指令识别
    • 实时语音转写服务
    • 音频内容分析

    🤝 开源贡献

    项目采用 Apache License 2.0 开源协议,欢迎社区贡献!无论是提交 PR 、报告问题还是提供建议,我们都非常欢迎。

    📮 结语

    如果你正在寻找一个可靠的、高性能的语音识别解决方案,Whisper ASR Server 绝对值得一试。项目正在积极维护中,欢迎大家 Star 和 Fork !

    项目地址:GitHub - Whisper ASR Server

    如果觉得项目对你有帮助,别忘了给个 Star ⭐️!

    #语音识别 #Rust #OpenAI #Whisper #ASR #开源项目

    第 1 条附言  ·  1 天前
    非常抱歉,第一次发 V2EX ,由于使用 AI 帮忙生成了文章部分内容,没有检查 GitHub 地址,这里跟补充地址: https://github.com/bean-du/SpeakSense
    15 条回复    2024-11-16 15:09:41 +08:00
    icefrogisgreat
        1
    icefrogisgreat  
       1 天前
    GitHub 地址应该是填错了,显示 404
    RockShake
        2
    RockShake  
       1 天前
    用 AI 生成的文案都没改就复制过来了: https://github.com/yourusername/whisper-asr-server
    alexsz
        3
    alexsz  
       1 天前
    yourusername 😂
    dismantle
        4
    dismantle  
       1 天前
    文案太走心了, 甚至仓库都是错的
    qiayue
        5
    qiayue  
       1 天前
    hanguofu
        6
    hanguofu  
       1 天前
    能支持 armv8 ( AArch64 ) 吗 ?
    Metatron7
        7
    Metatron7  
       1 天前
    .DS_Store 也搞进来了,有点搞笑
    Acorns
        8
    Acorns  
    OP
       1 天前
    @icefrogisgreat 不好意思已经修改,地址: https://github.com/bean-du/SpeakSense
    Acorns
        9
    Acorns  
    OP
       1 天前
    不好意思,已经修复了,地址: https://github.com/bean-du/SpeakSense
    Acorns
        10
    Acorns  
    OP
       1 天前
    @RockShake 被你发现了
    humbass
        11
    humbass  
       1 天前
    这么牛逼的吗,收藏支持!!!
    kkk9
        12
    kkk9  
       1 天前
    一定要 CUDA 吗……有没有办法 CPU 跑
    Acorns
        13
    Acorns  
    OP
       1 天前
    @kkk9 可以 CPU 跑,只是会慢一点儿,不过这个模型优化过也比原始的快很多,可以选小一些尺寸的模型,README.md 里面有介绍模型的下载地址
    Acorns
        14
    Acorns  
    OP
       1 天前
    @humbass 谢谢支持
    cooltechbs
        15
    cooltechbs  
       23 小时 11 分钟前 via Android
    我记得 V2EX 禁止 GenAI 内容来着(🐶
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2699 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 06:21 · PVG 14:21 · LAX 22:21 · JFK 01:21
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.