查看: 12|回复: 0

发现一个开源项目叫 Type4Me,作者自己定位就是 Typeless 平替,MIT 协议,免费用。

[复制链接]

14

主题

0

回帖

42

积分

新手上路

积分
42
发表于 昨天 13:22 | 显示全部楼层 |阅读模式
发现一个开源项目叫 Type4Me,作者自己定位就是 Typeless 平替,MIT 协议,免费用。


它最吸引我的地方有两个。

第一个是本地识别。底层跑的是 SherpaOnnx 引擎,不需要联网,不需要 API Key,Apple Silicon 上速度很快。你的语音数据全程不出本机,所有识别历史都存在本地的 SQLite 里,没有遥测,没有云同步。如果你觉得本地识别的准确率不够用,也可以切到云端引擎,目前支持火山引擎和 Deepgram。

第二个是它把语音识别和大模型串起来了。识别出文字之后,可以直接交给大模型做后处理,比如润色、翻译、按你写的 Prompt 做任意加工。内置了几种常用模式,也完全可以自己定义。更狠的是它有个命令模式:选中一段文字,按快捷键,对着麦克风说你想让大模型干什么,选中的文字就是上下文,大模型直接执行然后输出结果。等于把语音变成了大模型的命令行。

架构上做了插件化设计,加新的识别引擎只需要实现两个协议然后注册,Whisper、Google、AWS 的接口都预留好了,等社区来填。

要求 macOS 14 以上,GitHub 地址:github.com/joewongjc/type4me

##


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关注公众号

相关侵权、举报、投诉及建议等,请发 E-mail:admin@discuz.vip

Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.|青ICP备2025004122号-1

在本版发帖
关注公众号
返回顶部