直播或录制视频时想加上实时字幕,方便大家理解,但市面上的工具样式单一且无法修改。
直播或录制视频时想加上实时字幕,方便大家理解,但市面上的工具样式单一且无法修改。
最近在 GitHub 上发现 Curses 这个开源工具,专为 OBS、VRChat、Twitch 和 Discord 提供语音转文字字幕,而且自定义程度非常高。
支持多种语音识别引擎,包括微软 Azure、Speechly、Deepgram 和浏览器自带的 WebSpeechAPI,还能反向 ...
想训练一个机器学习模型,需要懂算法、写代码、调参数,这些门槛直接劝退大部分人。
想训练一个机器学习模型,需要懂算法、写代码、调参数,这些门槛直接劝退大部分人。
GitHub 上 Plexe 这个开源项目,大幅降低了门槛,然我们用自然语言描述需求,就能自动构建机器学习模型。
只需要用人话说明 “想预测什么”、“输入是什么”、“输出是什么”,系统就会通过多智能体协作,自动完成数据分析、方案规划、 ...
想要找个好用的 AI 网页自动化工具或浏览器智能体,网上资源太分散,GitHub 上一个个项目翻过去,既费时间又容易错过好东西。
想要找个好用的 AI 网页自动化工具或浏览器智能体,网上资源太分散,GitHub 上一个个项目翻过去,既费时间又容易错过好东西。
最近在 GitHub 上发现 Awesome Web Agents 这份精选合集,系统性地整理了各类 AI 网页智能体相关的工具、框架和资源。
按照自主浏览智能体、自动化工具、爬虫工具、搜索工具等分类整理,涵盖 O ...
有时候,Windows 系统会在我们工作或玩游戏时,突然自动更新重启,打断手头的事情,让人措手不及。
有时候,Windows 系统会在我们工作或玩游戏时,突然自动更新重启,打断手头的事情,让人措手不及。
偶然 GitHub 上发现 Windows Personalization Utility 这个开源工具,能将系统更新暂停到 2051 年,把设备控制权交还给用户。
提供两种使用方式:批处理工具和注册表脚本,前者功能更全面,后者无需管理员权限,一键运 ...
GitHub 上 Screenpipe 这款开源工具,可能是老板们的监工神器。我们在电脑上做过的事情,看过的网页,说过的话,都能记录下来。
GitHub 上 Screenpipe 这款开源工具,可能是老板们的监工神器。我们在电脑上做过的事情,看过的网页,说过的话,都能记录下来。
并且我们在回看的时候,还可以通过自然语言快速搜索到,想要查找的内容。
技术原理主要通过持续截屏配合 OCR 文字识别,加上音频转录技术,把我们在电脑上的所有操作都存成可搜索的数据库, ...
在 GitHub 找到了 AI-research-SKILLs 这个开源项目,为 AI Agent 准备的一套“研究工程技能包”。
让 AI 辅助写代码时,遇到模型训练或部署这类复杂任务,经常发现生成的代码引用了过时 API,甚至直接“幻觉”出不存在的参数,调试起来比自己写还累。
于是在 GitHub 找到了 AI-research-SKILLs 这个开源项目,为 AI Agent 准备的一套“研究工程技能包”。
收录了 83 项硬核 AI 研究技能,并且按照模型架构、分词器、微 ...
推荐【2026 AI 漫剧必备工具箱】
推荐【2026 AI 漫剧必备工具箱】
1️⃣ 结构 & 世界观|GitMind
gitmind.cn/one-liner-mindmap
2️⃣ 选题 & 设定|ChatGPT
chatgpt.com
3️⃣ 解说台词|Gemini 2.5 Pro
gemini.google.com
4️⃣ 声线生成|MiniMax / TTS
minimax.io
5️⃣ 成片剪辑|CapCut
capcut.com
##
...
逮到一款开源神器:VideoCaptioner
逮到一款开源神器:VideoCaptioner
基于大语言模型(LLM)的视频字幕处理助手,支持语音识别、字幕断句、优化、翻译全流程处理,windows可以下载安装包直接用,感觉非常适合搞油管视频搬运这种情景,传了一个YouTube视频试了下,调用的本地的Whisper模型,从识别到断句确实非常稳
传送门:github.com/WEIFENG2333/VideoCapti ...
豆包视频生成模型Seedance 2.0 上线了 正式接入豆包App、电脑端和网页版
豆包视频生成模型Seedance 2.0 上线了
正式接入豆包App、电脑端和网页版
##
一个免费的在线拼图工具 Collaigo
一个免费的在线拼图工具 Collaigohttps://collaigo.com创作背景在社交媒体时代,无论是个人分享生活点滴,还是品牌运营社交媒体账号,拼贴图都成为了内容创作的重要形式。然而,我在使用现有工具时遇到了不少痛点:
[*]功能限制:很多工具只能做简单的网格拼图,缺乏创意空间
[*]操作复杂:需要学习复杂的软件操作,上手门 ...
新人帖
SD画图助手-AI探金官方
今日AI绘画~❤️ 基stable-diffusion-xl-base-1.0模型的构思出的AI绘画图
评论可互动画自己想要画的,我要画:___________ 如:我要画:一个可爱的站着的长头发女孩。
5分钟左右给你绘画结果~
钢琴转谱工具 |AI 探金社区 更多 AI 工具资讯案例
钢琴转谱工具 - AI 探金社区https://aitanjin.ai-51.com/topic/41926
https://aitanjin.ai-51.com欢迎使用体验,还有更多的 AI 工具到 AI 探金社区,欢迎入驻社区:https://aitanjin.ai-51.com/tools
新人帖
AI 音乐生成器
AI 音乐生成器,有免费试用机会
链接:https://ai-music-gen.com/ 直接生成
AI 工具分享|一键人像抠图换背景 - AI 探金社区
一键人像抠图换背景:https://aitanjin.ai-51.com/topic/41527欢迎大家使用
AI 探金社区 https://aitanjin.ai-51.com
NotebookLM 可以说是 Google 最好的免费 AI 工具。
NotebookLM 可以说是 Google 最好的免费 AI 工具。可以用它分析文档,把文档做成播客,生成精美的信息图和 PPT。但这些都只是 NotebookLM 最简单基本的功能。如何才能发挥出 NotebookLM 最大潜力?AI Master 分享了让你超越 99% NotebookLM 用户的使用方法。
NotebookLM 本质上不是一个笔记本,也不是聊天工具,而是一个 ...
当程序员不再写代码,他们在做什么?
【当程序员不再写代码,他们在做什么?】
Spotify 最近放出一个惊人消息:公司最优秀的开发者从去年十二月起就没写过一行代码了。工程师在通勤路上用手机给 AI 下指令修 bug、加功能,到办公室前新版本就已经准备好合并上线。
标题党?当然是。但背后的趋势却真实得让人坐立不安。
不写代码不等于不做工程。顶尖开发 ...
清华大学Xmax AI团队搞的首款实时交互视频模型来了:X1,可以实时与虚拟角色互动,能伸手触摸
清华大学Xmax AI团队搞的首款实时交互视频模型来了:X1,可以实时与虚拟角色互动,能伸手触摸
通过手机摄像头与虚拟元素实时互动,毫秒级超低延迟与无限时长生成
把数字生命召进现实,无需手柄点击屏幕,用手势互动即可
官网:http://t.cn/AX5B4gN6
## http://t.cn/AX5BbymY
...
一款Rust版OpenClaw:moltis,单个静态二进制文件,零Node.js依赖
一款Rust版OpenClaw:moltis,单个静态二进制文件,零Node.js依赖
统一接口接入Codex、Copilot以及本地LLM,支持故障转移链
内置本地模型支持,自动下载配置模型,可完全离线运行
所有命令在Docker或Apple Container沙箱中会话级隔离执行;环境变量自动脱敏(覆盖明文、base64、hex 形式);首次运行终端打印设置码,杜 ...
2026年重要的AI工具 建议直接收藏
2026年重要的AI工具
建议直接收藏
1️⃣ ChatGPT —— 什么问题都能问
2️⃣ RecCloud —— 一键换声音
3️⃣ Krea AI —— 快速做 Logo / 视觉
4️⃣ ElevenLabs —— 声音克隆,像真人一样
5️⃣ Gamma —— 文档、方案直接生成
6️⃣ Suno —— AI 写歌、做配乐
7️⃣ Runway —— AI 剪视频
8️⃣ Relume —— 做网站 ...
解锁思维新境界,C-AiMind:AI赋能的思维导图神器
解锁思维新境界,C-AiMind:AI赋能的思维导图神器
前端必备工具推荐网站(免费图床、API和ChatAI等实用工具):
http://luckycola.com.cn/C-AiMind官网: https://luckycola.com.cn/public/dist/#/aiQStore/aiMindPage
在这个信息爆炸的时代,如何高效整理思绪、规划项目成为了我们日常工作中不可或缺的一环。今天,就让我为大 ...