autoresearch 是 Andrej Karpathy 开发的一个实验性框架,项目让 AI Agent(如 Claude 或 GPT-4)自主进行机器学习研究。
autoresearch 是 Andrej Karpathy 开发的一个实验性框架,项目让 AI Agent(如 Claude 或 GPT-4)自主进行机器学习研究。该项目建立了一个闭环系统,允许 Agent 直接修改核心训练代码(train.py),然后在单 GPU 上运行固定时间(如 5 分钟)的训练实验,并根据验证集性能(val_bpb)决定是否保留修改;通过这种方式,Agen ...
实际的应用,我是一个之前从来没有软件开发经验的人,但是靠我一个人和minimax的Coding Plan,已经完全写出了一个可用的,国内版的
我这两天尝试用Claude code和Openclaw写了一些实际的应用,我是一个之前从来没有软件开发经验的人,但是靠我一个人和minimax的Coding Plan,已经完全写出了一个可用的,国内版的notebookLM,从一个“原生”AI开发者的视角来说,如果我想让这个项目跑起来,只需要解决法规问题就够了。
但是想让这个应用正真的被用起来,让 ...
阿里出了很多小尺寸的模型,比如4B,9B这样的。 小模型智能不是特别高,有很多任务搞不定,比如说编码,智能体任务。
阿里出了很多小尺寸的模型,比如4B,9B这样的。
小模型智能不是特别高,有很多任务搞不定,比如说编码,智能体任务。
但是大家千万不要以为小模型智能不高,就没有用。
事实上,各种大厂的产品,后面都大量的用了小模型。
为什么呢?
因为有很多任务对于智能的要求就不是很高。
小模型的智能虽然不高,但是已经足够完成很 ...
Claude Code 新增的 /loop 命令猛啊
Claude Code 新增的 /loop 命令猛啊
可以连续三天帮你执行重复性任务,最细的粒度可以到每五分钟执行一次
这下把 Openclaw 的定时任务也搞来了,比如可以帮你定时审查 github 的 PR 或者每天帮你总结相关信息进行提醒
结合我的 Feishu 或者 Telegram Skills 可以定时给你的手机推送信息了,这个想象力太大了。#how i ...
Karpathy深夜炸出自动化AI研究新项目
Karpathy深夜炸出自动化AI研究新项目:autoresearch ,让AI帮你做自动化循环LLM训练,你给指令然后躺着等结果
5分钟即完成一次训练,单卡能跑
人工不用在苦哈哈的去改Python代码、调参数、改神经网络架构,只给Prompt,AI自己去修改代码优化模型
给AIAgent一个真实的LLM训练环境,让它通宵达旦自主进行实验研究,人类给P ...
全程没开编辑器:AMD 副总裁仅用 Claude AI 生成 Python 代码,直接对话 Linux GPU 内核驱动
【全程没开编辑器:AMD 副总裁仅用 Claude AI 生成 Python 代码,直接对话 Linux GPU 内核驱动】AMD 企业副总裁 Anush Elangovan 仅通过 Claude Code 生成 Python 代码,创建了一个轻量级 Radeon 驱动测试工具。该工具绕过 ROCm 软件栈,直接与 Linux 内核 GPU 接口交互,用于调试和硬件功能测试。……
...
Openclaw使用一个月,深感震撼,大家的热衷不是没有道理的,就像2025年1月Deepseek的爆火,都是能够让我们马上感知到的震撼。
Openclaw使用一个月,深感震撼,大家的热衷不是没有道理的,就像2025年1月Deepseek的爆火,都是能够让我们马上感知到的震撼。
下面是基于我的使用体验及交流的6个预测:
1. 人手一只"龙虾"
脑力劳动者将一人一只龙虾(AI助手),
开始替代自己干活。
2. 互联网服务 = Agent 自动调用
搜索、电商、社交媒体等服务的使 ...
为什么程序员和AI从业者,最近总感觉自己在小岛秀夫的游戏里?
【为什么程序员和AI从业者,最近总感觉自己在小岛秀夫的游戏里?】
快速导读:AI巨头及其创始人的名字连起来看,充满了一种诡异的、被设计好的宿命感。这让许多人产生了一个离奇的共识:我们可能活在一场大型游戏中。
---
ChatGPT的创造者叫Altman,可以理解为“人类的替代品”(Alternative to human),但他领导的公 ...
25 tokens/s vs. 50+ tokens/s,一个残酷的测试戳破了Ollama的神话
【25 tokens/s vs. 50+ tokens/s,一个残酷的测试戳破了Ollama的神话】
快速导读:很多人用Ollama或LM Studio图个方便,但一个在技术圈引起热议的帖子指出,这种便利的代价可能是损失超过一半的性能。一个叫llama-swap的轻量级工具,正在成为高阶玩家的新选择。
---
LM Studio里跑一个大模型,速度20-25 tok/s。换成纯 ...
在线向量数据库经常只提供基础的相似度搜索,结果固定不变,人工调整复杂。
在线向量数据库经常只提供基础的相似度搜索,结果固定不变,人工调整复杂。
最近发现 RuVector 这个开源项目,它是一个用 Rust 打造的高性能、实时自学习向量图神经网络和数据库,集成了自适应优化和本地 AI 推理,性能秒杀传统向量库。
RuVector 最大亮点是它的 GNN 层能够自动从每次查询学习,搜索结果随着使用自动提升 ...
在线阅读代码仓库总是东奔西跑,还得切换多个工具才能理清调用关系和依赖脉络,效率低且容易遗漏重要细节。
在线阅读代码仓库总是东奔西跑,还得切换多个工具才能理清调用关系和依赖脉络,效率低且容易遗漏重要细节。
GitNexus:零服务器的代码智能引擎,完全在浏览器端运行,直接拖入 GitHub 仓库或者 ZIP 压缩包,就能生成交互式的代码知识图谱,帮你全方位洞察代码架构。
不仅支持复杂调用链、依赖关系的可视化分析,还有强大 ...
每一个用Whisper的开发者,迟早都会被这个“YouTube幽灵”缠上
【每一个用Whisper的开发者,迟早都会被这个“YouTube幽灵”缠上】
快速导读:OpenAI的语音识别模型Whisper有个诡异的特性:在没有声音时,它不会输出空白,反而会自信地编造一些句子。一线开发者们汇总了135个这样的“幻觉”,发现这些胡话竟是模型训练数据——海量YouTube视频——留下的“胎记”。
---
一个开源会议机 ...
你以为AI Agent是魔法,其实90%的工作是管道疏通
【你以为AI Agent是魔法,其实90%的工作是管道疏通】
快速导读:一位给20多家创业公司构建AI Agent的开发者总结:多数人失败,因他们总想跳过工程,直奔模型。但现实是,构建可靠的AI Agent,90%是处理API、JSON、数据库和日志等“无聊”的系统工程,模型只是顶层的决策组件。
---
一位开发者今年给20多家创业公司做了A ...
停止给AI写“提示词”,请开始给它写“职位描述”
【停止给AI写“提示词”,请开始给它写“职位描述”】
快速导读:别再把Claude Skills当成一个保存提示词的收藏夹了。真正的突破在于,把它看作一份给AI员工写的、极其详尽的“职位描述”。定义它的角色、明确它的禁区、强制它的输出格式——这个思维转变,是区分AI业余玩家和专业选手的关键。
---
Anthropic推出Skills ...
开源一个用于实时监控 OpenClaw 对话会话的终端工具
开源一个用于实时监控 OpenClaw 对话会话的终端工具,能够读取 OpenClaw JSONL 文件里的 System msg,很适合投到大显示器上看他干活,或者用手机打开 Termux 监控它执行长任务。
想做一支像样的音乐视频,可预算不够、不会剪、也没有团队,怎么办?
想做一支像样的音乐视频,可预算不够、不会剪、也没有团队,怎么办?
AI 创作博主 FILM CRUX 介绍了一款专门用来制作 AI 音乐视频的工具:Vidmuse。它不是单纯给你几个模板,而是先 “听懂” 你用来制作 MV 的歌。你把歌曲传进去,不管是 MP3 还是 AI (例如 Suno)生成音乐的链接,它都会先分析节拍、速度、响度和段落, ...
在线开发者和 AI 爱好者注意了!
在线开发者和 AI 爱好者注意了!OpenAI 发布了超实用的开源项目「Skills Catalog for Codex」,它收集了大量可被 AI 代码代理(Codex)调用的技能包,帮助实现各种编程任务的自动化和智能化。
这些「技能」本质上是任务指令、脚本和资源的合集,Codex 可以用它们来完成特定工作,实现写一次、处处用的高效复用。
亮点功 ...
再来一条玩 🦞 小技巧:
再来一条玩 🦞 小技巧:
你可能从网上下了一堆 skills,但这些 skills 的作者后续可能还会更新,你可以设一个定时任务,让 🦞 一周去看一下,更新一下。
我给的指令:「整理一下我们哪些 skills 是自己做的,哪些是从网上下的,从网上下的,作者可能会有后续更新,设置一个 cron 任务,每周去看一下,觉得更新不错,就自 ...
抽空写一下关于 AI 开发和组织效率提升的一些想法。
抽空写一下关于 AI 开发和组织效率提升的一些想法。
去年的一段时间里,行业里关于 AI 开发的讨论,主要还是围绕工具和模型,比如从 Cursor 到 Claude Code,从 Claude Sonnet 3.5 到 Claude Opus 4.6。到了今年,整体来看工具和模型的提升都趋于平稳,行业里更关心的问题变成了:如何让 AI Coding 真正帮助组织/团队提升 ...
NotebookLM 推出了新功能"电影级视频概览"功能
NotebookLM 推出了新功能"电影级视频概览"功能
就是你把资料丢进NotebookLM,它能自动帮你生成一段沉浸式的视频来讲解这些内容
不是简单套模板,而是用Google 最先进的多个 AI 模型自动组合生成的定制视频。
目前只对 Ultra 付费用户开放,仅支持英文。
详细介绍↓
这个视频其实也是NotebookLM生成的 http://t.cn/AXV ...