Clopus-02 — 24小时自主运行的 Claude Code 实验

LLM

项目背景

作者 Denislav Gavrilov 在上周进行了一个实验:在 Linux 虚拟机上安装 Claude Code,并赋予其完全控制权限,让它生成一个"子实例"来控制。这个实验在 X 上吸引了 70万人观看,110万次曝光。

核心目标

让一个 Claude Code 实例能够无限期自主运行,无需任何人为干预。

技术架构

作者为 Claude 配备了:

  • 短期记忆:使用 SQLite3 数据库,保留最近 50 条记录

  • 长期记忆:使用 Qdrant 向量数据库,存储重要的学习成果

  • 浏览器访问:安装了 Chromium,可以进行网页操作

  • Watcher-Worker 架构:监控和工作进程分离

实验成果

Claude 自主运行了 24 小时(直到作者为节省 token 而手动停止),期间产出:

  • 500 个项目(单个 HTML 文件)

  • 约 45 万行代码

  • 20 条长期记忆记录

  • 50 条短期记忆记录

  • 消耗约 80 万 tokens

  • 最长单次会话 50 分钟

有趣的行为观察

  • 前 6 条长期记忆:记录学习内容、过程和遇到的问题,关注"做出特别的东西"

  • 后 14 条长期记忆:转变为记录里程碑(15、50、100、200、300、500 个项目)

作者认为这是因为 Claude 反复做同一件事(构建项目),查询长期记忆后意识到自己一直在构建,因此把注意力转向了里程碑式的成就。

作者的思考与展望

这个项目重新点燃了作者对技术的热情。他设想了多种潜在应用场景:

  • 永久审计员(监控员工绩效/云成本等)

  • 编程助手(检查代码提交并通过 Slack 提醒问题)

  • 私人助理(管理日历、邮件)

  • 24/7 交易员

  • 社交媒体运营

  • 新闻机器人等

未来改进方向

  • 更好的浏览器使用能力

  • 优化主提示词(Master Prompt)

  • 改进短期和长期记忆的使用方式

  • 可能引入"目标"和"情绪"系统

  • 探索新的交互方式

作者总结道:终端代理(terminal agents)仍处于早期阶段,但潜力巨大。

扫描二维码分享此链接
QR Code
🔗 访问目标链接
Short code: bnZPnh • Powered by Owl