My Digital Worker
一、总体目标
1. 最终目标
- 数字员工可 24 小时持续处理任务
- 白天:我在线时,通过 AI IDE / Agent 加速高价值工作
- 夜晚:数字员工自动运行,完成信息收集、初步分析与准备性工作
核心思想是:把人类最稀缺的清醒时间,用在判断、决策和创造上。
2. 拆解目标
每日自动完成:
- AI / 技术前沿信息汇总
- 金融与宏观相关信息收集
- 结果结构化写入数据库,形成可查询、可回放的数据资产
充分利用夜间时间,形成“睡后工作”能力
二、总体思路与路径
1. 自动化思路
打通“最后一公里自动化”,逐步接管每日重复、低价值但必要的工作
将个人时间从:
- 信息搬运
- 初级整理
- 机械执行
转移到:
- 竞争性判断
- 方向选择
- 关键决策
数字员工的定位不是“炫技智能”,而是稳定、可控、可复用的工作单元。
2. 阶段性目标(由浅入深)
阶段 1:基础执行型 Agent
接管终端,能够:
- 拉起、调通程序
- 执行固定脚本
自动浏览:
- GitHub Trending
- 重点项目的 PR / Issue
对明确问题给出可复用的模板化回复或草稿
阶段 2:信息理解与整理
阅读并总结:
- 技术报告
- 博客文章
- 社区讨论
输出:
- 趋势总结
- 优先级排序
- 初步结论与不确定性标注
阶段 3:决策辅助与前置分析
针对潜在方向,输出:
- ROI 初步估计
- 实现路径拆解
- 开发人力与成本假设
自动生成:
- 需求分析初稿
- 设计文档骨架
三、数字员工的“能力培养”问题
1. Agent 的 taste
数字员工并不是一开始就“懂你”,需要被逐步训练工作品味(taste),包括:
- 什么信息值得关注
- 什么是噪声
- 哪类结论对决策有帮助
这依赖于:
- 长期一致的反馈
- 可回放的数据与决策链路
- 明确的偏好编码(而不是模糊指令)
2. 数据与工具接入
数据源:
- 爬虫接入(技术社区、资讯站点)
- 结构化与非结构化混合
工具能力:
开源工具优先
API 接入需考虑:
- 价格
- 稳定性
- 智能水平差异
四、Agent 开发风格与工程约束
为了避免“看起来很聪明,但不可靠”的情况,必须采用强工程化约束:
1. 设计原则
不发呆、不死锁:
- 所有任务必须有超时、失败路径
低危险性:
- 禁止不可逆操作
- 高风险操作需人工确认
强监管:
- 全链路日志
- 中间结果可审计
易回放:
- 每一次决策与执行都可重现
2. Agent 的 TDD 风格
任务先定义:
- 输入
- 期望输出
- 校验规则
LLM 只是其中一个组件
最终结果必须通过 强校验,而不是“感觉还行”
五、关于 LLM 的现实判断
1. 当前策略
暂不自建 LLM:
- 硬件成本高
- 系统复杂度过大
优先使用 API 形态的模型
2. 对 API 型 LLM 的定位
视为:
- 短上下文
- 可执行简单任务的智能组件
必须配合:
- 强约束提示
- 明确任务说明
- 严格结果校验
稳定性优先于“看起来更聪明”。