Runcell:让你的 Jupyter Notebook 变成数据科学“副驾驶”的 AI Agent
Updated on

如果你一天大部分时间都在用 Jupyter Notebook,你大概率已经试过 GitHub Copilot 或 Cursor 这样的 AI 编码工具。它们在自动补全方面很强,但只停留在文本层面——你仍然需要自己粘贴代码片段、运行单元格、调试报错、安装缺失的包,还得时刻记住当前有哪些变量。
Runcell 往前走了一步。
它把一个自治 AI agent 直接嵌入到 Jupyter 里,可以读取实时环境——变量、单元格、DataFrame、图表——然后自动写代码、执行、调试并迭代。你不用在对话框和单元格之间来回切换,整条工作流变成一个连续闭环。
Runcell 到底是什么?
Runcell 是一个 JupyterLab 扩展 + Python 包(pip install runcell),可以把你的 Notebook 变成一个由 AI 驱动的自动化环境。
和独立的聊天助手不同,Runcell 可以:
- 读取 Notebook 状态(
globals()、单元格历史、变量) - 插入并运行代码单元格
- 生成可视化图表
- 调试失败的代码
- 用自然语言解释结果
- 随着 Notebook 的变化重新规划工作流
用起来更像是和一个能直接替你敲键盘的初级开发者结对编程,而不是简单的自动补全。
四大核心模式(含演示视频)
Runcell 把能力划分成四种模式。下面是来自 runcell.dev 的官方演示。
🎓 交互式学习模式(Interactive Learning Mode)
充当 AI 教师,用可运行的例子讲解算法——非常适合学习 K-means vs DBSCAN、PCA、聚类等主题。
🤖 自主 Agent 模式(Autonomous Agent Mode)
也就是传说中的 “YOLO 按钮”。
Agent 会规划任务、写代码、运行单元格、修复错误、安装包,并持续重试直到完成目标。
✏️ 推理 Agent(Reasoning Agent)
高级推理模式,会先逐步思考再行动。它会深入分析你的 Notebook,给出可靠的重构、代码优化或分步骤解题方案。
💬 AI 增强 Jupyter(AI-Enhanced Jupyter)
向它提问代码、让它解释实现细节、生成图表或输出总结——所有内容都会直接写回 Notebook。
为什么“上下文”这么重要?
大多数 AI 助手都工作在 Notebook 之外。它们在完全不了解以下情况时生成代码片段:
- 当前有哪些变量
- 导入了哪些库
- 你的 DataFrame 什么结构
- 之前出现过什么错误
- 哪个单元格产生了哪个输出
于是就形成了经典循环:“复制 → 粘贴 → 运行 → NameError → 手动修”。
Runcell 的做法是,在生成代码之前,先读取环境上下文。
它会知道:
df_sales是一个 100 万行的 pandas DataFrame- 你已经
import matplotlib.pyplot as plt - 前一个单元格画出了 seaborn heatmap
- 你的 kernel 2 分钟前刚重启过
这种对上下文的感知能力,让 Runcell 能够真正完成多步任务,而不是只给你半成品脚手架。
这个思路建立在 Jupyter 生态近期对 Notebook Intelligence (NBI)、tool-calling 和 Jupyter AI magics 的探索之上,但 Runcell 把它们打包成了一个开箱即用、打磨好的体验。
典型使用流程
使用 Runcell 一般是这样的体验:
1. 安装
pip install runcell
jupyter labextension enable runcell # Lab 4 auto-detects the extension2. 打开任意 Notebook
点击侧边栏里的 Runcell 图标。
3. 告诉它你的需求:
“加载
sales.csv,按地区计算同比增长,并用 seaborn heatmap 可视化。”
4. 看着 agent 搞定剩下所有步骤:
- 创建新的代码单元格
- 按顺序运行
- 若缺少
seaborn就自动安装 - 修复导入错误
- 用 Markdown 解释结果
- 当你修改单元格时自动重新规划
这是一个从头到尾都有“辅助驾驶”的 Notebook 工作流——而且你始终在 Jupyter 里。
Runcell 最适合做什么?
🔍 探索性数据分析(EDA)
自动完成导包、清洗、采样、profiling 和图表生成。
📊 报表类工作流
每月重复运行的 Notebook(逻辑不变、数据更新)非常适合交给 Autonomous Agent 模式。
🧪 教学与演示
Interactive Learning Mode 可以把抽象概念变成可运行、可调参的示例。
🧩 重构与调试
Reasoning Agent 能帮助找 bug、重写函数、简化混乱的 Notebook。
💨 快速原型
要图表、要新模型、要尝试不同思路,都可以快速尝试,而不必手写大量样板代码。
在多种环境中的无缝集成
Runcell 支持:
- JupyterLab 4
- Classic Notebook
- VS Code Notebooks
不需要换编辑器,也不用重新学习一套工作流。
只要装上,它就直接出现在你现有的环境中。
限制与注意事项
🔐 目前以云端 LLM 为主
Runcell 默认使用云端模型,除非你配置本地模型。对于敏感数据集,可能需要离线模式或更谨慎的配置。
🧠 自主模式需要清晰目标
如果你的指令太模糊,Autonomous Agent 模式可能会用掉更多 token。
🧬 多语言 Notebook
目前 Python 体验最佳;R/Julia 支持仍处于实验阶段。
🖥️ 超大 Notebook 可能会被摘要
体积很大的 DataFrame 在发送给模型前,可能会被采样或摘要化处理。
总结
Runcell 不只是自动补全。
它是一个覆盖全链路的 Notebook 自动化——从规划、写代码、执行、调试,到结果解释——全部在 Jupyter 内完成。
它把 Notebook 从一个完全手动的工具,升级成一个与你协作的 AI 工作空间,帮助你更快地思考、迭代和交付。
如果你想要一个真正“懂你的 Notebook 并和你一起工作”的 agent,可以尝试:
pip install runcell给你的 Jupyter 工作流装上一个副驾驶,也顺便给键盘放个假。