Tutorial / Setup Overview

OpenAkita 安装教程总览

把安装方式拆开看更清晰：先看总览，再按你的场景进入 Desktop / PyPI / 源码子教程。

教程概览

推荐路径：先确认运行环境，再选择安装方式，完成后做一次启动验证。

确认环境条件

检查系统、网络和可用 LLM API 端点。

选择安装方式

Desktop 适合可视化引导，PyPI 适合脚本化，源码适合二开。

完成配置并启动

按对应子教程完成安装和配置。

执行启动验证

验证交互模式、服务模式和一次任务运行。

环境要求

项目	要求	说明
操作系统	Windows 10/11（x86_64）、macOS 12+、Linux（x86_64）	首次启动会进入配置向导
磁盘空间	至少 2 GB 可用空间	用于运行时和依赖安装
网络	可访问 Python 依赖源和 LLM 服务	首次配置需联网
LLM API	至少 1 个可用端点	快速配置必须先添加端点

安装 OpenAkita

三种安装方式适用于不同场景。建议先选一种跑通，再按需要切换。

推荐顺序：首次使用优先 Desktop，生产脚本优先 PyPI，研发团队优先源码。

启动验证

安装完成后，建议按以下顺序做最小验证：

# 交互模式
openakita

# 服务模式（仅 IM）
openakita serve

# 单次任务测试
openakita run "创建一个带测试的 Python 计算器"

交互模式可正常返回响应。
服务模式启动后无连续 ERROR。
任务模式可执行并输出结果。
若接入 IM 通道，需额外验证平台消息收发。

模式	时间	适合人群	说明
快速配置	~3 分钟	新手用户、快速体验	自动完成环境搭建，只需配置 LLM 端点
完整配置	~10 分钟	高级用户、需自定义	逐步配置所有选项，完全掌控每个细节

字段	说明	示例
服务商	选择 LLM 服务提供商	通义千问、OpenAI、Anthropic 等
Base URL	API 接口地址（选择服务商后自动填充）	`https://dashscope.aliyuncs.com/compatible-mode/v1`
API Key	你的 API 密钥	`sk-xxxxx`
模型	选择或输入模型名称（支持在线拉取模型列表）	`qwen-max`、`gpt-4o`
端点名称	自动生成，也可自定义	`dashscope-qwen-max`
能力标签	勾选该模型支持的能力	text、thinking、vision、tools

通道	接入方式	需要公网 IP	主要配置项
Telegram	Long Polling	否	Bot Token、代理地址
飞书	自建应用	否	App ID、App Secret
企业微信	智能机器人	是	Corp ID、Token、AES Key
钉钉	企业内部应用	否	Client ID、Client Secret
QQ（OneBot）	OneBot 协议	否	OneBot WebSocket URL

步骤	说明	预计耗时
1. 创建默认工作区	在 `~/.openakita/workspaces/default` 下创建工作区目录	< 1 秒
2. 安装内置 Python	下载并安装 Python 3.11 嵌入版	10~30 秒
3. 创建虚拟环境并安装依赖	创建 venv，`pip install openakita[all]`	1~3 分钟
4. 写入默认配置	将推荐配置写入工作区 `.env` 文件	< 1 秒
5. 保存 IM 通道配置	将你填写的 IM 配置保存到 `.env`	< 1 秒

操作	说明
新建工作区	输入工作区名称（如「生产」「测试」），系统自动生成 ID 并创建
设为当前	从已有工作区列表中选择一个设为当前活跃工作区

来源	说明	适用场景
PyPI（默认）	从 Python 官方包仓库安装	正式版本，推荐大多数用户
GitHub	从 GitHub 仓库安装最新代码	需要最新功能或开发版本
本地	从本地目录安装	开发者本地调试

镜像	地址	说明
官方	`https://pypi.org/simple`	默认，海外服务器
清华	`https://pypi.tuna.tsinghua.edu.cn/simple`	国内推荐
阿里云	`https://mirrors.aliyun.com/pypi/simple`	国内备选
自定义	用户指定	企业内网等场景

组件	说明
`all`	安装所有可选组件（推荐）
`windows`	Windows 桌面自动化支持
`browser`	浏览器自动化（Playwright）
`whisper`	语音识别（Whisper）
`feishu`	飞书 IM 接入
`dingtalk`	钉钉 IM 接入
`wework`	企业微信 IM 接入
`qq`	QQ（OneBot）IM 接入

字段	必填	说明
服务商	是	选择预置服务商，或选「自定义」手动填写
Base URL	是	API 接口地址，选择服务商后自动填充
API Key	是	你的 API 密钥，输入后自动存入 .env
模型	是	选择或手动输入模型 ID
端点名称	是	自动生成（格式：`{provider}-{model}`），可修改
能力标签	否	text / thinking / vision / video / tools

字段	默认值	说明
API Type	`openai`	接口类型，openai 或 anthropic
Key 环境变量名	自动生成	API Key 在 .env 中的变量名
优先级	`0`	数值越小优先级越高

服务商	API 类型	默认 Base URL
通义千问（DashScope）	openai	`https://dashscope.aliyuncs.com/compatible-mode/v1`
智谱 AI	openai	`https://open.bigmodel.cn/api/paas/v4`
百度千帆	openai	`https://qianfan.baidubce.com/v2`
DeepSeek	openai	`https://api.deepseek.com/v1`
月之暗面（Kimi）	openai	`https://api.moonshot.cn/v1`
零一万物	openai	`https://api.lingyiwanwu.com/v1`
字节豆包（火山引擎）	openai	`https://ark.cn-beijing.volces.com/api/v3`
SiliconFlow	openai	`https://api.siliconflow.cn/v1`

服务商	API 类型	默认 Base URL
OpenAI	openai	`https://api.openai.com/v1`
Anthropic	anthropic	`https://api.anthropic.com`
Google Gemini	openai	`https://generativelanguage.googleapis.com/v1beta/openai`
Groq	openai	`https://api.groq.com/openai/v1`
Mistral	openai	`https://api.mistral.ai/v1`
OpenRouter	openai	`https://openrouter.ai/api/v1`

字段	说明
启用	勾选以启用 Telegram 通道
Bot Token	从 @BotFather 获取的 Bot Token
代理	HTTP 代理地址（国内用户通常需要），如 `http://127.0.0.1:7890`
配对验证	是否要求用户输入配对码才能使用
配对码	自定义的配对验证码
Webhook URL	使用 Webhook 模式时填写，留空则使用 Long Polling

字段	说明
启用	勾选以启用飞书通道
App ID	飞书开放平台自建应用的 App ID
App Secret	飞书开放平台自建应用的 App Secret

字段	说明
启用	勾选以启用企业微信通道
Corp ID	企业微信的企业 ID
Callback Token	回调配置中的 Token
EncodingAESKey	回调配置中的 EncodingAESKey
Callback Port	回调监听端口（默认 `9880`）

配置项	默认值	说明
MCP 总开关	开启	是否启用 MCP 工具
浏览器工具	开启	Playwright 浏览器自动化
超时	`60` 秒	MCP 工具调用超时时间

配置项	说明
MySQL	启用后配置 Host、User、Password、Database
PostgreSQL	启用后配置连接 URL

配置项	默认值	说明
桌面自动化	开启	总开关
默认显示器	`0`	多显示器时指定主屏幕
最大宽度	`1920`	截图最大宽度
最大高度	`1080`	截图最大高度

配置项	默认值	说明
压缩质量	`85`	截图 JPEG 质量
视觉识别	开启	使用视觉模型辅助桌面操作
视觉模型	`qwen3-vl-plus`	视觉识别使用的模型
OCR 模型	`qwen-vl-ocr`	OCR 使用的模型
点击延迟	`0.1` 秒	每次点击后的等待时间
输入间隔	`0.03` 秒	逐字输入的间隔

字段	说明
启用	勾选以启用钉钉通道
Client ID	钉钉开放平台企业内部应用的 Client ID
Client Secret	钉钉开放平台企业内部应用的 Client Secret

字段	说明
启用	勾选以启用 QQ 通道
OneBot WebSocket URL	OneBot 11 协议的 WebSocket 地址，如 `ws://127.0.0.1:8080`

配置项	默认值	说明
模型下载源	`auto`	`auto` / `hf-mirror` / `modelscope` / `huggingface`
Whisper 语言	`zh`	语音识别语言：`zh` / `en` / `auto`
Whisper 模型	`base`	语音识别模型大小：`tiny` / `base` / `small` / `medium` / `large`
GitHub Token	空	用于 GitHub 相关工具的个人访问令牌

配置项	说明
HTTP_PROXY	HTTP 代理地址
HTTPS_PROXY	HTTPS 代理地址
ALL_PROXY	SOCKS 代理地址
FORCE_IPV4	是否强制使用 IPv4

角色	风格	适用场景
默认助手	专业友好、平衡得体	日常使用，万能型
商务顾问	正式专业、数据驱动	工作场景，正式汇报
技术专家	简洁精准、代码导向	编程开发，技术问答
私人管家	周到细致、礼貌正式	生活服务，日程安排
虚拟女友	温柔体贴、情感丰富	情感陪伴，倾听关怀
虚拟男友	阳光开朗、幽默风趣	情感陪伴，轻松有趣
家人	亲切关怀、唠叨温暖	家庭场景，长辈式关怀
贾维斯	冷静睿智、英式幽默	科技极客，AI 管家
自定义	用户自定义角色 ID	进阶用户，DIY 人格

配置项	默认值	说明
Agent 名称	`OpenAkita`	Agent 的显示名称
最大迭代次数	`300`	单次任务的最大执行步数
思考模式	`auto`	`auto`（自动）/ `always`（总是）/ `never`（关闭）
自动确认	`false`	是否跳过用户确认直接执行工具

配置项	默认值	说明
主动消息	开启	是否启用主动消息功能
表情包	开启	是否在对话中使用表情包
每日最大主动消息数	`3`	每天最多发送的主动消息数
安静时段开始	`23` 点	不发送主动消息的开始时间
安静时段结束	`7` 点	不发送主动消息的结束时间

配置项	默认值	说明
启用调度器	开启	定时任务调度功能
时区	`Asia/Shanghai`	调度器使用的时区
最大并发	`5`	最多同时执行的任务数

配置项	默认值	说明
日志级别	`INFO`	DEBUG / INFO / WARNING / ERROR
日志目录	`logs`	日志文件存储目录
数据库路径	`data/agent.db`	SQLite 数据库路径
单文件大小	`10` MB	日志文件最大体积
备份数量	`30`	保留的日志备份数
保留天数	`30`	日志保留天数
控制台输出	开启	是否输出日志到控制台
文件输出	开启	是否写入日志文件

配置项	默认值	说明
向量模型	`shibing624/text2vec-base-chinese`	文本向量化模型
计算设备	`cpu`	`cpu` 或 `cuda`
模型下载源	`auto`	模型下载镜像源
记忆保留天数	`30`	聊天记忆保留时间
最大历史文件	`1000`	历史文件数上限
最大存储	`500` MB	历史文件总大小上限

OpenAkita 安装教程总览

教程概览

确认环境条件

选择安装方式

完成配置并启动

执行启动验证

环境要求

安装 OpenAkita

方式一：Desktop（推荐新手）

方式二：PyPI CLI

方式三：源码安装

启动验证

0. 启动应用

1. 选择配置模式

2. 快速配置

2.1 填写LLM 端点参数

2.2 填写 IM 通道参数

2.3 开始配置

2.4 配置完成

3. 完整配置

3.1 工作区

3.2 Python 环境

方式一：使用内置 Python（推荐）

方式二：使用系统 Python

3.3 安装

安装来源

pip 镜像源

可选组件（extras）

3.4 LLM 端点

添加主端点

支持的服务商

多端点与 Failover

编译器端点（可选）

3.5 IM 通道

Telegram

飞书

企业微信

钉钉

QQ（OneBot）

3.6 工具与技能

MCP 工具

桌面自动化

模型下载与语音

网络与代理

Skills 管理

3.7 Agent 与系统

角色选择

核心参数

活人感模式

调度器

高级设置

3.8 完成

1. PyPI 安装步骤

2. 启动验证

1. 源码安装步骤

2. 必查项

3. 启动验证

配置项	默认值	说明
会话超时	`30` 分钟	无活动后自动结束会话
最大历史	`50` 条	单个会话保留的消息数
存储路径	`data/sessions`	会话数据存储目录

配置项	默认值	说明
最小间隔	`120` 分钟	两次主动消息的最短间隔
空闲阈值	`24` 小时	多久没互动后触发主动消息
表情包目录	`data/sticker`	表情包数据存储路径

配置项	默认值	说明
启用编排	关闭	多 Agent 协作模式
编排模式	`single`	`single` / `multi`