FigCraft
入门

快速开始

FigCraft 是一款 AI 图像/视频创作桌面应用,核心是一个会「自己动手」的智能体——你用自然语言描述需求,它帮你生成、修图、抠图、做视频、批量出图,并能完成多步骤任务。

安装

  1. 1在官网下载对应系统的安装包(macOS .dmg / Windows .exe)。
  2. 2macOS:拖入「应用程序」;Windows:双击安装。
  3. 3首次打开如提示来源未知,在系统设置里允许运行即可。
  4. 4应用内会自动检查更新,有新版会提示一键下载。

登录 / 注册

  1. 1用手机号获取验证码登录,未注册会自动创建账号。
  2. 2有邀请码可在登录页「邀请码(选填)」填写,注册后自动归属邀请人。
  3. 3也支持 Google 登录。

第一次出图

  1. 1进入「图像」页,在底部输入框描述你想要的画面。
  2. 2需要参考(保持人物/产品一致)就把图片拖进来或粘贴。
  3. 3回车发送,智能体会生成并显示在画布上;继续对话即可微调。
核心概念

智能体介绍

FigCraft 的智能体不只是「生成一张图」,它能理解目标、自己规划步骤、调用各种工具完成整件事。你说「给这双鞋做一组主图,5 张不同场景」,它会自己分析产品、生成、对比、必要时修图,最后交付。

生成与编辑
文生图、图生图、局部重绘、抠图换背景、批量出图、文/图生视频。
理解与分析
看懂上传图、生成图或当前画布,做产品卖点分析与视觉建议。
多步骤任务
把复杂需求拆成任务、按依赖顺序执行,可暂停/续跑。
计划模式
先研究、给出方案让你确认,再动手执行。
文件与系统
读写本地文件、导入导出、调用 ffmpeg/sips 做格式处理。
联网
搜索网络、抓取网页内容作为参考资料。

一致性小技巧:把人物/产品图作为「参考图」加入,智能体会用参考索引保持同一形象贯穿整组图。

核心概念

使用方法

对话即操作

所有功能都通过对话完成。直接说目标即可,例如「把背景换成纯白」「这张放大到 4K」「按这个人物做 3 个不同表情」。

参考图与一致性

  • 拖入或粘贴图片作为参考,可同时放多张(人物、产品、风格)。
  • 想保持同一个人/同一件产品,明确说「保持参考图里的人物」。
  • 局部修改用「只改 XX 区域」,智能体会做局部重绘而非重画整张。

画布与素材库

  • 生成结果在画布上,可继续基于画布内容编辑、截图分析。
  • 常用产品/角色/场景可存入素材库,之后一句话就能复用。
  • 历史记录里可找回过往会话与任务,长任务支持断点续跑。

视频

  • 支持文生视频、图生视频、首尾帧;长视频用「上一段尾帧接下一段」链式生成。
  • 部分模型自带音频与多语种唇形同步。
账户

计费规则

一切消耗用「积分」结算。积分有两种来源:套餐每月发放(按月清零)、单独充值(永久不过期)。消耗时优先扣套餐,套餐用尽再扣永久积分。

套餐包含什么

  • 套餐积分:用于图片 / 视频生成。
  • 高级对话次数:用 GPT / Claude / Gemini Pro 等高级模型对话。
  • 基础对话次数:用 Qwen / DeepSeek 等基础模型对话。

对话怎么扣

套餐内对话按「次数」扣,看得懂、好预估。越贵的模型一次扣的次数越多(例如 GPT-5.5 扣 1 次、Claude Opus 扣 3 次)。次数用尽后,对话改为按实际用量(token)扣永久积分。

图片 / 视频怎么扣

按模型扣积分:图片按「积分/张」,视频按「积分/秒」。不同模型单价不同(越强越贵)。先扣套餐积分,用尽后扣永久积分,具体单价以应用内显示为准。

换算参考:1 积分 ≈ ¥0.072 ≈ $0.01(即 $1 = 100 积分)。充值的永久积分不过期,套餐积分每月重置。

参考

智能体工具

智能体内置 73 个工具,分 17 类、按需自动调用——你通常不用关心细节,了解它「有哪些本事」即可。

图像与视频生成 · 8

generate_image生成单张图(文生图 / 图生图)
generate_image_inline任务内逐张生成,支持参考索引保持一致
generate_batch一次批量生成多张
generate_video生成视频(文/图生视频、首尾帧)
edit_image局部修图(区域指令 + 参考图)
set_params设置比例 / 画质 / 模型
make_keyframes为视频生成关键帧
plan_shots规划分镜脚本

视频后期 · 2

stitch_videos拼接多段视频
reorder_videos重排视频片段顺序

语音 / 音频 · 3

generate_speech文字转语音(配音)
clone_voice克隆音色
list_voices列出可用音色

理解与分析 · 4

analyze_image视觉分析上传图 / 生成图 / 画布
analyze_product产品卖点与视觉策略分析
screen_capture截取当前画布再分析
query_model_capabilities查询某模型的能力与参数

文件操作 · 10

list_directory列出目录
read_file读取文件(图片自动载入)
write_file写入文本 / 代码
edit_file按行编辑文件
create_directory新建目录
delete_file删除文件 / 目录
glob_search按通配符查找文件
grep_in_files按正则搜索文件内容
import_file导入本地图片
export_file导出到本地(jpg/png/psd)

系统 · 2

shell_execute执行终端命令(ffmpeg / sips / Python)
sleep暂停若干秒

代码 / 工作区 · 6

lsp_diagnostics代码诊断(报错检查)
lsp_definition跳转到定义
lsp_references查找所有引用
lsp_hover查看类型 / 文档
enter_worktree进入隔离工作区
exit_worktree退出工作区

联网 · 2

web_search联网搜索参考与灵感
web_fetch抓取网页内容

记忆与待办 · 3

save_memory记住品牌 / 角色 / 风格
todo_write写任务待办清单
todo_read读任务待办清单

任务编排 · 6

task_create创建多步骤任务
task_update更新任务状态 / 进度
task_list列出所有任务
task_get获取单个任务详情
task_stop停止 / 暂停任务
task_output获取任务最终输出

计划模式 · 2

enter_plan_mode进入计划模式(只研究不动手)
exit_plan_mode退出并执行方案

产品库 · 3

list_products列出所有产品 SKU
get_active_product获取当前工作产品
find_product搜索产品

素材库 · 5

init_asset_library新建工作素材库
search_assets搜索素材
import_assets从素材库导入角色 / 场景
add_asset添加素材
remove_asset移除素材

多智能体与团队 · 10

spawn_agent派生子智能体并行处理
agent_job_status查询子智能体任务状态
register_agent注册命名智能体
send_message给其他智能体发消息
read_mailbox读取消息箱
list_agents列出已注册智能体
team_create创建持久化团队
team_list列出团队
team_delete删除团队
team_message团队内发消息

定时任务 · 3

cron_create创建定时 / 循环任务
cron_list列出定时任务
cron_delete删除定时任务

交互 · 3

reply纯文字回复 / 对话
ask_user_question弹窗向用户提问(多选 / 文本)
ask_confirmation简单确认弹窗

工具检索 · 1

tool_search按需检索可用工具
参考

支持模型

应用聚合了主流图像与视频模型,智能体会根据需求自动选用合适的模型;你也可以在生成时手动指定。

图像模型 · 7

Nano Banana
Google · 多轮对话式编辑,SynthID 水印
Nano Banana Pro
Google · 最多 14 张参考图、1K/2K/4K、强制思考
Nano Banana 2 (Flash)
Google · 512px~4K、极端比例(8:1/1:8)、思考可调
Seedream 5.0
火山 · 内置联网搜索、深度思考、一次最多 15 张
Seedream 4.5
火山 · 2K/4K、一次最多 15 张
万相 2.6 (wan2.6-image)
通义 · 图像编辑、多图风格融合、负向提示
GPT-5.4 Image 2
OpenAI · 自定义尺寸、质量档;不支持透明背景

视频模型 · 10

Seedance 2.0
火山 · 联网搜索、尾帧链式长视频、最高 1080p
Seedance 2.0 Fast
火山 · 快速版,最高 720p
Seedance 1.5 Pro
火山 · 唇形同步、镜头锁定、样片模式
Veo 3.1
Google · 原生 4K、自带音频、时间戳提示
万象 I2V Flash (wan2.6)
通义 · 图生视频,720p/1080p
万象 R2V Flash (wan2.6)
通义 · 图+视频混合参考(≤5)
万象 KF2V Flash (wan2.2)
通义 · 固定 5s、首尾帧、特效模板
HappyHorse 1.0
阿里 · 原生音视频 + 7 语种唇形、多镜头叙事
HappyHorse 1.0 图生视频
阿里 · 基于首帧生成,继承首帧比例
万相 2.7 文生视频
通义 · wan2.6 升级版,多镜头叙事

能力速记:透明背景用 GPT Image 2;人物一致性用 Nano Banana Pro;4K 视频用 Veo 3.1;长视频用 Seedance 尾帧接续。