[Gai] 生成内容使用手册

本手册旨在为已熟悉 Gai 极速上手:告别低效,即刻体验高质量内容生成 的用户,提供更深入的AI生成功能使用指导。我们将围绕强化多模对话、系统指令管理、资源管理、参数调节及最佳实践进行详细阐述。

T01-强化版多模对话:高效单次上下文交互

强化多模对话界面(统称为“多模对话界面”)是Gai应用的核心,专为高效、高质量的单次上下文对话设计。它支持富文本输入、多类型文件附件,并提供精细的生成参数控制,以助您一次性获取所需内容。

MQA强化多模对话

界面功能详解:

  1. 对话文本输入: 用于输入您的核心提示词和详细指令。
  2. 提示语加载/保存:
    • 提示语编号 (2): 显示当前已加载的提示语ID。
    • 重命名提示语 (3): 在加载已保存的提示语后,可对其ID进行重命名。
    • 保存提示语 (12): 将当前输入框中的文本作为提示语保存至提示词库。
  3. 系统指令集成:
    • 已加载指令 (4): 显示当前关联的系统指令。
    • 启用指令开关 (5): 控制本次对话是否激活已加载的系统指令。
    • 指令按钮 (9): 进入系统指令库,选择并加载预设指令。
  4. 附件管理:
    • 本地附件按钮 (10): 附加本地存储的文件(图像、音频、视频、PDF等),详见 T3-你的本地文件资源管理
    • 远程附件按钮 (11): 附加网络文件资源,详见 T4-你的网络文件资源管理
    • 已附加文件列表 (15): 显示当前已关联的本地文件。
  5. 内容生成与统计:
    • 生成按钮 (6): 触发AI内容生成。
    • 词元计数按钮 (7): 预估本次输入内容(不含思考模式及生成内容)所产生的词元(Token)数量。
    • 状态按钮 (8): 显示当前对话的详细统计信息,包括总词元消耗。
  6. 输出与分发:
    • AI生成内容 (16): 显示模型生成的文本或图像预览。
    • 分发按钮 (14): 一键将生成内容分发至系统其他应用(如邮件、笔记)。
  7. 辅助功能:
    • 缓存按钮 (13): 快速复制上次输入的文本内容至系统剪贴板。

版本更新 (v1.2.1) 新增功能:

  • 参数设置: 集成于当前对话界面,可针对本次单次上下文对话调整AI模型、安全等级和生成参数。请注意,在此界面进行的参数修改,如未保存为预设,仅对当前对话生效。
  • 存至目录: 允许将本次生成的对话内容保存至本地指定目录。
  • 分发文件: 针对AI生成的图像或特定格式文件,可一键分发至系统应用。

最佳实践:

  1. 预设场景: 首先通过系统指令(详见 T2-你的系统指令集)定义AI的角色、背景、语气和任务目标,为生成内容设定清晰的边界和风格。
  2. 迭代调优: 结合文本输入和多模态附件,不断调整提示词(Prompt Engineering)和系统指令,直至获得满意的生成效果。
  3. 工作现场复用: 通过“保存提示语 (12)”将优化后的提示词入库,便于后续复用和快速启动类似任务。
  4. 参数精调: 利用界面内的参数设置功能,为特定任务微调生成参数,实现精细化控制。

T02-内容生成类目面板:功能总览与快速入口

通过点击多模对话界面左上角的返回按钮(上图标注0),您将进入Gai应用的内容生成类目面板。此面板是各类AI生成相关功能的集中管理中心。

GAI生成内容类目面板

面板组成:

  • A. 主功能入口按钮: 快速访问主要AI生成功能,如强化多模对话、图像生成等。
  • B. 使用情况统计数据: 展示您的AI使用量概览。
  • C. 最后一次工作现场: 用于快速加载并复用您上次生成操作的提示词和参数设置,便于迭代优化。
  • D. 辅助功能菜单: 提供更多高级管理功能和帮助文档。

辅助功能菜单列表:

  1. 系统指令管理: 统一管理您的自定义系统指令集,包括新建、编辑、导入和导出。
  2. 提示语库管理: 集中管理所有已保存的提示词,支持加载、编辑、复制和删除。
  3. 对话日志管理: 管理单次上下文对话的历史记录。
  4. 会话日志管理: 管理多轮上下文会话(Chat模式)的历史记录。
  5. 模型参数设置: 配置文本和图像生成的默认参数,包括模型选择、安全等级和高级生成参数。
  6. 类目使用指南: 访问当前手册。
  7. 复原工作现场: 快速加载上次生成操作的详细状态(提示语、附件、参数等),以便继续调试或复用。

注意: 此菜单中的日志管理允许您加载记录到工作界面进行查看或修改。

T1-你的提示词库:高效管理与复用核心指令

提示词库是您存储和管理精心设计的提示词的地方,有助于提高工作效率和生成内容的稳定性。

通过类目面板,点击“提示语库管理”进入。

提示语管理界面

界面功能详解:

  • A. 提示语条目未展开: 显示提示语的简要信息。
  • B. 提示语条目展开: 显示提示语的完整内容及操作选项。

  • 操作菜单: 展开后显示针对该提示语条目的具体操作。

  • 展开/查看 (2): 显示该提示语的完整文本内容。
  • 收缩 (3): 折叠提示语条目,隐藏详细文本。
  • 加载至编辑界面 (4): 将该提示语加载到多模对话界面,您可以在此进行修改和重命名(保存后生效)。
  • 复制文本 (5): 将该提示语的文本内容复制到系统剪贴板。
  • 删除 (6): 从库中移除该提示语条目。

T2-你的系统指令集:定义AI的行为范式

系统指令是一组预设的指令,模型在处理用户提示词之前会优先遵循这些指令。它是控制模型行为、角色和输出风格的关键,能显著提升生成内容的质量和一致性。

示例:

你是动漫《夏目友人帐》中的猫咪老师,你的本名是“斑”,“娘口三三”,"三三",“saisai”都是粉丝对你的亲切称呼,你生活在这个超人气的奇幻动漫世界中。

系统指令的常见用途:

  • 定义角色/人设: 为AI设定特定的身份或专业领域(如专家、客服、创作者)。
  • 规范输出格式: 指定Markdown、YAML等特定输出格式。
  • 设定风格与语气: 控制生成内容的详细程度、正式程度和目标受众水平。
  • 明确任务目标与规则: 指导模型完成特定任务,如仅返回代码片段。
  • 提供额外上下文: 为模型补充背景知识或特定限制。
  • 指定回复语言: 强制模型使用某种语言进行回复(如“请用简体中文回复。”)。

多语言沟通提示: 如果您使用非英语语言进行提示,建议在系统指令中添加:

除非用户特别要求简明扼要的回复,否则所有问题都应得到全面的详细回答。请用与查询相同的语言进行回复。若查询用简体中文则回复语言也需一致。 或者更简洁的指令: 请用简体中文回复。

系统指令编辑

通过类目面板,点击“系统指令管理”进入。

界面功能详解:

  1. 系统指令文本编辑器 (1): 用于输入或编辑系统指令内容。
  2. 保存指令 (2): 将当前编辑器中的指令保存到指令库。
  3. 已保存指令编号 (3): 显示指令库中已保存指令的唯一标识。
  4. 重命名指令 (4): 在从指令库加载到编辑器后,可对该指令的ID进行重命名。
  5. 加载指令 (5): 从指令库中选择并加载指定的指令到编辑器。
  6. 一键分发 (6): 将当前指令内容分发至系统其他应用。

附加功能: * 指令导入与导出: 支持将指令集导入或导出,便于备份或与其他用户共享。

最佳实践: 熟练掌握系统指令的编写和生成参数的调整(即“指令创作”)是实现AI高级应用的关键。虽然预设场景能方便新手,但深入理解并定制系统指令,是您从新手进阶为高级用户的必由之路。


T3-你的本地文件资源管理:集成多模态输入

本地文件资源管理允许您将本地存储的PDF、图像、音频、视频等文件作为多模态输入附件。这些文件将被复制一份副本到应用的资源管理器中。

限制: 总文件大小不可超过5MB。此功能仅限桌面版和移动版可用,网页版不支持。

通过多模对话界面,点击“本地附件按钮 (10)”进入资源管理。

本地文件资源管理

界面功能详解:

  1. 添加本地文件 (1): 从您的设备中选择文件并添加到资源管理器。
  2. 文件选择框 (2): 勾选一个或多个需要附加到当前对话的文件。
  3. 返回对话界面 (3): 确认选择后,返回多模对话界面。
  4. 条目操作选项 (4): 展开后,可对该文件条目进行操作。
  5. 删除条目 (5): 删除该文件条目及其在应用资源管理器中的副本。
  6. 打开文件 (6): 使用系统默认应用打开此文件,便于查看或编辑。
  7. 分发文件 (7): 一键将此文件分发至系统其他应用。

最佳实践: 为了保持资源管理的整洁和高效,建议在添加文件前先对其进行有意义的重命名。


T4-你的网络文件资源管理:处理大型与共享文件

网络文件资源管理适用于需要多次重用比较大的文件(超过5MB);此功能目前仅限注册用户且用户通道为 serveonly | forwardonly | localonly

限制: 网络文件上传后有效期为48小时,系统将自动清除失效文件。支持一到多个文件附件。

通过多模对话界面,点击“远程附件按钮 (11)”进入资源管理。

远程网络文件资源管理

界面功能详解:

  1. 上传本地文件 (1): 选择本地文件并上传至网络资源。
  2. 文件选择框 (2): 勾选一个或多个需要附加到当前对话的网络文件。
  3. 返回对话界面 (3): 确认选择后,返回多模对话界面。
  4. 文件显示名 (4): 显示网络文件的名称。
  5. 文件有效期 (5): 显示该网络文件的剩余有效时间。

最佳实践: 上传文件时,系统会创建一份副本。建议在上传前对本地文件进行重命名,以确保网络资源列表的清晰易读性。


T5-生成内容日志记录:回顾与复用历史交互

日志管理功能记录了您所有的AI生成历史,包括单次对话和多轮会话的详细信息,便于您回顾、复用或分析过去的交互。

通过类目面板,点击“对话日志管理”或“会话日志管理”进入。

对话内容日志记录

界面功能详解:

  • A. 日志条目已展开: 显示日志的详细内容。
  • B. 日志条目未展开: 显示日志的简要信息。

  • 创建时间 (1): 记录该次内容生成或会话交互的时间。

  • 类别 (2): 指示日志类型,如 gentxt (生成文本)、genimg (生成图像)。
  • 用户通道标识 (3): 表示本次交互所使用的用户通道(L: 本机, T: 试用, F: 中转)。
  • 词元统计 (4): 显示本次交互中输入和输出词元的总消耗数量。
  • 加载条目 (5): 将该日志记录加载到多模对话界面,以便复用其提示语、参数和附件信息。
  • 复制条目 (6): 将日志中的文本内容复制到系统剪贴板。
  • 删除条目 (7): 从日志记录中删除该条目。

T6-文本内容生成参数调节:精细化控制模型输出

文本内容生成参数调节允许您调整AI模型的行为和输出特性,以及内容的安全过滤等级。请注意,在此界面进行的参数修改,如未保存为预设,仅对当前对话生效。

通过多模对话界面,点击“参数设置”按钮进入调节界面。

生成内容安全过滤器设置

A. 安全等级设置:过滤不良内容

安全等级用于控制模型输出内容的敏感性过滤。模型已优先考虑安全,并默认过滤CSAM(儿童性虐待材料)和PII(个人身份信息),此部分不可调节。

可调节安全等级选项:

  • unspecified (无): 基础过滤,仅过滤不可调节部分。
  • low (低): 过滤疑似有害内容。
  • medium (中): 适度过滤有害内容。
  • high (高): 严格过滤所有可能的有害内容。

对应的内容类型:

  1. 仇恨言论: 针对身份或受保护属性的负面或有害评论。
  2. 危险内容: 宣传或允许访问有害商品、服务和活动。
  3. 露骨情色: 包含性行为或其他淫秽内容的引用。
  4. 骚扰内容: 针对他人的恶意、恐吓、欺凌或辱骂性评论。

B. 生成参数设置:调节模型行为

  • MaxOutputTokens (最大输出词元): 限制单次生成文本的最大词元数量。
  • Temperature (温度): 控制词元选择的随机性。
    • 较低温度: 趋向于选择概率最高的词元,适用于需要真实、准确或确定性回复的场景。温度为0通常选择最高概率词元。
    • 较高温度: 增加词元选择的随机性,可能产生更具多样性或意想不到的创意结果。
  • StopSequences (停止序列): 当模型生成到指定的单词或短语组合时,将停止生成回复。该序列本身不会包含在回复中。最多可设置五个停止序列。
  • Top-p (核心采样): 调整模型选择输出词元的方式。系统会按概率从高到低选择词元,直到所选词元的累积概率总和达到Top-p的值。
    • 示例: 若词元A、B、C的概率分别为0.3、0.2、0.1,Top-p为0.5,则模型会从A和B中选择(通过温度进一步确定)。将Top-p设为0可获得变化程度最低的结果。

启用与保存: 若您已理解并需调整参数,请打开启用开关 (5) 后,点击保存设置 (6) 使其对当前对话生效。

版本更新 (v1.2.0) 新增功能:

  • 新增模型: 引入了 2.5 Flash Image Gen 等新模型,支持通过文本提示生成预览版图像。
  • 动态思考: 针对复杂任务,可开启动态的深度思考模式,目前仅支持2.5|3.0系列模型。
  • 思考内容输出: 在生成内容时,可选择一并输出模型内部的思考推理过程。

T7-图像生成与参数调节:将文本转化为视觉

图像生成功能允许您通过文本提示词(Prompt)创作图像。此功能目前仅限注册用户且用户通道为 serveonly

通过类目面板,点击“文本绘图”按钮,进入图像生成界面。

文本绘图主界面

界面功能详解:

  1. 图像提示词输入 (1): 输入描述您所需图像的文本提示词。
  2. 生成图像 (2): 触发AI根据提示词生成图像。
  3. 图像预览与分发 (3): 生成的图像会在此显示缩略图,点击可查看大图。大图支持一键分发至系统应用(如邮箱、相册)。
  4. 提示词存档编号 (4): 显示当前已保存的图像提示词ID。
  5. 提示词重命名 (5): 在保存提示词后,可对其ID进行重命名。
  6. 保存提示语 (6): 将当前输入的图像提示词保存到提示词库。
  7. 图像生成设置 (7): 进入图像生成参数调节界面。
  8. 最后输入文本缓冲 (8): 缓存上次输入的提示词文本。

图像生成最佳实践:

为获得高质量图像,建议在提示词中优先考虑主体、上下文和风格

  • 主体: 明确图像的中心对象。
  • 上下文: 描述主体的环境、背景或情境。
  • 风格: 定义图像的艺术风格、色调或视觉特征。

示例: 提示词:一副草图,中国风的现代美少女,穿越在大唐盛世,周围是繁华的古代街市。 * 主题: 现代美少女 * 上下文: 穿越在大唐盛世,周围是繁华的古代街市。 * 风格: 草图、中国风。


图像生成参数设置:

文本绘图设置

若已开启启用开关 (8),返回后当前参数设置即生效。

  1. 模型ID (modelId): 选择用于图像生成的AI模型,fast 模型通常生成速度较快。
  2. 生成数量 (gen images): 设置单次生成操作的图像数量(最多可生成4张)。
  3. 宽高比例 (aspectRation): 定义生成图像的宽高比。
    • 可选: 1:1 (正方形), 4:3 (传统), 16:9 (宽屏)。
  4. 提示词语言 (language): 指定提示词所使用的语言。
    • 可选: 英语、中文(含简体、繁体)、日语、韩语、印地语、西班牙语、葡萄牙语。
  5. 安全设置 (safetySetting): 调整图像内容的敏感性过滤。
    • 可选: some (适中过滤), few (过滤疑似), most (过滤所有)。
  6. 人物生成控制 (personGeneration): 控制图像中人物或面孔的生成。
    • 可选: all (允许任何年龄段人物), adult (仅允许成年人), dont (禁止生成人物或人脸)。
  7. 负面提示词 (negativePrompt): 输入您不希望在图像中出现的内容描述,以强制模型避免生成。
  8. 启用当前参数设置 (8): 激活或禁用当前界面的参数设置。
  9. 保存 (9): 保存当前参数设置为预设,以便下次快速加载。
  10. 复制参数为JSON (10): 将当前参数设置导出为JSON格式文本。

注意: 每次生成图像操作,通常会消耗一定的词元。例如,单次最多可生成4张图像,每张图像约消耗500词元。

T8 - 上下文缓存 (Context Caching)

上下文缓存是处理大规模资料的“加速包”。创建缓存会产生一次性费用,但在有效期内重复使用,可大幅降低后续对话成本。

权限: 仅限注册用户;需在设置中开启 Usage Mode (serveonly | forwardonly | localonly)。

适用场景

  • 长指令: 复杂的角色设定或行业规则。
  • 大文件: 需频繁分析的长视频、音频或 PDF 文档。
  • 超长文本: 多个文档组成的巨型知识库。

界面分布

界面功能详解

API 状态 (0):显示当前API Key的配额等级。
付费等级(Paid Tier)可解锁更多高性能模型(如:2.5 Pro, 2.5 Flash Image)。

  1. 模型选择:选择缓存运行的目标模型。
  2. 有效期 (TTL):设置缓存在云端的保留时长(分钟)。
  3. 本地重命名:为当前配置起名。修改已创建缓存时,需先重命名以启用编辑。
  4. 系统指令:编辑缓存的角色/全局规则。
  5. 文本内容:输入需缓存的长文本资料。
  6. 附件信息:显示已选附件名及其剩余有效期。
  7. 本地保存【免费】 将当前配置记录在本机。
  8. 本机缓存库:管理所有本地记录及生成的缓存 ID。
  9. 创建缓存【收费】 正式生成云端缓存,生成后内容锁定(只读)。
  10. 选取附件:关联已上传的文件(需在有效期内)。
  11. 删除:移除当前本地记录。

💡 核心操作逻辑

1. Token 门槛 内容量需达标方可创建:Flash 模型 (2048+ tokens) / Pro 模型 (4096+ tokens)。

2. 如何修改已锁定的缓存? 云端缓存一旦生成即不可更改。如需调整,请遵循: 重命名(另存为副本)修改内容本地保存重新创建


使用示例

以分析视频为例:创建缓存后,后续提问可直接调用,无需重复加载视频。

使用示例

  1. 选取缓存:从库中加载已生成的有效缓存。
  2. 状态回显:确认缓存剩余可用时长。
  3. 编写提示词:直接输入针对缓存资料的问题。
  4. 开始分析:模型基于缓存快速响应,降低输入成本。

Token 消耗计算

usage meta

# tokens calc pseudocode
# 计费规则:已缓存的内容不重复计费

cachedContentTokenCount = cacheTokensDetails.TEXT.tokenCount + cacheTokensDetails.VIDEO.tokenCount + cacheTokensDetails.AUDIO.tokenCount;

usedTokens = (totlaTokens > cachedContentTokenCount) 
? (totlaTokens - cachedContentTokenCount)
: (candidatesTokenCount + thoughtsTokenCount + promptTokensDetails.TEXT.tokenCount) ;