1篇2章9节:介绍 ICIO 提示词工程框架

张开发
2026/4/16 11:20:08 15 分钟阅读

分享文章

1篇2章9节:介绍 ICIO 提示词工程框架
在复杂的 AI 应用场景中仅凭一句简单指令往往难以获得稳定、可靠的输出结果因此提示词的结构化设计显得尤为重要。ICIO 提示词工程框架正是在这一背景下被广泛采用的经典方法之一。ICIO 由任务指令Instruction、上下文信息Context、输入数据Input Data和输出指示Output Indicator四个核心要素构成分别从“做什么”“在什么条件下做”“用什么数据做”以及“最终以什么形式呈现结果”四个维度对人机交互过程进行系统化拆解。通过这种方式提示词不再是零散的自然语言描述而是演变为一套严谨、可控的人机协作指令系统为复杂任务的高质量执行提供了稳定基础。ICIO 提示词工程框架在众多提示词设计方法中ICIO 框架被认为是基础且实用的框架之一。ICIO 框架通过明确任务指令、提供上下文信息、输入数据以及输出格式指示使得 AI 模型能够在复杂任务中表现得更加精准和可靠。ICIO 框架中的第一个组成部分是 Interrogatory 或 Instruction即任务指令。这一部分主要用于告诉 AI 需要执行的具体操作是整个提示词的核心。任务指令必须明确、具体避免模糊或歧义。例如可以要求模型分析评论的情绪“Analyze the sentiment of the following reviews”或者生成正式的电子邮件“Write a professional email”甚至可以是翻译文本“Translate this paragraph into French”或者总结文章的关键内容“Summarize the key findings”。指令越具体AI 执行任务的准确性就越高。通过清晰的指令模型能够理解任务目标从而减少生成内容偏离主题或出现错误信息的概率。第二个组成部分是 Context即上下文信息。上下文提供了必要的背景或约束条件引导 AI 以正确的方式完成任务。上下文可以包括身份设定、目标受众、语气要求或内容领域等。例如可以告诉模型“你是一名转化率优化分析师”明确角色定位或者指出受众群体“目标读者是高中生”以便调整语言难度和表达方式再或者规定语气“语气必须正式且带有歉意”还可以说明内容来源“评论来自电子商务网站涵盖电子产品和时尚品类”。通过提供上下文AI 能够在理解任务的基础上结合背景信息做出更符合预期的响应从而增强输出的可读性和专业性。第三个组成部分是 Input Data即输入数据。这部分包含了 AI 需要处理的具体信息或文本是任务执行的原材料。例如如果任务是情绪分析输入数据就是用户评论的文本如“电池续航差但屏幕质量很棒”如果任务是文章总结输入数据就是整篇文章的内容如果任务是数据分析输入数据可以是一组需要处理的表格或数据库信息。输入数据的完整性和准确性直接决定了 AI 输出结果的质量。缺少关键数据或提供模糊信息可能导致生成结果不完整或者偏离预期因此输入数据在提示词设计中占据举足轻重的地位。第四个组成部分是 Output Indicator即输出指示。这部分用来明确模型输出的格式或结构让 AI 知道最终结果应该呈现的形式。例如可以要求情绪分析结果以“正面/负面/混合”的列表形式呈现也可以规定结果必须以 JSON 格式输出或者要求总结内容不超过 100 字。输出指示能够避免生成内容冗长、格式混乱或信息结构不清晰的问题使得结果更易于后续使用和分析。在需要数据处理和报告生成的场景中输出指示尤其重要因为它确保了 AI 输出结果的可操作性和可读性。I — Interrogatory / Instruction任务指令核心意义明确 AI 需要完成的具体任务或操作。作用通过清晰的指令AI 能够理解目标任务避免偏离主题或生成无关内容从而提升输出的准确性和实用性。应用示例“分析以下评论的情绪倾向。”“撰写一封正式的商务邮件。”“将下列段落翻译成法语。”“总结文章的关键发现并提炼成要点。”C — Context上下文信息核心意义提供 AI 完成任务所需的背景、角色设定、约束条件或特定场景信息。作用上下文让 AI 在执行任务时能够结合背景理解任务逻辑使输出结果更符合实际需求和预期语境。应用示例“你是一名数据分析师专注于用户转化率优化。”“目标受众是高中生语言需简明易懂。”“语气必须正式且带有歉意。”“评论来源于电子商务网站涵盖电子产品和服饰。”I — Input Data输入数据核心意义提供 AI 处理任务所需的具体数据、文本或信息。作用输入数据是 AI 输出结果的基础完整且准确的数据能够确保模型分析或生成的内容具有可靠性和参考价值。应用示例“以下是用户评论‘电池续航差但屏幕质量很棒。’”“请分析以下市场调研数据提出营销策略建议。”“文章内容如下请根据内容提炼关键要点。”O — Output Indicator输出指示核心意义规定 AI 输出结果的格式、结构或长度要求。作用通过明确输出指示可以确保结果的可读性、可操作性和标准化尤其在需要数据处理或报告生成的场景中十分重要。应用示例“请将情绪分析结果以正面/负面/混合的列表形式呈现。”“最终结果需以 JSON 格式输出。”“总结内容不超过 100 字。”ICIO 框架和 CRISPE 框架都是提示词工程中常用的结构化设计方法但它们侧重点和应用逻辑存在明显差异。ICIO 框架由四个要素组成核心在于明确 AI 需要执行的具体任务、提供背景和数据支撑并规定输出的格式和结构因此更适用于需要高精度、结构化输出的分析、总结或数据处理类任务。相比之下CRISPE 框架由五个要素构成其设计逻辑不仅关注任务本身还强调 AI 的角色扮演、输出风格和多样性生成强调人机协作的创意和灵活性。简单来说ICIO 更注重“任务执行与数据处理的准确性”它强调明确输入和输出使生成结果可控、可量化而 CRISPE 更注重“创意生成与人机互动的丰富性”通过角色设定和风格控制提升输出的个性化和多样性。如果目标是结构化分析、报告生成或精确数据处理使用 ICIO 框架更合适而如果目标是创意写作、广告文案或多方案生成CRISPE 框架的灵活性和多维度控制优势更为明显。两者可以结合使用以兼顾准确性与创意性。偏向数据处理、分析或结构化任务的提示词示例I任务指令 / Interrogatory 请你对以下心血管相关的原始临床数据进行专业的数据预处理包括 1. 数据清洗去重、纠错、处理缺失值和异常值 2. 统一字段命名与单位 3. 将非结构化或混乱数据整理为标准化的结构化表格 4. 为后续建模与统计分析做好可直接使用的数据集。 ⸻ C上下文信息 / Context 你是一名医学数据科学家擅长处理临床医疗数据与心血管疾病相关的健康数据。当前这些数据来自多家基层医院的体检系统采集时间、格式、单位和命名规则不统一存在大量缺失、异常和书写错误。该数据将用于后续的“心血管疾病风险预测模型”训练因此需要具备严格的医学合理性与数据规范性。 ⸻ I输入数据 / Input Data原始杂乱数据示例 001, 男, age: 56, 收缩压165, 舒张压90, 心率78, LDL3.8, HDL0.9, 血糖: 6.4, 有吸烟史, BMI: 27.6 002|女|年龄 49 | SBP 142 | DBP 88 | HR: 82 | LDL: ? | HDL 1.1 | FBG 5.2 | 否吸烟 | 体重指数 24.1 ID003, male, 61 yrs, BP: 180/102, pulse: 95, LDL-C: 4.6 mmol/L, HDL-C: 0.8, glucose 7.9, smoker, BMI31 004, 女, 年龄?, 收缩压98, 舒张压62, 心率45, LDL2.1, HDL1.9, 空腹血糖3.1, 不吸烟, BMI18.2 005 男 35 收缩压 250 舒张压 140 心率 160 LDL 9.8 HDL 0.2 血糖 18.0 吸烟 BMI 45.0 006, 男, 52, 收缩压138, 舒张压85, 心率76, LDL3.2, HDL 缺失, 血糖5.9, 从不吸烟, BMI26.0 说明 • 年龄字段部分缺失或格式混乱 • 血压单位未统一 • LDL、HDL 存在缺失或医学异常值 • 吸烟字段存在多种表达方式 • BMI 与血压存在明显极端异常值 • 英文、中文与符号混杂。 ⸻ O输出指示 / Output Indicator 请按照如下规范输出结果 1. 先用文字说明你进行了哪些数据预处理步骤如缺失值填补、异常值处理规则、单位换算规则等 2. 再输出一份标准化后的结构化表格数据字段统一为 • ID • GenderMale/Female • Age整数单位岁 • SBP收缩压mmHg • DBP舒张压mmHg • HeartRate次/分钟 • LDLmmol/L • HDLmmol/L • FastingGlucosemmol/L • SmokingYes/No • BMI 3. 对无法合理修正的数据请标记为 NaN 并说明原因 4. 最终数据请以规范表格形式Markdown 表格或 CSV 结构输出可直接用于建模。豆包模型的回答如下心血管临床数据预处理报告及标准化数据集 一、数据预处理步骤说明 一数据清洗 去重处理检查输入数据的 ID 字段001、002、ID003、004、005、006无重复 ID无需去重。 纠错处理 字段格式纠错统一 ID 格式去除 “ID” 前缀统一为 “001-006”将性别字段的 “男 / 女”“male” 统一转换为 “Male/Female”将吸烟史的 “有吸烟史 / 否吸烟 / 不吸烟 / 从不吸烟 /smoker” 统一规范为 “Yes/No”“有吸烟史”“smoker” 对应 “Yes”“否吸烟”“不吸烟”“从不吸烟” 对应 “No”。 医学逻辑纠错无明显逻辑矛盾数据如性别与生理指标无冲突主要修正书写格式问题如 “年龄 49” 中的空格、“BP: 180/102” 拆分为收缩压 180、舒张压 102。 缺失值处理 年龄缺失004因年龄是心血管疾病风险预测的关键特征且无其他字段可推导如无出生日期、体检年份无法合理填补标记为 “NaN”。 LDL 缺失002LDL低密度脂蛋白无直接关联字段可推导且医学上无默认值标记为 “NaN”。 HDL 缺失006HDL高密度脂蛋白无间接推导依据标记为 “NaN”。 异常值处理依据心血管医学临床标准 血压异常正常成人收缩压SBP正常范围 90-139 mmHg舒张压DBP正常范围 60-89 mmHg。005 的 SBP250 mmHg、DBP140 mmHg远超重度高血压标准SBP≥180 或 DBP≥110判定为极端异常值004 的 SBP98 mmHg、DBP62 mmHg处于正常范围下限无医学异常保留原值。 心率异常正常成人静息心率正常范围 60-100 次 / 分钟。004 的心率 45 次 / 分钟心动过缓、005 的心率 160 次 / 分钟心动过速均为医学异常值但考虑到可能存在特殊临床情况如 004 可能为运动员、005 可能为应激状态暂保留原值并标注 “医学异常”后续建模时可结合临床注释进一步筛选。 血脂异常LDL 正常范围3.4 mmol/L005 的 LDL9.8 mmol/L严重升高HDL 正常范围1.0 mmol/L男性、1.2 mmol/L女性001 的 HDL0.9 mmol/L男性偏低、003 的 HDL0.8 mmol/L偏低、005 的 HDL0.2 mmol/L严重偏低均为医学异常值保留原值反映真实临床数据特征建模时需纳入异常值分析。 血糖异常空腹血糖FBG正常范围 3.9-6.1 mmol/L004 的 FBG3.1 mmol/L低血糖、005 的 FBG18.0 mmol/L严重高血糖为医学异常值保留原值。 BMI 异常BMI 正常范围 18.5-23.9004 的 BMI18.2偏瘦、005 的 BMI45.0重度肥胖为医学异常值保留原值。 二统一字段命名与单位 字段命名统一按输出要求将原始字段映射为标准字段如 “age / 年龄 /yrs”→“Age”、“收缩压 / SBP/BP收缩压部分”→“SBP”、“舒张压 / DBP/BP舒张压部分”→“DBP”、“心率 / HR/pulse”→“HeartRate”、“LDL/LDL-C”→“LDL”、“HDL/HDL-C”→“HDL”、“血糖 / FBG / 空腹血糖 /glucose”→“FastingGlucose”、“BMI / 体重指数”→“BMI”。 单位统一 年龄统一为 “岁”整数如 “56”“49”“61 yrs” 去除 “yrs” 保留 “61”。 血压统一为 “mmHg”原始数据无其他单位默认均为 mmHg无需换算。 血脂LDL、HDL统一为 “mmol/L”原始数据中 “LDL-C: 4.6 mmol/L” 保留单位无单位的默认按 mmol/L 处理符合临床常用单位。 血糖统一为 “mmol/L”“FBG 5.2”“空腹血糖 3.1” 默认按 mmol/L 处理符合临床标准。 BMI无单位体重指数为比值无需单位。 三非结构化数据结构化整理 将原始以 “逗号 / 竖线 / 空格” 分隔的杂乱数据按标准字段逐一提取信息如从 “ID003, male, 61 yrs, BP: 180/102, pulse: 95, LDL-C: 4.6 mmol/L, HDL-C: 0.8, glucose 7.9, smoker, BMI31” 中提取 ID003、GenderMale、Age61、SBP180、DBP102、HeartRate95、LDL4.6、HDL0.8、FastingGlucose7.9、SmokingYes、BMI31确保每个字段信息准确对应。 二、标准化后的结构化表格数据集IDGenderAgeSBPmmHgDBPmmHgHeartRate次 / 分钟LDLmmol/LHDLmmol/LFastingGlucosemmol/LSmokingBMI备注医学异常标注001Male5616590783.80.96.4Yes27.6HDL 偏低男性正常1.0 mmol/L002Female491428882NaN1.15.2No24.1SBP 偏高正常140 mmHg003Male61180102954.60.87.9Yes31.0SBP/DBP 重度升高、HDL 偏低、血糖偏高004FemaleNaN9862452.11.93.1No18.2心率过缓、血糖偏低、BMI 偏瘦005Male352501401609.80.218.0Yes45.0血压 / 心率 / 血脂 / 血糖严重异常、重度肥胖006Male5213885763.2NaN5.9No26.0BMI 超重正常24.0数据说明​ 标记为 “NaN” 的字段004 的 Age、002 的 LDL、006 的 HDL因无合理医学依据或推导字段无法填补需在后续建模时根据样本量选择 “删除样本” 或 “多重插补法” 进一步处理。​ 备注中的 “医学异常标注” 为后续建模提供临床参考可辅助判断异常值是否为 “真实病理数据” 或 “测量误差”若为测量误差需进一步核查原始体检记录后修正。​ 所有字段单位已统一数据格式符合 “心血管疾病风险预测模型” 的输入要求可直接用于后续特征工程与模型训练。

更多文章