本提示词专为数据清洗与预处理场景设计,帮助商业数据运营者高效处理数据集中的缺失值问题。通过系统分析数据特征、缺失模式及业务背景,智能推荐最适合的填充策略,确保数据完整性和质量。该提示词结合统计方法与业务逻辑,提供从缺失模式诊断到策略选择的全流程指导,支持数值型、分类型和时间序列等多种数据类型,最终输出具体可操作的填充方案及实施建议,提升数据分析和建模的准确性与可靠性。

免费试用多模型对比变量与模板化文本输出
完整提示词模板
¥20.00

提示词变量

正在加载表单组件...

提示词生成结果

📝
暂无试用结果

变量说明

  • 数据集描述
    数据集类型、字段特征和业务背景的详细描述
    示例:“销售数据集,包含产品ID、销售额、客户类型、销售日期等字段,用于分析月度销售趋势”
  • 缺失特征类型
    存在缺失值的特征数据类型
    示例:“数值型”
  • 输入数据信息
    CSV格式的原始数据内容
    示例:“ID,销售额,客户类型,销售日期 1,1000,A类,2023-01-01 2,,B类,2023-01-02 3,1500,,2023-01-03”
  • 填充方法偏好
    用户偏好的缺失值填充方法
    示例:“均值填充”

使用场景案例

  • 用户画像填充
    用户画像表含多源缺失,需在不扭曲城市与性别分布的前提下,对年龄、月消费及评分进行可解释预测填充,并给出分类型与等级型字段的稳健策略。
  • 产线传感填充
    产线传感器时序含多处间断与停机点,需对连续段采用插值、对停机与维护段做有条件填充与保持缺失,确保异常检测与OEE计算不被稀释。