¥
立即购买

根据数据集特征和处理需求,自动生成可执行的Python标准化脚本,支持多种标准化方法和缺失值处理策略,提高数据清洗和建模准备效率。

免费试用多模型对比变量与模板化文本输出
完整提示词模板
¥25.00

提示词变量

正在加载表单组件...

提示词生成结果

📝
暂无试用结果

变量说明

  • 数据集特征
    待处理数据集的结构、字段类型、规模、业务背景等详细信息
    示例:“数据集包含10万条记录,5个数值型字段(如年龄、收入),3个类别型字段(如城市、产品类型),存在约5%的缺失值...”
  • 标准化方法
    对数值型数据进行标准化的具体方法
    示例:“Z-Score标准化(均值0,标准差1)”
  • 缺失值处理策略
    处理数据集中缺失值的具体策略
    示例:“数值型字段用中位数填充”
  • 输出脚本格式要求
    对生成的标准化脚本在格式、结构、内容方面的具体要求
    示例:“包含详细注释”
  • 特定字段处理规则
    对数据集中特定字段进行特殊处理的规则说明
    示例:“ID列和日期列需要排除在标准化过程之外,高基数类别列建议使用目标编码...”

使用场景案例

  • 电商订单清洗
    电商订单明细统一货币与时区、稳健处理金额异常、标准化类别字段,生成可直接用于分析与建模的清洗脚本。
  • 广告日志清洗
    广告投放日志统一命名与币种,补齐缺口并构造指标,缩放到0-1并输出验证图与执行说明。
  • 工厂传感清洗
    产线传感器时序数据重采样与插值,单位与异常规整,分位数变换提升可建模性并保留验证步骤。