¥
立即购买

本提示词为数据科学家设计,能够针对指定数据类型或数据特征生成专业、结构化的数据预处理步骤。输出内容涵盖数据清洗、缺失值处理、异常值检测、特征编码和标准化等操作,内容准确、可执行,并采用技术写作风格呈现,帮助用户快速准备高质量分析或建模数据集。

免费试用多模型对比变量与模板化文本输出
完整提示词模板
¥30.00

提示词变量

正在加载表单组件...

提示词生成结果

📝
暂无试用结果

变量说明

  • 数据类型或特征
    数据集类型和特征描述
    示例:“结构化表格数据,包含数值型和类别型特征”
  • 分析目标
    数据分析的主要目标
    示例:“预测建模”
  • 数据规模
    数据集的规模大小
    示例:“中型(1-100万行)”
  • 数据源类型
    数据来源的格式类型
    示例:“CSV文件”
  • 缺失值策略偏好
    处理缺失数据的方法
    示例:“均值填充”
  • 异常值处理策略
    处理异常数据点的方法
    示例:“删除异常值”

使用场景案例

  • 流失分类预处理
    面向中型CSV会员订阅数据,数据科学家希望快速得到一份可执行的流失分类预处理清单,涵盖清洗、缺失值填充、异常值处理、类别编码、文本清理、数值标准化与数据划分,并附验证标准与可复现实验设置,便于团队协作评审。
  • 销量序列预处理
    针对大型Parquet零售时序数据,需要产出一份覆盖重采样、节假日特征构造、缺失值前向填充、异常截断、稳定化变换、分层标准化、滑动窗口切分与回测方案的专家级步骤,以支撑门店-商品级销售预测。
  • 推荐日志预处理
    面向超大型日志文件的推荐系统场景,希望返回一份可直接执行的预处理蓝图,明确缺失字段标记策略、离群与可疑流量标记、会话重建、类别与多热编码、文本清洗与分词、时间窗聚合、负采样与数据切分标准,支持后续召回与排序建模。

相关提示词模板推荐