¥
立即购买

该提示词基于用户提供的数据集概述,生成结构化、可执行的数据清洗计划(含字段检查、缺失/异常处理、类型转换、去重、标准化、采样策略与交付物)。输出以技术写作风格呈现,强调步骤可复现、所需输入字段和验收指标,便于工程实施与审计。所有结论仅基于用户输入数据。

免费试用多模型对比变量与模板化文本输出
完整提示词模板
¥25.00

提示词变量

正在加载表单组件...

提示词生成结果

📝
暂无试用结果

变量说明

  • 数据集概述
    用户对数据集的简要说明,包括来源、包含表或文件名、主要字段或列名列表、每列样例值、是否为时序数据等信息
    示例:“数据集来源于用户行为日志,包含表名user_logs,主要字段有user_id、action、timestamp、value,每列样例值如user_id: 12345, action: click, timestamp: 2023-01-01 10:00:00, value: 100,非时序数据。”
  • 期望交付物
    期望的交付物类型,指定数据清洗后需要生成的具体输出形式
    示例:“清洗后数据集(可直接建模)”
  • 关键字段与主键
    列出被视为主键或关键识别字段,以及哪些字段为目标变量(若有)
    示例:“主键字段为user_id和timestamp,关键识别字段包括order_id,目标变量为purchase_amount。”
  • 样本量与时间窗
    说明数据覆盖的时间范围与可用样本量(行数),或注明是否需按时间切片或采样策略
    示例:“数据覆盖时间范围从2023-01-01至2024-01-01,可用样本量约10000行,需按月份进行时间切片。”

使用场景案例

  • 电商统一表
    该用例覆盖电商多表场景, 需要统一时区与货币、处理跨表主键与去重、标准化状态枚举、修复价格异常并联结生成统一宽表。验证接口能基于字段样例与数据问题提示给出可复现的字段级检查、类型转换、去重与主外键校验、异常值规则、货币与地理字段标准化、联结顺序与验收指标, 产出可直接下游使用的统一数据表。
  • 楼宇时序对齐
    该用例专注楼宇物联网时序数据的对齐与质量修复, 检验接口能生成对 ts 与时区统一、重复去除、异常值修正、插补策略、等频对齐与外部气象联结的可执行计划, 并明确每步输入字段、窗口长度、插补方法与验收指标(缺测率下降、对齐覆盖率、物理边界约束)。目标是交付统一频率且列齐全的时序对齐数据集。
  • 广告特征集
    该用例检验接口在广告与归因多源数据上的能力, 包含去重与归因关联、时区统一、负值与缺失修复、类别标准化与编码、事件窗口聚合、按安装日对齐成本等步骤, 形成可复现的特征候选字典与字段级工程说明, 并明确验收指标(特征覆盖率、稀疏度、泄露检查与时间一致性)。