续前.....
在将模型用于评分之前,您需要评估模型质量的好坏。用于评估模型的结果类型取决于用于生成模型的技术。本示例使用在“直销”附加选项中提供的“购买倾向”功能的可用结果。
“购买倾向”生成一个整体模型质量图表和分类表,以用于评估模型。
整体模型质量图表提供有关模型质量的快速直观指示。作为一般规则,整体模型质量应当大于 0.5。
要确认模型是否足以用于评分,您还应该检查分类表。
分类表将目标字段的预测值与目标字段的实际值相比较。总体准确率可以在某些方面显示模型工作情况,不过,如果构建模型是为了确定可能产生等于或大于指定的最小正响应率的正响应率的一组联系人,那么您可能更关注正确预测的正响应的百分比。
在本例中,分类表拆分为训练样本和测试样本。训练样本用于构建模型。然后,该模型被应用到测试样本,以查看模型的表现情况。
指定的最小响应率为 0.05 或 5%。分类表显示训练样本中正面响应者的正确分类率为 7.43%,而测试样本中为 7.61%。由于测试样本响应率大于 5%,因此该模型应当能够确定可能产生大于 5% 的响应率的一组联系人。
打开数据文件 dmdata3.s**。该数据文件包含所有未在测试营销中包含的联系人的人口统计学及其他信息。
->打开评分向导。要打开评分向导,从菜单中选择:
实用程序 > 评分向导
->单击浏览导航到要保存模型 XML 文件的位置,然后在浏览器对话框中单击选择。
->选择创建的模型 XML 文件,然后单击下一步。
为了对活动数据集进行评分,该数据集必须包含对应于模型中的所有预测变量的字段(变量)。如果模型还包含拆分字段,那么该数据集还必须包含对应于模型中所有拆分字段的字段。
默认情况下,自动匹配活动数据集中任何与模型中的字段具有相同名称和类型的字段。
使用下拉列表匹配数据集字段到模型字段。模型和数据集中每个字段的数据类型必须相同才能匹配字段。
在模型中的所有预测变量(以及拆分字段,如果有的话)与活动数据集中的字段匹配之前,您无法继续向导或对活动数据集进行评分。
评分函数是所选模型可用的“得分”类型。可用的评分函数取决于模型。对于在本示例中使用的二项 logistic 模型,可用函数为预测值、预测值的概率、所选值的概率和置信度。请参阅 主题 选择评分函数 详细信息。
在本示例中,我们对邮件正响应的预测概率感兴趣,因此我们需要选定值的概率。
->选择(选中)选定类别的概率。
->在“值”列中,从下拉列表中选择 1。目标的可能值列表在模型中定义,并基于用于构建模型的数据文件中的目标值。
注意: 在您使用“购买倾向”功能来构建模型时,与正响应关联的值将始终为 1,这是因为“购买倾向”自动对二元字段的目标重新编码,其中 1 代表正响应,0 代表在用于构建模型的数据文件中遇到的任何其他有效值。
->取消选择(取消选中)所有其他评分函数。
->根据需要,可以为在活动数据集中包含得分值的新字段指定一个更具描述性的名称。例如,Probability_of_responding。有关字段(变量)命名规则的信息,请参见变量名。
->单击完成将模型应用到活动数据集。包含正响应概率的新字段被附加到数据集的末尾。
然后,您可以使用该字段来选择可能产生等于或大于特定级别的正响应率的联系人子集。例如,可以创建包含可能产生至少 5% 正响应率的个案子集的新数据集。
四总结
以上以汽车增换购作为业务背景,结合IBM SPSS Statistics中的数据。对基于客户评分的保客营销进行了过程的论述,并且给出了SPSS的界面。可以指导4S店或者主机厂进行有效的保客营销的客户再购买意向的概率。从而可以以此作为基础,进行更加精准的保客营销市场活动。
这里特别需要说明的是,对于dmdata2.s**中顾客的信息,其中只包含了客户的基本信息和一部分属性信息。而在实际的场景中,客户信息包含的更加丰富。比如有大量的行为信息,如消费的RFM;对各种服务的满意情况;车辆的各种信息。因此在实践中可以利用更为多元的信息。尤其是消费的行为信息更能够体现进行增换购的意愿。
以上只是结合简单的表格进行了简单的界面操作说明,为了实现自动化可以通过接口把业务系统和SPSS对接,并且可以和DMS的营销活动进行对接。从而形成建模、评分、实施,模型优化等闭环的改善。
(完)
分享