德国信用数据集的描述。1.标题:德国信用数据2.源信息汉斯霍夫曼教授统计研究所和“经济汉堡系计量经济学大学”冯·梅勒园52000汉堡133.实例数:1000提供了两个数据集。原始数据集,由霍夫曼教授以提供的形式,包含分类/符号属性和是在文件“german.data”。对于需要数值属性的算法,斯特拉斯克莱德大学产生文件“german.data-numeric”。此文件已编辑并添加了几个指示符变量以使其适合不能处理分类变量的算法。一些排序分类(例如属性17)的属性被编码为整数。这是StatLog使用的形式。6.german文件包括20个变量:20(7numerical,13categorical)german.numer文件包括24个变量:24(24numerical)7.德国人的属性描述属性1:(定性)现有支票帐户的状态A11:...0DMA12:0=...200DMA13:...=200DM/工资分配至少1年A14:不检查帐户属性2:(数值)月份持续时间A2属性3:(定性)信用记录A30:没有学分/所有积分支付回来A31:所有在这家银行的信用卡已收回A32:到现在支付的现有贷项A33:延迟过去的回报A34:关键帐户/存在的其他信用(不在此银行)属性4:(定性)目的A40:汽车(新)A41:汽车(使用)A42:家具/设备A43:广播/电视A44:家用电器A45:修理A46:教育A47:(vacation-不存在?)A48:再培训A49:业务A410:其他属性5:(数值)信用额A5Attibute6:(定性)储蓄账户/债券A61:...100DMA62:100=...500DMA63:500=...1000DMA64:..=1000DMA65:未知/不存储储蓄帐户属性7:(定性)目前就业A71:失业A72:...1年A73:1=...4年A74:4=...7年A75:..==7年属性8:(数值)分期付款率按可支配收入的百分比计算A8属性9:(定性)个人地位和性别A91:男:离婚/分居A92:女性:离婚/分居/已婚A93:男:单身A94:男性:已婚/丧偶A95:女:单身属性10:(定性)其他债务人/担保人A101:无A102:共同申请人A103:担保人属性11:(数值)现在居住地A11属性12:(定性)属性A121:房地产A122:如果不是A121:建筑社会储蓄协议/人寿保险A123:如果不是A121/A122:汽车或其他,不属于属性6A124:未知/无属性属性13:(数值)年龄A13属性14:(定性)其他分期付款计划A141:银行A142:商店A143:无属性15:(定性)住房A151:租金A152:自己A153:免费属性16:(数值)此银行现有的信用额A16属性17:(定性)工作A171:失业/非技术-非居民A172:不熟练A173:熟练的员工/官员A174:管理/个体经营/高度合格的员工/官员属性18:(数值)负责提供维修的人数A18属性19:(定性)电话A191:无A192:是,以客户名称注册属性20:(定性)外国工人A201:是的A202:不8.成本矩阵此数据集所需要使用成本矩阵(参见下文)12----------------------------101-----------------------250(1=好,2=差)其中,行表示实际分类和列表示预测分类。将坏客户分类为好客户的成本较大为5个单位,而将好客户分类为坏客户的成本为1个单位。