探索意外、健康保险欺诈概率识别

更新时间:2024-01-11 作者:用户投稿原创标记本站原创
摘要:保险理赔过程中时常发生投保方欺诈现象,通过对实证调研的2000—2011年度258个意外、健康保险理赔诉讼样本进行描述性统计和Logistic回归,发现年龄41~60岁欺诈概率甚于其他年龄段,年龄41~50岁欺诈频次最高,年龄51~60岁欺诈概率最大,工人欺诈概率甚于其他职业,北京欺诈概率甚于外地,北京郊区县欺诈概率甚于北京市区;保险金额与欺诈概率正相关,疾病身故保险欺诈金额最大,保险期间与欺诈概率负相关,意外伤害住院医疗保险欺诈频次最高,健康险欺诈概率甚于意外险;摔扭伤欺诈概率甚于其他伤害,交通事故机动车司机欺诈概率甚于交通事故非机动车伤害,被保险人索赔欺诈概率甚于投保人索赔,非律师参与欺诈概率甚于律师参与。
关键词:欺诈概率;索赔人特征;保单信息;案件情况;健康保险;统计分析;保险金额;律师
1007-2101(2014)06-0138-05
一、引言
自保险业诞生之日起,保险欺诈(Insurance Fraud)随之而来。美国雪城大学(Syracuse University)“政府档案交流中心”(Transactional Records Access Clearinghouse,TRAC)统计,2011年1-8月美国发生903起健康险欺诈诉讼,相比2010年、2006年、1991年分别增加85%、157%和822%;美国保险研究委员会(Insurance Research Council,IRC)发现,2007年美国汽车人身伤害保险欺诈造成保险公司多支出48亿美元~68亿美元;英国保险人协会(Association of British Insurers,ABI)估计,保险欺诈每年给保险业带来20亿英镑损失,未能识别的欺诈金额每年高达19亿英镑,每个投保人每年额外支付约44英镑。广东省是我国经济、保险发达地区,索赔欺诈相对严重:东莞,2010年财产险赔付支出21.79亿元,其中约4亿元属于欺诈索赔;深圳,2008年各保险机构车险赔案,疑似骗赔案件976起,涉案金额超过2 000万元,某些险种欺诈导致的赔款支出最高达到保费收入的5倍。
保险欺诈是否属实,法院判决具有客观公信力。实证调研部分保险理赔诉讼案件,深入研究欺诈动因,提炼欺诈识别因子,对于有效遏制欺诈、推动保险业可持续发展,具有重要的理论作用和实践价值。

二、研究假设、模型设计与样本选择

(一)研究假设

假设1:保险欺诈受索赔人特征(性别、年龄、职业、婚姻状况、所在地区等)影响。
假设2:保单信息(保险金额、保险费、险别、保险期间等)对索赔欺诈也有重要影响。
假设3;索赔欺诈还受案件情况(保险事故类型、索赔人类型、是否律师参与、是否存在第三方赔付等)影响。

(二)模型设计

三、描述性统计分析

对258个案件数据进行描述性统计,结果见表2。
表2显示,男性欺诈概率(0.659)甚于女性(0.341),年龄41~50岁欺诈概率(0.437)甚于其他年龄段,工人欺诈概率(0.333)甚于其他职业,已婚欺诈概率(0.881)远甚于其他婚姻状况,北京欺诈概率(0.570)高于外地(0.430),北京郊区县欺诈概率(0.281)高于北京市区(0.148),外地地市欺诈概率(0.333)高于外地区县(0.237)。
高保险金额欺诈概率(0.532)甚于低保险金额(0.491),高保险费欺诈概率(0.548)甚于低保险费(0.458),短期保险欺诈概率(0.800)甚于长期保险(0.200),健康险欺诈概率(0.993)高于意外险(0.733)。
疾病欺诈概率(0.321)高于伤害,摔扭伤欺诈概率(0.207)远大于其它伤害,交通事故机动车司机伤害欺诈概率(0.163)略高于交通事故非机动车伤害(0.156),被保险人索赔欺诈概率(0.540)远大于投保人索赔(0.193),非律师参与欺诈概率(0.319)大于律师参与(0.170),无第三方赔付欺诈概率(0.919)大于第三方赔付(0.081),无证人证言欺诈概率(0.852)远甚于证人证言(0.148)。
对每个索赔案件欺诈总额(索赔总额-判决总额)及各子项欺诈金额(索赔金额-判决金额)进行描述性统计,结果如表3。
欺诈总额,从79.48元~399 138.7元不等,均值29 121.08元,不同案件欺诈金额差异很大。135例欺诈案件中,意外伤害住院医疗保险(63例)欺诈数量最多,其次为疾病住院医疗保险(35例)和伤残保险(33例)。从子项欺诈金额看,疾病身故保险(1例)与意外伤害身故保险(25例)欺诈均值最高,分别为80 000元和68 267.09元;其次是伤残保险(33例)和重大疾病保险(1例),分别为30 901.44元和10 000元;疾病医疗保险(1例)最低,均值499.5元。

四、Logistic回归分析

为避开多重共线性,本文筛选出的各变量容忍度(Tolerance)均大于0.2,方差膨胀因子(Variance inflation factor,VIF)均小于5,Logistic回归结果见表4。
表4显示,极大似然估计值为195.624,Nagelkerke R2为0.615,说明模型拟合度较好;从P-value看,年龄41~50岁、年龄51~60岁、工人、北京市区、北京郊区县、高保险金额、健康险、长期保险、摔扭伤、交通事故机动车司机伤害、被保险人索赔、非律师参与的回归系数在5%置信度水平下显著不为零,年龄41~50岁、年龄51~60岁、工人、北京市区、北京郊区县、高保险金额、健康险、长期保险、摔扭伤、交通事故机动车司机伤害、被保险人索赔、非律师参与是欺诈概率识别的关键要素。

点赞:33554 浏览:155888