簡體中文 | 繁體中文 | English

ja_mageia

《税务漫谈》国税局用大数据查税 PDF 打印 E-mail
2015-10-23 13:38

2015.10.19世界日报新闻汇整

《税务漫谈》国税局用大数据查税

沈泽宪

大数据是指在互联网时代由于包括结构性和非结构性可用数据的指数增长,为商业和社会提供了精确分析的大量高速多样的数据。近几年来,由于电子报税的 普及,第三方报表的增加,可用数据和国税局计算机系统及互联网的发展,使大数据在国税局应用有了客观条件。据国税局统计,每年有约2.5亿份电子报税,18 亿第三方报表,2.4万亿元税收,1.22亿份退税共4000多亿元,2.23亿封信件或通知寄出,1000多亿元应收税款。这些都是国税局大数据处理的 物质基础。

IBM等公司帮助国税局建立的计算机联网系统,主要运用有三方面:一是税表处理,包括退税、查出计算错误、问题解决及和解,与各州数据交换等;二是 案件管理,包括监测低报税及逃税、查税、申诉、征收欠税、身分盗窃、刑事调查等;三是客户帐户,包括通知、信件和电话服务等。国税局有超过450个独立的 系统和运用,有超过30个数据来源,并与政府各机构联网,甚至与脸书等社交网站联网。

由于近年预算缩减,国税局越来越多依靠计算机联网的大数据处理来提高查税效率。国税局已不用人工而用计算机筛选查税对象,以解决每年约3000亿元税收 损失。由于计算机网络的发展,现在国税局只用十个小时就可加载过去要四个月才能加载的全部2亿多份税表。国税局用大数据可以帮助精确分析每个纳税人的行为, 包括未报税付税、违规避税(Abusive tax shelters)、身份盗窃、未报收入和抵扣、退税欺诈、报税员违规、离岸交易等。

计算机联网系统还可以帮助国税局建立纳税人报税缴税预测模型、估计税收缺口、衡量税负、模拟立法改变对纳税人行为的冲击(Impact),分析纳税人 的网络和结构关系等。而且,虽然有争议说国税局计算机查税是侵犯个人隐私,但由于国会赋予更大的权力,使国税局有每个人的社安号和收入等个人资料及其历史数 据,有大量第三方报告,有广泛的政府和商业机构的联网,比任何商业机构更能掌握每个人的信息。

国税局怎样建立计算机模型没有向外透露。但据国税局合规分析办公室(Office of Compliance Analytics)描述,国税局用了三种办法查税。一是建立了确认报税错误的模式识别(Pattern Recognition)。该程序可以实时发现报税错误,使国税局可以立即联系报税人,避免以往在报税季过后才发现错误,导致数以亿元计的退税错误发给报 税人。二是建立诈欺检测模型。由于退税诈欺越来越严重,特别是身分盗窃的退税十分猖獗,国税局建立了不同的身分盗窃的滤网程序,改善了在处理税表和退税之 前,阻止退税诈欺的能力。国税局创造了身分盗窃分类法,形成完整的防范策略。三是建立了从信用卡交易查税追踪程序。两年前开始,信用卡公司已被要求必须用 1099K表向国税局报告所有给交易者的付款,这使国税局可以在第一时间得到第三方报告,发现低报生意收入的行为。2013年,国税局发起1492个身分 盗窃的调查,其中1257个被起诉。过去三年,国税局因为上述分析节省超过20亿元。

计算机网络技术不断发展,过去用的逃税手法已很难逃避计算机对大数据的分析发现。例如,每个行业都有行业代码,如出租车行业代码,通过信用卡公司等第三 方报告,国税局用模型对数以百万计的出租车报税数据进行分析,找出收入和费用规律,如果出租车报税偏离均值太远,计算机的红旗(Red Flag)就会出现,就可能被查税。

再例如,一些人低收入报税,却有大笔现金买房或汇款回中国,或消费模式与收入不符,报低收入却买宝马车和出国旅游,都可在国税局的联网计算机分析中反 映出来。国税局甚至可能在如微信等社交网站发现有低收入报税者在群里聊天炫富。如果电子数据显示某人消费多过报税收入,国税局就会断定其低报收入或逃税, 就会将其列入查税对象。

最后更新于: 2015-10-23 13:39
 

友善连接