国家税务总局深圳市税务局税收大数据和风险管理局智能分析平台采购项目合同公告
发布时间:2020-12-02 15:32:16来源:国家税务总局深圳市税务局
一、合同编号:SZSW-2020-017
二、合同名称:国家税务总局深圳市税务局税收大数据和风险管理局智能分析平台采购项目合同
三、项目编号:SZZZ2020-QC0167
四、项目名称:国家税务总局深圳市税务局税收大数据和风险管理局智能分析平台采购项目
五、合同主体
采购人(甲方):国家税务总局深圳市税务局
地址:深圳市福田区沙嘴路38号
联系方式:李宇祥,83878487
供应商(乙方):深圳市华云中盛科技股份有限公司
地址:深圳市南山区粤海街道麻岭社区高新中区科技中2路1号深圳软件园(2期)11栋701
联系方式:李晓涛,0755-86961830
六、合同主要信息
主要标的名称:国家税务总局深圳市税务局税收大数据和风险管理局智能分析平台采购项目软件开发
规格型号(或服务要求):详合同条款
主要标的数量:1项
主要标的单价:218万元
合同金额:218.000000万元
履约期限、地点等简要信息:详合同条款
采购方式:公开招标
七、合同签订日期:2020-12-01
八、合同公告日期:2020-12-01
九、其他补充事宜:
本合同对应的中标成交公告:
国家税务总局深圳市税务局税收大数据和风险管理局智能分析平台采购中标公告
附件:
国家税务总局深圳市税务局税收大数据和风险管理局智能分析平台采购项目合同
摘录自合同部分内容:
附件
国家税务总局深圳市税务局税收大数据和风险管理局智能分析平台采购项目工作说明书
1. 前言
本工作说明书是国家税务总局深圳市税务局税收大数据和风险管理局智能分析平台采购项目合同(以下为简称主合同)的不可分割的组成部分,并经国家税务总局深圳市税务局(以下简称甲方)和深圳市华云中盛科技股份有限公司(以下简称乙方)协商达成以下一致意见:
(1)乙方同意向甲方提供本工作说明书所述服务。
(2)主合同的定义、解释、条款、术语和条件将作为此工作说明书未提及部分的补充。本工作说明书与合同有冲突的,以本工作说明书条款为准。
(3)此工作说明书描述了由乙方为甲方实施项目(以下简称本项目)的过程中提供的技术服务细则,以及甲乙双方在项目实施过程中的主要职责。
1.1. 目的
为保证项目的顺利实施,本文档将作为项目执行过程中的基准。
1.2. 术语
深圳税务:国家税务总局深圳市税务局或甲方。
华云中盛:华云中盛科技股份有限公司或乙方。
本项目:国家税务总局深圳市税务局税收大数据和风险管理局智能分析平台采购项目。
1.3. 参考
甲方发布的与本项目相关的文件、通知和工作方案。
2. 项目概述
2.1. 项目目标
实现税收风险管理数字化转型
在深圳市税务局税收风险管理“防火墙工程”的总体架构下,形成“1+4”工作目标格局。包括1个工作目标“实现税收风险管理数字化转型”,4个工作标准“用数据平台支撑;用人工智能(AI)分析;用数字说话;用图表展示”。
建设全内容的风险数据库
基于大数据平台建成全对象的风险数据库,覆盖风险分析全对象与业务的分层解耦数据库,包括业务表单库、风险指标库、风险模型库、风险疑点清册库,为风险分析提供全对象、全环节的涉税数据基础,统一管理风险管理过程中产生的业务数据,并实现共享共用的目的。
建设全对象的风险分析工具
构建满足各层级、全对象、不同技术水平的业务人员的风险分析工具,支持SQL查询与结果筛选、拖拽式定制查询、面向业务人员的指标建模、面向业务人员的人工智能建模,4种满足各层级、各水平风险分析人员的分析需求,同时支持各业务人员利用不同分析方法构建的分析模型定时扫描结果,并提供平台预警与信息预警,为税收风险识别提供统一智能分析引擎。
共建共享全面的风险识别成果
对智能分析平台种风险数据库与分析工具产生的模型实现成熟模型的固化和定期扫描,对产生的模型通过图谱化直观方式呈现,方便用户检索使用,支撑市区两级风控部门和相关单位的重复使用、共同分享以及指标与模型的二次创建。同时对风险任务应对成果进行统计展示,供各级领导监控风险识别与任务应对的成效。
实现全流程的管控能力
对平台的风险数据库、智能分析工具、主题分类分析模型图谱使用过程中的数据权限、模型权限、操作留痕审计、数据运维的工作进行全流程统一管控,使风险分析过程中的数据、模型使用透明化、数字化;对接决策支持系统,实现风险疑点清册推送并进行任务流程,对接风险应对反馈数据,实现模型优化,形成税收风险管理业务全闭环。
2.2. 项目实施前提
2.2.1. 工作条件
甲方负责向乙方提供本合同相关的工作场地安排及乙方驻点服务人员工位。
2.2.2. 技术条件
甲方负责向乙方提供能进行应用系统运维及开发相关的内网网络环境。
3. 工作范围
1、个人中心
个人中心用于维护用户信息,查询待办事项与已办事项,进行待办处理,以及接收与查看消息通知。功能点包括:
1.1待办事项,待办事项包括:待分析计划任务、模型调整、设置模型标签、清册提交分析科长确认、清册退回重新调整、模型发生变化、AI模型训练完毕、产生扫描结果、清册进行调整
1.2已办事项,已办事项包括:列表展示、AI模型标签、传统模型标签、反馈调整
1.3消息中心,包括接收到应对指引、接收到某一批次任务的回归分析结果、接收到典型调查的结果、接收到某一批次任务、已到期的全部应对结果、BI模型审批通过、BI模型审批被退回、模型被引用
2、业务表单管理
业务表单管理用于创建与维护业务表单与数据库映射关系,以及业务表单与第三方数据映射管理,管理表单目录以及表单数据项。业务表单配置需支持上传Excel表单并解析,同时通过拖拽方式进行数据口径值与表单栏次位置的映射关系配置。
2.1 业务表单维护:通用业务表单与数据库映射关系配置、第三方数据与业务表单映射关系配置、目录展示、业务表单明细
2.2表单数据项:维护展示指标元列表
2.3 数据源维护:新建数据源及已有数据源列表的维护
3、指标库管理
指标库管理用于维护指标目录与用户创建的指标。创建指标的方式允许用于通过查询出需要的业务表单并将相关的业务数据项拖拽到计算器上进行公式配置,保存公式配置后用于模型构建;同时支持SQL创建指标,提供数据仓库的业务表单数据项的数据字典,页面编写SQL,执行SQL,配置字段映射关系,完成指标的创建。
3.1 指标目录维护,目录列表展示、目录新增、目录重命名、目录删除的功能
3.2 指标维护,指标列表维护、指标新建-表单拖拽、指标新建-SQL方式、指标编辑-表单拖拽、指标编辑-SQL方式,指标查看的功能
3.3 我的常用指标,个人关注指标展示
4、模型管理
模型管理用于维护与创建传统模型、AI模型、BI模型。传统模型的创建提供通过画布拖拽逻辑关系的功能,用户可选择指标或者业务表单数据项进行关系配置,允许多个逻辑关系在一个画布上配置;提供SQL创建传统模型的功能,提供数据仓库的业务表单数据项的数据字典,页面编写SQL,执行SQL,完成模型的创建;AI模型管理包括样本维护与AI模型维护,提供给用户进行训练样本创建的功能,提供AI模型创建、训练、查看训练结果的功能;BI模型管理包括以传统模型与AI模型的配置方式生成数据,并提供结果字段选择,推送至决策系统展示。
4.1 AI模型维护:AI模型列表展示、AI模型新建、AI模型编辑、AI模型查看、样本维护、新建样本、编辑样本
4.2 传统模型维护:传统模型维护、画布新建、SQL新建、传统模型编辑、传统模型查看
4.3 BI模型:模型新建-AI模型、模型新建-传统模型、BI模型列表维护
5、扫描方案管理
扫描方案管理用于创建相关模型的手动与自动扫描方案,维护扫描样本,配置扫描定时任务,定时生成扫描清册,维护扫描清册。
5.1 扫描方案(清册)查询:方案(清册)列表、模型类别筛选、方案名称模糊搜索、扫描方案查看
5.2 扫描方案配置:选择模型、选择样本、方案配置
5.3 扫描样本维护:扫描样本列表、新增扫描样本
5.4 扫描清册的列表展示
6、分析烽火台
分析烽火台是以在线表格的形式对扫描清册进行查看、编辑、分析的在线分析器,可实现EXCEL部分基本功能。在分析烽火台上提供给用户选择业务表单数据项、指标使用的功能,创建指标、模型的功能,智能填充数据的功能,数据导入导出的功能,设定评分规则的功能(评分算法需至少提供三种),剔库规则设定功能,操作日志查询功能,历史版本回退功能,推送清册到风险管理系统功能。
6.1 风险企业清册:展示风险企业清册列表、保存为样本、导出数据、导入数据、保存修改、保存并推送至决策
6.2 工具栏:添加字段、提取数据、编辑模型、扫描方案、操作日志、智能填充分析结果
6.3 侧边浮框:模型基本信息查看、评分规则、剔库规则
7、全景分析图谱
全景分析图谱提供通过图谱的方式展示模型分类目录,并展示通过验证后的模型成果,需区分传统/AI模型图谱与BI模型图谱,提供模型明细查询功能,模型推送任务反馈情况查询功能,模型引用、扫描功能。
7.1 图谱展示分类:传统/AI模型图谱和BI模型图谱
7.2 模型信息:模型详细信息、模型版本、清册列表、清册明细、模型引用
8、与风险管理系统对接
智能分析平台需要与深圳市税务局风险管理系统进行对接,接收风险管理系统产生的分析事项,推送风险扫描清册到风险管理系统,接收风险管理系统产生的相关反馈。
8.1 在个人中心待办事项中接收风险管理系统产生的分析事项
8.2 在分析烽火台推送风险扫描清册到风险管理系统
8.3 在全景分析图谱接收风险管理系统产生的风险任务相关反馈
9、新建涉嫌普票虚开画像
普票虚开画像以近年来发现的涉嫌虚开普通发票的小规模纳税人为负样本,以正常经营的小规模纳税人为正样本,采用机器学习算法,对小规模纳税人进行扫描识别。利用小规模纳税人的基础登记信息、发票相关业务信息、发票开具信息、增值税申报信息、实名绑定人员相关信息等涉税相关信息,判断小规模纳税人是否具有虚开普通发票的嫌疑。建设该画像有助于提升对虚开普通发票的管理水平,优化营商环境。
9.1 填写模型基础信息
9.2 选择构建模型所涉及的登记信息、发票信息、增值税申报信息等特征
9.3 选择模型训练样本,训练的正样本为正常经营的小规模纳税人,训练的负样本为近年来发现的涉嫌虚开普通发票的小规模纳税人
9.4 模型构建成功,开始训练
9.5 可以查看模型结果,包括基础信息、机器学习效果、算法自动筛选的重要特征,以及决策单元和决策树
10、新建“买壳”企业画像
在近期的风险任务中,业务人员总结规律发现虚开金额较大、性质恶劣、风险较高的风险企业中,大部分均是成立时间较长的老企业。这类企业有过一段时间正常经营记录,之后一段时间内处于“沉睡”状态,不法分子从不经营纳税人手中高价买入,变更法定代表人之后一次性领购大量发票,短时间内暴力虚开完毕后走逃,我们将这类企业定义为空壳企业。空壳企业往往具有较高的最高开票限额和每月购票最高数量,暴力虚开造成的税款损失较高,需要重点关注这类风险。为此深圳市税务局计划建设“买壳”虚开企业画像,从以往业务中提取“买壳”虚开的相关特征,尤其是变更法定代表人相关信息和之后的一系列发票相关业务,通过机器学习算法整合相关指标,实现对“买壳”虚开这一风险较高特征进行定点打击,能对恶意从事虚开活动的不法分子起到一定的震慑作用。
10.1 填写模型基础信息
10.2 选择构建“买壳”企业画像的特征,重点分析法人变更前后的基础登记信息、发票核定、发票开具等涉税相关信息
10.3 选择模型训练样本,正样本为登记超过5年,有过法人变更的正常经营企业;负样本为存续期大于一年,且变更过法定代表人风险企业
10.4 模型构建成功,开始训练
10.5 可以查看模型结果,包括基础信息、机器学习效果、算法自动筛选的重要特征,以及决策单元和决策树
11、新建“潜伏”企业画像
在基础性风险管理工作中,现有事中监管环节较为单薄,对已经领购发票但还未大规模开具发票的涉嫌虚开企业尚无有效的监管手段。“潜伏”画像的基本思路在于将打击虚开工作从事后处理推向事中监控,利用实名办税数据与金三核心征管数据等纳税人涉税数据,构建“潜伏”企业指标体系,通过机器学习模型对异常企业进行识别,实现将一部分虚开企业提前扼杀的效果。
10.1 填写模型基础信息
10.2 构建“潜伏”企业画像的特征来源于发票核定、增值税申报等相关信息
10.3 选择模型训练样本,正样本为不在监控库与企业负样本库内的正常经营企业;画像训练的负样本为核实有虚开风险企业名单;
10.4 模型构建成功,开始训练
10.5 可以查看模型结果,包括基础信息、机器学习效果、算法自动筛选的重要特征,以及决策单元和决策树
4. 项目的主要交付物
项目的主要交付物如下表所示: