第二届全球程序员节 | 新锐程序员评选 西安十佳优秀程序员评选
行业大数据创新应用大赛

基于铁路、民航、轨交、西安城市政务等领域的真实稀缺数据,进行应用场景和算法的创新设计。赛题分为算法题、统计分析展示题和解决方案题,

参赛选手根据自身优势,选择其一参赛并提交相应作品。

大赛面向企业和个人(含高校学生)征集作品。所有参赛作品由专家评审与网络投票,依权重比例共同产生。

  • 大赛规则
  • 民航赛题及数据
  • 铁路赛题及数据
  • 轨交赛题及数据
  • 西安政务赛题及数据
报名结束

参赛规则

1、参赛作品必须原创,具有完整自主知识产权。以个人身份参赛,不可将个人所在企业的产品提交参赛,如发生产权纠纷,参赛者须承担法律责任;

2、参赛者可以是企业、个人(含高校学生);

3、企业参赛者需在解放号完成企业认证,个人及高校学生参赛者需完成实名认证;

4、每个参赛者只能提交一个作品;

5、作品以提交截止日期前提交的最终版本为准;

6、所有参赛作品代码所有权归参赛者所有,解放号平台严格根据《中华人民共和国著作权法》及《计算机软件保护条例》执行评审工作,对作品进行保密并严格保管,绝不以任何方式提供、展示给任何第三方或用作其他用途,仅会将其用于作品评审,平台对代码查看权限进行严格控制,仅在评审期间对评审团开放;

7、解放号承诺为参赛者的作品和代码提供如下安全保障:

解放号平台基于华为软件开发云为参赛代码提供企业级安全保障,代码加密传输和存储,云端存储,集中灾备,确保7×24小时高可靠性。

作品提交要求

所有参赛成员在9月30日前提交参赛作品,必须提交的材料:

算法题:

方案设计文档(包括解决思路、算法说明)、算法结果(定制的格式,如Excel、CSV等格式)、算法源代码(可选项)。

统计分析展示题:

统计分析说明、可视化展示界面、源代码(可选项,包括数据处理及数据可视化实现)。

解决方案题:

可行性建议方案(PPT形式、添加必要的效果图等)。

比赛赛制

评审团对参赛者分三个阶段进行作品评审,陆续公布评审通过名单

  1. 第一阶段
  2. 第二阶段
  3. 第三阶段

评审团从所有参赛作品中评选出80个作品进入下一轮。

80个作品进行网络投票,汇总网络投票和评审团评分进行排名,角逐出66个作品,其中,网络投票权重占比20%,评审团评审权重占比80%。

评审团复审,进行综合评分,评选出最终获奖名单,获奖选手代表于10月24日-25日活动现场颁奖。

评审标准

综合类评分 单项类评分 分值(总分:100) 备注
1、功能完备性 1.1、可落地运行 0~20 提供可落地运行的解决方案并做可行性分析
2、技术创新及难度 2.1、方法新颖性 0~20 评价参赛者解决问题采用方法的新颖程度,有创新性的思路或方法给分较高
2.2、实现难度 0~20 选择较难题目,根据完成情况,给予较高得分
3、作品可用性 3.1、新技术应用 0~10 作品使用了大数据新技术切实解决了用户需求
3.2、适用性 0~10 方案能否最大程度满足场景的实际需求
4、作品完整性 4.1、作品资料完整 0~10 参赛者按照大赛规定清单内容提交对应的作品,保证资料完整性
4.2、资料可读性 0~10 作品资料易读、符合企业开发约定或规范、文档清晰
满分 100
加分项 提供源代码 0~20 1、提交算法源代码 2、提交部分源代码验证作品真实性

参赛承诺

1、参赛者必须保证参赛作品为首次参赛的原创作品,参赛作品不存在权利争议或侵犯第三方知识产权的行为,违反者自行承担相应责任。任何参赛作品知识产权方面的争议均与本次竞赛的主办单位无关。

2、参赛作品若经人检举或告发为他人代劳或违反本竞赛相关规定,有具体事实者并经查证属实者,主办单位将取消该队伍之参赛资格。若该作品为得奖作品,主办单位将追回原授予的荣誉及奖励。

3、参赛作品若经人检举或告发,涉及著作权、专利权等侵害,将由参赛队伍自行负担相关责任。侵权行为一旦经法院判決属实,主办单位将取消该队伍的参赛资格。若该作品为得奖作品,主办单位将追回原授予的荣誉及奖励。

4、参赛作品的专利权、著作权等知识产权均归属该参赛者所有,但自将参赛作品送交大赛组委会之日起,即视为许可大赛组委会可以将其参赛作品、技术方案或设计在非商业用途下通过各种方式向社会展现,授予大赛组委会对作品的权利包括且不限制于复制权、发表权、信息网络传播权等权利。

5、参加者应尊重评选委员会的决议,除非能具体证明其他作品违反本办法相关规定,不得有其他异议。

6、大赛阶段缴交所有文件将不退回,请参赛队伍自行备份。

一个机场6个月航班数据:航班号,飞机注册编号,出发站,到达站,计划起飞时间,计划到达时间,实际起飞时间,实际达到时间,航空器型号。

下载数据

算法题:航班起飞准点率的预测

为了提高航班准点率,提升旅客服务品质,请使用大数据分析技术,基于历史航班运行数据,使用相应的算法模型,预测一个机场未来7天的航班起飞准点率。

其中,航班起飞准点计算指具有实际起飞时间的所有航班,其公式为:起飞实际时间-起飞计划时间-15分钟<0 为准点,其中统计周期内起飞准点率指统计周期内起飞准点的航班与统计周期内全部航班数量的比率。

数据支撑(一个机场6个月航班数据):

1、航班号,飞机注册编号,出发站,到达站,计划起飞时间,计划到达时间,实际起飞时间,实际达到时间,航空器型号。

2、为了能提升预测效果,可以自行补充西安城市其他开放数据,如天气、空管数据等。

提交参赛产品要求:

方案设计文档(包括解决思路、算法说明)、算法结果(定制的格式,如Excel、CSV等格式)、算法源代码。

统计分析展示题:航班综合多维分析

以一个机场为中心,进行航班来源、到达的多维分析,维度包括:时刻(每天、每小时)、航空器型号等,利用先进分析技术、可视化展示技术,使用图形图表如折线图、柱状图、饼图、地图、热力图、线图、雷达、仪表盘等,进行直观、美观的分析。

数据支撑(一个机场6个月航班数据):

航班号,飞机注册编号,出发站,到达站,计划起飞时间,计划到达时间,实际起飞时间,实际达到时间,航空器型号。

提交参赛产品要求:

统计分析说明、可视化展示界面、源代码(包括数据处理及数据可视化实现)。

解决方案题:航班延误处置方案

有很多客观原因导致航班延误,为了提升航班延误后的旅客满意度,科学合理解决航班延误的后续处置问题,包括改签、退票、餐饮住宿服务等方面,请使用大数据技术、新型技术,发挥想象和创意,提供航班延误处置方案。

提交参赛产品要求:

提交航班延误处置建议方案(PPT形式、添加必要的效果图等)。

某铁路局连续6个月的货运真实脱敏数据:日期、货物运输类别、货品类型、发站名称、到站名称、货物吨数

下载数据

算法题:货源预测及分析

科学、准确的货源预测,可为铁路局合理安排运输生产、正确制定运输计划、编制运输方案、最大程度的发挥铁路运能提供一定的依据。请利用大数据分析技术,基于所提供的数据对未来7天每天A站的货物发送量进行预测,并给出预测模型算法。

数据支撑(某铁路局连续6个月的货运真实脱敏数据):

1、日期、货物运输类别、货品类型、发站名称、到站名称、货物吨数。

2、你觉得需要补充的其他社会数据,如天气、货物流通增长率等。

提交参赛产品要求:

方案设计文档(包括解决思路、算法说明)、算法结果(定制的格式,如Excel、CSV等格式)、算法源代码。

统计分析展示题:货运量统计分析

为满足运输生产需求,加强货物运输管理,准确及时反映货物运输状态,为领导的决策提供支持。请基于所提供的数据,围绕货运站A站从时间、货物运输类别、货物运输品类、OD区域等多种维度,进行货运量统计分析,并将统计分析结果通过合理布局的图表(折线图、柱状图、饼图、地图、热力图、线图、雷达、仪表盘等)形象展示。

数据支撑(某铁路局连续6个月的货运真实脱敏数据):

日期、货物运输类别、货品类型、发站名称、到站名称、货物吨数。

提交参赛产品要求:

统计分析说明、可视化展示界面、代码。

解决方案题:提升客运收益方案

铁路局的收入来源主要包括两部分:客运收入和货运收入,针对客运收入,在满足社会服务效益的前提下,如何提升客运收益?请从客票定价、旅客个性化服务、客票票额分配等方面,使用大数据技术进行分析,发挥你的创意,提供可行性建议方案。

提交参赛产品要求:

可行性建议方案(PPT形式、并添加必要的效果图等)。

数据支撑(某轨道交通连续12个月的客流真实脱敏数据):

1、周边环境数据—经济情况、公共交通状况、土地利用等 2、轨道交通车站数据 3、轨道交通OD客流数据

下载数据

算法题:客流预测及分析

科学、准确的客流预测,可为轨道交通行业合理安排列车投入、正确制定车辆运输计划,最大程度的发挥轨交运输提供一定的依据。请利用大数据分析技术,结合线路周边综合调查情况,综合OD客流信息等,对路网各站客流进行短期(未来7天)预测,并给出预测模型算法。

数据支撑(某轨道交通连续2个月的交易真实脱敏数据):

1、轨道交通车站数据

2、轨道交通乘车交易数据

提交参赛产品要求:

算法模型DEMO、客流统计结果、算法说明、算法源代码(包括数据处理及数据可视化实现)。

解决方案题:数据安全方案

轨道交通每天的交易数据、统计数据量十分庞大,数据的安全性尤为重要,请从硬件、软件、企业管理等角度思考,提供可行性方案建议,确保数据的安全性。

提交参赛产品要求:

可行性建议方案(PPT形式、添加必要的效果图等)

数据支撑:

题目一——食药监局12个月餐饮处罚数据(行政处罚决定书文号、违法企业或违法自然人编码、违法企业名称或违法自然人姓名、企业所在区域等)、食品抽查结果数据(抽样单编号、样品名称、标示生产单位编码、标示生产单位地址、被抽样单位编码、被抽样单位地址等)。

题目二——出租车6个月GPS信息:车牌号、GPS时间、经度、维度、车辆状态(空车、重车、熄火)、车辆速度、车辆方向。

题目三——路口过车数据(过车流水号、交叉口ID、车道编号、方向、车牌号、车牌类型、过车时间)、交通信号控制数据(路口ID、时段、方案编号、机动车相位、行人相位、时长、全红)。

请在网盘下载该数据:https://pan.baidu.com/s/1Qu7UPGhuZNsJtD4LPKE2-Q 密码:ev5q

解决方案题

题目一:食品安全精准监管方案

食品安全是关系到民生的大事,也是城市运行治理的重要内容,食品监管对象面广量大,涉及到不同的食品种类、区域、相关企业,但行政资源是有限的,如何利用数据分析,进行重点监管对象的快速定位,实现精准监管?请参考提供的数据,发挥您的创意,提出方案建议。

数据支撑(12个月数据):

1、餐饮处罚数据项:行政处罚决定书文号、违法企业或违法自然人编码、违法企业名称或违法自然人姓名、企业所在区域、主要违法事实、行政处罚的种类和依据、行政处罚的履行方式和期限、作出处罚的日期、作出处罚的机关名称。

2、食品抽查结果数据项:抽样单编号、样品名称、标示生产单位编码、标示生产单位地址、被抽样单位编码、被抽样单位地址、抽样环节、行政区域、样品大类、规格、生产/加工/购进日期、检验项目、不合格项目、不合格类型、检测数据、标准规定、判定依据、检测机构、是否合格。

提交参赛产品要求:

提交精准监管建议方案(PPT形式、添加必要的效果图)、算法(可选项,如涉及算法,请提供算法说明、算法结果、算法源代码)。

题目二:基于居民出行行为优化出租车调度

出租车作为一种特殊的交通工具, 行驶起讫点和行驶时间完全由乘客决定,其运营具有随机性、24小时全天行驶以及即停即走等特点,其运营规律能够很好的反映乘客出行特点,请基于出租车GPS数据,分析居民出行在时间和空间上的分布特点,对于居民出行频率和密度较大的区域,进一步从车辆有效调度等角度,提供用户打车难、降低出租车空驶率的解决方案。

数据支撑(6个月数据):

出租车GPS信息:车牌号、GPS时间、经度、维度、车辆状态(空车、重车、熄火)、车辆速度、车辆方向。

提交参赛产品要求:

提交优化出租车调度建议方案(PPT形式、添加必要的效果图等)、算法(可选项,如涉及算法,请提供算法说明、算法结果、算法源代码)。

题目三:利用大数据解决城市交通拥堵问题

交通拥堵一般出现在车流交会、改换节点,这些节点往往由信号灯控制,因此信号灯配时方案的合理性和科学性直接关系着城市的疏通、市民的出行体验,影响着城市路网运行效率。请利用大数据技术,结合所给出的数据,充分理解、挖掘和应用这些信息,根据所给出数据中各路口的交通通行状况,建立准确的交通模型,开发高效的优化算法,为提高路口的交通通行能力,提出科学合理的方案。

数据支撑:

路口过车数据:过车流水号、交叉口ID、车道编号、方向、车牌号(已脱敏)、车牌类型、过车时间。
交通信号控制数据:路口ID、时段、方案编号、机动车相位、行人相位、时长、全红。

提交参赛产品要求:

方案设计文档(包括解决思路、算法说明、交叉口的配时方案优化)、算法结果(定制的格式,如Excel、CSV等格式)、算法源代码、仿真原文件(inp格式)。