一、竞赛目的
本竞赛项目深度落实国家“建设数字中国”战略部署,紧扣大数据产业创新发展趋势,聚焦离线数据处理、数据采集与实时计算、数据可视化、向量数据库等核心技术领域,全面覆盖Scala开发、Spark/Hive/Hudi数据处理、Flume/Kafka/Flink流处理、Vue.js/ECharts可视化、Milvus向量数据库操作等关键技能点,旨在系统培养大数据领域技术技能型人才。
二、竞赛内容
本赛项涉及的典型工作任务包括离线数据处理、数据挖掘、数据采集与实时计算、数据可视化、向量数据库操作,引入行业内较为前沿的数据湖架构作为创新、创意的范围与方向,考查的技术技能如下:
1.离线数据处理:Scala应用开发、Pom文件配置、Maven本地仓库配置使用、基于Spark的数据清洗处理方法、基于Hive的数据清洗处理方法、基于Hudi的数据清洗处理方法、数据仓库基本架构及概念、数据湖基本架构及概念、MySQL基本操作、ClickHouse基本操作、Azkaban基本操作、DolphinScheduler基本操作。
2.数据挖掘:特征工程应用、SparkML机器学习库应用开发、推荐算法的召回和排序、回归模型、聚类模型、决策树模型、随机森林模型应用。
3.数据采集与实时计算:Scala应用开发、Pom文件配置、Maven本地仓库配置使用、基于Flume及Kafka的数据采集方法、基于Flink的实时数据处理方法、HBase基本操作、Redis基本操作、MySQL基本操作。
4.数据可视化:Vue.js框架应用开发、ECharts组件应用开发,会使用ECharts绘制柱状图、折线图、折柱混合图、玫瑰图、气泡图、饼状图、条形图、雷达图、散点图等图表。
5.Milvus数据库操作:数据入库操作,Milvus混合搜索等。
6.展示汇报:三人组队,进行项目的背景、技术路线、创新点等汇报,限时10分钟。
三、参赛对象
全体在校学生均可报名参加。
四、奖项设置
参赛学生:本次比赛按参赛选手数量的10%、20%、30%分别设置一等奖、二等奖、三等奖。
指导教师:以指导学生的获奖情况评定等次。
获奖者颁发荣誉证书。
五、报名比赛安排及联系方式
各参赛选手扫描下方二维码加入QQ群报名。

报名截止时间:2026年5月18日;
比赛时间:2026年5月19日,地点另行通知;
联系人:季秀兰,13912088725;盛婷钰,13261571876。
实验实训管理中心 人工智能学院
2026年5月7日
