一、 大赛简介
2016年,教育部高等学校计算机类专业教学指导委员会、教育部高等学校软件工程专业教学指导委员会、教育部高等学校大学计算机课程教学指导委员会、全国高等学校计算机教育研究会联合创办了“中国高校计算机大赛”(ChinaCollegiateComputingContest,简称C4),目前“中国高校计算机大赛”继续由全国高等学校计算机教育研究会主办。大数据挑战赛是其中的一项重要赛事,在2018-2024年均入选全国普通高校学科竞赛排行榜,获得社会各界的高度关注和广泛好评。
2025中国高校计算机大赛——大数据挑战赛(以下简称“大赛”)由清华大学、大数据系统软件国家工程研究中心联合举办。由上海和今信息科技有限公司提供竞赛平台支持。大赛是以实际数据为基础、面向全球开放的高端算法竞赛。
大赛旨在通过竞技的方式,提升人们对数据分析与处理的算法研究与技术应用能力,探索大数据的核心科学与技术问题,尝试创新大数据技术,推动大数据的产学研用。
本次大赛面向全球开放,不限年龄国籍,高等院校在校学生(包括高职高专、本科生、研究生)以及科研机构和企业从业人员均可报名参赛。参赛队伍根据赛题要求设计相应的算法进行数据分析和处理,比赛结果按照指定的评价指标使用在线评测数据进行评测和排名,得分最优者获胜。
二、 竞赛规程
本次大赛聚焦于时间序列数据的建模与预测,通过构建基于真实金融市场数据的任务场景,旨在推动前沿算法在实际复杂环境中的落地应用。时间序列数据广泛存在于金融、交通、能源、医疗等领域,具有强烈的时序依赖性和动态变化特征。股价作为典型的时间序列对象,表现出高波动性、高频率、强非线性和多因素驱动等复杂特性,对建模技术提出了严峻挑战。
本次竞赛选择中国A股市场的股价数据作为研究对象,是基于其高度代表性和数据质量的综合考量。A股市场是中国资本市场的核心组成部分,包含上千家上市公司,涵盖多个行业和市值层级,拥有丰富的历史数据与活跃的交易行为。其股价受宏观经济政策、行业发展、企业基本面、市场情绪等多重因素影响,为时间序列预测模型的特征提取、机制建模、异常识别与动态调整提供了良好的实践平台。同时,A股股价数据在时间维度上既具备微观的高频波动,也蕴含中长期的趋势变化,有助于推动参赛者设计多尺度、分层次的预测方法,提升模型的综合表现。
从更宏观的视角来看,A股市场在中国经济发展与全球资本格局中的地位日益重要。近年来,随着注册制改革的全面推进、新兴科技企业的持续上市、以及资本市场对外开放步伐的加快,A股正逐步从融资市场向资源配置市场转变,承担起更为核心的经济调节与资源优化职能。在国家大力发展数字经济、推动金融科技融合创新的背景下,围绕A股市场构建智能化分析与预测工具,不仅能够服务于投资决策与风险控制,也具有提升金融体系智能化水平、促进技术成果转化的现实意义。
2.1赛题设置
本次大赛的题目是“基于历史数据预测未来股价涨跌”,具体说明详见附件“赛题描述”。其目标是基于沪深300指数成分股的历史股价数据,通过建立机器学习模型来预测未来股价涨跌幅最大和最小的股票。选手需通过构建模型、训练和调优,预测并输出给定数据后一个交易日沪深300指数成分股的涨跌幅最大和最小各10支股票,以此进行排名。
2.2参赛对象
本次大赛面向全球开放,不限年龄国籍,高等院校在校学生(包括高职高专、本科、研究生)以及科研机构和企业从业人员均可参赛。具体要求如下:
可以自由组队参赛,具体组队要求见后文相关说明;Ÿ
参赛选手应保证报名信息准确有效,如队伍中的选手信息不符合要求,组委会有权取消整个队伍的参赛资格及奖励。
2.3赛制说明
本次大赛分为报名&组队、线上赛和决赛等三个阶段,其中线上赛均由参赛队伍下载数据在本地进行算法设计和调试,并通过大赛报名官网提交结果文件及模型代码;决赛要求参赛者进行现场演示和答辩。
1. 报名&组队(3月26日–7月15日)
参赛选手须在竞赛平台报名并且组队参赛(即使单人参赛也要组建单人队伍),大赛不收取任何报名费用。大赛报名系统开放时间为北京时间2025年5月20日10:00,截止时间为北京时间2025年7月15日中午12:00。
报名方式:登录竞赛平台,完成个人信息注册,即可报名参赛;Ÿ
每个选手可单人成队或2-3人组队参赛;Ÿ
参赛队伍(包括队长及全体队伍成员)需要在竞赛平台完成实名认证,未完成认证的队伍将无法参加正式比赛。
大赛官方渠道主要包括:Ÿ
大赛官网:https://nercbds.tsinghua.edu.cn/bdc.htmlŸ
竞赛平台:https://www.heywhale.com/u/2026BDCŸ
大赛邮箱:data@tsinghua.edu.cnŸ
大赛QQ群:112186245 / 759142692/762146461
报名截止之后,不再允许添加或更改任何队伍成员。如有中途退出情况,只允许在参赛队伍内部更换队长或删除队员。参赛队伍须应在决赛开始前向大赛组委会提交成员更换申请,由参赛队伍全部成员亲笔签名,经由大赛组委会审核后变更生效。
2.线上赛(3月26日–8月2日)
参赛队伍可从竞赛平台下载数据,在本地进行算法调试,并在线提交结果及模型代码。每个参赛队伍可在以下4个时间范围内汇总提交,之后一周后进行评测并返回成绩及排行榜。请确保结果可复现。
线上赛A阶段
(1)4月25日8:00—4月26日23:59,由于假期影响,T+5直接复用T+4数据
(2)5月30日8:00—5月31日23:59
(3)6月27日8:00—6月28日23:59
线上赛B阶段
(4)8月1日8:00—8月2日23:59
以上每个时间段结束时,竞赛平台会关闭提交系统,并汇总所有结果和模型代码进行评测审核。提交内容及要求如下:
提交最终的result.csv,确保可复现;
选手需将自己打包的docker文件(要求详见“代码规范”)上传至夸克网盘,并生成对应分享链接,确保永久有效,不要加提取码,提交生成的分享链接
在每个阶段的参赛队伍提交代码截止后,以线上赛榜单成绩为依照,组委会对参赛队伍提交的模型和代码进行审核和复现。组委会将审核并剔除没有机器学习算法贡献的队伍,并取消存在违反比赛规定队伍的比赛资格,另外将审核并剔除复现结果和提交结果不一致的队伍。
在线上赛B阶段通过代码审核的队伍中,单独排名前三名的在校学生队伍直接晋级决赛,其余队伍按照线上赛B阶段成绩排在前三名的队伍晋级决赛。
3、决赛(8月中下旬)
决赛将以现场答辩会的形式进行,具体要求和安排另行通知。受邀参加决赛的选手在决赛期间的食宿由大赛组委会负责,其他费用自理。
2.4奖项设置
大赛的奖金池总额为5.48万元人民币,所有奖金均为税前金额。
所有获奖必须满足成绩好于基准程序(https://github.com/Sherlock1956/THU-BDC2026),奖项空缺不补。
1. 线上赛奖项(以大赛官网线上赛最终排行榜为准)
线上赛通过代码审核的100支队伍将颁发线上赛名次证书。
2. 决赛奖项(以大赛官网决赛结果为准)
奖励对象 |
数量 |
奖励办法 |
决赛第1名队伍 |
1 |
奖金2万元,决赛名次证书 |
决赛第2名队伍 |
1 |
奖金1万元,决赛名次证书 |
决赛第3名队伍 |
1 |
奖金0.8万元,决赛名次证书 |
决赛第4-6名队伍 |
3 |
奖金0.4万元,决赛名次证书 |
3.在校学生队伍奖项
中国大陆在校学生提供学信网的教育部学籍在线验证报告编号进行身份验证,其余学生提供相关在读证明进行身份验证,在校学籍以2026年5月30日为准。
此奖项仅颁发给中国在校学生队伍,要求队伍通过代码审核且成绩好于基准程序,并根据在校学生队伍成绩的单独排名结果进行颁发。以下各奖项,同一学校获奖队伍不超过总获奖数的30%。
奖励对象 |
数量 |
对象 |
全国一等奖 |
5 |
单独排名第1-5名 |
全国二等奖 |
10 |
单独排名第6-15名 |
全国三等奖 |
15 |
单独排名第16-30名 |
(2)赛区奖
大赛将面向中国高等院校设立赛区奖,即参赛队伍按照下面的赛区单独排名,分别以赛区排名顺序以5%、10%、15%比例颁发各赛区一等奖、二等奖和三等奖,赛区奖颁发获奖证书。
大赛整体的赛区及其覆盖范围划分如下:
华北赛区:北京市、天津市、河北省、山西省、内蒙古自治区
东北赛区:辽宁省、吉林省、黑龙江省
华东赛区:上海市、江苏省、浙江省、安徽省、山东省、江西省、福建省
华中赛区:河南省、湖北省、湖南省
华南赛区:广东省、广西壮族自治区、海南省
西南赛区:重庆市、四川省、贵州省、云南省、西藏自治区
西北赛区:陕西省、甘肃省、青海省、宁夏回族自治区、新疆维吾尔自治区
港澳台赛区:香港、澳门、台湾
3、月月星
在线上赛A阶段,设立月月星奖励。以3次排行榜为准,分别取在校生队伍的第一名和在职队伍的第一名发放月月星奖励(每队发放奖金800元)。对于前面已经获得月月星的队伍,不重复发放,名额按名次顺延。
违规处理
此奖项仅颁发给在校学生队伍,要求队伍通过代码审核,并根据在校学生队伍成绩的单独排名结果进行颁发。
参赛者应本着诚实、公平的态度参加比赛,如在以下情况出现违规,大赛组织委员会(简称“组委会”)有权取消参赛者所在队伍的参赛资格,情节严重者将通报参赛者所在单位并追究其违法责任。
1.账号使用:参赛者所用的账号必须是使用本人信息注册的,并有义务保证账号所有信息的真实性和有效性,且账号仅限于参赛者本人使用;参赛者禁止使用多账号参赛,同一参赛者不可使用多个账号进行提交、刷分操作;如根据判断认为参赛账号存在异常或违背正常使用条例,组委会可以单方面暂停或终止该账号登录大赛平台。
2.比赛成果:
•严禁参赛队伍之间相互抄袭。如不同参赛队伍提交结果高度相似,经判定存在抄袭行为的,组委会将取消相关参赛队伍的参赛资格,相关参赛成绩无效。
•参赛者应保证其在比赛过程中所产出的所有成果未侵犯任何第三方的知识产权、商业秘密及其他合法权益。如第三方因为参赛者侵权行为提出索赔、诉讼等,参赛者应承担由此产生的全部责任及损失。
•如大赛主办方及其关联公司有意取得参赛者在本次大赛中独立开发的依约定享有完整知识产权的研究成果,参赛者同意大赛主办方及其关联公司在同等条件下享有优先受让权,相关转让事宜由双方另行协商确定。
3. 数据使用:
对于大赛提供的数据(数据集),参赛者须仅在比赛场景下使用,并应妥善保存已下载的数据(数据集),避免泄露;在完成比赛使用后应及时销毁已下载数据(数据集);如使用比赛之外的任何数据应获得组委会许可。对于不提供下载的比赛数据,参赛者不得以任何形式擅自复制、下载或获取。参赛者如发现任何出现数据未授权访问的可能,应立即通知组委会并积极提供相关信息。如参赛者泄露已下载的数据(数据集),或未及时销毁已下载的数据(数据集)导致已下载的数据(数据集)泄露,参赛者应承担由此产生的全部责任及损失。
4. 代码分享:
在大赛举办期间,未经组委会同意,参赛者禁止公开分享与赛事相关的数据、模型和代码;大赛结束之后,参赛者可以在拥有模型和代码的知识产权的情况下自行选择公开分享,但需要确保此类公开共享不会侵犯任何第三方的知识产权、商业秘密及其他合法权益。
5.参赛者若在参赛过程中发现相关规则漏洞或技术漏洞,有义务及时告知组委会相关漏洞的信息,组委会将对提供相关信息的参赛者表示感谢;若参赛者利用相关漏洞进行参赛,经判断查证后,成绩将会被判断为无效成绩。
2.6申诉与仲裁
1.参赛团队或选手对不符合大赛规定的设备、工具和软件,有失公正的评判和奖励以及工作人员的违规行为等,均可向大赛组委会提出申诉。组委会负责受理比赛中提出的申诉并进行调解仲裁,以保证大赛的顺利进行和大赛结果的公平公正。组委会作出的仲裁结果为终局决定。
2.申诉报告应明确申诉内容,指定一名成员作为联系人,通过大赛邮箱以邮件发送,否则申诉将不予受理。
3.组委会将在收到申诉之日起5个工作日之内受理,并认真核查和处理。
2.7其他
1.为了确保整个大赛顺利、公正地进行,以及保证参赛选手的合法权益,参赛选手报名时应阅读和确认大赛官网上的《参赛协议》,自觉遵守协议规定。
2.在大赛举办过程中,竞赛规程可能会有少量的变更和调整,大赛组委会将本着公平、公正、公开的原则在大赛官网公告,所有内容均以大赛官网为准。
附件1:2026大数据挑战赛-大赛通知.pdf
附件2:2026大数据挑战赛-赛题描述.pdf
附件3:2026大数据挑战赛-代码规范.pdf
大赛校园组(太阳成集团tyc33455cc)委会联系人:张老师
邮箱:kp.zhang@qust.edu.cn
联系电话:15555510431 校内QQ群: 1095695513
