辅修“智能科学与技术”的申请,在春季学期开始后不久便顺利通过了审核。流程比韩澈预想的要顺畅,或许得益于他不错的GPA和体育特长生的“特殊通道”,又或许是交叉信息研究院本身鼓励学生进行跨学科探索。当看到选课系统中多出的那几门颜色不同的课程时,韩澈深吸一口气,知道一段新的、注定更加忙碌的旅程开始了。
新课表排得如同高难度乐谱。除了本专业的《电磁场与波》、《模拟电子技术基础》等硬核课程,辅修专业的《人工智能导论》、《计算神经科学基础》、《最优化方法》也赫然在列,其中《最优化方法》还是与数学系合上,以难度大、作业多著称。训练时间被重新规划,更加紧凑。每天清晨,当大多数同学还在梦乡时,韩澈已经完成了一组核心力量训练和投篮练习;上午的课程结束后,他匆匆赶往食堂,边吃边看上课录屏或预习资料;下午是固定的球队集体训练和战术演练;晚上则完全交给了图书馆和自习室,在《信号与系统》的傅里叶变换和《最优化方法》的拉格朗日乘子法之间来回切换,常常到闭馆音乐响起,才带着满脑子的公式和代码离开。
生活被压缩成了简单的三点一线:教室(实验室)-训练馆-图书馆。睡眠时间被无情地挤压,咖啡和浓茶成了忠实伴侣。但他却奇异地感到一种充实的疲惫。篮球训练让他的身体保持在高强度的运转状态,而繁重的学业,尤其是那些全新的、充满挑战的交叉学科课程,则不断刺激和拓展着他思维的边界。两种截然不同的“苦”,交织在一起,竟产生了一种奇特的平衡与满足感。
苏晚的身影,偶尔还是会出现在图书馆,通常是在更僻静的专题阅览区或研究厢,身边堆放着更多外文书籍和打印的论文。韩澈远远见过几次,并未上前打扰。他们像两条偶尔交汇又迅速分开的溪流,各自奔涌在属于自己的河道里。直到那个寻常又不寻常的下午。
那是《人工智能导论》的课程项目宣讲会。这门课是辅修专业的核心必修课,考核方式除了期末考试,还有一个占总评30%的团队课题项目,要求3-4人一组,自选与人工智能相关的课题,完成从问题定义、文献调研、方法实现到结果分析的完整流程,并在期末进行展示和答辩。
宣讲会在一个中型阶梯教室举行。授课的是一位年富力强、语速极快的青年副教授,姓秦,研究方向是计算机视觉与强化学习。秦教授用了大半节课时间,以令人眼花缭乱的速度介绍了近年来AI各子领域的突破性进展和前沿方向,从生成式模型谈到具身智能,从大语言模型聊到AI for Science,信息密度极高,听得底下学生们既兴奋又头大。
“好,前沿我们就先了解到这里。”秦教授推了推眼镜,切换到PPT的最后一页,上面列出了课题项目的具体要求和时间节点,“接下来是重点:课题自由组队,自由选题。但有两个建议:第一,选题不要太泛,比如‘研究人工智能的利弊’这种不行,要具体,有明确的技术目标和可评估的结果;第二,鼓励交叉创新,结合你们各自的专业背景。我们清北的优势就是学科齐全,别浪费了。你是学生物的,能不能想想AI在基因测序或药物发现中的应用?你是学建筑的,能不能探索生成式设计?你是学心理的,能不能结合认知模型?当然,经典的CV、NLP、推荐系统课题也可以,但要做出新意。”
“组队名单和初步选题意向,下周上课前提交。现在,给大家二十分钟自由讨论,可以寻找队友,也可以初步碰撞一下想法。”
教室里立刻响起一片嗡嗡的讨论声。学生们开始四处张望,寻找熟悉的同学,或者主动出击,询问彼此的专业和兴趣。韩澈坐在靠后的位置,有些踌躇。他在这个班里认识的人不多,仅有的几个点头之交,似乎也已经找到了队友。他本身是电子工程专业,对AI的了解刚刚入门,要提出一个具体且有新意的课题,并非易事。
他正低头看着课程大纲,思考着自己那点可怜的篮球数据分析想法是否够格作为一个课题时,一个平静的声音在旁边响起:
“你对什么方向感兴趣?”
韩澈抬头,微微一怔。苏晚不知何时走了过来,站在他旁边的过道上。她今天穿着一件浅灰色的连帽卫衣,背着那个看起来永远鼓鼓囊囊的帆布包,表情是一贯的沉静,只是眼神里带着一丝询问。
“呃……”韩澈没想到她会主动过来,一时语塞。他快速整理了一下思绪,决定实话实说,“我对AI在体育数据分析,特别是篮球比赛分析上的应用,有一些模糊的想法。但具体怎么做,还没什么头绪。这个方向……可能有点偏,也未必容易出成果。” 他知道苏晚的研究方向很高端,担心自己的“业余”想法入不了她的眼。
苏晚听了,并没有立刻表示赞同或否定,而是微微偏了偏头,似乎在思考。“体育数据分析……具体指什么?球员动作捕捉?战术模式识别?还是比赛结果预测?”
她的问题很直接,也很专业,一下子把韩澈脑海中那些零散的念头逼到了需要具体化的境地。韩澈深吸一口气,努力组织语言:“可能……更偏向战术模式识别和球员行为预测?比如,通过比赛视频数据,自动识别常见的战术配合,或者预测球员在特定局势下的跑位和传球选择。我打球,对这些比较有直觉,但不知道能不能用AI的方法来建模和验证。”
苏晚安静地听着,手指无意识地摩挲着帆布包的带子。“基于视觉的时空行为分析,确实是当前的一个研究热点。难点在于数据标注成本高,模型需要理解高层次的语义信息,而不仅仅是像素变化。另外,篮球比赛的动态性很强,规则和球员互动复杂,建模难度不小。” 她顿了顿,目光落在韩澈脸上,那眼神像是在评估一个实验方案的可行性,“不过,如果你能提供准确的领域知识和具体的分析需求,或许可以简化问题。比如,不追求全自动的通用模型,而是针对特定战术或特定球员,设计专门的识别或预测任务。”
韩澈眼睛一亮。苏晚没有否定他的方向,反而给出了非常专业的难点分析和可行的切入点建议。这让他心里那点不自信消散了不少。“你的意思是,我们可以做一个更聚焦的、验证性质的小课题?比如,专门识别‘挡拆’(pick and roll)战术,或者预测控球后卫在快攻中的传球选择?”
“可以朝这个方向考虑。”苏晚点头,“但需要明确数据来源、标注方法、模型选型和评价指标。公开的、标注好的篮球比赛视频数据集可能不多,甚至没有。我们需要自己想办法获取和处理数据。”
“数据我可以想办法!”韩澈立刻说,“球队有大量的比赛录像,教练组也有详细的战术标注记录。虽然不一定完全符合机器学习的数据格式要求,但可以作为起点。如果需要更精细的标注,我……我可以想办法处理一部分。” 他想到了自己漫长的基础训练后那些可以用来“抠细节”的时间。
苏晚似乎有些意外他能提供数据支持,但并未多问,只是说:“有数据是第一步,也是关键一步。如果能解决数据问题,这个课题的可行性会高很多。”
这时,另一个声音插了进来:“嘿,你们在讨论课题吗?加我一个怎么样?”
一个戴着黑框眼镜、身材微胖的男生凑了过来,脸上带着友好的笑容。韩澈认得他,是计算机系大三的,好像叫王睿,在之前的课程小组讨论中发言挺积极,技术基础似乎很扎实。
“我们正在讨论一个可能的方向,关于AI在篮球比赛分析中的应用。”韩澈简单介绍了一下。
王睿一听,来了兴趣:“篮球?这个有意思!我是NBA铁杆球迷,自己也打球。用AI分析比赛,酷啊!数据问题韩澈你能搞定的话,那太棒了。建模和实现这块我可以多出力,我对计算机视觉和时序建模有点研究。哦对了,我还会点前端,最后成果展示可以做个炫酷点的交互界面!” 他语速很快,显得热情洋溢。
苏晚看了王睿一眼,又看了看韩澈,平静地说:“如果数据能解决,这个课题在技术上有挑战,但也有创新点。交叉学科的特点也符合秦老师的要求。”
韩澈看向苏晚:“那你……愿意加入吗?” 他问得有些小心。苏晚的专业水平明显很高,研究方向也更偏向底层模型和神经科学启发,他担心这个“应用性”较强的课题对她吸引力不足。
苏晚沉默了几秒钟。她的目光在韩澈和王睿脸上扫过,似乎在权衡。然后,她轻轻点了点头:“可以。这个课题涉及到时空序列建模、模式识别,可能还会用到一些图神经网络的方法,与我的研究方向有结合点。而且,”她顿了顿,看向韩澈,“你有领域知识,这是宝贵的输入。王睿同学擅长工程实现。我们可以互补。”
她的话语依然简洁,逻辑清晰,带着一种就事论事的冷静,但其中“可以互补”四个字,让韩澈心里微微一动。这大概是苏晚式的高度认可了。
“太好了!”王睿兴奋地搓了搓手,“那我们队就算齐了?三人组,黄金三角啊!我来当组长,负责跟秦老师沟通和协调进度,怎么样?你俩没意见吧?”
韩澈看向苏晚,苏晚无可无不可地点了点头。
“那就这么定了!”王睿立刻进入状态,掏出手机,“来,加个微信,拉个群。我们得赶紧把选题意向定下来,秦老师要求不低,得好好琢磨一下题目和初步方案。”
就这样,一个奇妙的组合在二十分钟的自由讨论时间里迅速成型。韩澈,电子工程系大二,校队篮球明星,提供领域知识和数据;苏晚,物理系(兼修脑启发计算方向)的学术新星,提供前沿的算法思路和理论支撑;王睿,计算机系大三的技术达人,负责核心代码实现和工程落地。三个不同专业、不同背景的人,因为一门课程,因为一个或许有些异想天开的“篮球+AI”课题,走到了一起。
接下来的一周,三人小组开始了紧锣密鼓的初步讨论。主要是通过微信群,偶尔在没课的下午约在图书馆的研讨室碰面。王睿是天然的“项目经理”,热情高涨,不断抛出各种技术实现方案和酷炫的展示点子。苏晚则像团队的“理论顾问”和“质量把控”,冷静地分析每个方案的可行性、理论依据和潜在缺陷,常常一针见血地指出王睿想法中过于乐观或不严谨的地方。韩澈则扮演着“领域专家”和“需求方”的角色,不断将王睿和苏晚讨论的技术方案,翻译成具体的篮球场景和问题,同时也从可行性角度提出约束。
“我们不能一开始就搞全场比赛的战术识别,太复杂了。先从简单的、定义清晰的场景开始,比如‘高位挡拆’的识别。这个战术在NBA和我们的比赛里都非常常见,有明确的起始形态和球员位置关系。”韩澈在白板上画着简单的示意图。
“没问题!我们可以先用目标检测模型(比如YOLO)识别出视频帧里的球员和篮球,然后用目标跟踪算法把每个人和球的轨迹连起来,形成时空序列数据。”王睿接话。
“然后呢?识别出球员和轨迹只是第一步,怎么定义‘挡拆’?是看两个球员的轨迹是否在某个时刻接近,然后一个留下,一个移动?”苏晚提问,语气平静但切中要害,“这需要明确的、可量化的规则。而且,防守球员的位置和反应呢?真正的挡拆成功与否,和防守人的位置密切相关。”
“这个……”王睿挠了挠头,“可能需要引入图神经网络?把每个球员看作节点,他们之间的距离和相对运动方向作为边,构建一个动态图,然后用图分类或节点分类的方法来识别特定的战术模式?”
“可以尝试。但动态图的构建和计算开销需要考虑。而且,标注数据会是大问题。我们需要大量标明了‘挡拆’发生时刻和参与球员的视频片段作为训练数据。”苏晚转向韩澈,“你之前说的比赛录像和教练标注,具体到什么程度?”
韩澈解释道:“录像很全,有多角度。教练组的标注更多是文字记录和手工画的战术板,比如‘第一节8分15秒,我方发起高位挡拆,由5号与1号执行,形成错位,1号突破分球给底角3号,命中三分’。有具体时间和战术描述,但没有精确到每一帧的球员坐标和动作标签。”
“这需要大量的预处理和人工细化标注。”苏晚总结道,眉头微微蹙起,显然意识到了任务的艰巨性。
“要不……我们先不用真实比赛视频?”王睿提议,“可以用篮球游戏,比如NBA 2K系列,它的回放模式可以导出精确的球员位置数据,而且可以自定义战术让AI执行,批量生成带标注的数据!虽然和真实比赛有差距,但作为概念验证和原型开发,足够了!等模型跑通了,再迁移到真实数据上优化。”
这个想法让韩澈和苏晚都眼睛一亮。用游戏数据作为起点,巧妙地避开了初期最头疼的数据获取和标注难题,而且游戏引擎生成的数据干净、规整、量大,非常适合模型训练。
“好主意。”苏晚难得地直接表示了赞同,“可以先用游戏数据训练和验证模型框架。同时,韩澈可以开始整理真实比赛录像,并设计一个半自动的标注工具或流程,为后续迁移学习做准备。”
课题的方向和初步技术路线,在一次次的讨论、争论、修正中,逐渐清晰起来。他们最终将课题暂定为:《基于时空图神经网络与注意力机制的篮球战术意图识别研究——以“挡拆”战术为例》。标题很长,很学术,但核心明确:利用游戏数据,构建一个能自动识别篮球比赛中“挡拆”战术的AI模型,并探索其可解释性。
韩澈负责提供篮球专业知识、定义清晰的战术规则和边界条件、并开始着手准备真实数据。苏晚负责调研和确定核心的图神经网络模型架构、注意力机制的设计,以及理论部分的撰写。王睿则负责搭建数据预处理管道(从游戏导出数据)、实现模型代码、进行训练和调优,并开发一个简单的演示界面。
分工明确,各展所长。韩澈看着白板上逐渐成型的计划图,看着苏晚冷静地在笔记本上记录要点,看着王睿眉飞色舞地讨论着技术细节,心中涌起一股奇异的感觉。这不同于在球场上与队友的默契配合,那是一种基于长期训练和本能的条件反射。而此刻,是一种基于理性、知识和技能互补的,全新的协作模式。他需要不断将自己的篮球直觉,翻译成苏晚和王睿能理解的技术语言和数学约束;也需要努力理解他们口中那些“嵌入向量”、“邻接矩阵”、“梯度消失”等陌生概念,思考其在篮球语境下的实际含义。
这个过程充满挑战,有时甚至会因为沟通不畅或理解偏差而产生小小的争论。但每当一个模糊的想法被逐渐厘清,一个技术难题找到可能的解决路径时,那种豁然开朗的喜悦,那种共同创造着什么的参与感,都让他感到新奇而振奋。
课题合作,就这样将他和苏晚——这个曾经遥远而模糊的、象征着另一个深邃世界的名字——拉到了一个可以具体讨论、甚至争论“损失函数该怎么设计”和“防守人距离阈值设为多少合适”的、实实在在的、共同奋斗的平面上。他知道,这只是一个开始,前方还有无数的困难等着他们。但第一次,他如此清晰地感觉到,自己正在有意识地将球场上的世界,与书本和代码中的世界,尝试着连接起来。而这条连接的道路上,有了可以并肩探讨、甚至争执的同行者。这感觉,陌生,却充满力量。