天网课题组最早是95重点科研项目,最初由陈葆珏教授负责,开发出最早的天网;目前新的课题组刚成立,也确立了新项目。」
李晓明教授简单地给余江介绍了课题组情况,顿了顿道:「你有自己的目标,这当然很好,但越是困难的目标,就越是不能一蹴而就。」
余江嗯了一声。
「所以有没有兴趣来天网实验室?」
说完後,李晓明教授便一脸温和地看着余江。
余江的名字,从去年填报计算机科学系之後,就放在了他的案前。
高考出分後,招办表示该生目标明确、意志坚定,数学和计算机水准均达国际顶赛金牌水平,值得重点培养,他的名字因此被全系熟知。。
但全系的老师却都没有「管他」。
都在看他自己到底想往什麽方向走,要怎麽走。
而随着一学期过去,他却并没有任何动作。
反而只是在期末考试中坐实了他的「考神」之名————
李晓明觉得,应该干预一下了。
这麽好的脑袋,如果只用在考试上,太浪费了!
然而,余江却没有第一时间回答他,反而陷入了思考。
李晓明微微惊讶起来。
难道这家夥真是铁了心要现在就去弄他那什麽神经网络?
这时余江突然擡头。
「好的,李老师。」
李晓明好奇道:「你刚才想什麽呢?」
「我在想这种搜索工具的未来。」
——
「哦?你说说看。」李晓明看了一眼手表,笑道:「我还以为你在想技术问题。」
余江轻轻咳了咳。
他确实是在想技术问题。
——这种纯学术攻坚的东西,一开始还可以「突破空白」、「达到领先」,继而培养人才。
但毕竟是课题项目,完全无法和巨头对抗,将会不可避免地面临经费欠缺、
人员流动、无法商业化等难题。
最後的下场要麽是裱糊一通继续要经费;要麽是项目彻底关停。
「搜索工具本质上是对已有信息的整理和调取,当人工智慧理解和掌握海量的信息後,它应该就会逐渐消亡了。」
听到余江直接联系到人工智慧,李晓明笑了起来。
他想到了此人在招办人员面前的话。
一再冷的板凳也要有人坐,他们不坐我坐!
「很有想法,但人工智慧怎麽掌握海量的信息呢?」李晓明饶有兴趣地问道:「纯基於文档符号训练还是高速存储?」
余江摇头:「纯文档符号不行的,去年Bengio教授在NIPS上提出了用低维稠密向量表示单词含义的概念,这意味着文本可以进行向量化,从而化解维度灾难,当然後期工作还是有很多,但起码有个基础了。
7
李晓明顿时惊讶起来。
他对神经网络涉足不多,但光是听到余江对神经网络前沿这麽熟悉,他起码能确定这小夥子不是空谈。
当下他沉吟了几秒道:「行,那你就多想想怎麽把课题组和你的想法结合起来,或者从工程中干起—很多灵感都是在实干中涌现出来的。」
余江点头。
「还有点时间,我带你到实验室熟悉一下。」
目送李晓明出门,余江看向那位留着齐耳短发、额头有几颗痘痘的研二师姐。
师姐也瞪大眼睛看着他,就仿佛好奇的小猫看到了玩具。
就在余江想着怎麽开口的时候,突然看到师姐冲他眨了眨眼。
「余神好,终於见到活人了。
「师姐好————」
「哈哈哈哈!」喻林笑着从椅子上起身,她身材娇小,也就一米六不到,看起来跟个小男孩差不多。
「来来来,我给你介绍一下咱们组现在的情况。」
「大BOSS呢,就是李教授,然後王建勇老师负责爬虫,闫宏飞闫哥负责分布式运算、徐飞负责FTP、彭波负责模块开发、我负责字典。」喻林口齿伶俐,连珠炮一般就把目前整个天网课题组的情况介绍了个遍。
余江吃了一惊:「才这麽点人啊?」
「之前人挺多,去年有几个师兄没毕业就走了。」喻林笑了笑:「他们一走,咱们这边网页搜索的底层就吃力了,於是李老师就新开了课题,重点走FTP搜索。」
「是去百度了?」
「对的。」
别的人他不熟悉,但百度的雷鸣他还是知道的,此人在天网就是核心,进了百度也是技术大佬之一。
听着喻林的语气似乎并没有什麽,余江也就点了点头。
毕竟天网是学术项目,这里的每个人,都只是把它用来当「练手」的工具,然後等毕业就直接进相关行业—你总不能把未来的东家当对手吧?
在喻林身旁的「公用电脑」坐下,余江刚一按电源,就听到呼啦啦的风扇直转,紧接着就是唰唰唰的硬碟声,折腾了一分多钟,才看到win2000界面。
喻林过来输入密码後,余江又等了一会才敢操作滑鼠。
靠!赛扬566!
他打开网页看了一眼17173,发现传奇的新闻一个接着一个,几乎占据了整版————
截至目前,传奇的在线人数已经突破十五万。
关掉浏览器,余江站起身来,开始溜达。
心中只想着那几位老哥快点从机房出来,见个面赶紧走人。
旁边的喻林别看性子活跃,但真是静若处子,此时正盯着显示器一眨也不眨地不断敲着键盘。
余江站到她身後。
只见她正在翻看用户搜索日志,统计新词。
「学姐是在维护字典?」
「嗯呢。」
「天网现在用的是正向最大搜索法吗?」
「嗯呢。」
「没有双向匹配?」
「嗯呢。嗯?!」喻林依旧随口回答着,而後瞬间望向余江:「你懂这个?」
「了解了一点点。」
余江没说谎,他当初是真的了解了一点点一他差点加入搜狗的。
「一点是几点?双向匹配是我的课题!」喻林瞬间瞪大眼:「怎麽解决双向等长歧义?」
余江想了想:「试试加一条词长乘积优先规则?」
「等长歧义时,分别算两种切分结果里每个词长度的乘积,乘积更大的那个,就是更合理的分词。」
「如果乘积相同,靠右长词优先,符合现代汉语表达习惯。」
喻林低头想了想。
「卧槽!你等着!」
余江摇头一笑,站到她身後,开始安静地等待。
就在这时,门外也传来一阵急促的脚步声。
不多时,几个男子鱼贯进门。
(下章稍晚,中午依旧有更新。)