格也有社交需求,他可能是交不到什么朋友,但不等于不希望交朋友。想要朋友而不得,他应该会觉得很孤独。”
肖萌点开了freddie220284微博的基本信息栏,看看注册时间——时间位于两个月前,正是她在书店偶遇路之航的那天,他买了那本双胞胎的学霸之路,还带她参观了实验室。肖萌仔细回忆他们在书店时的那番交谈。当时她清晰地感觉到路之航对身为双胞胎的自己的好奇和羡慕,感受到他可能孤独的度过了一个童年。
肖萌盯着220284这个id,沉默了很久,根本说不出任何话来——自己的这位大神师兄,到底是怀着怎样的感慨注册了这样的微博id呢?
肖薇注意到妹妹的情绪不太对,就连伸手拿过她手中的鼠标她都没什么反应,于是她拍了拍妹妹:“对了,我有个灵感,你能不能帮我实现?”
“什么?”肖萌这才反应过来,她连忙驱散开自己心中的怅然。
肖薇拿过她手里的鼠标,点开自己的主页,示意她看粉丝数量。
“你看看,前几天我的粉丝数量突破了5万,我想知道我的5万粉丝各由什么人群组成,你能写个程序帮我把这些粉丝的基本信息都整理出来?了解这些粉丝的性别、年龄、地区等等,方便我以后发微博时能有的放矢?”
肖萌的编程水平类似赵括,完全的纸上谈兵,信息竞赛和acm的训练比较偏于算法,应用性非常差,就好比理论数学和应用数学的差距那大。她在此之前没写过任何具有实用性的软件,更别提网页信息抓取软件——不过,人生总需要一些挑战,她觉得这个挑战应该在自己能力范围内,当即点头。
“好的。我明天试试看。”
肖薇用脑门撞了下她的,然后伸手关灯。
“那咱们睡觉吧。”
从第二天开始,肖萌就按照肖薇的要求开始写一个网页信息抓取代码。
第一天,她下载了几本书,把浏览器开到调试模式,开始研究网络协议和前端语言,分析微博的结构和条件;第二天,她再根据已有的结果一边查资料一边用c++写代码——因为信息竞赛和acm的要求,她对c++掌握得比较好。
所谓知易行难,随后,肖萌发现这件事的难度比自己想得大得多,她在电脑前奋斗了一整天,才写了不到一百行代码,而且还老出错。
肖薇看到妹妹忙到晚上十点,也是好气又好笑:“不用那么拼啦,写不出来也没事,我又不着急。”
“不,我要写出来。相信我,没问题。”
“那好吧,你加油。”
有追求是好事,没这点精神也没办法在华大计算机系混下去,以后写代码的苦日子还多呢——肖薇拍了拍妹妹的头顶,爬到床上开开心心的和易思北聊天去了。
到了第三天,肖萌的进展依然不太大,卡在某个筛选条件上,怎么写代码都不对——不得已,她给路之航发了一条信息,再次泪流满面的求助。
大神就是大神,只针对肖萌的一个求助问题,就看出了肖萌的真正需求。
[freddie]:如果你要收集信息,应该有现成的一些爬虫软件软件。
[小萌]:那些软件都不好用,有些还要收费我也想通过写这种程序来提高应用水平。
[freddie]:那用python写代码比较快。
python这个大名鼎鼎的软件肖萌当然听过,但仅仅是听过。
[小萌]:是吗?但我还不会
[freddie]:你会什么?
[小萌]:c,c++,java。
[freddie]:你电脑上的c++是哪个版本?
肖萌迅速回复,片刻后,肖萌收到路之航发来的两个cpp文件。
[freddie]:我之前写过一些信息抓取软件,这两个应该对你有参考价值,你可以看看。
[小萌]:谢谢!
肖萌感激涕零。不过,“谢谢”两个字打完,她才猛然发现,自己和路之航的聊天记录里,大都是各种各样的“谢谢”——自己和大神的技术距离怎么就那么远呢!
[freddie]:有不懂的问我。
肖萌打开这两个cpp文件,其中一个针对性很强,部分代码可以直接复制过来;至于另一个cpp文件,肖萌被里面的数万行代码震惊了。她粗略地看了看,却发现有点不对,这些代码的信息抓取能力有些强到离谱,有点像黑客的手段。
[小萌]:师兄,你是针对什么网站写的这些代码?
[freddie]:针对一个数据网站写的。
肖萌的疑惑稍稍被解开了一点,虽然内心还不能完全放心,但没有再问。