爬取某基百科的历史上的今天-再探
书接上回:
顺利拿到了某度百科的数据后,和某基百科进行了对比,发现数据少的可怜,于是开始研究怎样简便、容易的获取某基百科的数据。
发现从界面上直接获取数据,这条路走不通,于是又打开了某个神奇的大型同性交友网站 github ,这种需要肯定有其他人实现过,抱着这样的想法,开始了全站搜索,果然被我找到了这个。
既然有现成的东西,不要犹豫,果断下载用起来。
安装完成后,按照说明试了下,可是搜出来的结果都是英文……
开始时没有找到原因,作者也没有提供文本或者接口的切换,于是发挥我作为一名软件测试工程师的特长,查了遍源码,终于发现了问题所在。
把这里的接口地址,换成中文的就OK了。
重新搜索下,终于显示出了中文,这样就不用考虑翻译的问题了。
剩下的就是获取更多的数据和怎样把这些数据用起来了,这是个问题,需要好好规划下。