CarterCat's Blog.

爬取某基百科的历史上的今天-再探

Word count: 325 / Reading time: 1 min
2019/02/12 Share

爬取某基百科的历史上的今天-再探

书接上回:

顺利拿到了某度百科的数据后,和某基百科进行了对比,发现数据少的可怜,于是开始研究怎样简便、容易的获取某基百科的数据。

发现从界面上直接获取数据,这条路走不通,于是又打开了某个神奇的大型同性交友网站 github ,这种需要肯定有其他人实现过,抱着这样的想法,开始了全站搜索,果然被我找到了这个。

既然有现成的东西,不要犹豫,果断下载用起来。

安装完成后,按照说明试了下,可是搜出来的结果都是英文……

开始时没有找到原因,作者也没有提供文本或者接口的切换,于是发挥我作为一名软件测试工程师的特长,查了遍源码,终于发现了问题所在。

把这里的接口地址,换成中文的就OK了。

重新搜索下,终于显示出了中文,这样就不用考虑翻译的问题了。

剩下的就是获取更多的数据和怎样把这些数据用起来了,这是个问题,需要好好规划下。

CATALOG
  1. 1. 爬取某基百科的历史上的今天-再探
    1. 1.1. 书接上回: