Python | LeetCode「遍历」

生命不息,刷题不止!

虽然当前职业非计算机相关,但曾经也是个计算机专业的学生,对于LeetCode也是有一定了解的,也曾在求职期间疯狂刷题……

前两天闲来无事,逛了逛曾经熟悉的网站,发现力扣开始做教学了,出了个LeetBook板块,对一些基础算法进行普及,感觉更像是将评论区的解法进行了系统化归类,当然有一些还是收费的……

于是乎海鲜市场搞了个会员账号,然后直接F12,具体过程省略几百字吧,因为网站的架构还是很简单的,操作命名也很友好,基本都是通过graphql这个接口进行post操作,不过post的内容和其他站点不太一样,力扣貌似是(本人sql渣渣)post了一个sql语句,不过变量还是那一两个,直接替换就完事了。

而且题目和题目的解法基本上都是markdown形式,所以我直接将英文原版题目+中文翻译版题目和top1的python3解法输出至.md文件中。

到了book这边就很难受了,先是文本内容有markdown和html之分,好在都灌进md文件也是能识别的,但还有视频和题目……需要进行更细致的区分。不过有至今仍未解决的问题,部分题目需要先AC后才能开启下一题目或者下一章节,好在不算多,我只能手动点击和copy高票答案强行AC之后,再用脚本「遍历」。

不过好在除了这些小问题以外,整体过程还是非常顺利的,下载的过程也没有遇到限流之类的问题,一共3000+个文件不到半天就搞完了。最后上个链接吧,项目已经在github开源了,项目中也有爬下来的完整内容,与君共享。

https://github.com/GaryNotGay/LeetCodeSpider