批量下载 O'Reilly 提供的免费电子书

作者:唐钰豆豆 发布于:2016-12-08 分类:研究

批量下载 O'Reilly 提供的免费电子书

在编程类的免费电子书的下载页面,http://www.oreilly.com/programming/free/

点击后会进入到具体的下载页面但是需要填写个人信息,然后才能下载,下载了几个之后就发现了规律

最终下载的文件分为三种类型:pdf、epub和mobi,并且下载的链接就是上面链接中的文件名+相应的后缀,

比如介绍页面里有一个电子书的链接为:http://www.oreilly.com/programming/free/c++-today.csp?intcmp=il-prog-free-product-lgen_cpp_today,

那么这个电子书的PDF文件下载地址就是http://www.oreilly.com/programming/free/files/c++-today.pdf

其他格式的只需要修改最后面的后缀即可,

那么如何批量下载呢


var files_url = "";
$.map(
	$('body > article:nth-child(4) > div a'), function(e) {
		files_url += e.href.replace(/free/, "free/files").replace(/csp.*/, "pdf")+ "\n"
		files_url += e.href.replace(/free/, "free/files").replace(/csp.*/, "epub")+ "\n"
		files_url += e.href.replace(/free/, "free/files").replace(/csp.*/, "mobi")+ "\n"
	}
)
console.log(files_url)

这样得到所有下载链接,哈哈,接着将所有链接保存到programming.txt,使用 wget -i programming.txt来下载全部文件,或者可以用各种下载工具批量


上面例子中提到的是Programming类电子书,当然在页面最下面还有其他类型的,如Business、Data、IoT、Security、Web、Development,WebOps

自己动手下载吧




标签: JavaScript

本文地址:https://doudoudzj.com/post-200.html
除非注明,本文章为《 唐钰豆豆的博客 》原创作品。摘取文中部分(包括全部、大部分和小部分)信息请注明来源,谢谢。
文中原创部分版权归本站 唐钰豆豆的博客所有;文中摘录及引用部分版权归原作者所有

我来说说