从微信链接爬取音频

mpvoice

Posted by Yuankun Li on 2019-04-24

故事是这样的

报名了某英语课程, 进群后老师会发微信课程链接, 链接里有音频视频等. 我就想做笔记把这个文字和音频视频内容保存下来.

看代码去

微信链接在浏览器打开, 视频的很好找 <video origin_src="里面的就是视频的链接"> , 把链接直接粘贴到浏览器里就好了,右键save as 就可以保存下来了.
视频

有的音频的资源source也很好找, <audio src="里面的就是视频的链接">, 把链接直接粘贴到浏览器里就好了,右键save as 就可以保存下来了.
音频1

但是后来遇到了个看不出直接source的<mpvoice>, 应该是微信的自定义html标签. 随便在网上一搜, 就看到了跟我一样目的童鞋, 哈哈.
音频2

按照他的方法试了, 果然可以. Network中有获取media的请求 (开发者工具 --> Network —> “media” tab). 而且<mpvoice>标签上voice_encode_fileid属性的值就是mediaid的值。同样的粘贴链接"https://res.wx.qq.com/voice/getvoice?mediaid=MzI1NDMxNTIxNF8xMDAwMDIxNjg="到浏览器里就好了,右键save as 就可以保存下来了.
request

Todo 写个脚本自动爬

参考文章

一个简单的逻辑英语音频小爬虫



show git comment