网页版微博是纯正的HTML,而且调用的微博自家的API来获取图片。
网址:https://m.weibo.cn/api/container/即为微博api里面包含了个人的信息与微博文字与图片存储地址。
进入api页面我们可以很清晰的看到各种信息都用json存储起来了。我们再利用python中的json库提取出来即可。这比其它利用cookie模拟登陆要方便很多,我们只要输入被爬虫用户的微博ID然后运行便能自动爬取。
ID从这个复制链接里面可以看出来。
代码采用Python3
最终的效果图(爬取的微博txt文件):
👋 感谢您的观看,对您有用就分享出去吧 !
如您有好的资源/素材,可参与创作者激励计划享投稿分成。分成介绍
投稿成功收录,即可获得 1-10元/篇奖励。(重复内容无奖励)
Ppython调用微博自家的API爬取微博文字与图片(不使用Cookie)此内容为付费阅读,请付费后查看
黄金灯牌免费钻石灯牌免费
付费阅读
已售 12© 版权声明
1 如果您喜欢本站,
点击这儿赞助下本站,感谢支持!
2 可能会帮助到你:
下载帮助 |
报毒说明 |
进站必看 |
广告合作;
3 本站素材资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责;
4 本站所有素材资源来源于网络,仅供学习与参考,请于下载后24小时内删除;
5 若作商业用途,请联系原作者授权,若本站侵犯了您的权益请
联系站长 进行删除处理;
6 如若转载,请注明文章出处:
THE END
暂无评论内容