【爬虫实战】使用Python获取小红书笔记下的几千条评论和多级评论_百度小程序

您的位置：上海毫米网络优化公司 > 小程序 > 百度小程序 >

一、目标整理

今天的目标是爬取小红书上指定笔记下的所有评论数据。

以某篇举例，有2千多条评论。
以下代码，截止2023-12-01 有效。

【爬虫实战】使用Python获取小红书笔记下的几千条评论和多级评论,穿上了最漂亮的衣服向杀害孩子的凶手投石头,第1张

效果如下：

【爬虫实战】使用Python获取小红书笔记下的几千条评论和多级评论,首页,第2张

【爬虫实战】使用Python获取小红书笔记下的几千条评论和多级评论,其他页,第3张

每条评论获取多个字段，

笔记链接
页码
评论者昵称
评论者ID
评论者主页链接
评论时间
评论IP属地
评论点赞数
评论级别
评论内容

而评论包含根级评论、二级评论和二级展开评论（评论回复）。

二、逻辑分析

接口分析

【爬虫实战】使用Python获取小红书笔记下的几千条评论和多级评论,抓取目标,第4张

可以看到从这个接口中获取了我们想要的数据，左边是内容展示，右边是接口返回的相关字段。

请求头

【爬虫实战】使用Python获取小红书笔记下的几千条评论和多级评论,请求头,第5张

# 请求头
headers = {
   
	'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36',
	# cookie需定期更换
	'Cookie': 'xxxxxx',
}

请求头这部分主要的就是UA和Cookie，其中Cookie需要定期更换，否则会出现响应数据为空的情况。

请求参数

【爬虫实战】使用Python获取小红书笔记下的几千条评论和多级评论,载荷,第6张

【爬虫实战】使用Python获取小红书笔记下的几千条评论和多级评论,第7张

简单说明一下这几个参数：

note_id 这个是笔记的ID，为固定值
cusor，获取第一页的时候可以为空，获取后面评论的时候需要使用，稍后再讲
top_comment_id ，同样首次请求可以为空，之后才需要。
image_scenes 固定值

上一篇：spring boot中常用的安全框架 Security框架利用Security框架实现用户登录验证token和用户授权（接口权限控制）

下一篇：如何申请文心一言&文心千帆大模型API调用资格、获取access