Python爬取携程指定景点评论的用户、评论内容及时间

作者：暴富20212024.01.17 10:44浏览量：9

简介：本文将介绍如何使用Python爬取携程指定景点（以黄龙溪为例）的用户、评论内容及时间。我们将使用requests和BeautifulSoup库进行网页抓取，并使用pandas库进行数据处理。

千帆应用开发平台“智能体Pro”全新上线限时免费体验

面向慢思考场景，支持低代码配置的方式创建“智能体Pro”应用

首先，你需要安装requests和BeautifulSoup库，你可以使用以下命令进行安装：

pip install requests beautifulsoup4

接下来，我们可以使用以下代码来爬取黄龙溪景点的用户、评论内容及时间：

import requests
from bs4 import BeautifulSoup
import pandas as pd
# 定义目标URL
url = 'https://hotels.ctrip.com/hotel/list/review/hotelId=3885096.0&areaId=1000057&cityId=1000005&pageNo=1&pageSize=10&sort=0&order=0'
# 发送HTTP请求并获取网页内容
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 提取用户、评论内容及时间
comments = soup.find_all('div', class_='hotel-list-review')
user_list = []
content_list = []
time_list = []
for comment in comments:
user = comment.find('span', class_='review-user').text.strip()
content = comment.find('p', class_='review-content').text.strip()
time = comment.find('span', class_='review-time').text.strip()
user_list.append(user)
content_list.append(content)
time_list.append(time)
# 将数据保存为CSV文件
df = pd.DataFrame({'User': user_list, 'Content': content_list, 'Time': time_list})
df.to_csv('huanglongxi_comments.csv', index=False)

在上面的代码中，我们首先定义了目标URL，然后使用requests库发送HTTP请求并获取网页内容。接下来，我们使用BeautifulSoup库来解析网页内容，并提取用户、评论内容及时间。最后，我们将数据保存为CSV文件。
需要注意的是，由于网站的结构可能会发生变化，因此你需要定期检查和更新代码。此外，爬取网站数据需要遵守相关法律法规和网站的使用协议，确保你的行为合法合规。

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

开发者热搜

Python爬取携程指定景点评论的用户、评论内容及时间

千帆应用开发平台“智能体Pro”全新上线限时免费体验

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

千帆大模型服务与开发平台ModelBuilder

千帆大模型应用开发平台AppBuilder

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者

Python爬取携程指定景点评论的用户、评论内容及时间

千帆应用开发平台“智能体Pro”全新上线 限时免费体验

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

千帆大模型服务与开发平台ModelBuilder

千帆大模型应用开发平台AppBuilder

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者

千帆应用开发平台“智能体Pro”全新上线限时免费体验