天眼查数据爬虫分析
2024.02.17 07:40浏览量:23简介:本文将介绍如何使用爬虫技术抓取天眼查的数据,并通过数据分析来深入了解企业的相关信息。
千帆应用开发平台“智能体Pro”全新上线 限时免费体验
面向慢思考场景,支持低代码配置的方式创建“智能体Pro”应用
天眼查是一款提供企业信息查询的软件,涵盖了企业的工商信息、股东信息、法人代表、主要人员、知识产权等多方面的数据。这些数据对于了解企业情况、投资决策、风险管理等方面都有着重要的参考价值。
在进行天眼查数据爬虫分析之前,我们需要先了解天眼查的数据结构。通过观察天眼查的网页源代码,我们可以发现其数据是存储在JSON格式的接口中,每个接口都提供了不同的数据内容。例如,获取某个企业的工商信息接口是“/api/company/basic”,获取该企业的股东信息接口是“/api/company/shareholder”。
接下来,我们可以使用Python的requests库来发送HTTP请求,获取这些接口的数据。以下是一个简单的示例代码,用于获取某个企业的工商信息:
import requests
import json
# 企业ID
company_id = '你的企业ID'
# 发送HTTP请求
response = requests.get(f'https://api.tianyancha.com/api/company/basic?id={company_id}')
# 解析JSON数据
data = json.loads(response.text)
# 打印工商信息
print(data['data'])
在获取到数据之后,我们可以使用Python的pandas库来进行数据分析。以下是一个简单的示例代码,用于将获取到的股东数据整理成DataFrame格式,并进行简单的统计分析:
import pandas as pd
# 股东数据列表
shareholders_list = data['data']['shareholders']
# 将股东数据整理成DataFrame格式
shareholders_df = pd.DataFrame(shareholders_list)
# 统计股东数量、持股比例等信息
num_shareholders = len(shareholders_df)
holding_ratio = shareholders_df['holding_ratio'].sum()
print(f'股东数量:{num_shareholders}')
print(f'持股比例总和:{holding_ratio}')
除了简单的统计分析之外,我们还可以通过可视化手段来更直观地展示数据分析结果。例如,我们可以使用Python的matplotlib库来绘制企业工商信息的饼图、柱状图等。以下是一个简单的示例代码,用于绘制企业工商信息的饼图:
import matplotlib.pyplot as plt
# 工商信息数据字典,键为企业工商信息类型,值为对应的数值
business_info = {
'注册资本': 1000,
'实缴资本': 500,
'经营状态': '存续',
'成立时间': '2018年1月1日',
'营业期限': '长期',
'企业类型': '有限责任公司',
'经营范围': '计算机软硬件的技术开发、技术咨询、技术转让、技术服务',
'公司口号': '追求卓越,创造价值',
}
# 绘制饼图,显示企业工商信息类型及其对应的数值比例
labels = list(business_info.keys())
sizes = list(business_info.values())
fig, ax = plt.subplots()
ax.pie(sizes, labels=labels, autopct='%1.1f%%', startangle=90)
ax.axis('equal') # Equal aspect ratio ensures that pie is drawn as a circle.
plt.show()

发表评论
登录后可评论,请前往 登录 或 注册