天眼查数据爬虫分析
2024.02.17 15:40浏览量:27简介:本文将介绍如何使用爬虫技术抓取天眼查的数据,并通过数据分析来深入了解企业的相关信息。
天眼查是一款提供企业信息查询的软件,涵盖了企业的工商信息、股东信息、法人代表、主要人员、知识产权等多方面的数据。这些数据对于了解企业情况、投资决策、风险管理等方面都有着重要的参考价值。
在进行天眼查数据爬虫分析之前,我们需要先了解天眼查的数据结构。通过观察天眼查的网页源代码,我们可以发现其数据是存储在JSON格式的接口中,每个接口都提供了不同的数据内容。例如,获取某个企业的工商信息接口是“/api/company/basic”,获取该企业的股东信息接口是“/api/company/shareholder”。
接下来,我们可以使用Python的requests库来发送HTTP请求,获取这些接口的数据。以下是一个简单的示例代码,用于获取某个企业的工商信息:
import requestsimport json# 企业IDcompany_id = '你的企业ID'# 发送HTTP请求response = requests.get(f'https://api.tianyancha.com/api/company/basic?id={company_id}')# 解析JSON数据data = json.loads(response.text)# 打印工商信息print(data['data'])
在获取到数据之后,我们可以使用Python的pandas库来进行数据分析。以下是一个简单的示例代码,用于将获取到的股东数据整理成DataFrame格式,并进行简单的统计分析:
import pandas as pd# 股东数据列表shareholders_list = data['data']['shareholders']# 将股东数据整理成DataFrame格式shareholders_df = pd.DataFrame(shareholders_list)# 统计股东数量、持股比例等信息num_shareholders = len(shareholders_df)holding_ratio = shareholders_df['holding_ratio'].sum()print(f'股东数量:{num_shareholders}')print(f'持股比例总和:{holding_ratio}')
除了简单的统计分析之外,我们还可以通过可视化手段来更直观地展示数据分析结果。例如,我们可以使用Python的matplotlib库来绘制企业工商信息的饼图、柱状图等。以下是一个简单的示例代码,用于绘制企业工商信息的饼图:
import matplotlib.pyplot as plt# 工商信息数据字典,键为企业工商信息类型,值为对应的数值business_info = {'注册资本': 1000,'实缴资本': 500,'经营状态': '存续','成立时间': '2018年1月1日','营业期限': '长期','企业类型': '有限责任公司','经营范围': '计算机软硬件的技术开发、技术咨询、技术转让、技术服务','公司口号': '追求卓越,创造价值',}# 绘制饼图,显示企业工商信息类型及其对应的数值比例labels = list(business_info.keys())sizes = list(business_info.values())fig, ax = plt.subplots()ax.pie(sizes, labels=labels, autopct='%1.1f%%', startangle=90)ax.axis('equal') # Equal aspect ratio ensures that pie is drawn as a circle.plt.show()

发表评论
登录后可评论,请前往 登录 或 注册