天眼查数据爬虫分析

作者:暴富20212024.02.17 07:40浏览量:23

简介:本文将介绍如何使用爬虫技术抓取天眼查的数据,并通过数据分析来深入了解企业的相关信息。

千帆应用开发平台“智能体Pro”全新上线 限时免费体验

面向慢思考场景,支持低代码配置的方式创建“智能体Pro”应用

立即体验

天眼查是一款提供企业信息查询的软件,涵盖了企业的工商信息、股东信息、法人代表、主要人员、知识产权等多方面的数据。这些数据对于了解企业情况、投资决策、风险管理等方面都有着重要的参考价值。

在进行天眼查数据爬虫分析之前,我们需要先了解天眼查的数据结构。通过观察天眼查的网页源代码,我们可以发现其数据是存储在JSON格式的接口中,每个接口都提供了不同的数据内容。例如,获取某个企业的工商信息接口是“/api/company/basic”,获取该企业的股东信息接口是“/api/company/shareholder”。

接下来,我们可以使用Python的requests库来发送HTTP请求,获取这些接口的数据。以下是一个简单的示例代码,用于获取某个企业的工商信息:

  1. import requests
  2. import json
  3. # 企业ID
  4. company_id = '你的企业ID'
  5. # 发送HTTP请求
  6. response = requests.get(f'https://api.tianyancha.com/api/company/basic?id={company_id}')
  7. # 解析JSON数据
  8. data = json.loads(response.text)
  9. # 打印工商信息
  10. print(data['data'])

在获取到数据之后,我们可以使用Python的pandas库来进行数据分析。以下是一个简单的示例代码,用于将获取到的股东数据整理成DataFrame格式,并进行简单的统计分析:

  1. import pandas as pd
  2. # 股东数据列表
  3. shareholders_list = data['data']['shareholders']
  4. # 将股东数据整理成DataFrame格式
  5. shareholders_df = pd.DataFrame(shareholders_list)
  6. # 统计股东数量、持股比例等信息
  7. num_shareholders = len(shareholders_df)
  8. holding_ratio = shareholders_df['holding_ratio'].sum()
  9. print(f'股东数量:{num_shareholders}')
  10. print(f'持股比例总和:{holding_ratio}')

除了简单的统计分析之外,我们还可以通过可视化手段来更直观地展示数据分析结果。例如,我们可以使用Python的matplotlib库来绘制企业工商信息的饼图、柱状图等。以下是一个简单的示例代码,用于绘制企业工商信息的饼图:

  1. import matplotlib.pyplot as plt
  2. # 工商信息数据字典,键为企业工商信息类型,值为对应的数值
  3. business_info = {
  4. '注册资本': 1000,
  5. '实缴资本': 500,
  6. '经营状态': '存续',
  7. '成立时间': '2018年1月1日',
  8. '营业期限': '长期',
  9. '企业类型': '有限责任公司',
  10. '经营范围': '计算机软硬件的技术开发、技术咨询、技术转让、技术服务',
  11. '公司口号': '追求卓越,创造价值',
  12. }
  13. # 绘制饼图,显示企业工商信息类型及其对应的数值比例
  14. labels = list(business_info.keys())
  15. sizes = list(business_info.values())
  16. fig, ax = plt.subplots()
  17. ax.pie(sizes, labels=labels, autopct='%1.1f%%', startangle=90)
  18. ax.axis('equal') # Equal aspect ratio ensures that pie is drawn as a circle.
  19. plt.show()
article bottom image

相关文章推荐

发表评论