Skip to content

pandas ai, 数据的智能探索

0 场景

pandasai 是一个专门用来与 pandas 进行协同, 通过自然语言对话式地理解和操作分析数据的强大的工具, 有些时候对于忘记pandas的语法的一些朋友来说, 能够更友好 & 快速的进行一些探索性的分析.

有一些优点:

  • 即使我们不是很熟悉生成式AI或者Pandas语法的话, 它也可以快速上手.
  • 能够协助我们执行和完成各项探索性任务, 比如数据清理 & 数据探索 & 数据分析 & 特征工程等.
  • 帮助我们画图.
  • 协助我们进行决策.

当然, 也有一些缺点:

  • 适合小打小闹, 数据量大了, 直接报error

1 安装

由于是第三方包, 通过pip命令进行安装:

pip install pandasai

2 使用

导入相关的包

import pandas as pd
from pandasai.llm import OpenAI
from pandasai import SmartDataframe

导入我们的数据

df = pd.read_excel('E:/jupyter/data/main_userInfo.xlsx')
df.head()

image-20231110012148168