TechPulse
首页博客项目关于联系
搜索
Wild Intelligence

高级前端开发工程师 | AI 全栈工程师 | 正在深入学习人工智能

GitHubTwitterRSS

内容

博客文章项目展示搜索

关于

关于我联系方式RSS 订阅

© 2026 Leon Yang. All rights reserved.

Built with Next.js & shadcn/ui

返回博客
AI 基础

Pandas 数据分析实战:从数据清洗到可视化

2026-04-2016 分钟2,340 次阅读

Pandas 数据分析实战:从数据清洗到可视化

Pandas 是 Python 数据分析的核心工具,掌握它是 AI 工程师的必备技能。

DataFrame 基础

import pandas as pd
import numpy as np

# 创建 DataFrame
data = {
    'name': ['Alice', 'Bob', 'Charlie', 'David'],
    'age': [25, 30, 35, 28],
    'city': ['Beijing', 'Shanghai', 'Shenzhen', 'Guangzhou'],
    'salary': [15000, 20000, 25000, 18000]
}
df = pd.DataFrame(data)
print(df)

数据清洗

# 处理缺失值
df.dropna()                    # 删除含缺失值的行
df.fillna(0)                   # 用 0 填充
df['age'].fillna(df['age'].mean())  # 用平均值填充

# 数据类型转换
df['date'] = pd.to_datetime(df['date'])

# 去重
df.drop_duplicates()

数据分析

# 分组统计
city_stats = df.groupby('city').agg({
    'salary': ['mean', 'max', 'min'],
    'name': 'count'
})

# 相关性分析
correlation = df[['age', 'salary']].corr()

数据可视化

import matplotlib.pyplot as plt

# 绘制柱状图
df.groupby('city')['salary'].mean().plot(kind='bar')
plt.title('各城市平均薪资')
plt.ylabel('薪资')
plt.show()

Pandas 让数据分析变得简单而高效。

PandasPython数据分析数据可视化

相关文章

2026-05-02·AI 基础

NumPy 入门指南:AI 工程师必备的数据处理基础

掌握 NumPy 的核心概念和常用操作,为深度学习打下坚实的数据处理基础。

12 分钟1,890 次阅读

评论

加载评论中...

目录

Pandas 数据分析实战:从数据清洗到可视化DataFrame 基础数据清洗数据分析数据可视化

分类

AI 学习1AI 应用2AI 基础2深度学习1

标签

PythonAILangChainLLM职业转型RAGNumPy数据处理TransformerAttention

热门文章

Transformer 架构详解:从 Attention 到 GPT

4,560 次阅读

Agentic RAG:下一代智能检索系统

3,890 次阅读

LangChain 实战:构建你的第一个 RAG 应用

3,200 次阅读

关于作者

Leon Yang

兰亭古墨

@leonyangdev

Front-End Expert | Full-Stack Developer | Currently Learning AI | Husband & Father

了解更多 →