数据分析·作者 运营自学指南编辑·发布 2026-03-08·更新 2026-04-17
电商运营 Python + Pandas 速成:15 段代码搞定日常数据处理
Excel 跑不动几十万行订单时,Python + Pandas 是运营自学成本最低的工具。本文给出 15 段可直接复制的代码:数据读取、清洗、统计、透视、合并、导出,配场景说明。
下面 15 段代码可以直接复制。假设你有一份订单 CSV,列包含 order_id, user_id, sku_id, paid_amount, order_time, channel。
1. 读 CSV
import pandas as pd
df = pd.read_csv("orders.csv", encoding="utf-8")
print(df.shape, df.columns.tolist())
2. 预览
df.head(5)
df.info()
df.describe()
3. 时间字段处理
df["order_time"] = pd.to_datetime(df["order_time"])
df["date"] = df["order_time"].dt.date
df["month"] = df["order_time"].dt.to_period("M")
4. 缺失值与去重
df = df.dropna(subset=["order_id"])
df = df.drop_duplicates(subset=["order_id"])
5. 条件筛选
mask = (df["paid_amount"] > 100) & (df["channel"] == "douyin")
df_filter = df[mask]
6. 日 GMV
daily = df.groupby("date")["paid_amount"].sum().reset_index()
7. 渠道 GMV
by_channel = df.groupby("channel")["paid_amount"].agg(["sum","count","mean"])
8. 用户消费统计
user = df.groupby("user_id").agg(
total=("paid_amount", "sum"),
orders=("order_id", "count"),
last=("order_time", "max"),
)
9. 新老客
first = df.groupby("user_id")["order_time"].min()
df = df.merge(first.rename("first_time"), on="user_id")
df["is_new"] = (df["order_time"] == df["first_time"]).astype(int)
10. 透视表
pivot = pd.pivot_table(
df, index="channel", columns="month",
values="paid_amount", aggfunc="sum", fill_value=0,
)
11. 合并表(JOIN)
products = pd.read_csv("products.csv")
df_merge = df.merge(products, on="sku_id", how="left")
12. 分箱(价格带)
bins = [0, 50, 100, 300, 1000, 99999]
labels = ["<50", "50-100", "100-300", "300-1000", "1000+"]
df["price_band"] = pd.cut(df["paid_amount"], bins=bins, labels=labels)
13. 复购率
repurchase_users = df.groupby("user_id")["order_id"].nunique()
rate = (repurchase_users >= 2).sum() / len(repurchase_users)
14. 排序与 Top N
top_sku = df.groupby("sku_id")["paid_amount"].sum().nlargest(20).reset_index()
15. 导出 Excel
with pd.ExcelWriter("report.xlsx") as w:
daily.to_excel(w, sheet_name="daily", index=False)
by_channel.to_excel(w, sheet_name="channel")
top_sku.to_excel(w, sheet_name="top_sku", index=False)
第十六节:学习路径建议
- 第 1 周:环境搭建 + 读取与预览;
- 第 2 周:筛选、聚合、合并;
- 第 3 周:透视与可视化;
- 第 4 周:自动化脚本与定时任务。
第十七节:常见误区
- 只学不练;
- 全靠 AI 复制,不理解代码含义;
- 数据清洗跳过,结果不靠谱;
- 一上来做大项目,半途而废。
Python 对运营的真正价值,不是替代 Excel,而是让你能处理 Excel 处理不了的场景。坚持 1 个月,你会发现自己对数据的掌控力上了一个台阶。
常见问题
以下为可见 FAQ,与 FAQPage 结构化数据一致。
- 完全没学过 Python 能看懂吗?
- 能。本文是「运营视角」的最小必要代码,1-2 周就能上手。不追求工程化,只追求效率。
- Pandas 和 Excel 比优势在哪?
- 处理大数据(> 几十万行)、自动化重复任务、更灵活的条件筛选与透视。
- 如何搭建 Python 环境?
- 推荐 Anaconda 一键安装,自带 Jupyter Notebook。Windows / Mac 都有图形化安装包。
- 中文乱码怎么办?
- 读 CSV 时加 `encoding='utf-8'` 或 `encoding='gbk'`;写 Excel 用 `openpyxl` 默认即可。
- AI 辅助写代码有用吗?
- 非常有用。让 AI 生成初版再按需求调整,是运营学 Python 最快的路径。
标签
本文属于以下专题
进入专题可以看到同主题下的全部相关文章、代表作者与常见问题解答。
相关文章 / 猜你喜欢
同栏目 +1、共享标签 +2;真实相关不足时,用同栏目最新 / 全站最新补位并标注来源。
数据分析·5 分钟阅读·2026-04-19
电商低代码工作流自动化:10 个高 ROI 自动化场景(附工具)
运营团队 80% 的时间花在「搬数据 / 填表 / 通知」等重复工作。本文给出 10 个电商场景的低代码工作流方案,用飞书多维表格、Zapier、Make、钉钉宜搭等工具,让人力从事务中解放。
同栏目《数据分析》
数据分析·5 分钟阅读·2026-04-19
2026 电商 AI 自动化工具全景:从写文案到客服的 10 大场景
AI 已经从「新奇」进入「生产力」。本文盘点 2026 年电商行业可用的 AI 自动化工具,覆盖 10 个场景(文案、素材、客服、选品、定价、库存、物流、评价、财务、舆情),每个给出 2-3 个代表工具与成本评估。
同栏目《数据分析》
数据分析·4 分钟阅读·2026-04-19
电商数据 ETL 管道搭建:从平台 API 到数仓的 6 层架构
多平台运营第一件事就是把数据打通——天猫、抖音、京东、自研 CRM 数据怎么汇到一个数仓?本文给出 6 层 ETL 架构(接入、清洗、集成、维度建模、指标层、应用层),配合工具选型与落地 Roadmap。
同栏目《数据分析》
数据分析·5 分钟阅读·2026-04-04
电商 RFM 会员分层模型:把用户分成 8 组、ROI 翻 3 倍的实战手册
所有用户一视同仁投流和发券 = 浪费钱。RFM 模型是把 10 万用户分成 8 组、对每组设计不同运营动作的数据工程。本文给出 RFM 的完整计算方法、分层矩阵、每组对应动作、工具清单,让老客复购率提升 40%+ 的落地方案。
同栏目《数据分析》
数据分析·1 分钟阅读·2026-04-08
电商数据看板搭建指南:日报、周报、月报的 18 个核心指标
手把手教你搭建电商店铺数据看板:数据源打通、指标口径、报表结构、异常阈值,附 18 个必看指标的定义与 BI 工具推荐。
同栏目《数据分析》
数据分析·2 分钟阅读·2026-04-17
抖音电商罗盘新版深度解读:5 张报表回答 80% 的运营决策
电商罗盘是抖店运营的「驾驶舱」,但报表多到看不过来。本文聚焦 5 张高价值报表:流量大盘、商品分析、客户分析、达人合作、广告效果,逐张说明「看什么、怎么用、决策是什么」。
同栏目《数据分析》