商干货社区

数据分析·作者 ·发布 2026-03-08·更新 2026-04-17

电商运营 Python + Pandas 速成:15 段代码搞定日常数据处理

Excel 跑不动几十万行订单时,Python + Pandas 是运营自学成本最低的工具。本文给出 15 段可直接复制的代码:数据读取、清洗、统计、透视、合并、导出,配场景说明。

电商运营 Python + Pandas 速成:15 段代码搞定日常数据处理

下面 15 段代码可以直接复制。假设你有一份订单 CSV,列包含 order_id, user_id, sku_id, paid_amount, order_time, channel

1. 读 CSV

import pandas as pd

df = pd.read_csv("orders.csv", encoding="utf-8")
print(df.shape, df.columns.tolist())

2. 预览

df.head(5)
df.info()
df.describe()

3. 时间字段处理

df["order_time"] = pd.to_datetime(df["order_time"])
df["date"] = df["order_time"].dt.date
df["month"] = df["order_time"].dt.to_period("M")

4. 缺失值与去重

df = df.dropna(subset=["order_id"])
df = df.drop_duplicates(subset=["order_id"])

5. 条件筛选

mask = (df["paid_amount"] > 100) & (df["channel"] == "douyin")
df_filter = df[mask]

6. 日 GMV

daily = df.groupby("date")["paid_amount"].sum().reset_index()

7. 渠道 GMV

by_channel = df.groupby("channel")["paid_amount"].agg(["sum","count","mean"])

8. 用户消费统计

user = df.groupby("user_id").agg(
    total=("paid_amount", "sum"),
    orders=("order_id", "count"),
    last=("order_time", "max"),
)

9. 新老客

first = df.groupby("user_id")["order_time"].min()
df = df.merge(first.rename("first_time"), on="user_id")
df["is_new"] = (df["order_time"] == df["first_time"]).astype(int)

10. 透视表

pivot = pd.pivot_table(
    df, index="channel", columns="month",
    values="paid_amount", aggfunc="sum", fill_value=0,
)

11. 合并表(JOIN)

products = pd.read_csv("products.csv")
df_merge = df.merge(products, on="sku_id", how="left")

12. 分箱(价格带)

bins = [0, 50, 100, 300, 1000, 99999]
labels = ["<50", "50-100", "100-300", "300-1000", "1000+"]
df["price_band"] = pd.cut(df["paid_amount"], bins=bins, labels=labels)

13. 复购率

repurchase_users = df.groupby("user_id")["order_id"].nunique()
rate = (repurchase_users >= 2).sum() / len(repurchase_users)

14. 排序与 Top N

top_sku = df.groupby("sku_id")["paid_amount"].sum().nlargest(20).reset_index()

15. 导出 Excel

with pd.ExcelWriter("report.xlsx") as w:
    daily.to_excel(w, sheet_name="daily", index=False)
    by_channel.to_excel(w, sheet_name="channel")
    top_sku.to_excel(w, sheet_name="top_sku", index=False)

第十六节:学习路径建议

  1. 第 1 周:环境搭建 + 读取与预览;
  2. 第 2 周:筛选、聚合、合并;
  3. 第 3 周:透视与可视化;
  4. 第 4 周:自动化脚本与定时任务。

第十七节:常见误区

  • 只学不练;
  • 全靠 AI 复制,不理解代码含义;
  • 数据清洗跳过,结果不靠谱;
  • 一上来做大项目,半途而废。

Python 对运营的真正价值,不是替代 Excel,而是让你能处理 Excel 处理不了的场景。坚持 1 个月,你会发现自己对数据的掌控力上了一个台阶。

常见问题

以下为可见 FAQ,与 FAQPage 结构化数据一致。

完全没学过 Python 能看懂吗?
能。本文是「运营视角」的最小必要代码,1-2 周就能上手。不追求工程化,只追求效率。
Pandas 和 Excel 比优势在哪?
处理大数据(> 几十万行)、自动化重复任务、更灵活的条件筛选与透视。
如何搭建 Python 环境?
推荐 Anaconda 一键安装,自带 Jupyter Notebook。Windows / Mac 都有图形化安装包。
中文乱码怎么办?
读 CSV 时加 `encoding='utf-8'` 或 `encoding='gbk'`;写 Excel 用 `openpyxl` 默认即可。
AI 辅助写代码有用吗?
非常有用。让 AI 生成初版再按需求调整,是运营学 Python 最快的路径。

标签

本文属于以下专题

进入专题可以看到同主题下的全部相关文章、代表作者与常见问题解答。

同栏目 +1、共享标签 +2;真实相关不足时,用同栏目最新 / 全站最新补位并标注来源。