Skip to content

使用 PyWxDump 提取微信聊天记录

要微调模型,首先你需要你的微信聊天数据。

下载并安装PyWxDump

PyWxDump是一个用于提取微信聊天记录的工具。由于PyWxDump目前仅确认在Windows环境下正常运行,所有无论使用WSL2还是纯Windows环境部署的WeClone,这里都切换到Windows环境

在Windows环境下访问 PyWxDump GitHub 仓库 获取最新版本安装包。安装教程可直接参考PyWxDump官方教程

导出数据

  • 根据 PyWxDump 的指南,运行软件并解密你的微信数据库
  • 在 PyWxDump 中选择“聊天备份”功能
  • 导出类型选择 CSV
  • 你可以选择导出与多个联系人或群聊的聊天记录(当前版本不建议使用群聊记录)

整理数据

  • PyWxDump 导出的 CSV 文件通常位于其运行目录下的 wxdump_tmp/export 文件夹中。

  • 将整个 csv 文件夹 (其中可能包含多个代表不同聊天对象的子文件夹,每个子文件夹里是对应的聊天记录CSV文件) 移动或复制到 WeClone 项目的 ./dataset/ 目录下。

  • 因为WSL2Windows环境实际上是互通的,对于使用WSL2部署的用户可使用以下命令将Windows环境下的文件复制到WSL2的项目目录下:

    bash
    cp -r /mnt/你的PyWxDump/csv ./dataset/ #在WeClone根目录下执行该命令
    #例如:
    cp -r /mnt/d/Desktop/Just_for_fun/wxdump_work/export/wxid_wk5iejbp9ma322/csv ./dataset/
  • 最终的目录结构应类似于:WeClone/dataset/csv/张三/聊天记录.csv 等。

PyWxDump操作流程图解