Advance_Assessment 2

Structure

load_raw_records.py 不依赖任何项目内模块，纯文本处理；其他文件都围绕 post.py 的类展开。

类	是否有 children	角色	在树中的位置
`Post`	❌	抽象基类	不直接使用
`TextPost`	❌	普通文本帖	叶子节点
`StoryPost`	✅	故事帖（可包含其他帖）	分支节点

职责：把 posts.txt 文件每一行原始字符串解析为 dict，并修复 text 字段。

fix_text 字符修复算法

示例：'b'（ord=98，偶数）→ 'a'；'a'（ord=97，奇数）→ 'b'。这是个对称变换：fix_text(fix_text(x)) == x

版本	实现方式	特点
第 1 个（被覆盖）	`f.readlines()` 一次读完 → `return list`	占内存
第 2 个（生效）	`for line in f` + `yield record`	生成器，省内存

注意：Python 中后定义的函数会覆盖前面的同名函数，所以实际生效的是第二个 yield 版本！

职责：把 dict 列表转换为 Post 对象字典，处理重复 ID 时合并。

💡 设计哲学：合并时点赞累加（数据汇总），但文本保留较长版本（信息更全）。

职责：递归统计某个帖子自己 + 所有后代的总点赞数。

职责：递归收集某个帖子的所有后代帖子（去重 + 过滤无点赞 + 排除 solution）。

职责：作为装饰器，自动过滤掉返回列表中任何 text 包含 “solution”（不区分大小写）的 StoryPost。

最后更新 · 2026-05-19 23:52