TravelContentCreator/docs/NEXT_PHASE_PLAN.md

2.9 KiB
Raw Blame History

下阶段工作计划

创建日期: 2024-12-10
当前版本: 2.3.0


一、当前完成状态

1.1 AIGC 引擎

引擎 状态 说明
topic_generate 选题生成
content_generate 内容生成 (v2.1.0,支持参考文献)
poster_generate 海报生成 (轻量服务)

1.2 热点数据模块

爬虫 状态 说明
百度热搜 实时热点 + 旅游榜
节日日历 预设节日数据
小红书 MediaCrawler 集成 (需扫码登录)
Bing 搜索建议
微博 ⚠️ 反爬严格,需优化

1.3 基础设施

  • Prompt 管理 (YAML + 版本控制)
  • 参考文献库 (标题/正文范例)
  • MediaCrawler 集成 (libs/MediaCrawler/)

二、下阶段任务

2.1 热点数据增强 (P1)

2.1.1 微博爬虫优化

  • 研究 MediaCrawler 的微博模块
  • 实现稳定的微博热搜获取
  • 添加微博热搜 API 路由

2.1.2 抖音热搜集成

  • 研究 MediaCrawler 的抖音模块
  • 实现抖音热搜爬虫
  • 添加抖音热搜 API 路由

2.1.3 热点与内容生成联动

  • 热点数据自动注入选题生成
  • 基于热点的内容推荐
  • 热点趋势分析

2.2 海报系统重构 (P2)

参考 docs/POSTER_REFACTOR_PLAN.md 方案 C

  • 重构模板系统
  • 支持更多模板类型
  • 优化图片处理流程
  • 添加 Fabric.js JSON 输出

2.3 内容质量提升 (P2)

  • 内容评判引擎优化
  • 多轮生成与筛选
  • A/B 测试支持

2.4 系统优化 (P3)

  • 清理临时文件 (当前 943MB)
  • 统一配置管理
  • 日志系统优化
  • 性能监控

三、技术债务

参考 docs/TECHNICAL_DEBT.md

问题 优先级 状态
数据库双端访问 🔴 待处理
图片 Base64 传输 🟡 待处理
ppid/sid/pid 混乱 🔴 待处理
临时文件堆积 🟡 待处理
巨型文件 (poster.py) 🟡 待处理

四、文档索引

文档 说明
docs/PROJECT_STATUS.md 项目状态总览
docs/HOTSPOT_MODULE.md 热点模块文档
docs/POSTER_REFACTOR_PLAN.md 海报重构计划
docs/TECHNICAL_DEBT.md 技术债务分析
docs/JAVA_MIGRATION_GUIDE.md Java 端迁移指南

五、快速启动

# 启动服务
cd /root/TravelContentCreator
PYTHONPATH=. uvicorn api.main:app --host 0.0.0.0 --port 8001

# 测试热点 API
curl http://localhost:8001/api/v2/hotspot/baidu?limit=10
curl http://localhost:8001/api/v2/hotspot/travel?limit=10

# 测试 AIGC API
curl -X POST http://localhost:8001/api/v2/aigc/execute \
  -H "Content-Type: application/json" \
  -d '{"engine": "topic_generate", "params": {...}}'

六、联系方式

如有问题,请参考相关文档或查看代码注释。