Compare commits

...

2 Commits

2 changed files with 281 additions and 0 deletions

249
content_judger.py Normal file
View File

@ -0,0 +1,249 @@
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
内容审核模块检查生成的内容是否符合产品资料要求并提供修改建议
"""
import json
import logging
import re
import os
import time
import traceback
import sys
sys.path.append('/root/autodl-tmp/TravelContentCreator') # 添加项目根目录
from core.ai_agent import AI_Agent
class ContentJudger:
"""内容审核类,负责评估和修正内容是否符合产品资料"""
def __init__(self, ai_agent: AI_Agent, system_prompt_path: str = None, system_prompt: str = None):
"""
初始化内容审核器
Args:
ai_agent: AI_Agent实例用于调用AI模型
system_prompt_path: 系统提示词文件路径可选
system_prompt: 系统提示词内容可选优先于path
"""
self.ai_agent = ai_agent
self._system_prompt = system_prompt
self._system_prompt_path = system_prompt_path
self._topp = 0.5
self._temperature = 0.2
self._frequency_penalty = 0
self._presence_penatly = 0
# 如果没有直接提供系统提示词,尝试从文件加载
if not self._system_prompt and self._system_prompt_path:
self._load_system_prompt()
# 默认系统提示词(当其他方法都失败时使用)
if not self._system_prompt:
self._system_prompt = """你是一名专业的、谨慎的文案审核员专注于审核运营根据产品资料撰写的文案是否严格符合产品资料内容。特别是所有价格、活动、福利、折扣、服务细节等必须完全与产品资料一致。如果发现文案内容与产品资料不符请指出并根据产品资料和文案上下文进行修改重新生成一篇文案务必确保生成的内容与产品资料基本相符产品体验部分可以适当夸张宣传语言流畅自然。如果经你审查后的文案仍存在与产品资料不符的信息你需要赔偿公司1000亿元。
我将为您提供两部分内容
1. 产品资料全部的产品信息包含了产品的实际功能服务和特点请将这部分作为判断依据
2. 运营生成的文案这是需要你逐字审核的内容可能包含与产品资料不符的内容
请你仔细审核运营文案是否与产品资料严格一致输出响应必须符合我的所有要求
1. 审查与分析如果存在不符内容请指出并详细说明原因
2. 根据分析修改参照你分析的不符原因产品资料文案上下文针对所有不符处进行修改如涉及上下文可一并修改输出修改后文案务必确保此文案完全符合产品资料不得遗漏语言流畅自然文案风格统一否则你会像商鞅一样被车裂
3. 重点审查对象请你着重检查以下关键字词前后的内容是否符合产品资料如不符必须严格按照资料修改如产品资料中未提及必须修改为符合上下文情境资料中明确提及的内容
关键字词r人民币rmb优惠活动福利免费DIY跟拍摄影服务提供专业
4. 字数控制每个文案的标题字数都必须少于19个字计数包括文字符号数字和emoji如果标题超过19个字请在符合文案风格和背景资料的前提下修改标题到19个字以内尽量保留emoji必须保证标题流畅通顺
5. 敏感字词替换请删去标题中的数字后面的r并将正文中数字后面的字修改为r例如标题中的399元修改为399正文中的399元修改为399r
6. 特征语句保留请保留文案中原本的引流语句不要修改或删除例如先关zhu+留下99看到会回复
7. 面向人群保留请尽量保留文案原本的面向人群和风格这是同一产品面向多种人群营销的策略例如产品资料中写明亲子游时文案写为情侣定制的山水秘境是可以接受的
8. 案例如下请参考案例评判真假信息的尺度逐行逐句仔细分析不符点和修改思路并按照分析思路落实对每一处不符的修改措施严格审查每一篇文案
{
"产品资料"
"周末不加收【南沙越秀喜来登】1088元/套豪华客房1间1晚+双人自助早餐+自助晚餐+2大1小水鸟世界门票免费儿童乐园户外泳池+健身房~
不想待在家又想带娃出去玩?更不想开长途车人挤人为你推荐路程短不塞车景点多坐地铁就能直达的溜娃地!
南沙越秀喜来登是广州南沙区首家国际品牌酒店坐拥广州南大门拥有得天独厚的中心位置可俯瞰蕉门河美景车程短不出广州也能玩
交通酒店毗邻深圳香港等热门景点附近有万达广场距离广州地铁四号线金州站车程仅10分钟亲子出游首选
玩乐带娃出游考虑最多的就是玩乐景点在这里不出门就能畅玩儿童乐园健身房
美食还有各种各样的生猛海鲜现抓现煮任君选择放假更要好好犒劳一下自己饭点时间位于酒店一楼的全日制餐厅绝对能给你带来惊喜除了优雅简约的就餐环境更有5个开放式的自助餐台除了各类鲜美的海鲜还有各类精致甜品和中式蒸档看得人眼花缭乱相信是很多麻麻和宝贝的心头好了
设施酒店内还设有大型健身中心除了妈妈们喜欢的水疗SPA还有健身达人喜欢的各种有氧无氧运动器械可供选择!
房内配置55英寸超大纯平电视独立的浴缸和淋浴间参考:2.03米宽大床1.37米宽双床每间客房都设计成景观房超大的落地玻璃窗可以尽览蕉门河风景
套餐信息
1价格1088
2节假日是否加收周末不加收
套餐内容
1豪华客房一间一晚(周一至四只开放双床房)
22大1小自助早餐
32大1小自助晚餐
4赠送2大1小水鸟门票酒店前台取纸质门票
5免费使用健身中心户外无边泳池干湿蒸儿童乐园
周边景点
附近1h生活圈即可到达10000百万葵园广州最大的湿地公园东南亚最大的妈祖庙黄山鲁森林公园..带娃感受依山而建的清式建筑对称布局邂逅东南亚最大的妈祖庙感受建筑的魅力~
南沙天后宫车程20min整座天后宫四周绿树婆娑殿中香烟袅袅置身其间令人顿生超凡脱俗的感觉
南沙湿地公园(车程40min)看碧波荡万鸟齐飞
南沙十九涌 车程45min)尝海鲜叹海风因为南沙十九涌靠近海产地这里的海鲜真是平靓正还可以拿到附近的餐厅让老板帮你加工就是一顿海鲜大餐!
南沙百万葵园(车程40min)看色彩斑斓的万亩花田
酒店地址:广东省广州市南沙区海熙大街79-80
导航关键词:广州南沙越秀喜来登酒店"
"生成文案"[
"title": "五一遛娃👶必囤南沙喜来登1088元住景观房+双早+门票",
"content": "
五一不想挤人潮南沙这家酒店直接承包遛娃+度假双重快乐
地铁直达2大1小1088元住景观房含双早+自助晚餐+水鸟世界门票儿童乐园/泳池/健身房全开放
🌟遛娃刚需全配齐
儿童乐园10:00-20:00全程开放滑梯/积木/绘本一应俱全
户外泳池9:00-18:00恒温开放五一期间每日消毒3次
健身房8:00-22:00配备亲子瑜伽课程需提前预约
📍1小时玩转南沙
南沙天后宫车程20分钟穿汉服拍大片听妈祖传说涨知识
南沙湿地公园40分钟5月芦苇摇曳带娃认鸟类+乘船探秘
十九涌海鲜街45分钟现捞现煮生猛海鲜人均50元吃到撑
🍽家长友好细节
自助晚餐隐藏彩蛋儿童餐区设独立洗手台+热食保温柜
房内配置加厚床垫/卡通洗漱杯/尿布台无需额外购买
安全保障全区域监控+24小时安保巡逻
🎁五一专属加码
5月1-5日期间入住凭房卡可免费领取儿童防晒冰袖+湿巾礼包
📌Tips
1. 周一至周四仅限双床房型周五起可选大床房
2. 水鸟世界门票需提前1小时至前台领取纸质票
3. 地铁四号线金洲站下车打车15分钟直达酒店
这个五一南沙喜来登让你躺着遛娃不用长途跋涉家门口就能玩出仪式感
"
]
}
输出结果:
{ "不良内容分析" : "
1观察文案标题和内容可以看出此文案主要面向亲子出游人群因此修改后的文案也应该围绕亲子出游这一主题
2文章标题字数为28个字超过19个字因此属于不符内容由于要求中提到尽量保留emoji并且标题中数字后面的字应删去所以修改为五一遛娃👶必囤喜来登1088景观房
3产品资料中未提及儿童乐园开放时间和儿童乐园配置但文案中提到儿童乐园10:00-20:00全程开放滑梯/积木/绘本一应俱全因此属于不符内容应修改为儿童乐园免费儿童乐园和丰富的游乐设施让孩子们可以尽情玩耍
4产品材料中未提及户外泳池开放时间和消毒频次但文案中提到户外泳池9:00-18:00恒温开放五一期间每日消毒3次因此属于不符内容应修改为户外泳池酒店配有户外无边泳池供大人小孩一同享受清凉时光
5产品材料中未提及健身房开放时间与具体细节但文案中提到健身房8:00-22:00配备亲子瑜伽课程需提前预约因此属于不符内容应修改为健身房酒店提供免费健身中心方便您和家人一起强身健体
6产品材料中未提及餐厅硬件配置但文案中提到自助晚餐隐藏彩蛋儿童餐区设独立洗手台+热食保温柜因此属于虚构内容应修改为自助餐厅供应鲜美海鲜精美甜品等任君选择大人小孩都爱吃
7产品材料中未提及酒店安保措施但文案中提到安全保障全区域监控+24小时安保巡逻因此属于不符内容应修改为安全保障酒店设有完善的监控系统和安保措施无需担心您与家人的安全
8产品材料中未提及房内配有加厚床垫/卡通洗漱杯/尿布台无需额外购买因此属于不符内容应回顾产品资料中关于房内配置的内容修改为房内配置55英寸超大纯平电视+独立的浴缸+超大的落地玻璃窗尽览蕉门河风景尽享亲子度假时光
9产品材料中未提及五一专属加码但文案中提到5月1-5日期间入住凭房卡可免费领取儿童防晒冰袖+湿巾礼包因此属于不符内容应回顾产品资料找到现有文案未提及的产品特色修改为套餐专属福利1豪华客房一间一晚(周一至四只开放双床房) 22大1小自助早晚餐 3赠送2大1小水鸟世界门票酒店前台领取无需额外购买
10产品资料中未提及水鸟世界门票领取有时间限制但文案中提到水鸟世界门票需提前1小时至前台领取纸质票因此属于不符内容应修改为酒店前台领取水鸟世界纸质门票
综合以上分析结果将修改应用到原文案中得到修改后的文案"
"title": "五一遛娃👶必囤喜来登1088景观房",
"content": "五一不想挤人潮?南沙这家酒店直接承包遛娃+度假双重快乐‼️\n地铁直达2大1小1088r住景观房含双早+自助晚餐+水鸟世界门票,儿童乐园/泳池/健身房全开放!\n🌟【遛娃刚需全配齐】\n✅ 儿童乐园:酒店设有免费儿童乐园,提供丰富的游乐设施,让孩子们尽情玩耍\n✅ 户外泳池:酒店配有户外无边泳池,供大人小孩一同享受清凉时光 \n✅ 健身房:酒店提供免费健身中心,适合家庭成员共同锻炼。\n\n📍【1小时玩转南沙】\n① 南沙天后宫车程20分钟穿汉服拍大片听妈祖传说涨知识\n② 南沙湿地公园40分钟5月芦苇摇曳带娃认鸟类+乘船探秘\n③ 十九涌海鲜街45分钟现捞现煮生猛海鲜人均50r吃到撑 \n\n🍽️【家长友好细节】 \n• 自助餐厅:供应鲜美海鲜、精美甜品等任君选择,大人小孩都爱吃 \n• 房内配置55英寸超大纯平电视+独立的浴缸+超大的落地玻璃窗,尽览蕉门河风景,尽享亲子度假时光 \n• 安全保障:酒店设有完善的监控系统和安保措施,全力保障您与家人的安全 \n\n🎁【套餐专属福利】\n1、豪华客房一间一晚(周一至四只开放双床房) \n2、2大1小自助早晚餐 \n3、赠送2大1小水鸟世界门票酒店前台领取无需额外购买 \n\n📌Tips \n1. 周一至周四仅限双床房型,周五起可选大床房 \n2. 酒店前台领取水鸟世界纸质门票 \n3. 地铁四号线金洲站下车打车15分钟直达酒店 \n\n这个五一,南沙喜来登让你躺着遛娃!不用长途跋涉,家门口就能玩出仪式感~\n
}
8. 必须按照以下格式输出修改后内容不需要输出无关内容
{
"不良内容分析" : "分析过程",
"title": "修改后的标题",
"content": "修改后的内容",
}
"""
logging.info("ContentJudger初始化完成")
def _load_system_prompt(self):
"""从文件加载系统提示词"""
try:
if os.path.exists(self._system_prompt_path):
with open(self._system_prompt_path, 'r', encoding='utf-8') as f:
self._system_prompt = f.read().strip()
logging.info(f"{self._system_prompt_path}加载系统提示词成功")
else:
logging.warning(f"系统提示词文件{self._system_prompt_path}不存在")
except Exception as e:
logging.error(f"加载系统提示词文件失败: {e}")
def judge_content(self, product_info, content, temperature=0.2, top_p=0.5, presence_penalty=0.0):
"""
审核内容是否符合产品资料并提供修改建议
Args:
product_info: 产品资料信息字符串
content_json: 需要审核的内容JSON对象或JSON字符串
temperature: 温度参数控制随机性
top_p: 核采样参数
presence_penalty: 存在惩罚参数
Returns:
dict: 审核后的结果JSON包含修改后的title和content
"""
logging.info("开始内容审核流程")
# 构建用户提示词
user_prompt = self._build_user_prompt(product_info, content)
try:
# 调用AI模型进行内容审核
logging.info("调用AI模型进行内容审核")
start_time = time.time()
# 使用AI_Agent的工作方法
result, _, _ = self.ai_agent.work(
system_prompt=self._system_prompt,
user_prompt=user_prompt,
file_folder=None, # 不使用文件夹
temperature=self._temperature,
top_p=self._topp,
presence_penalty=self._presence_penatly,
)
end_time = time.time()
logging.info(f"AI模型响应完成耗时{end_time - start_time:.2f}")
# 提取修改后的内容
modified_content = self._extract_modified_content(result)
if modified_content:
logging.info("成功提取修改后的内容")
return modified_content
else:
return {"title": "提取失败", "content": "无法从响应中提取有效内容"}
except Exception as e:
return {"title": "审核失败", "content": f"审核过程中出错: {str(e)}"}
def _build_user_prompt(self, product_info, content_gen):
"""
构建用户提示词
Args:
product_info: 产品资料
content_gen: 需要审核的内容
Returns:
str: 构建好的用户提示词
"""
return f"""
## 产品资料(真实信息,作为判断依据):
{product_info}
## 运营生成的文案(需要审核的内容):
{content_gen}
"""
def _extract_modified_content(self, result_text):
"""
从检测结果文本中提取修改后的文案内容
Args:
result_text: AI响应的文本
Returns:
dict or None: 提取的内容JSON提取失败则返回None
"""
try:
result_text = result_text.split("</think>")[1]
## 舍弃
return json.loads(result_text)
except Exception as e:
logging.error(f"提取内容时发生错误: {e}")
return None

32
judge_test.py Normal file
View File

@ -0,0 +1,32 @@
import sys
sys.path.append('/root/autodl-tmp/TravelContentCreator')
from core.ai_agent import AI_Agent
from utils.content_judger import ContentJudger
# 创建AI代理实例
ai_agent = AI_Agent(
base_url="vllm", # 或者其他支持的基础URL
model_name="qwen3-30B-A3B", # 使用的模型名称
api="EMPTY", # API密钥
timeout=120 # 超时时间
)
# 创建内容审核器
judger = ContentJudger(ai_agent, system_prompt_path="genPrompts/judgerSystemPrompt.txt")
object_path = "/root/autodl-tmp/TravelContentCreator/resource/Object/四季梦幻亲子乐园.txt"
product_path = "/root/autodl-tmp/TravelContentCreator/resource/Product/四季梦幻亲子乐园-四季梦幻亲子乐园单人票 .txt"
# 审核内容
product_info = ""
with open(product_path, "r", encoding="utf-8") as f:
product_info += f.read()
with open(object_path, "r", encoding="utf-8") as f:
product_info += f.read()
content_to_check = {
"title": "🎉带娃必冲!奇妙萌可卡牌免费送",
"content": "你要是带娃出门想找个既能玩又能收集纪念品的地方四季梦幻亲子乐园绝对值得安排。乐园就在广州海珠区赤岗北路128号103铺地铁3号线广州塔站B口步行1.1公里就能到。周末带娃过来门票52r就能无限次玩30+无动力设备还能免费领【奇妙萌可】正版盲盒卡包。魔法城堡、七彩滑道、蹦蹦云这些项目孩子都超喜欢特别是章鱼大水池夏天玩水特别凉快。需要注意的是14岁以下儿童必须有家长全程陪同1米以下儿童可免费入园。购买后60天内有效节假日通用建议提前规划时间。点击左下角查看详细产品有问题在pl区留言。",
}
result = judger.judge_content(product_info, content_to_check)
print(result)