一、功能介绍
背景与需求
随着人工智能技术的发展,AI 拟人化内容在各个领域的应用日益广泛。然而,在使用这些经过 AI 拟人化处理后的文本或文档时,会面临一个问题:当使用常规的 AI 检测工具(如 GPTZero)进行检测时,这些内容很可能会被判定为 AI 创作。这是因为常规检测工具主要基于通用的 AI 语言特征进行判断,而经过 AI 拟人化处理的内容虽在形式上更接近人类表达,但仍可能保留一些 AI 创作的痕迹,从而导致误判。
功能目标
为了解决上述问题,我们设计了 AI 伪检测(Ai Fake Detect)功能。该功能旨在搭建一条伪检测链路,通过一系列技术手段,使用户能够绕过传统检测机制,对经 AI 拟人化的内容进行有效且符合预期的检测,确保检测结果更准确地反映内容的真实创作情况。
二、核心任务项
1:拟人化内容添加水印
水印作用:在拟人化内容中添加水印是为了实现内容的溯源和验证,同时也为后续的检测提供关键信息。水印包含了与内容相关的特定标识,如用户信息、处理时间、处理算法等,这些信息可以帮助检测系统更准确地判断内容的来源和处理方式。
水印类型与格式:选用零宽水印,这种水印具有不可见性,不会影响文本的正常显示和阅读。水印的格式可以采用特定编码方式,将所需信息按照一定规则转换为二进制或字符串形式嵌入到文本中。
添加位置与算法:水印会被添加到文本的特定位置,这些位置的选择基于一种复杂的算法,确保水印不易被发现和篡改。例如,可以根据文本的字符长度、语义结构等因素确定添加位置,同时采用加密算法对水印信息进行加密处理,提高水印的安全性。
2:内容水印识别
识别流程:当需要对内容进行检测时,系统首先会对输入的文本或文档进行扫描,查找可能存在的水印信息。通过特定的解码算法,将嵌入在文本中的水印信息提取出来,并进行解密和解析。
识别准确性:为了确保水印识别的准确性,系统会采用多种验证机制。例如,对提取的水印信息进行格式检查和完整性验证,与预先存储的水印模板进行比对,同时结合文本的上下文信息进行综合判断。如果识别过程中出现错误或不完整的水印信息,系统会进行相应的提示和处理。
异常处理:在水印识别过程中,可能会遇到各种异常情况,如水印被篡改、损坏或未检测到水印等。针对这些情况,系统会有相应的处理机制。例如,如果水印被篡改,系统会标记该内容为可疑,并进一步分析内容的其他特征;如果未检测到水印,系统会按照默认的检测流程进行处理。
3:AI伪检测报告
报告内容构成:AI 伪检测报告是对检测结果的详细呈现,包含多个关键信息。
整体检测结果:通过明确的指标和分类,如“most_human_likely”(最可能为人类创作)、“most_ai_likely”(最可能为 AI 创作)、“document_classification”(文档分类)等,直观地展示内容的创作可能性。
置信度信息:“confidence_category”(置信度类别)和“overall_probability”(整体概率)等指标用于说明检测结果的可信度,帮助用户判断检测结果的可靠性。
详细特征分析:“class_probabilities”(各类别概率)展示了内容被判定为人类创作、AI 创作或混合创作的概率分布;“ai_high_frequency_phrases”(AI 高频短语)列出了文本中可能表明为 AI 创作的高频短语,并给出相应的等级;“annotated_text”(标注文本)则在原文中对这些高频短语进行标注,方便用户直观地查看。
其他信息:还包括“total”(总字数)、“remain”(剩余可用检测次数)、“per_chars”(每字符检测成本等相关指标)、“char_length_prompt_code”(字符长度提示码)、“result_message”(检测结果说明信息)、“input_text”(输入的原始文本)、“result_type”(检测结果类型)等。
报告生成与展示:系统根据检测算法的输出结果,自动生成格式化的检测报告。报告可以以文本、表格或可视化图表的形式展示,方便用户查看和理解。同时,报告还支持导出功能,用户可以将报告保存为常见的文件格式,如 PDF、CSV 等,以便后续分析和存档。
4:文本、文档内容检测逻辑兼容
多种格式支持:该功能需要兼容多种常见的文本和文档格式,包括但不限于纯文本(TXT)、Word 文档(DOC、DOCX)、PDF 文档等。对于不同格式的输入,系统会采用相应的解析器将其转换为统一的文本格式进行处理。
检测逻辑适配:针对不同类型的内容,如新闻文章、学术论文、小说等,系统的检测逻辑会进行相应的调整和优化。例如,学术论文可能会有特定的语言风格和引用格式,系统会考虑这些因素,采用更适合学术领域的检测模型和规则;而新闻文章则更注重时效性和客观性,检测逻辑会相应地进行调整。
性能优化:为了提高检测效率和性能,系统会采用缓存机制和并行处理技术。对于频繁检测的内容或相似的文本片段,可以将检测结果进行缓存,避免重复计算;同时,对于大规模的文档或批量检测任务,可以采用并行处理的方式,将任务分解为多个子任务同时进行检测,提高整体检测速度。
三、主要流程图
四、文本、文档内容检测逻辑兼容
AI伪检测逻辑返回的数据内容结构如下:
{
"code":0,
"msg":"successful",
"data": {
"most_human_likely":null,
"most_ai_likely":null,
"document_classification":"",
"confidence_category":"",
"class_probabilities": {
"human":0,
"ai":0,
"mixed":0
},
"total":0,
"remain":0,
"per_chars":0,
"char_length_prompt_code":0,
"result_message":"",
"input_text":"",
"result_type":0,
"fake_ai_detection": {
"ai_high_frequency_phrases": [
{
"grade":3,
"phrase":"marked by profound Integration and transformative Agentic Paradigm Shifts"
},
{
"grade":3,
"phrase":"no longer rests solely on scaling up models"
},
{
"grade":3,
"phrase":"rather on crafting autonomous systems that tangibly boost business outcomes"
},
{
"grade":3,
"phrase":"earned its reputation as the "Year of the Agent.""
},
{
"grade":3,
"phrase":"embrace proactive AI Agents that can strategize, leverage APIs, and execute complex workflows with minimal human input"
}
],
"annotated_text":"\n <grade3>late 2025, the Cloud AI tools market has shifted from the so-called "experimental hype" phase into an era marked by profound Integration and transformative Agentic Paradigm Shifts.</grade3></revised> The emphasis <grade3>no longer rests solely on scaling up models</grade3> but <grade3>rather on crafting autonomous systems that tangibly boost business outcomes</grade3>.<added>不得不说,这一步骤真的是令人期待呢。</added>\n\n<grade2>Here's a breakdown of today's Cloud AI landscape:</grade2>\n\n1. <grade3>Market Macro-Dynamics: Moving Beyond "Chat" to Concrete "Action"</grade3>\n<grade3>The Ascendance of the AI Agent:</grade3> 2025 has <grade3>earned its reputation as the "Year of the Agent."</grade3> The field <grade3>has transcended mere conversational bots</grade3> to <grade3>embrace proactive AI Agents that can strategize, leverage APIs, and execute complex workflows with minimal human input.</grade3>\n\n<grade3>Inference Takes the Lead:</grade3> For the first time ever, spending on AI inference <grade3>dramatically outstripped</grade3> training expenses. This trend owes much to the widespread rollout of AI in live environments",
"grade_total":5,
"overall_probability":"42%"
}
}
}
整体状态信息:
code:表示检测请求的处理结果状态码,0 通常表示成功,其他值可能表示不同的错误类型。
msg:对状态码的文字描述,如 “successful” 表示处理成功。
详细检测结果信息:
most_human_likely 和 most_ai_likely:分别表示内容最可能是人类创作或 AI 创作的相关信息,当前为 null,可能在后续根据具体检测情况填充。
document_classification:文档的分类信息,如新闻、学术、小说等,当前为空,需要根据具体的分类算法进行填充。
confidence_category:置信度类别,用于描述检测结果的可信度等级,如高、中、低等,当前为空,需要根据检测模型的输出进行判断和填充。
class_probabilities:各类别创作的概率分布,包括 human(人类创作概率)、ai(AI 创作概率)、mixed(混合创作概率),当前均为 0,会在检测完成后根据模型计算得出具体值。
total:输入文本的总字数,用于统计和计费等相关操作。
remain:用户剩余的可用检测次数,方便用户了解自己的使用情况。
per_chars:每字符的检测成本等相关指标,可能用于计费或资源分配等方面。
char_length_prompt_code:字符长度提示码,可能用于提示用户输入文本长度是否符合要求或其他相关信息。
result_message:关于检测结果的详细说明信息,如对检测结果的解释或建议等,当前为空,会根据检测情况生成相应的文本。
input_text:用户输入的原始文本,方便用户核对和查看。
result_type:检测结果的类型,如明确为人类创作、AI 创作或无法确定等,当前为 0,需要根据具体的判断规则进行赋值。
ai_high_frequency_phrases:文本中出现的 AI 高频短语列表,每个短语都有一个对应的 grade(等级),用于表示该短语与 AI 创作的关联程度。
annotated_text:标注后的文本,将高频短语用特定的标签(如 <grade3>)进行标注,方便用户直观地看到哪些部分可能是 AI 创作的痕迹。
grade_total:高频短语的总等级数,用于综合评估文本中 AI 创作痕迹的程度。
overall_probability:整体的 AI 创作可能性概率,以百分比形式表示,当前为 “42%”。
暂无评论,快来抢沙发!