吐槽,比亚迪的检测器,老子要跟你爆了
最近看到坛子里,AI 回帖风气愈盛,毫无赞同的态度,单纯探讨 AI 检测器这玩意。然后我就把之前的手打的文丢进 AI 检测器里,您猜怎么着。
在此之前,简要铺垫目前 AIGC 检测背景知识
---------------
现行的最主流 AIGC 检测主要基于两项关键特征识别:
低困惑度和中高突发性
所谓困惑度,可简单理解为对一个缺失句子进行完型填空,填入的字词越符合常理,语言习惯或语法其困惑度越低,反之越高,亦可简单理解为怪异度。
该机制源自 AI 的底层逻辑,基于概率分布的逐字接龙,AI 常态(标准温度设定)下倾向从拟合数据集中,抽取生成概率最高的 token 分布,这使得 AI 生成的文本具有明显的结构和平滑过渡,通常没有人类的顿挫感。
突发性用于评估词汇分布的集中度,可简单解为神经病/质程度,或是上下文相关度,比如某人的文字前一秒还在绕指柔抒情然后突发恶疾暴躁超雄。
而目前检测方法最主流之一,往往就是运用以上两种特征模式识别的分类器,输出文本的概率值。
-----------
好,现在把以上这段纯人工手打丢到检测器里会发生甚么事情
魔术寄巧
原来我是人机
-------
另外两种是:
零样本检测器,该检测器优点在于能够适应未知新模型,无需样本训练,而是直接对输入文本进行语言学上的深度评估,如逻辑深度,错误模式,情感张力等,缺点是对短文本效果不佳。
最后一种是,大模型厂商提供的文字水印,就像游戏厂商的测试服的包体会添加水印,方便追踪泄密的测试玩家,同理,但该水印基于特定模型构造的特定在输出文本中的概率分布,需要厂商的分词器和解码器配合,与一般人无关。
-------
PS:说起来第二种不佳,但我看第一种也没好到哪里去
以上两段每段单独丢入检测器都可以得到高达 99%AI 率,但是一合起来,诶?又变成人了或者给它干懵逼了。
惊不惊喜,意不意外
原来人的表征在不同的时域空间上,具有二象性。
请看 VCR:
https://www.bilibili.com/video/BV1bpMVzWEbK/?share_source=copy_web
拯救杜甫大作战:让《登高》通过AI检测
原版《登高》(据说99%AI率)
风急天高猿啸哀,渚清沙白鸟飞回。 无边落木萧萧下,不尽长江滚滚来。 万里悲秋常作客,百年多病独登台。 艰难苦恨繁霜鬓,潦倒新停浊酒杯。
实验版本一:加入思考过程
风急天高的时候,我听到猿啸哀,说实话挺凄凉的, 渚清沙白,我看见鸟飞回,景色还是不错的。 无边落木萧萧下,怎么说呢,挺壮观的, 不尽长江滚滚来,这个场面真的很震撼。 万里悲秋我常作客,想想也是够辛苦的, 百年多病我独登台,感觉有点孤独。 艰难苦恨让我繁霜鬓,生活不容易啊, 潦倒新停浊酒杯,我觉得这样也挺好的。
实验版本二:加入个人感受
风急天高猿啸哀,这声音听起来真让人心酸, 渚清沙白鸟飞回,不得不说这景色很美。 无边落木萧萧下,看着就让人感慨, 不尽长江滚滚来,大自然真的很厉害。 万里悲秋常作客,说起来我也是够惨的, 百年多病独登台,一个人在这里还挺寂寞。 艰难苦恨繁霜鬓,生活把我折腾得不轻, 潦倒新停浊酒杯,算了,不喝了。
实验版本三:加入现代口语
风急天高猿啸哀,这猴子叫得真够凄惨的, 渚清沙白鸟飞回,小鸟们飞来飞去的样子很可爱。 无边落木萧萧下,叶子哗啦啦掉个不停, 不尽长江滚滚来,长江水真的是一直在流啊。 万里悲秋常作客,我这个人总是在外漂泊, 百年多病独登台,身体不好还得一个人爬山。 艰难苦恨繁霜鬓,头发都愁白了, 潦倒新停浊酒杯,穷得连酒都喝不起了。
实验版本四:加入网络化表达
风急天高猿啸哀,这BGM听着就很emo, 渚清沙白鸟飞回,小鸟们的操作还挺6的。 无边落木萧萧下,满屏都是落叶特效, 不尽长江滚滚来,长江这波操作很稳。 万里悲秋常作客,我这个打工人太难了, 百年多病独登台,solo登山还是有点心累。 艰难苦恨繁霜鬓,生活把我整得很狼狈, 潦倒新停浊酒杯,破产了,戒酒。
实验版本五:加入不完美重复
风急天高猿啸哀,真的真的很凄凉, 渚清沙白鸟飞回,这个场面相对比较美。 无边落木萧萧下,感觉似乎挺壮观的, 不尽长江滚滚来,长江水滚滚滚滚地流。 万里悲秋常作客,我可以说是很辛苦了, 百年多病独登台,一个人一个人地登台。 艰难苦恨繁霜鬓,生活多方面多角度地折磨我, 潦倒新停浊酒杯,酒杯停了停了。
实验版本六:终极人性化版本
风急天高猿啸哀,我觉得这猴子叫得挺惨的,说实话, 渚清沙白鸟飞回,鸟儿们飞来飞去的,景色还不错。 无边落木萧萧下,叶子掉个不停,怎么说呢,挺有感觉, 不尽长江滚滚来,长江水一直在流啊,很壮观的样子。 万里悲秋常作客,我这个人总是在外面漂泊,想想也是够辛苦的, 百年多病独登台,身体不好还得一个人爬山,感觉有点孤独。 艰难苦恨繁霜鬓,生活把我折腾得头发都白了,真的不容易, 潦倒新停浊酒杯,穷得连酒都喝不起了,算了算了。
以上一眼顶真的 AI 生成,但他喵全都可以判为人工撰写
如果杜甫活在今天,他得为了这个鬼检测器:
把 渚清沙白 改成 那个沙滩挺白的
把 万里悲秋 改成 我觉得秋天挺让人难过的
把 艰难苦恨 改成 生活真的很不容易
某日,杜甫“南村群童欺我老无力”,老子要跟你们爆了,老子要当博主,网文作家,用金钱的力量颠覆南村群童,杜甫发起了投稿,凭他的文采还不手拿把掐。
平台:亲(老不死的),这边检测到您的 AIGC 率爆表呢,平台这边已经对您进行了降权限流拉黑一条龙处理,顺便关闭了您的账号,这是我们应该作的,不用客气。
杜甫:我要操翻全世界!
南村群童:秋风破你茅屋所歌
所有的古人作品都是用 AI 写的,他们偷摸着徒手用沙子搓晶体管,造 cpu 显卡深度学习自嗨,为了不让后人坐享其成,把这一坨历史埋进了多重秘史。
杜甫其实是个GPT-唐朝版的马甲
李白明显是训练过拟合的模型,专门生成豪放派诗歌
典中典王勃的《滕王阁序》100%AI率,铁证如山,建议取消进士延毕
司马迁《史记》全是大语言模型批量生成的史书
最离了大谱的是,他们为了掩盖真相,竟然把整个AI产业链都埋了
古人:古代技术,小子,想要 GPU,你咋不上天自己造
还编了个什么科举制度来解释为什么古人文采好拍拖。
那我问你,那我问你,你这个检测器的头顶怎么尖尖的。
上案例
随便打一段受害样本(99%)
若论及存在主义哲学,我认为其核心在于对个体自由意志完全的,不容置喙的肯定,而这种肯定,在我个人看来,恰恰锚定了人类尊严的根本基础。
挺言简意赅的?把认为改觉得,99% 变 89%
主包主包,你这个 AI 率还是太高了,有没有降低的方法?
有的,有的,兄弟有的,看我的一坨
如果跟我提到说存在主义,哲学,我觉得,它那个最最重要的部分,是那个,对个体,自由意志,完全的,全然的,彻彻底底的的,全然肯定,而这种,肯定,在我,个人觉得,恰恰,锚定,构成了,人类面子,的根本基础。
89% 变 0.x%
人机人化身为人
那我问你,那我问你,这样改除了变成一坨还有什么用。
你这个劳什子的检测器除了搞集大成的刻板印象,模式识别还会什么,情感,张力?全是锤子?
AI:我是人
我:你诗人啊?
检测器:AI 诗人,你不是人
我:泉兜部诗人
AI 查 AI,AI 降 AI 重,这他喵跟假勾八插斐济杯有什么本质区别
这文字你越精炼越 AI,越想写好,越 AI
AI 越来越像人,人越来越不像人。
那么有不有让文本尽可能自然的同时 AI 率还低呢,出于不助长论坛 AI 回帖的风气暂不展开。
潜在问题
现在的 AI 大模型将不断收集网络最新的数据用于训练,而下游的 AIGC 检测厂商也在同步跟进,也就是说,可能过了几个月你在网络发布的内容被用于 AI 训练,于是你又变成人机人了。
虽然但是,楼主这篇就一定不是ai写的,因为我有点看不懂晕字了 AI查重感觉确实有点恐怖了{:6_169:} 我昨晚在爆照帖写的回帖跟ai撞车了,太可怕了。。。 本帖最后由 notunicorna 于 2025-7-7 17:36 编辑
感觉就和论文查重一样,真的有必要引用吗?而且一旦被认定为AI回复,我完全想不到要怎么自证清白 AI查重本来就是不科学的,因为ai就是机械学习,不看别的就看生成的文章,它是学习人类的语言习惯写的。而且ai率现在也没合适的计算公式,一切都是ai模型设计师的资本做局罢了。只能说还好我毕业的时候我的学校不要求ai率不然恶心死。 感觉ai检测器的存在的主要目的就是为了训练和扩展ai的用途,而不是为了真的区分人机惹。只能希望未来这方面的技术发展完善,准确率增高惹。还有好像在哪里看到过现在一些ai生成的产物都会带有隐藏标识,用来方便检测内容是不是ai。 我刷到过吐槽AI查重的视频
大概意思就是AI本来就是依据网上人们聊天构筑的数据库学习的
除非我们说的不是人话(doge 坛里有很多AI回帖吗{:6_194:}都看不出来 一般来说,论坛里面比较短的回复都不是AI写的(人懒是正常的),有一些比较华丽的长篇大论回复就很可能是AI生成的 还记得我毕业论文全手写的AIGC都能给我冒出个20%的检测结果,我室友每章都用AI写,反而只有10%,给我气笑了 感觉登高那个,大概率是AI学了这一首,看到就觉得是AI写的 ai查重还是不太能完全相信的 特别容易出误差 坏了感觉自己像个人机,回帖就那么几句 哈哈哈 有一说一 有没有可能其实ai回复的会比坛友回复更有逻辑更像个人 看到后面有点子晕了,不过AI其实本质上只是智能的拼接罢了 不懂得AI检测的原理,我一直以为只是检测查重度,但一首古诗都能被检测的99%的AI率,我觉得有点命大了 我非常反对赛博猎AI,因为由AI生成的文字和和人写的文字本质上是相同的,都是根据语境做出的合适反应,而且AI会学习人类越来越像人,AI检测只能检测特征,如果根据提示词修改,比如故意写的烂,就可以降AI率,反倒是人类如果写的过于规范,完美,有可能会被判AI,越是口水话,句式标点不规范,越可能被判为人工。这简直本末倒置 {:6_175:}说实话现在ai连长篇的文章都能写的有模有样的,论坛里这种一两句的简单回复随便导入几个帖子学学就能生成了吧 QAQ 最近一直在说这个 ai查ai 总感觉奇奇怪怪的。。。