OpenAI o3 / o4-mini 模型 AI 生成文本含特殊符號,推測為隱形水印快訊
Rumi 表示在 GPT-4o 等 OpenAI 此前模型中,推測這可能是 OpenAI 故意設(shè)置的水印,這種字符檢測方法誤報率極低。
IT之家 4 月 22 日消息,AI 初創(chuàng)公司 Rumi 發(fā)現(xiàn) OpenAI 公司在 o3 和 o4-mini 模型中,嵌入了窄不換行空格(Narrow No-Break Space, NNBSP, U+202F)等特殊 Unicode 字符。
IT之家注:這些字符在普通視圖中與標(biāo)準(zhǔn)空格無異,但在 SoSciSurvey 或 Sublime Text 等專業(yè)工具中,可檢測其獨特代碼。
Rumi 表示在 GPT-4o 等 OpenAI 此前模型中,并不存在這些設(shè)置,這些選項可以通過簡單的“查找替換”移除,推測這可能是 OpenAI 故意設(shè)置的水印。
Rumi 強調(diào),這種字符檢測方法誤報率極低,但易被繞過的缺陷明顯。另一種解釋是,這些字符符合排版規(guī)則,用于防止貨幣符號與金額或姓名縮寫間換行,可能是模型從訓(xùn)練數(shù)據(jù)中習(xí)得的習(xí)慣。
OpenAI 此前曾探索過多種水印方案,例如在 2024 年初為 DALL?E 3 圖像添加 C2PA 元數(shù)據(jù),以及 2025 年 4 月在 GPT-4o 模型上測試可見的“ImageGen”標(biāo)簽。
行業(yè)內(nèi),谷歌的 SynthID、微軟的元數(shù)據(jù)嵌入和 Meta 的強制標(biāo)簽也反映出對內(nèi)容溯源的重視,但研究顯示許多水印技術(shù)易受攻擊。
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補充。