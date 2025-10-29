國科會補助台大教授王鈺強（右2）團隊，針對生成式AI提出「概念抹除」技術「Receler」，能精準切斷AI連結到暴力、色情乃至侵權內容等風格，有助AI正向發展。（國科會提供）

生成式AI興起改變人類社會，不只自動撰文，更應用到圖像生成與模擬，卻帶來侵權、濫用及倫理挑戰；國科會補助台灣大學電機系教授王鈺強團隊，開發「概念抹除（concept erasing）」技術「Receler」，免重新訓練，就讓AI模型精準切斷高風險概念聯想，避免血腥暴力、深偽換臉，讓AI「不學壞」。

王鈺強表示，自身專長在電腦視覺，生成式AI雖方便，如之前ChatGPT可用來生成吉卜力風格的繪圖，然此舉恐侵犯藝術家版權，以及「Deepfake」深偽技術可以把明星、政治人物換臉，從而產生詐騙或色情影像，以及AI也恐被濫用生成血腥暴力內容等，皆帶來種種問題。

但如果AI模型要避免上述違法內容，只靠關鍵字或人工審核，往往出現漏洞或誤攔情況，王鈺強說，在不重新蒐集資料跟重新訓練AI模型之下，團隊研發出概念抹除技術「Receler」，是具有交叉注意力機制的概念橡皮擦（Concept Eraser），結合對抗性機器學習（Adversarial Learning）技術，能精準抹除高風險概念、保留原始AI模型創作能力。

王鈺強舉例，當AI模型使用Receler技術避免「暴力」、「裸露」或｢特定藝術風格｣等概念，輸入相關的直白或隱喻指令時，模型將不會輸出上述概念的圖片，使AI「不學壞」，更同時不會犧牲AI模型的多樣性與細節品質。該項成果在去年9月發表於歐洲計算機視覺會議 （ECCV），僅一年的論文被引用已逾60次。

國科會工程處長洪樂文表示，AI工具若不去特別防範，有時候難以避免會生出具有爭議內容，而藉由該團隊的Receler技術，能精確切斷連結的風險內容，對AI發展至關重要，該技術在網路上的開源模型也受到廣泛使用，具有良好的貢獻跟影響力。

台大電機系教授王鈺強團隊針對生成式AI開發出概念抹除技術「Receler」，相比原始模型，AI能避免生成裸露、特定藝術繪畫風格以及特定物品等，有助AI未來正向發展。（王鈺強提供）

