限制級

您即將進入之新聞內容需滿18歲方可瀏覽。

根據「電腦網路內容分級處理辦法」修正條文第六條第三款規定，已於網站首頁或各該限制級網頁，依台灣網站分級推廣基金會規定作標示。台灣網站分級推廣基金會（TICRF）網站：http://www.ticrf.org.tw

首頁　>　國際

拒訓練AI 新聞媒體封殺ChatGPT

螢幕上顯示生成式人工智慧機器人ChatGPT和開發公司OpenAI的標誌。（法新社檔案照）

2023/08/26 05:30

〔編譯管淑平／綜合報導〕生成式人工智慧機器人ChatGPT的資料取用愈加受到爭議，包括紐約時報、有線電視新聞網（CNN）、路透及澳洲廣播公司（ABC）知名新聞機構，都已封鎖開發ChatGPT的OpenAI，利用網路爬蟲程式擷取其網站內容，用於訓練AI系統。

英國衛報廿五日報導，OpenAI的網路爬蟲程式「GPTBot」會掃描網頁，收集資料，用於AI大型語言模型以及內容生成。科技媒體「Verge」披露紐時封殺GPTBot的消息後，衛報進一步發現，包括CNN、路透、芝加哥論壇報、澳洲廣播公司（ABC）和澳洲社區新聞集團（ACM）也都已禁止網路爬蟲在其網站抓取資料。

從這些網站的robots.txt檔案中可見允許網路爬蟲程式造訪哪些頁面的程式碼。報導指出，這些新聞媒體都是在八月加入封鎖指令，除了ChatGPT，也不讓同樣用於AI的開放網路資料庫Common Crawl的網路爬蟲CCBot訪問網頁。

像ChatGPT所用的大型語言模型，仰賴收集龐大資訊來訓練，使其能夠以類似人類語言模式回答使用者的問題，但是運作這些AI機器人的公司，對於其資料庫中儲存有版權內容的問題，都緊守口風。