為達最佳瀏覽效果,建議使用 Chrome、Firefox 或 Microsoft Edge 的瀏覽器。

請至Edge官網下載 請至FireFox官網下載 請至Google官網下載
晴時多雲

限制級
您即將進入之新聞內容 需滿18歲 方可瀏覽。
根據「電腦網路內容分級處理辦法」修正條文第六條第三款規定,已於網站首頁或各該限制級網頁,依台灣網站分級推廣基金會規定作標示。 台灣網站分級推廣基金會(TICRF)網站:http://www.ticrf.org.tw

拒訓練AI 新聞媒體封殺ChatGPT

螢幕上顯示生成式人工智慧機器人ChatGPT和開發公司OpenAI的標誌。(法新社檔案照)

螢幕上顯示生成式人工智慧機器人ChatGPT和開發公司OpenAI的標誌。(法新社檔案照)

2023/08/26 05:30

〔編譯管淑平/綜合報導〕生成式人工智慧機器人ChatGPT的資料取用愈加受到爭議,包括紐約時報、有線電視新聞網(CNN)、路透及澳洲廣播公司(ABC)知名新聞機構,都已封鎖開發ChatGPT的OpenAI,利用網路爬蟲程式擷取其網站內容,用於訓練AI系統。

英國衛報廿五日報導,OpenAI的網路爬蟲程式「GPTBot」會掃描網頁,收集資料,用於AI大型語言模型以及內容生成。科技媒體「Verge」披露紐時封殺GPTBot的消息後,衛報進一步發現,包括CNN、路透、芝加哥論壇報、澳洲廣播公司(ABC)和澳洲社區新聞集團(ACM)也都已禁止網路爬蟲在其網站抓取資料。

從這些網站的robots.txt檔案中可見允許網路爬蟲程式造訪哪些頁面的程式碼。報導指出,這些新聞媒體都是在八月加入封鎖指令,除了ChatGPT,也不讓同樣用於AI的開放網路資料庫Common Crawl的網路爬蟲CCBot訪問網頁。

像ChatGPT所用的大型語言模型,仰賴收集龐大資訊來訓練,使其能夠以類似人類語言模式回答使用者的問題,但是運作這些AI機器人的公司,對於其資料庫中儲存有版權內容的問題,都緊守口風。

籲為生成式AI制定規範

CNN向澳洲版衛報證實,近期封鎖了GPTBot的訪問權。路透發言人說,「智慧財產是我們業務的命脈,我們勢必要保護我們的內容版權」。紐時發言人說,網站服務約定條款最近更新,「更清楚表明禁止抓取我們的內容,用於AI訓練和開發」。

ChatGPT刮起生成式人工智慧機器人旋風後,全球新聞機構都正面臨是否使用人工智慧於新聞收集,以及其新聞內容可能會被收集用於訓練AI的問題。法新社和Getty Images等新聞、出版組織日前才簽署公開信,呼籲為生成式AI機器人制定規範,包括「生成AI模型所用訓練的所有內容透明度」,以及使用有版權內容,須取得版權所有人同意等。

不用抽 不用搶 現在用APP看新聞 保證天天中獎  點我下載APP  按我看活動辦法

國際今日熱門
看更多!請加入自由時報粉絲團

網友回應

載入中
此網頁已閒置超過5分鐘,請點擊透明黑底或右下角 X 鈕。