追新聞 The Chaser News
4.88K subscribers
7.2K photos
6 videos
6.02K links
Download Telegram
//人工智能(AI)聊天軟件連月熱爆,美國《華盛頓郵報》與艾倫人工智能研究所合作研究多個AI模型使用的Google數據集「C4」資料來源,整理出約1,000萬個網站的資料。不少香港網站也被列入參考,其中來自香港政府新聞網的資訊,在資料庫中約有92萬個「Token」(業內術語,可理解為AI程式內的字元單位,每個Token約相當於0.5個中文字),英文傳媒Hong Kong Free Press則有180萬個Token,估計冠絕香港傳媒,已結束的「立場新聞」亦有約16萬個Token,至於仍留存於香港的中文傳媒,暫則以香港獨立媒體的6.2萬個Token佔優。

人工智能無法像人類一樣學習,只是從不同網站獲取資料,再轉化為人類語言,才能跟人類用戶「聊天」。Google「C4」是其中一個AI模型常用的數據庫,目前Google和Facebook的語言模型都會參考其資料。《華郵》和艾倫人工智能研究所發現「C4」背後約有1,500萬個網站,當中約1,000萬個找到來源,以及數據庫從這些網站輸入的Token數量。//

【Google AI數據庫曝光 HKFP港媒來源最多勝《南早》 「立場」仍留存16萬Token】

全文請到《追新聞》網站閱覽
https://thechasernews.co.uk/google-ai數據庫曝光-hkfp勝南早-立場留16萬token/

#C4數據集 #人工智能 #立場新聞 #香港獨立媒體 #蘋果日報 #追新聞 #TheChaser
===========
報道無罪 知情有價 請即訂閱《追新聞》:
💰 Patreon|https://www.patreon.com/thechasernews
🔗 網站|https://thechasernews.co.uk/
📺 YouTube|https://www.youtube.com/channel/UC5l18oylJ8o7ihugk4F-3nw
📷 Instagram|https://www.instagram.com/the_chaser_news/
🌐 Facebook|https://www.facebook.com/the.chaser.news
💬 Telegram Channel|https://t.me/the_chaser_news
☕️ ko-fi|https://ko-fi.com/thechasernews