人氣 48

領導人是習近平?中研院語言模型出包

#習近平 #中研院 #語言模型 #ChatGPT #CKIP-Llama-2-7b #中華人民共和國 #地方
中國時報記者林志成/台北報導
 
中央研究院近日推出類似ChatGPT的繁體中文語言模型CKIP-Llama-2-7b,有網友測試問「我國領導人是誰?」語言模型回答「國家主席習近平」,進一步問「我國法律是?」語言模型回答「中華人民共和國憲法」。該語言模型被踢爆都持大陸觀點回答後,中研院9日緊急將其下架。
 
CKIP-Llama-2-7b是中研院詞庫小組(資訊所及語言所共同成立)開發的繁體中文大型語言模型,可作為學術使用或商業使用,應用於文案生成、文學創作、問答系統、客服系統、語言翻譯、文字編修、華語教學等。
 
 

 

中央研究近日推出繁體中文語言模型CKIP-Llama-2-7b,被外界質疑總是以大陸觀點來回答問題,9日緊急下架。圖/中時資料照片

中央研究近日推出繁體中文語言模型CKIP-Llama-2-7b,被外界質疑總是以大陸觀點來回答問題,9日緊急下架。(本報資料照片)

 

 
近日有不少網友測試,語言模型都以大陸觀點給答案。譬如問「我國領導人是誰?」語言模型回答「國家主席習近平」;發問「國慶日是何時?」獲回覆是每年10月1日、大陸國慶日。專家認為該語言模型都採用大陸資料,最後進行「簡轉繁」而已。
 
中研院資訊所發聲明說,CKIP-LlaMa-2-7b並非「台版chatGPT」,且無關國科會正在發展的「可信任人工智慧對話引擎」(TAIDE)。研究目標之一是讓meta開發的Llama 2大型語言模型具備更好的繁體中文處理能力。
 
中研院資訊所說,這項小型研究僅花約30萬元,自動化分析明清人物的生平,建構自動化的歷史人物、事件、時間、地點等事理圖譜,因此訓練資料除了繁體中文的維基百科,另包含台灣的碩博士論文摘要、來自大陸開源的任務資料集COIG、詩詞創作、文言文和白話文互相翻譯等閱讀理解問答。
 
中研院資訊所說,由於是一項個人小型研究,各界對該模型的提問測試,並未在原始研究範疇。因生成式AI易產生「幻覺」,模型產生內容出乎預期,也是未來要努力改善的地方,研究人員9日已先下架測試版,未來相關研究及成果釋出會更謹慎。
 
林志成∕台北報導

熱銷建案&網友看屋心得



好房網不只有新聞,還能找優質宅

好房網News粉絲團

成為好房網Line好友

★好房網HouseFun,加我好友,房產最新消息每天整理給你→點我

★好房網HouseFun,加我好友,房產最新消息每天整理給你→點我

頭版 總覽 圖輯 名家 專題 土壤液化 好房網TV 樂生活