跳至主要内容

科技週刊-第十五期

一、AI革新!ChatGPT推新模型o1,學會推理的模型會降低幻覺嗎?

不久之前的9/12日OpenAI正式宣布旗下最先進的模型o1已經推出,震撼了整個行業。ChatGPT作為當前世界上最多人使用的AI服務,想必也不需要多做介紹了,而今天推出超越原先水準的全新模型,也決定不延續過往的命名序號,採用從頭開始的「o1」可見他們對模型技術進步的自信。

圖片

「o1」採用思維鏈的架構去設計,能有效的提升模型的思考能力。就像我們在寫數學問題時總是先從列式、化簡、計算後才會得到答案,而不是直接通靈的得到答案一樣,AI模型也需要思考,也需要一步一步的推理出答案。一般來說人們在遇到大型的計劃的時候也會寫計畫書、時程表來統整整個流程,將項目拆分成許多細項方便執行,現在o1也會拆分大家的問題,針對每一個子問題去思考、推理並回答。

根據官方的說法,全新的「OpenAI o1」大模型在物理、生物、化學的科學領域取得重大進展,能夠達到「博士」相似等級;同時在數學與程式設計領域也都有大幅進步。在國際數學奧林匹克競賽(IMO)中這個新模型答對了83%的分數,相較舊模型的13%有相當巨大的進步。

圖片

如果你是ChatGPT Plus 用戶的話現在就可以在選單中體驗全新的o1大模型了,如果不是訂閱用戶也沒關係,官方已經承諾將在不久之後向免費用開放使用。目前模型處於預覽版,取多配套功能似乎尚未開發完善,因此也不需要著急為了體驗而去開通,可以先靜靜地觀望官方的動作,但可以肯定的是這次模型的推出象徵一個新時代的來臨,也給予其他努力追趕他們的其他公司如Google、亞馬遜等公司更巨大的壓力。

除了使用者有感的升級外,OpenAI也是釋出一系列研究數據給大眾閱讀,其中就包括了大型語言模型(LLM)的潛力,以及各項評估指標。還有各項安全性檢核的分數,有興趣觀看全文的可以自行前往官網閱讀,我們這裡只放上幾張圖給各位參考。

延伸閱讀: OpenAI o1 簡介OpenAI 數據與評估

圖片
圖片