科技週刊-第十五期

一、AI革新！ChatGPT推新模型o1，學會推理的模型會降低幻覺嗎？

不久之前的9/12日OpenAI正式宣布旗下最先進的模型o1已經推出，震撼了整個行業。ChatGPT作為當前世界上最多人使用的AI服務，想必也不需要多做介紹了，而今天推出超越原先水準的全新模型，也決定不延續過往的命名序號，採用從頭開始的「o1」可見他們對模型技術進步的自信。

「o1」採用思維鏈的架構去設計，能有效的提升模型的思考能力。就像我們在寫數學問題時總是先從列式、化簡、計算後才會得到答案，而不是直接通靈的得到答案一樣，AI模型也需要思考，也需要一步一步的推理出答案。一般來說人們在遇到大型的計劃的時候也會寫計畫書、時程表來統整整個流程，將項目拆分成許多細項方便執行，現在o1也會拆分大家的問題，針對每一個子問題去思考、推理並回答。

根據官方的說法，全新的「OpenAI o1」大模型在物理、生物、化學的科學領域取得重大進展，能夠達到「博士」相似等級；同時在數學與程式設計領域也都有大幅進步。在國際數學奧林匹克競賽(IMO)中這個新模型答對了83%的分數，相較舊模型的13%有相當巨大的進步。

如果你是ChatGPT Plus 用戶的話現在就可以在選單中體驗全新的o1大模型了，如果不是訂閱用戶也沒關係，官方已經承諾將在不久之後向免費用開放使用。目前模型處於預覽版，取多配套功能似乎尚未開發完善，因此也不需要著急為了體驗而去開通，可以先靜靜地觀望官方的動作，但可以肯定的是這次模型的推出象徵一個新時代的來臨，也給予其他努力追趕他們的其他公司如Google、亞馬遜等公司更巨大的壓力。

除了使用者有感的升級外，OpenAI也是釋出一系列研究數據給大眾閱讀，其中就包括了大型語言模型(LLM)的潛力，以及各項評估指標。還有各項安全性檢核的分數，有興趣觀看全文的可以自行前往官網閱讀，我們這裡只放上幾張圖給各位參考。

延伸閱讀: OpenAI o1 簡介、OpenAI 數據與評估

一、AI革新！ChatGPT推新模型o1，學會推理的模型會降低幻覺嗎？​

一、AI革新！ChatGPT推新模型o1，學會推理的模型會降低幻覺嗎？