跳至主要内容

科技週刊-第一期

這週科技圈有許多產品發佈會,包含OpenAI與Google公司皆相繼公佈令人振奮的新產品與更新。接著就讓我們一起跟著程式貓的步伐,一起來了解這些即時新聞吧 !

一、彷彿電影再現!chat-GPT再推新功能!

就在前不久,Open-AI在新的發表會上展出了他們新的AI模型:chat-GPT 4 ommi,並直接在直播上當場展出他與過往差距最大,也最具特色的功能:能直接用語音與使用者對話。 令人驚嘆的新功能與技術革新

在發表會上,開發人員直接在手機上使用「即時語音功能」與AI對話,令人意外的是,chat-GPT不但在短時間內做出回應,其發出來的聲音也彷彿真人一般有起伏、有感情,並且面對許多惡搞般的問題,新的chat-GPT也都對答如流,並展現出他能夠切換多種不同聲線,用來達到使用者的需求。

另外在一系列的功能展示中,Open-AI也展示了chat-GPT 4o的圖片識別功能,以及解答數學問題的能力,並且能以像是老師的口吻,仔細地引導使用者解出題目。在官網中更是展現了作曲作詞與唱歌的能力。 科幻情節逐漸實現的現在與未來...

這次的新功能讓不少人想起了2013年的科幻電影「Her」,幾乎等於0的延遲、富含感情的聲線、口語化的文字,令人很難想像這只是個AI,也令人期待未來Open-AI還能推出什麼樣的技術創新。

GPT-4o 文字和圖像功能已經開始支援 ChatGPT,一般用戶可免費使用,未來幾週內則會為 ChatGPT Plus 用戶推出具新版語音模式的 GPT-4o alpha版,感興趣的各位也不妨試試看喔!

/ 渡鴉編

二、科幻成真?日本搭乘型機器人「ARCHAX」即將開放購買!

從小就開始看動畫的各位,想必對於日本機器人動畫都不會太陌生,擁有一台屬於自己的巨大機器人更是許多孩子的夢想,而現在日本企業「Tsubame Industry」(暫譯燕工業)則幫各位完成了夢想!

具備多項技術的「始祖鳥」 燕工業於去年打造出了4.5公尺高的載具機器人「ARCHAX」,並在2023年10月底於日本交通展展出。ARCHAX名子取自始祖鳥的學名,機體高4.5公尺,重3.5噸,並且透過簡單的變形機構,可以切換成「車輛模式」與「仿人形模式」,車輛模式下可達到最高時速可達10公里,動力採用電池驅動,並透過9個鏡頭與駕駛艙中4個螢幕的配合,實現多視角的切換,並且透過搖桿與觸控螢幕的精密操作,甚至能夠達到五指全可動手的操控。

圖片

(仿人形模式)

(車輛模式) (圖片取自官方網站:https://tsubame-hi.com/en/the-archax/) 不可或缺的安全機制

圖片

安全方面,ARCHAX在許多操控角度上都設有安全限制,一旦超過限制就會停止運作,駕駛艙內的操控安全、逃生艙等也都有達到工業標準,足以保障駕駛員的安全。 需要大量財力與毅力的夢想

圖片

聽到以上介紹,有夢的各位是不是很興奮呢?不過想購買的話,可能要先擁有不見底的荷包才行。由於高昂的造價,一台ARCHAX的價格高達4億日圓(約8600萬台幣)。不僅如此,由於操控複雜,還需要經歷長時間的專業訓練,得到許可證後才得以駕駛,另外由於不符合法規規範,ARCHAX也不能正式上路。 年輕有為的社長與未來展望

圖片

燕工業的25歲社長吉田龍央表示,現在ARCHAX的客群鎖定在擁有大量金錢的機器人愛好者,不過未來仍然會精進技術,也期望未來自家的機器人能被運用到各大災害的救災、太空領域的運用等方面,也讓我們期待這位年輕的社長,未來能帶領公司做出什麼樣子的機器人。

圖片

/ 渡鴉編

三、Google IO 大會

IO大會是Google公司的年度盛會,今年已經於5/15順利落幕,主題圍繞著生成式AI討論。這次Google為我們帶來許多重磅產品,一路從AI的模型升級到新模型發佈,再到圖片生成以及Android 15 系統升級:

(一) Gemini 1.5 Flash: 這是一個更加輕量化的大型語言模型,在提升效率的同時還節省能耗,會環保盡一份心力。這個新模型支持上下文共一百萬的token數量,將一舉刷新GPT4的紀錄成為業界最高。

(二) Project Astra: 基於多模態的AI代理服務。這將改變原先以文字為主的AI互動方式。這項功能正式推出後,將未人類的生活帶來一定程度的品質提升。未來將能夠透過拍照等方式直接與AI互訂,不侷限以文字的方式。這也就意味著我們有機會與AI打電話,甚至是視訊電話。

(三) Imagen 3 : 下一代的文生圖大模型,效能與品質甚至比業界目前領先的Midjourneye更好。這個全新的模型將具有更好的推理效果,能夠處理過往較如意出錯的部分,如手指文字等。20日將於 Vertex 開放部分用戶使用!

(四) Veo: 全新推出的影片生成模型,對標 OpenAI 的 Sora 模型。Veo 模型可以以高畫質生成長達數分鐘的影片,其品質堪比好萊屋電影,去除以往AI影片生成時會有的物理瑕疵或邏輯問題。

(五) Android: 最新一代的安卓系統將全面搭載 Gemini 大模型,透過 Nano直接在手機上執行本地運算。全面整合系統的 AI 未來將能夠協助用戶處理各個 APP ,甚至還夠分辨詐騙電話!同時系統還提供圈選搜尋、AI 螢幕截圖分析等強大的新功能。

/ YD編