跳到主要內容

AI發展卡關 業者摸索新模式

經濟日報/A7版/國際
編譯吳孟真╱綜合外電
2024年11月12日   人氣: 315   開始朗讀

網路識讀

隨著用來訓練人工智慧(AI)的大型語言模型(LLM)進步速度變慢,OpenAI和其他AI業者正透過開發新的訓練方法,尋求克服AI模型發展瓶頸的方式,這可能重塑AI硬體的競爭版圖。

 

路透報導,ChatGPT問世後,科技業者不斷對外宣稱,透過更多數據和算力來「擴大」現有模型,定能持續改善模型。如今一些最傑出的AI科學家卻說,這個「大就是好」的觀點有其限制。

 

LLM每一輪的訓練都可能耗費數百萬美元,也較容易出現由硬體造成的故障,且研究人員要在可能長達數個月的訓練期結束後,才知道模型的最終效能。

 

另外,LLM需要大量數據,而目前的AI模型已用盡世上所有容易取得的數據。再者,訓練模型需要大量能源,各地電力短缺的情況,也使訓練受阻。

 

為克服這些困難,研究人員正探索一個能在推論階段,提升現有AI模型的方法,稱為「測試時運算」(test-time compute)。此方法讓AI模型能將更多力氣用在特定的困難任務上。

 

OpenAI已在其最新發表的模型「o1」中使用此方法。o1能用類似人類推理的方式,多步驟「思考」問題。知情人士表示,其他AI業者如Anthropic、xAI和Google DeepMind,也都開始發展這種方法的自家版本。

 

相關文章

你知道,你的孩子看了什麼嗎?
你知道,你的孩子看了什麼嗎?

網路影音、動畫與遊戲是許多孩子與家長喜歡享受的休閒娛樂,尤其是可以挑選多元的影片類型、不受限傳統電視的播放時間。漸漸地,孩子觀看網路影片的時間甚至比電視還多。打開手機或平板電腦的影音頻道,讓孩子觀看網路影片,有時更變成一種陪伴孩子或讓孩子「平靜」的新方式。不過,你知道你的孩子看了什麼嗎?

辨識網路健康資訊,你可以怎麼做? -從COVID-19訊息疫情談起-
辨識網路健康資訊,你可以怎麼做? -從COVID-19訊息疫情談起-

隨著COVID-19疫情爆發,「資訊疫情」(infodemic)隨起流行,過量資訊如傳染般地擴散,其準確性卻有待商榷。誤導性的健康資訊與其他形式的不準確內容(例如:政治錯誤訊息)不同,因其傳播者通常會透過銷售產品或提供服務來獲取經濟利益。例如,許多TikTok網紅在沒有受過正規的醫學培訓下,向數百萬觀眾推廣口服避孕藥;在沒有科學依據的情況下,聲稱飲用以水稀釋的硼砂可治療癌症......

相關影片

氣噗噗大挑戰
氣噗噗大挑戰
如果短影音是…
如果短影音是…
另一個我
另一個我
有圖有真相?
有圖有真相?

返回網路識讀新聞列表

頁首