跳到主要內容

AI發展卡關 業者摸索新模式

經濟日報/A7版/國際
編譯吳孟真╱綜合外電
2024年11月12日   人氣: 231   開始朗讀

網路識讀

隨著用來訓練人工智慧(AI)的大型語言模型(LLM)進步速度變慢,OpenAI和其他AI業者正透過開發新的訓練方法,尋求克服AI模型發展瓶頸的方式,這可能重塑AI硬體的競爭版圖。

 

路透報導,ChatGPT問世後,科技業者不斷對外宣稱,透過更多數據和算力來「擴大」現有模型,定能持續改善模型。如今一些最傑出的AI科學家卻說,這個「大就是好」的觀點有其限制。

 

LLM每一輪的訓練都可能耗費數百萬美元,也較容易出現由硬體造成的故障,且研究人員要在可能長達數個月的訓練期結束後,才知道模型的最終效能。

 

另外,LLM需要大量數據,而目前的AI模型已用盡世上所有容易取得的數據。再者,訓練模型需要大量能源,各地電力短缺的情況,也使訓練受阻。

 

為克服這些困難,研究人員正探索一個能在推論階段,提升現有AI模型的方法,稱為「測試時運算」(test-time compute)。此方法讓AI模型能將更多力氣用在特定的困難任務上。

 

OpenAI已在其最新發表的模型「o1」中使用此方法。o1能用類似人類推理的方式,多步驟「思考」問題。知情人士表示,其他AI業者如Anthropic、xAI和Google DeepMind,也都開始發展這種方法的自家版本。

 

相關文章

知道網路風險,卻仍踏入陷阱? 你知道孩子上網都在做什麼嗎?
知道網路風險,卻仍踏入陷阱? 你知道孩子上網都在做什麼嗎?

「其實孩子們都不笨。」受訪的內政部警政署刑事警察局詐欺犯罪防制中心隊長洪丞奇語氣平穩,卻帶著一絲複雜的感受。他接著說:「外界常以為會去當車手的孩子,都是家裡有狀況、缺乏資源,然而我們的統計並不是這樣。真正因為家庭功能不彰而涉案的孩子,不到兩成,其餘八成都是再普通不過的家庭,家裡沒有特別辛苦,也不是因為缺錢。」那為什麼這些學生還要冒險去從事這樣的違法行為呢?

認識Deepfake技術及其應用與風險
認識Deepfake技術及其應用與風險

俗稱「AI換臉」的Deepfake技術又稱為「深偽技術」,它是深度學習(deep learning)與偽造(fake)的混成字,意指一類利用深度學習技術進行逼真的人像影像合成的技術。Deepfake技術之所以引起全世界如此重視的原因,在於它的相關軟體可以讓一般人輕鬆地取得,並且運作於一般的個人電腦或行動裝置上,因此各種相關的善意或惡意的應用方式層出不窮,迫使這個世界必須嚴肅看待Deepfake技術帶來的巨大衝擊。

相關影片

氣噗噗大挑戰
氣噗噗大挑戰
如果短影音是…
如果短影音是…
另一個我
另一個我
有圖有真相?
有圖有真相?

返回網路識讀新聞列表

頁首