什麼是生成式AI
人工智慧(artificial intelligence, AI)其實是許多技術的合稱,生成式(generative AI)是其中的一類,誤認生成式AI等同於AI,或是誤認為AI的技術僅限於生成式AI的範疇,都是不正確的。AI核心技術之一的類神經網路(neural network, NN)本質上是一種統計技術,藉由現代IC技術與平行計算技術的輔助,使用諸如GPU之類的多核心計算軟硬體,可以統計恆河沙等級的資料,並找出資料之間蛛絲馬跡般的關聯性,運用這個統計而得的AI模型,就可以做到「預測」和「生成」,這便是生成式AI的原理。
常見的生成式AI
同樣的概念也可以套用在各種類型的資料上,例如大語言模型(large language model, LLM)統計海量的文字資料以後,可以統計出在什麼樣的上下文和語境下,某一句話的下一句話有多大的機率會是什麼,於是當我們要AI編纂一篇文章的時候,我們只要給一些提示,它就可以接連不斷地生成許多語句、構成一篇文章,問它問題,它就會給答案並解說;例如統計繪圖的步驟,在什麼樣的描述下,某個點的附近會補上什麼顏色的點;又或例如統計大量的樂譜,在什麼曲風之下,各小節音符的走向,運用統計而得的AI模型,於是我們便獲得了「文生圖」、「文生曲」之類的AI功能。在同樣的框架之下,我們還可以獲得AI寫程式、AI做簡報、AI做網頁等等的生成式AI技術。
除了統計大量的資料產生符合大眾風格的生成式AI模型以外,也可以統計特定時代或特定人物的風格,產生能夠「模仿」特定風格的生成式功能,例如藉由統計某人的用字遣詞、發聲風格、表情習慣,可以虛構出某人演說或歌唱的聲音或影片。除此之外,如果統計的目標物不在於接續的媒體內容,而是當事人說出這些話或寫下這些文字時的「意圖(intention)」,例如進行「當他說這些話的時候,他想要的是……」這樣的統計,那麼獲得的模型將會是一個可以理解人類語言的AI助理。
生成式AI的應用
生成式AI技術的相關應用,最直覺的當然是讓AI來代替人們寫作、繪圖、作曲等等,生成各種媒體內容的應用,除了圖片和文字之外,影片、程式、簡報、網頁等等的各樣產物也都在生成之列,而且逐漸融入大眾日常使用的編輯工具當中,例如文書軟體內建生成部分文字和簡報的功能,繪圖軟體內建生成部分畫面物件的功能。除了生成內容之外,前面提到的AI助理功能也即將無所不在,例如網頁搜尋引擎以AI助理作為輸入,使用者是問它問題、要求它搜尋相關內容並統整為一篇報告,而不是下關鍵字再自行逐篇檢閱搜尋結果。此外還有兩個重磅的應用領域是客戶服務和語言教育,前者接收客戶的提問,然後根據以相關知識文章或教戰手冊統計出的AI模型進行回答或建議後續動作。後者是接收學生的語音或文字,運用既有的大語言模型進行對話、偵錯,或是建議更好的表達及寫作方法。
成為生成式AI的主人而非被取代
生成式AI的相關產品已經日新月異且不勝枚舉,一度讓人擔憂創作者們是否會遭AI取代,但是請記得,生成式AI的原理畢竟是大數據模型的統計建立與運用,它可以在模仿人類的生產與行為方面達到維妙維肖、真假難辨的程度,但畢竟只是「知其然而不知其所以然」的模仿,在生成這些內容的過程中,生成式AI技術是沒有任何策略思考、沒有任何知識推演,甚至不知道結果正確與否的,所以人類的行為可以被生成式AI模仿,但專業素養目前沒辦法被AI取代。在AI助理方面,基於現有手冊或紀錄的基本應對可以被AI取代,但是遇到未知的狀況時,人類能統整跨領域資源並隨機應變的能力,目前還沒辦法被AI取代。所以我們若要成為一個使用AI而非被取代的人,充實專業素養、培養統整與應變能力,是最主要的自我成長方向。