FIND研究員:蕭宏智
資本市場寒冬,生成式AI異軍突起
2022年美國聯準會為打壓通膨,開始加速升息步伐,因而墊高資金成本,對新創投資趨於保守。資本市場寒冬下,生成式AI新創卻逆勢而起,屢屢創下鉅額募資的佳績。以生成行銷文案為業務主軸的Jasper AI,在A輪募資取得1.25億美元,市場估值15億美元;另一家開發圖像生成開源模型的Stability AI,宣布完成1.01億美元種子輪融資,估值也站上10億美元,與Jasper AI同樣躋身獨角獸的行列。就如同今(2022)年9月紅杉資本(Sequoia Capital)發表之《生成式AI:一個創造性的新世界》報告所說,生成式AI雖蘊藏巨大市場潛力,各領域的應用仍方興未艾,我們不期待人工智慧可以寫出像托爾斯泰那樣的曠世巨著,但可以確定生成式AI將是新一輪典範移轉的開端。
資料來源:Jasper AI
圖一、Jasper AI官網首頁
深度學習模型驅動生成式AI發展
生成式AI之所以在這一兩年來快速發展,主要是因為生成對抗網路(Generative Adversarial Network)、生成擴散模型(Diffusion Model)、基礎模型(Foundation Model)等深度學習技術的突破。其中生成對抗網路與生成擴散模型都有助於生成更為細緻逼真的圖形或影像,兩者差別在於生成對抗網路要先建立生成器(Generator)和判別器(Discriminator)兩種神經網路,透過彼此攻防對抗來生成圖像;生成擴散模型則運用熱力學擴散原理,透過連續添加噪訊來破壞訓練圖像,直到圖片變成完全雜訊,再將此步驟逆向還原以生成圖像,因此無須判別器的輔助。
驅動生成式AI更重要的關鍵,在於基礎模型的興起,基礎模型係由史丹福大學教授李飛飛在2021年聯合百餘位學者發表並命名。以往深度學習模型多半聚焦在單一領域,只能解決特定問題。基礎模型先蒐集大規模未標記的數據樣本,並透過預訓練(Pre-training),建構具通用性的深度學習模型,之後再進行模型參數微調,就可以勝任不同任務,應用於更多元的落地場景。以OpenAI開發的GPT-3生成模型為例,調整參數高達1,750億個,運用GPT-3可自動生成程式碼、個人履歷、行銷文案、文章閱讀摘要等。
生成式AI落地應用與產業現況
結合上述生成對抗網路、生成擴散模型、基礎模型等深度學習技術,不但可生成文本,更可以從文字生成圖形、聲音、影像、3D模型等,在不同媒介之間轉換,成為跨領域、多模態(Multimodal)內容生成的通才。根據Gartner發布之2022年重大技術趨勢,生成式AI將造就下一波生產力革命,成為未來企業數位創新的引擎,預估到2025年生成式AI產製的內容將佔所有數位內容10%。此外,Gartner也指出,從技術成熟度曲線(Gartner Hype Cycle)來看,生成式AI已跨越新興科技的促動期,邁向高峰期,未來將進入主流市場採用階段。
紅衫資本盤點目前生成式AI之落地應用場景,主要分為文本生成、圖像生成、語音生成、影像生成、3D建模、程式碼自動撰寫等不同類別。以圖像生成、文本生成與程式碼自動撰寫相關應用較為成熟,投入業者也較為踴躍,其中圖像生成可用於社群經營、媒體廣告、平面設計等;文本生成可用於行銷文案、產品販售、客服支援與一般寫作等;程式碼撰寫除了產生程式代碼,還可以生成軟體說明文件、網頁/App或資料庫SQL指令等。
以下列舉兩家國外具代表性的生成式AI業者,以勾勒現階段生成式AI的產業發展現況,包括Github Copilot藉由AI自動生成程式碼,還有OpenAI推出熱門的圖像生成工具DALL-E 2。
Github是全世界最大的開放原始碼社群與協同合作平台,2021年Github結合GPT-3生成模型,提供Github Copilot服務,程式設計師只要描述想要實現的演算邏輯,Copilot就可以理解並生成相對應的程式碼,且支援包括Python、JavaScript、TypeScript、Ruby等主流程式語言。
OpenAI是總部位於美國舊金山的人工智慧實驗室,2019年微軟投資10億美元,2020年OpenAI開發出GPT-3生成模型,並由微軟取得獨家授權。OpenAI在今(2022)年推出圖像生成工具DALL-E 2,繼Midjourney之後,引爆AI圖像生成風潮,OpenAI在今年9月表示,有超過150萬名用戶每天使用DALL-E 2,創建超過200萬張的圖像,用戶包括藝術家、創作者與創意總監。借助生成式AI強勁的增長力道,微軟更在2022年產品發表會,宣布其新款的平面設計軟體Microsoft Designer將納入DALL-E 2技術,使用者可根據輸入文字,自動生成情境圖畫與視覺版型。
資料來源:Sequoia Capital
圖二、生成式AI落地應用與產業現況
既競爭又合作的產業發展格局
依生成式AI近年來的發展態勢,已清楚看出從使用者生成內容(User Generated Content)到人工智慧生成內容(AI Generated Content)的脈絡,未來幾年隨XR虛擬體驗時代的來臨,對於沈浸式內容的需求更為迫切,進一步帶動AI生成影像、視訊或3D模型之應用。
此外,生成式AI是以基礎模型為底層技術,若將生成式AI簡單分為基礎層與應用層,就基礎層而言,可以發現包括微軟、谷歌、百度、阿里巴巴等科技巨頭都競相投入或支持基礎模型的研發,形成算法、算力與數據的軍備競賽;就應用層來說,未來將有更多新創業者尋求與大型科技平台合作,在不同領域發展落地應用與解決方案,共創商業生態系。
資料來源:
1.封面照片為筆者運用OpenAI DALL-E 2生成人工智慧意象圖
https://openai.com/dall-e-2/
2.紅杉資本發布之研究報告《生成式AI:一個創造性的新世界》
Generative AI: A Creative New World | Sequoia Capital US/Europe
3.生成對抗網路(Generative Adversarial Network)技術原理
https://en.wikipedia.org/wiki/Generative_adversarial_network
4.生成擴散模型(Diffusion Model)技術原理
https://en.wikipedia.org/wiki/Diffusion_model
5.基礎模型(Foundation Model)技術原理
https://en.wikipedia.org/wiki/Foundation_models
6.Gartner發布之2022年重大技術趨勢報告
The Gartner Top 12 Strategic Technology Trends for 2022