誰說AI不具美感?以生成式AI的方法來評定藝術品的美感


【人資e周刊】內容包含最新勞工政策解析、企業管理進修、人事聘用秘方,希望您的疑難雜症能獲得解決之道。 【東寫西讀電子報】摘錄《好讀周報》精彩話題,以推廣閱讀與寫作為核心內容,讓您掌握每周最新內容!
★ 無法正常瀏覽內容,請按這裡線上閱讀
新聞  健康  udn部落格  
2024/06/20 第785期  |  訂閱/退訂  |  看歷史報份
  科技新知 誰說AI不具美感?以生成式AI的方法來評定藝術品的美感
引領未來-全球智慧機場蓬勃發展,驅動創新技術
台灣商用無人機市場發展與展望
AI生成式遊戲產業趨勢逐漸成長、茁壯發展

誰說AI不具美感?以生成式AI的方法來評定藝術品的美感
FIND研究員:李啟榮

2022年,一份由生成式人工智慧(Generative AI)技術所產出的畫作,獲得了美國科羅拉多州美術博覽會的第一名,一度震驚全世界;而AI生成式畫作之品質,精美到挑戰真人的審美觀和評價,造成了對藝術界和科技界的衝擊。

因此,AI工程師和美工設計師應共同探討AI如何解析、學習畫作並產生畫作,並藉由不斷反覆訓練,來找到AI如何評定畫作美感的方法和思維。使AI畫作在精進品質之餘,其審美觀更接近真實世界的觀點,並提高AI審美的客觀公正性。

【技術發展背景】

在AI自動繪圖、AI合成圖片進入成熟發展之際,人們開始對AI繪圖和合成圖片的品質加以重視,不但要確保圖片的原創性和真實性,還要分析AI圖片是否能達到品質上的需求和期望。

因此,AI工程師就嘗試以較為知名的精美畫作為訓練素材,讓AI資料集了解「這是一幅精美的畫作」,作為評價畫作是否具有美感的基準。例如像GPT類型的資料集,可藉由「微調(Fine-tuning)」的方式,讓資料集的訓練能夠專精化,再加上人工標註有哪些具有美感的圖案或關鍵字,讓圖像分析和解讀更為精準。

【技術介紹與應用現況】

以電腦視覺為基礎,並藉由AI演算法來「審美」的方式,有很多種不同的方法與相關研究,茲節錄如下:

OpenAI CLIP:利用人工標註圖片的方式來密集訓練資料,並將受測圖片與資料集加以比對,由資料集挑出較接近受測圖片描述的關鍵字結果;此一技術可進一步發展為圖片評分機制,藉由讓系統分析後打分數,來評定圖片的品質和美感(Suresh, 2023)。

圖1:OpenAI CLIP圖片評分機制與分數對照圖

資料來源:Suresh, 2023年

MUSIQ:由Google研究團隊所開發出來,針對畫質、美學含量(例:構圖、光影)、技術含量(例:是否出現模糊、雜訊)三種指標評分;該系統利用一張圖片,依據不同長寬比例加以分割(例如5*6、4*5、3*4比例),在將不同比例的子像素重疊比對,來評定圖片構圖、光影、雜訊是否達到應有的品質需求(Ke & Yang, 2022)。

圖2:MUSIQ圖片評分機制和分數對照圖

資料來源:Ke & Yang, 2022

ADSSFID-49:這個AI繪圖引擎由一支來自中國大陸和澳門的聯合研究團隊,於《自然》期刊所發表(Chen, Shao, Zheng, Zhang, & Yin, 2024)。ADSSFID-49是參考Stable Diffusion、DALL-E、Midjourney等坊間常見的AI繪圖引擎,同時自行訓練了針對室內設計專精化的AIDDM資料集而成;該繪圖引擎可輸入不同風格的關鍵字(例:北歐風、日式、中式、美式),以及不同的房間陳設布局(例:客廳、臥室、浴室),繪圖方式採用變更關鍵字的方式,相對於傳統AI繪圖引擎,減少了因為算圖成果不如預期,導致需要整個重新繪圖、砍掉重練的流程,並在滿意度方面也宣稱超越傳統AI繪圖引擎。

圖3:ADSSFID-19與傳統AI繪圖引擎之輸出對照

資料來源:Chen, Shao, Zheng, Zhang, & Yin, 2024年

圖4:ADSSFID-19與傳統AI繪圖引擎之算圖流程對照

資料來源:Chen, Shao, Zheng, Zhang, & Yin, 2024年

圖 5 ADSSFID-19與傳統AI繪圖引擎之滿意度比較

資料來源:Chen, Shao, Zheng, Zhang, & Yin, 2024年

未來展望/挑戰

AI在影像分析上有著卓越的效能和分析能力,可以用來進行科學性的掃描和判讀,適用於包含醫學、物理、化學、生物學、電子學等必須講求客觀且不容絲毫模糊空間的精準分析之領域。

但在講求相對標準及容許範圍較寬廣、美學見解較為主觀而複雜的「審美」概念中,AI可以藉由強大的學習和歸納能力,加上真人專家的細心投入深究,讓AI變成具有美感和科技感兼具的「工藝品」;正好工藝就是科學和藝術的綜合體,藉由整合科學性分析和創意美感的剖析,讓AI審美能成為協助真人評估美感的好幫手。

封面圖片來源: 123RF

參考資料來源:

1.Chen, J., Shao, Z., Zheng, X., Zhang, K., & Yin, Z. (2024, February 12). Integrating aesthetics and efficiency: AI-driven diffusion models for visually pleasing interior design generation. Retrieved from Nature: https://www.nature.com/articles/s41598-024-53318-3

2.Ke, J., & Yang, F. (2022, October 10). MUSIQ: Assessing Image Aesthetic and Technical Quality with Multi-scale Transformers. Retrieved from Google Research: https://blog.research.google/2022/10/musiq-assessing-image-aesthetic-and.html

3.Suresh, R. (2023, October 20). Image aesthetics quantification using OpenAI CLIP. Retrieved from Medium: https://medium.com/@sureshraghu0706/image-aesthetics-quantification-using-openai-clip-7bbb45e00147

 
引領未來-全球智慧機場蓬勃發展,驅動創新技術
FIND研究員:王楨芸

全球智慧機場的迅速發展,引領著航空業的未來,並驅動創新科技的前進。透過科技技術在各個作業層面應用,從提高效率的工作效能到提升乘客體驗皆呈現出數位轉型所帶來的多重利益。Allied Market Research 前陣子更發表了一份報告指出,智慧機場市場正在蓬勃發展,根據2023-2032 年全球機會分析與產業預測報告顯示,2022年全球智慧機場市場規模僅有71.0億美元,預計2032年將達242.8億美元,複合年增長率為13%。

隨者疫情過後旅客增加,提升機場量能及維護機場安全至關重要。智慧機場利用人工智慧、物聯網和數據分析等現代科技來優化作業,提升乘客滿意度,在陸上和空中作業、支付系統和資訊管理方面體現創新。桃園機場也正在積極轉型朝向智慧機場、永續機場的目標邁進,參考各機場的成功經驗,讓人流、物流更加智慧化,使旅客通關、辨認、檢查更順暢、更有效率,並期勉桃園國際機場公司持續透過多元方式,進行各項節能措施及提升能源效率,努力朝綠色轉型目標前進。

何謂智慧機場?

從字義上來看,智慧機場類似於其他「智慧」概念,因此意味著使用人工智慧、物聯網、數據分析等現代技術解決方案來提高機場營運效率和乘客滿意度。所謂的航空公司數位轉型體現在機場的各種營運中,無論是陸側還是空側營運、支付和財務控製或資訊管理。科技驅動的智慧機場有更多機會滿足乘客的期望,透過改善服務提高乘客的滿意度,進而提高客戶忠誠度,帶來更多的銷售和飛機收入。最後,目前的技術進步水平,包括尖端的生物識別技術、掃描儀和追蹤器,可以顯著改善機場服務,這是傳統機場無法比擬的機場服務。

技術強化的機場在各個作業層面帶來多方面的好處

- 透過實時數據存取和任務自動化提高生產力

- 通過優化資源管理實現大幅成本降低

- 加強的安全措施,優先考慮乘客安全

- 高效的乘客流管理,提升旅行體驗

- 減少碳足跡的可持續實踐

圖一:智慧機場帶來的便利與效能

資料來源:https://eastern-peak.medium.com/smart-airports-optimizing-airport-operations-with-technology-eastern-peak-962ac3c3f34f#19a5

智慧機場數位轉型涵蓋了航空業內多種應用

- 排隊管理:引入自助設施和人工智慧追蹤系統,加速流程並有效管理乘客流

- 安全和維護:實時監控和預測性維護系統,增強飛行安全並減少延誤

- 自動化溝通和回饋:利用人工智慧聊天機器人和數據分析迅速解答乘客疑問和關切

- 機場安全:採用先進的生物識別和網絡安全措施,降低威脅並確保乘客安全

- 可持續資源管理:應用智慧解決方案優化能源消耗並增進廢物管理

圖二:智慧機場科技應用範圍

資料來源:https://eastern-peak.medium.com/smart-airports-optimizing-airport-operations-with-technology-eastern-peak-962ac3c3f34f#19a5

成功採用機場技術解決方案的顯著案例包括達美航空和英國航空。達美航空採用面部識別技術進行快速登機和預測性維護,從而減少航班取消。英國航空在倫敦希斯路機場引入導覽機器人,協助乘客順利通過航廈。航空業已經擁抱了數位轉型,在機場運營的各個方面應用技術。從流暢的登機手續到機器人助手,為乘客提供無憂無慮、高效的旅行體驗。未來的機場將是自動化、資訊豐富且準時的,驅動著技術創新。

封面照片來源:https://www.pexels.com/

參考資料來源:

1. https://easternpeak.com/blog/smart-airports-operations-solutions/

2. https://www.openpr.com/news/3334288/navigating-the-future-smart-airport-market-poised-to-soar

3. https://futurecity.cw.com.tw/article/1069

4. https://udn.com/news/story/7241/7526789

 
台灣商用無人機市場發展與展望
FIND研究員:周靜芳 要探討台灣商用無人機的發展與展望之前就必須先研究全球市場,根據德國無人機研究機構DRONEII發表的研究報告指出,2020至2025年全球無人機市場將倍數成長,預測複合年均成長率高達13.8%。 ...
 
AI生成式遊戲產業趨勢逐漸成長、茁壯發展
FIND研究員:李啟榮 人工智慧生成式內容(AI-generative contents, AIGC)自從展現了全自動化的程式撰寫、美工設計、特效生成、影音生成等能力後,遊戲業界也開始擁抱AIGC,做為後疫情時代因應節約人事和開發成本等大環境下全新的開發型態。 ...
 
勞保、國保、工會哪個好?放大退休金必學這1招
有些人覺得麻煩,乾脆不加勞保也不繳國保,年紀大了才發現,錯失的年資已經追不回來,加上求職困難、退休金不足,老後生活更難過。至於加入職業工會有門檻和條件,但是運用「這1招」不僅增加保障,還會領到更多退休金。

Do you feel FOMO? 什麼意思?認識10個常見「流行英文用語」
常見的用語流行程度也會隨著時間的推移而變化,而新的流行用語也會不斷出現!有一陣子很常出現的流行語"FOMO"是什麼意思?愈來愈多年輕人崇尚的「YOLO族」是什麼樣的生活態度?帶你認識10個常見卻不一定知道的英文流行語。
 
本電子報著作權均屬「聯合線上公司」或授權「聯合線上公司」使用之合法權利人所有,
禁止未經授權轉載或節錄。若對電子報內容有任何疑問或要求轉載授權,請【
聯絡我們】。
  免費電子報 | 著作權聲明 | 隱私權聲明 | 聯絡我們