當一支鉛筆的顫抖,遇見億萬參數的沉思

林一平
2026-03-06
AI語音摘要
00:48
林一平提供
林一平提供

左圖是我的手,右圖是AI的靈魂,或者說,是它從人類無數個靈魂中蒸餾出來的回應。這件事讓我著迷許久。

起初,我只是隨手在紙上勾勒一個女性的姿態:頭部後仰,雙臂上舉,身體的弧度像一個無聲的感嘆號。線條粗糙,比例也不完美,但那個姿勢裡有某種說不清楚的渴望,像是一個人在黑暗中向天空伸手的瞬間。我把它拍下來,輸入一段精細的提示詞(Prompt),然後交給AI。

幾秒鐘後,右圖出現了。

我盯著螢幕看了很長時間。那還是我的姿勢,我的構圖,但那個向天空伸手的女人,已經不再是草稿。她的頭髮像墨水在水中散開,一絲一縷都有自己的重量。她的皮膚在炭筆(Graphite)的陰影裡呼吸,光從不可見的地方打來,讓鎖骨下方有了深度。

最讓我震驚的是那些紫色的牽牛花,它們並非強行安插,而是像真的從她的身體裡生長出來,藤蔓沿著腰線纏繞,葉片覆蓋本來空白的下半身,像是自然界對一個姿勢的詮釋。

要理解這幅圖從何而來,得稍微走進AI的思維邏輯。

AI首先透過視覺編碼讀取草稿中的線條結構,同時解析提示詞的語義,將兩者在潛在空間(Latent Space)中進行多模態融合。接著,它識別出頭部後仰、雙臂上舉的骨架,透過ControlNet確保生成結果嚴守原始輪廓,再從訓練資料中召喚素描技法與新藝術運動(Art Nouveau)的視覺記憶,將它們揉進同一個畫面。

最核心的演變發生在擴散過程(Diffusion Process)裡:圖像從一片純粹的隨機噪聲出發,在逐步去噪中讓細節從虛無中浮現,像是某種沉睡的記憶在黑暗中緩緩甦醒。那些牽牛花之所以長在那裡,是因為交叉注意機制(Cross-Attention)讓花卉的語義在圖像特定區域精準激活,而ControlNet那雙無形的手,始終拉住AI奔湧的想像力,讓它不越出我草稿劃定的物理邊界。整個過程,像一位藝術家在高維向量空間中進行的聯想,素描的肌肉記憶與牽牛花的印象在同一瞬間翻湧交疊。

那幅右圖太美了,美得讓我有一瞬間覺得左圖顯得有些多餘。但我很快意識到,如果沒有左圖,右圖根本無從談起。AI的所有聰明,在那一刻都在服務我那個顫抖的輪廓。那個姿勢是我的,那個渴望是我的,AI只是給了它一場盛大的赴約。

這就是人機協作最迷人的地方:不是替代,而是放大。我帶來意圖,AI帶來技法;我帶來情感的骨架,AI帶來血肉和皮膚。工具在改變,從獸骨到毛筆,從油彩到潛在空間中的運算,但那個想要表達某件事的衝動,仍然是整件事的起點,也是任何參數都蒸餾不出來的精華。

現為中國醫藥大學醫療資訊學系講座教授,曾任科技部次長,為ACM Fellow、IEEE Fellow、AAAS Fellow及IET Fellow。研究興趣為物聯網、行動計算及系統模擬,發展出一套物聯網系統IoTtalk,廣泛應用於智慧農業、智慧教育、智慧校園等領域/場域。興趣多元,喜好藝術、繪畫、寫作,遨遊於科技與人文間自得其樂,著有<閃文集>、<大橋驟雨>。
智慧應用 影音