■台灣科技大學資訊管理系專任特聘教授 盧希鵬
(圖/翻攝自Unsplash圖庫)

人類要與機器聊天,有兩項技術要解決:讓機器懂人類語言(Language to Data),讓機器講人類語言(Data to Language)。語言技術已經發展了數十年,最近因為深度學習演算法與巨量數據,有了巨幅的進步。

Open AI公司的ChatGPT橫空出世,讓人驚艷AI對於人類語言多重意圖與隱含意圖的理解,以及自然語言生成模型(NLG, Natural Language Generation)的成熟。過去,語言生成模型包含了各類文本,簡單如健檢數據轉換成醫師口吻的文本,企業財報資料轉變成報紙文本的財經新聞,小說與偶像劇也有劇本文本(如英雄總是在第七集接吻,最後一集絕地反攻),情書大全也是一種文本。有了這些文本,ChatGPT就可以幫人寫劇本與情書,只要把人名與情境詞彙重組就好。當機器懂人類說甚麼,人類也懂機器在說甚麼,ChatGPT就把這技術用來做聊天。

但,人類語言的文本何其多。ChatGPT(Generative Pre-trained Transformer)預先幫人類閱讀巨量資料,再以深度學習演算法產生巨量文本結構情境詞句與知識庫。譬如,請它幫我準備電子商務結構洞應用的演講大綱,幫我用金庸小說風格寫出十集影集大綱,並請它為台灣科大設計招生文案。請它幽默一點,具體一點,煽情一點……都有驚豔的表現(結果都放在我臉書上)。

上周有學生問我:「影響信任的因素有那些?」 若問Google大神,會得到上百種不同的連結,同學要慢慢讀。若問ChatGPT相同問題,它會在事先閱讀與整理過的知識庫中,產生人類看得懂的文字,就會說:「通常得到他人信任的因素有以下六項……」。如果你不喜歡這項答案,也可以換一種敘述文本。

ChatGPT不僅可以像人類一樣交談,知識庫包山包海, 同時對於自己不懂的事物,也有一些推論文本(譬如說幹話),雖然不是這麼精準,還是非常有趣。

Google害怕嗎?搜尋引擎是幫人找(Search)資訊,請人自己讀。ChatGPT不是搜尋引擎,是語言模型,在閱讀(Read)整合好的知識庫中,用人類看得懂的自然語言表達出來。網路上數據愈來愈多,一個幫人閱讀又產生整理過的自然語言生成模型,是否將會改變這個世界?

任何創新,一旦成了大家都知道的事 ,勢必引來大量的模仿者。當微軟投資100億美元在ChatGPT,讓自家搜尋引擎Bing有了自然語言生成模型,接下來應該所有搜尋引擎都會有類似的功能。

這場戰爭,不只是技術之爭(me too),更是生態系之爭。ChatGPT只是一種人機介面,決勝的關鍵在結構洞所串聯的多重網路,如同iPhone贏的,不只是易用的人機介面,更是串聯背後強大的生態網絡。

我幻想,當Google把自然語言生成模型放到自駕車時,車子將會開始跟我聊車況、路況甚至是新聞?而我在手機、車子,客廳,辦公室都在跟同一套Google系統聊天時,Google會不會成為世界上最瞭解我的人,進而成為我可信任的理專與購物專家?這場戰爭,先是技術之爭,未來更是搶占網路結構洞之爭,這才是Google的關鍵策略點。

(轉載自盧希鵬臉書)