(圖片素材取自網路開放授權CC。)
一、前言
近期,「ChatGPT」關鍵字不斷出現在新聞版面,代表其火紅程度已漸蔓延至台灣。ChatGPT 是由 OpenAI 開發的一個人工智慧聊天機器人程式,於去(2022)年 11 月推出,問答方面,ChatGPT 可以根據輸入的問題自動生成答案,還具有編寫和除錯電腦程式的能力。小弟對 AI 一直情有獨鍾,個人的投資策略以量化為主,在預測未來數據的部分,也有用到類似的技術。上述所謂的「AI」,係指「人工智慧」的縮寫,可以透過電腦程式及運算自動執行複雜的任務,而早期應用最廣、最成熟,當屬圖像、語音辨識及自然語言處理等等,目前火紅的「ChatGPT」屬於後者。
「AI」開始普遍被世人所知,源自於 2016 年 AlphaGo(由 Google DeepMind 開發的人工智慧演算法)在網路圍棋世界打敗眾多高手,而後更以 4 比 1 的成績打敗當時世界冠軍李世石,因而引起社會大量關注。更早之前,於 1997 年,同樣是人工智能運算用於棋局,DeepBlue 也曾打敗過世界冠軍 Garry Kasparov。不過,雖同樣屬於 AI,但上述兩者所使用的演算法是截然不同的,其演算複雜度(圍棋 vs 象棋)也是差異極大。2016 年之前,學術界根本不談 AI,相關應用比較廣泛的,多半局限於影像、影音、醫療等,例如用於簡單車輛影像判斷、醫學影像之判讀(如今這些技術都已臻至成熟)。當時 AI 還不成熟,智能化能力與人類仍有極大差距,導致「人工智慧」四字長期被學術界所嘲笑,由於研究產出時常出於電腦運算結果,很難簡單化成數學式,也就難以在學術期刊發表,是個沒前途,學術研究價值低,相當耗數學能力又不討好的學問,沒人要學。過去,沒有一個專門稱為「AI」的科系,沒有所謂的「人工智能」,只有數據科學,與之相關的科系通常是「資訊、資工、通訊、計算機」等專長領域。
2016年,AlphaGo 和兒子剛好在同一年誕生,起初,看著小孩睡著可愛的臉,興起利用空閒時間,花了將近一年,才將過去自已於 2010 年所做的半成品選股模型整理到比較完善的地步。隔年,以兒子的生日數字開了一個小小個人部落格,目的用於呈現該研究的模擬測試結果,迄今已滿 5 年。不過,由於忙碌於工作和家庭的關係,該系統一直離最終想要達成的目標,仍有一段距離。
二、ChatGPT 對世界的影響
前述 ChatGPT 於 2022 年 11 月底開放,短短 5 天就吸引 100 萬人註冊。相關應用,快速被應用於演講稿、紀錄稿、學生作業、文案、程式編寫等等,其便利的功能也被學生用於論文,但已被多所校園警告禁用,可見其正確性仍待質疑。
相較於搜尋引擎使用關鍵字查找資訊,ChatGDP(Generative Pretrained Transformer)則更偏重於自然語言模式的訓練。透過自然語言生成的 AI 要能準確回應問題的關鍵(或者說是任何 AI,都有同樣的問題),在於給它正確的資料;由於 ChatGPT 的資料採用 2021 年之前的數據,當時還處在一個沒有 ChatGPT 的環境,該環境中、大數據多數仍是依賴人類彙整而成,尚未參雜太多機器演算的結果,透過 AI 訓練,能夠得到一個大致符合人類環境的結果。此結果的權重,個人猜測多半與資料本身的 SEO 有所關聯。
ChatGPT 透過大數據的訓練,理解一般普羅大眾的自然語言用語及習慣,從而查找使用者想要了解的資訊,並給予正確回應;相較於一般使用瀏覽器查找資料,由於 ChatGPT 可以直接針對使用者想要的部分去解析文本,直接從內文提取使用者想要了解的答案,就以資料查找的效率來說,遠勝過使用瀏覽器查找解答所需花費的時間。因此,在 ChatGPT 如此優異(符合人性化需求)的搜尋功能下,首當其衝的當屬 Google 搜尋引擎;Gmail 的創始人 Paul Buchheit 日前就在社交媒體大膽預言,未來一到兩年內,ChatGPT 人工智慧技術的應用發展,將會徹底顛覆 Google 過去以來所建立的優勢,因為 Google 的營利模式,正是來自於搜尋引擎,但像是 ChatGPT 這種 AI 查詢資料的模式,等於是人工智能直接透過本身訓練的資料來給予解答,人們將不再需要搜尋引擎(或相關需求變的極低),也就直接傷害 Google 的廣告營收。
注意上述所說,「人們將不再需要搜尋引擎」,因此受害者恐怕不止是 Google、百度等搜尋引擎業務。影響最廣泛的,恐怕是內容創作者,或許會受到更為深度的影響。以前,有問題就問「Google 大神」的模式不在了,等於是通往內容創作者的道路因此不見。短期來看,似乎 ChatGPT 也能成為內容創作者的良好輔助工具,但若未來類似的工具開始普及化,使用者對於查找資料的需求轉為直接詢問 AI,且坊間開始出現大量由機器所創造出來的內容時,屆時,最先受害的就是那些沒有使用 ChatGPT 的內容創作者,以及少數純人類所創作內容優質的資料,正被由大量機器生而的海量資料所淹沒。
三、解析 ChatGPT 的缺陷
過去 DeepBlue 能夠贏得棋局,在於棋盤上的規則可以被人類所人為演譯出來。而 AlphaGo 相較於 DeepBlue 的不同,在於 AlphaGo 吸收了眾人過去曾經對奕過的棋譜,再將 AI 演算的結果透過邊緣運算導出,甚至使用機器人自己與自己對弈的模式,來創造出一般對奕者不會(或絕少機率)出現的棋路,而這些極少概率的棋路,遠超過專業棋士過去所能處理的經驗,從而造成 AI 打敗專業棋士的結果發生。而 AI 處理像是下棋等遊戲、後續所能生成出來的步數及其結果、概率,只要符合棋盤上的規則,都能被計算出來。以 AlphaGo 來說,其實 AI 並不懂得下棋,他只是將過去處理相同棋路的資料庫,依據最大獲勝結果的概率來進行下一步(下棋)。相較之下,ChatGPT 則是透過自然語言的文本來訓練,同樣是跟 AlphaGo 一樣沒有靈魂,只是透過大量資料庫的訓練,在使用者詢問模式下,找出過去類似的發問,以及最有可能的結果來回答,當然,訓練的靈魂仍是基於人類過去的大數據所產生。
因此,前述所說的情況就會產生幾個重大問題:
(1)ChatGPT 的訓練資料,可能受到人為偏見的結果而導致不正確的信息。
(2)一旦未來大部分資料都是仰賴機器輔助而生成,就有可能產生 GIGO(Garbage in, garbage out)的結果,即錯誤、表面看似合理但思慮不周的答案等,有可能因為論點的 SEO 高,且過去亦受人類觀念所誤解,再透過類似 ChatGPT 等工具不斷地創造及錯誤反饋循環,錯誤的程度將會擴大。
(3)假使未來對接網路,若無法有效地過濾一些錯誤資訊及偏見,恐怕容易成為人為、或政治搧動的工具,加大社會及族群之間對抗。
四、ChatGPT 對投資的影響
ChatGPT 目前資料都還是 2021 年以前,投資是看未來而非過去,尚看不出會有什麼影響。對於 ChatGPT 的未來趨勢,個人有如下幾點看法:
(一)對於文字訊息的使用效率
投資的行為模式及股市投資而言,獲利總是遵循著類似 82 法則的結果,即少數人賺取大多數人之利潤。ChatGPT 所能提供的訊息建議,大部分偏向一般人一般程度可以提供的結果,回應結果的正確性離專業人士仍有一段距離。因此若純粹對於投資的影響,個人認為使用 ChatGPT 短期並不會產生太多優勢。不過,未來若是 ChatGPT 接上網路,情況或許會略有改變,投資者對於資料查找的速度將大幅優化,AI 將輔助一般投資者,得到趨近於網路爬蟲工程師才有的能力。
(二)對於數據訊息的使用效率
個人認為 ChatGPT 對數據來說,優勢相對偏低,原因在於 ChatGPT 的資料取得模式,是來自於訊息資料的文本,但數據資料原本就是市場必須公開的,資料的直接取得,比起相對取得還要來得更為容易且簡單的多。
(三)過去人工智能投資無法長期打敗大盤
人工智能(AI)投資於 2016 年 AlphaGo 打敗李世石後,開始蔚為一股風潮。經過這幾年實證後,透過機器學習來進行市場預測和選股,能夠長期打敗大盤的量化投資基金區區可數(除大獎章基金外)。主要原因在於:
(1)市面上的 AI 基金雖然掛著「AI」兩字,但在本質策略上及選股核心,常常基於市值、動能、波動等評價因子進行選擇,與市面上常見的選股策略差異不大。
(2)人為著墨的跡象過深,純粹以機器演算法來進行演算的基金少之又少。
(四)大獎章基金
關於以數學演算模型為基礎的基金,目前績效表現最好的當屬「大獎章基金」,該基金是 James Harris Simons 的團隊創建,基於數學統計分析的定量模型,在 20 年內投資年報酬率超過 35%。而關於大獎章基金,個人有幾點看法如下:
(1)量化交易策略實際上無法在任何市況下都帶來穩定的報酬,除非策略是用於中長期的選股,而非追求短期回報。但是,一個 20 年內投資年化報酬率超過 35% 的策略,不管從任何角度看都不現實,原因是短期策略雖然回報高,但交易頻率、停損等都會有成本,不容易實現。下圖,以小弟的量化模型為例,圖為本數學模組投資組合近 5 年每筆模擬投資的績效分布圖,平均績效為 8.01%、中位數為 2.8%、平均持有期間約 146.69 天(含假日)、選股清單年化報酬率 21.13%(不含股息收益)。假設以上述模型為基準,若要年化報酬率達到 35%,則每筆平均績效要拉高到 13% 左右才能達成,當中只有 40% 左右的股票能辦到。亦即,使用一個年化報酬率有 20%以上的模型,若要連續 20 年達到 35% 這種報酬率,其機率為 0.000001%,機率將低到非常不現實。
(本站預估大盤本益比,自行繪製。)
0 意見:
張貼留言