目錄
研究概要
東京大學、大阪公立大學與松尾研究所的研究團隊,發表了一項關於使用大型語言模型(LLM)自動生成股票投資策略的實證研究。
本研究的核心問題是:「給予LLM不同的回饋設計,是否會影響投資策略的改善程度?」
結論是:比起回饋設計的細節,「選擇哪個LLM模型」對策略績效的影響更為關鍵。
實驗設計
驗證的LLM模型(8種)
| 系列 | 模型 |
|---|---|
| GPT | GPT-5 nano, GPT-5 mini, GPT-5 |
| Gemini | Gemini 3 Flash Preview, Gemini 3 Pro Preview |
| Claude | Claude Haiku 4.5, Claude Sonnet 4.5, Claude Opus 4.5 |
回饋設計(2軸×3條件)
研究團隊將提供給LLM的資訊分為以下兩個維度:
維度1:資訊範圍
- 僅基本資訊:報酬率、波動率、夏普比率、最大回撤等
- 基本+追加資訊:上述內容再加上IC(資訊係數)、淨曝險、因子曝險
維度2:呈現形式
- 僅文字:以文字字串呈現數值
- 文字+圖表:同時提供累積報酬與回撤的圖表影像
據此,研究比較了以下3種條件:
| 條件 | 資訊範圍 | 形式 |
|---|---|---|
| P1 | 僅基本資訊 | 僅文字 |
| P2 | 基本+追加資訊 | 僅文字 |
| P3 | 基本+追加資訊 | 文字+圖表 |
研究數據
- 標的:TOPIX 500(排除金融類股)
- 期間:2014年~2022年(日頻數據)
- 交易成本:單邊5bps(0.05%)
主要發現
發現1:模型選擇決定績效表現
P&L年化改善幅度平均值(依模型排序)
| 排名 | 模型 | 平均改善幅度 |
|---|---|---|
| 第1名 | Claude Sonnet 4.5 | +14.12% |
| 第2名 | Claude Opus 4.5 | +12.69% |
| 第3名 | Claude Haiku 4.5 | +8.27% |
| 第4名 | Gemini 3 Pro Preview | +7.35% |
| 第5名 | Gemini 3 Flash Preview | +7.27% |
| 第6名 | GPT-5 mini | +4.75% |
| 第7名 | GPT-5 | -0.29% |
| 第8名 | GPT-5 nano | -3.06% |
Claude系列模型取得壓倒性的優異成績,而GPT系列模型相對表現落後。
發現2:回饋設計的效果有限
即使提供追加資訊或圖表,對績效改善的貢獻也相當有限:
- P1→P2(加入追加資訊):平均變化 -1.30%(反而惡化)
- P1→P3(加入圖表):平均變化 ±0.00%(幾乎沒有差異)
發現3:各模型的「行為特性」差異
研究團隊發現,各模型在策略改善方法上存在明顯差異:
| 模型系列 | 改善方法 | 特徵 |
|---|---|---|
| Claude系列 | 保留既有策略結構,逐步累積局部邏輯修正與參數調整 | 改善穩定,迭代次數與改善率呈穩定關係 |
| Gemini系列 | 傾向探索與初始策略無關的新策略 | 改善幅度期望值高但變異也大 |
| GPT系列 | 傾向保守,不大幅變更既有邏輯 | 實質變更率低(GPT-5僅18.5%) |
發現4:回饋設計影響「手法品質」
雖然對績效的直接效果有限,但回饋設計對LLM提出的實作手法內容有顯著影響:
| 條件 | 傾向 |
|---|---|
| P1(僅基本資訊) | 探索傳統因子與手法(200日均線、ROE、FCF殖利率等) |
| P2(含追加資訊) | 增加與風格因子中性化相關的實作 |
| P3(含圖表) | 使用IC或VIX進行動態門檻控制,嘗試適應市場狀態變化 |
研究意義與實務啟示
1. 模型選擇的重要性
本研究實證了在使用LLM生成投資策略時,「選擇哪個模型」才是最重要的。
回饋設計的細節(要呈現哪些指標、是否附上圖表等)的影響,遠不如模型本身的特性來得重要。
2. Claude系列模型的優勢
目前的研究結果顯示,Claude系列模型最適合投資策略的改善任務。
這可能是因為Claude具有「在維持既有脈絡的同時逐步改善」的特性。
3. 未來課題
研究團隊列出以下未來課題:
- 驗證模型差異是單純的行為特性差異,還是源於與改善流程架構或提示詞的相容性
- 找出能最大發揮各模型策略改善潛力的條件
對外匯、CFD交易者的啟示
本研究雖然以股票投資策略為對象,但對外匯、CFD交易者也有以下啟示:
- 將LLM作為策略開發輔助工具時,模型選擇至關重要
- Claude系列模型(特別是Sonnet、Opus)可能較適合既有策略的改善任務
- 並非提供越多數據就越好——增加資訊量不一定能直接改善績效
- 理解LLM的「行為特性」後再分別運用才是關鍵
其實筆者現在也正準備挑戰使用AI建構自動交易系統。
今天介紹的是以東京大學為中心的研究團隊所進行的學術驗證,但在外匯和CFD的實戰中「到底能不能用?」「真的能獲利嗎?」這些問題,終究還是要親自實踐才能知道答案。
如果筆者在嘗試過程中獲得了什麼心得或踩了什麼坑,一定會再跟大家分享。AI與投資的結合仍是一個快速發展中的領域,讓我們一起學習、一起成長吧!
論文資訊
- 標題:大規模言語モデルを用いた株式投資戦略の自動生成におけるフィードバック設計(使用大型語言模型自動生成股票投資策略的回饋設計)https://www.jstage.jst.go.jp/article/jsaisigtwo/2026/FIN-036/2026_193/_pdf/-char/ja
- 作者:河村飛來(東京大學)、久保健治(東京大學)、中川慧(大阪公立大學)、株式會社松尾研究所
- 發表:人工知能學會 第二種研究會 金融情報學研究會 SIG-FIN-036-31