본문 바로가기

IT와 과학/주식자동매매기술

AI가 주식 시장을 정복하는 방법 — 최신 연구 논문이 밝혀낸 7가지 진실

728x90
반응형
AI가 주식 시장을 정복하는 방법 — 최신 연구 논문이 밝혀낸 7가지 진실
iotnbigdata.tistory.com 퀀트 시스템 구축 시리즈 Vol.3
AI × QUANT RESEARCH — 2024/2025 최신 논문 분석

AI가 주식 시장을 정복하는 방법 최신 연구 논문이 밝혀낸 7가지 진실

ChatGPT가 뉴스 헤드라인 하나로 내일 수익률을 예측한다. GPT로 학습한 모델이 연환산 119% 수익을 낸다. 이것은 공상이 아니라 2023~2025년 사이 학술 논문으로 검증된 사실이다. 무엇이, 어떻게, 왜 작동하는지 낱낱이 해부한다.

10+핵심 논문
7연구 분야
119%StockGPT 연수익
6.5Sharpe Ratio

오닐, 그레이엄, 미너비니 같은 거장들이 수십 년에 걸쳐 발견한 매매 원칙들. 이제 AI 연구자들은 그 원칙들보다 더 강력한 무언가를 데이터로 증명하고 있다. "뉴스 헤드라인을 GPT-4에 넣으면 다음 날 주가를 예측할 수 있다"는 것이 단순한 아이디어가 아니라, UCLA 교수팀이 통계적으로 검증한 팩트다.

2022년 ChatGPT 등장 이후, 금융 AI 연구는 완전히 다른 시대로 진입했다. 수치 데이터만 보던 모델들이 이제 뉴스를 읽고, 공시를 해석하고, 시장 심리를 감지한다. 이 글은 그 연구들의 핵심을 뽑아 정리한다. 읽고 나면, 내 자동매매 시스템에 무엇을 추가해야 할지 보인다.

PRE-LLM 시대 (2022 이전)
수치 데이터의 시대
  • LSTM, GRU, CNN, SVM, Random Forest
  • OHLCV 가격·거래량 중심
  • 수동 팩터 엔지니어링
  • 규칙 기반 + 통계 모델
  • 단일 시장, 단일 모델
POST-LLM 시대 (2022~현재)
언어 이해의 시대
  • GPT-4, FinBERT, FinGPT, BloombergGPT
  • 뉴스·공시·SNS·실적발표 텍스트
  • LLM 기반 알파 자동 생성
  • Chain-of-Thought + Multi-Agent
  • RAG로 과거 케이스 실시간 검색

두 시대의 차이는 단순히 모델 크기가 아니다. 시장을 이해하는 방식이 근본적으로 달라졌다. 이제 AI는 "어제 삼성전자 주가가 얼마였나"를 보는 것이 아니라, "삼성전자 실적발표 뉴스가 투자자들에게 어떤 의미인가"를 추론한다.

RESEARCH 01 LLM 감성

"ChatGPT가 뉴스를 읽으면
다음 날 수익률이 보인다"

Lopez-Lira & Tang, UCLA — 2023 · SSRN 4412788
월스트리트 저널 헤드라인 하나를 ChatGPT에 넣고 "이 뉴스가 해당 주식에 긍정적인가 부정적인가"를 물었다. 그 대답이 실제 다음 날 주가 방향과 통계적으로 유의미하게 일치했다. GPT-1, GPT-2, BERT는 아무 예측력이 없었다. GPT-3.5부터 효과가 나타났고, GPT-4에서 정점을 찍었다. 모델이 클수록 시장을 더 잘 이해한다는 것이 처음으로 실증됐다.
📊
핵심 수치 — GPT-4 기반 일별 롱숏 포트폴리오
일평균 수익률 +44bp  ·  Sharpe 상승  ·  t-stat 4.01
감성 점수가 -1 → +1로 전환될 때 다음 날 주가 수익률 +51.8bp 상승. 5-factor Fama-French 리스크 조정 후에도 알파 41bp 유지. 단, GPT-1/GPT-2/BERT에서는 이 효과가 전혀 없었음 → 모델 규모가 핵심.
모델파라미터수익률 예측력비고
GPT-1117M없음텍스트 이해 미흡
GPT-21.5B없음금융 문맥 이해 부족
BERT / BART340M약함단방향 이해 한계
ChatGPT 3.5~175B강함 ✓t-stat 5.26, 회귀계수 0.259
GPT-4~1T+가장 강함 ✓일평균 44bp, 알파 41bp
작동 원리 — 구현 파이프라인
STEP 01
뉴스 수집
종목 관련 헤드라인 실시간 수집
STEP 02
LLM 스코어링
-2~+2 감성 점수 + 신뢰도 출력
STEP 03
신호 생성
점수≥+1 + 신뢰도≥0.7 → 매수
STEP 04
다음날 진입
장 시작가 매수, 3~5일 보유
STEP 05
IC 측정
예측 vs 실제 수익률 정보계수 추적
내 시스템 전략 A에 적용: 현재 뉴스 키워드 기반 감성 분류를 GPT-4o 스코어링으로 교체. DART 중요 공시 발생 시 → GPT-4o 분석 → 감성 점수 -2~+2 → 기존 진입 로직에 confidence 필드 추가. FinBERT로 대량 뉴스 1차 필터, GPT-4o로 중요 뉴스만 정밀 분석해 비용 절감.
RESEARCH 02 금융 특화 LLM

FinBERT와 금융 특화 LLM들
뉴스를 3계층으로 해부하다

Araci 2019 / FinBERT-LSTM 2024 / FinGPT 2024 / BloombergGPT 2023
범용 GPT가 비용이 부담스럽다면, 금융 전용으로 파인튜닝된 모델이 대안이다. FinBERT-LSTM 연구의 핵심 발견은 뉴스를 시장 전체 / 업종 / 개별 종목으로 3단계 분류하고, 각 레벨에 다른 가중치를 부여하면 예측 정확도가 크게 올라간다는 것이다.
금융 감성 특화
FinBERT
110M
BERT 기반, 금융 텍스트 파인튜닝. HuggingFace 무료. 한국어는 KR-FinBert-SC 사용.
오픈소스 금융 LLM
FinGPT
LoRA
실시간 파인튜닝 가능. GPT-4 대비 비용 90% 절감. 자체 서버 배포 가능.
Bloomberg 자체 개발
BloombergGPT
50B
일반+금융 데이터 혼합 학습. 금융 벤치마크에서 GPT-4 수준 달성.
종목 선정 시스템
MarketSenseAI 2.0
RAG
GPT-4 + RAG로 과거 유사 케이스 검색. 재무+시장+뉴스 통합 종목 등급 산출.
FinBERT-LSTM 연구의 핵심은 뉴스의 영향 범위를 구분하는 것이다. "한국은행 금리인상" 뉴스는 시장 전체(Level 1)에 영향을 미치고, "반도체 수출 규제" 뉴스는 반도체 섹터(Level 2)에, "삼성전자 깜짝 실적"은 삼성전자(Level 3)에만 영향을 준다. 세 레벨을 0.2 : 0.3 : 0.5로 가중 합산하면, LSTM 단독보다 예측 정확도가 유의미하게 향상된다.
뉴스 레벨예시영향 대상가중치
Level 1 — 시장 전체기준금리, 환율, 외국인 수급, 글로벌 증시KOSPI/KOSDAQ 전체0.2
Level 2 — 업종/섹터반도체 수출, 바이오 임상, 방산 수주해당 섹터 전종목0.3
Level 3 — 개별 종목어닝 서프라이즈, M&A, 대규모 계약해당 종목만0.5
비용 최적화 전략: GPT-4o는 호출당 비용이 발생한다. 대량 뉴스를 처음부터 GPT-4o로 처리하면 비용이 폭증한다. 해결책은 FinBERT로 1차 필터(대량·저비용) → GPT-4o로 2차 정밀 분석(중요 뉴스만)으로 이원화. Level 3 뉴스 + FinBERT 신뢰도 낮은 건만 GPT-4o 재분석하면 비용 70~80% 절감 가능.
RESEARCH 03 딥러닝

LSTM과 Transformer
시계열을 기억하고 주목한다

LSTM-Attention Hybrid / PatchTST / Informer / Autoformer
주가는 어제와 오늘이 연결된 시계열 데이터다. LSTM은 이 연속성을 기억하고, Transformer의 Attention은 어떤 과거 시점이 현재 예측에 중요한지를 학습한다. 최신 연구는 이 두 강점을 결합하고, 여기에 FinBERT 감성 점수까지 피처로 추가하면 예측 정확도가 한 단계 더 올라간다는 것을 보여준다.
LSTM 단독으로는 장기 의존성 포착에 한계가 있다. Transformer는 이를 해결하지만, 금융 시계열의 비정상성(non-stationarity)에 취약하다. 이 둘을 결합한 Attention-LSTM 하이브리드가 현재 실용적 최선이다. 더 나아가 PatchTST는 시계열을 "패치" 단위로 잘라 Transformer에 입력하는 방식으로 로컬 패턴과 장거리 의존성을 동시에 포착한다.
모델핵심 기여장점한계
LSTM장기 의존성 기억 (게이트)구현 간단, 안정적병렬처리 느림, 극장기 포착 한계
Attention-LSTM중요 시점 집중 가중치해석 가능, 성능↑추가 파라미터
InformerO(n log n) 희소 Attention긴 시퀀스(500일+) 처리구현 복잡
Autoformer추세·계절성 자동 분리주기성 포착 강점금융 시계열 검증 부족
PatchTST시계열→패치 토큰화LLM 방식, 전이학습 가능설정 민감
실전 구현의 핵심은 입력 피처 구성이다. 가격과 거래량만 넣지 말고, RSI·MACD·볼린저밴드·ATR·Force Index 같은 기술지표, FinBERT 감성 점수, 원/달러 환율·WTI 유가·VIX 같은 거시경제 지표까지 하나의 입력 벡터로 결합한다. 60일 시퀀스를 입력하고 5일 후 방향을 예측하는 구조가 현재 가장 검증된 설계다.
구현 권장 순서: Phase 1 — LSTM + 감성 피처(2주 내 구현 가능, 안정적 베이스라인). Phase 2 — Attention Layer 추가(어떤 날짜가 중요한지 시각화 가능). Phase 3 — PatchTST 도입(오픈소스 구현체 존재). 처음부터 Transformer를 시도하면 파인튜닝 지옥에 빠진다. 단계적 접근이 필수다.
RESEARCH 04 강화학습

PPO와 강화학습
시장과 싸우며 스스로 학습한다

A2C / PPO / SAC / FinRL 라이브러리
강화학습(RL)은 정답 레이블 없이 스스로 시장과 상호작용하며 최적 매매 전략을 학습한다. 지도학습이 "과거에 이 상황에서 매수하면 수익이 났다"를 배운다면, RL은 "이 상황에서 매수하면 앞으로 누적 보상이 극대화된다"를 스스로 발견한다. PPO(Proximal Policy Optimization)가 금융 환경의 표준 알고리즘으로 자리잡았다.
🤖
PPO가 금융 표준이 된 이유
정책 업데이트 폭을 clip_epsilon=0.2로 제한
일반 RL은 한 번에 너무 많이 학습해 불안정해진다. PPO는 이전 정책에서 너무 멀어지지 않도록 제약을 걸어 주식 시장 같은 비정상·비선형 환경에서도 안정적으로 수렴한다. A2C는 새 전략 탐색에, SAC는 포지션 크기 최적화에 각각 강점이 있다.
강화학습의 핵심 설계는 보상 함수(Reward Function)다. 단순히 일간 수익률을 보상으로 쓰면 에이전트가 과도한 리스크를 감수하는 법을 배운다. 드로우다운이 5%를 넘으면 패널티, 월 손실이 3%를 넘으면 추가 패널티, 거래비용을 차감하는 식으로 리스크 조정 보상을 설계해야 실전에서 살아남는 에이전트가 만들어진다.
알고리즘행동 공간금융 적합성추천 용도
DQN이산 (매수/매도/보유)보통진입·청산 시점 결정
PPO ✓ 추천이산 또는 연속높음전체 매매 전략, 실전 표준
A2C이산보통새 전략 탐색 (탐험 강점)
SAC연속 (포지션 크기)높음포지션 사이징 최적화
TD3연속높음과대평가 방지 + 연속 제어
FinRL 라이브러리 활용 권장: PPO, A2C, DDPG, SAC, TD3 모두 내장된 금융 RL 전용 라이브러리. yfinance와 연동해 한국 주식(KRX 티커)도 바로 사용 가능. 환경 설계만 잘 하면 알고리즘 구현 없이 시작할 수 있다. 단, 한국 개인 공매도 제한 → 롱 포지션만 학습하도록 환경 설정 필수.
RESEARCH 05 LLM + RL 결합

LLM이 예측하고, RL이 리스크를 제어한다

Two-Stage Framework (2025) · LLM + PPO + VaR/CVaR
LLM은 언어를 이해하지만 리스크를 수치로 제어하지 못한다. RL은 리스크를 최적화하지만 뉴스를 해석하지 못한다. 이 둘을 결합한 2단계 프레임워크가 2025년 등장했다. LLM이 초기 예측을 하고, PPO가 VaR·CVaR 리스크 지표를 보며 최종 결정을 내린다.
LLM + PPO 2단계 결합 구조
1단계
LLM 예측
뉴스+가격 요약 → 방향·신뢰도 출력
2단계
리스크 계산
VaR / CVaR 실시간 산출
3단계
PPO 조정
LLM 예측 + 리스크 상태 → 행동
최종
리스크 차단
CVaR > 2% 초과 시 매수 자동 차단
이 구조의 핵심은 "LLM이 매수를 추천해도 리스크 한도를 초과하면 PPO가 거부한다"는 것이다. 반대로 LLM이 중립이어도 강한 모멘텀 + 낮은 리스크 조합이면 PPO가 진입을 결정할 수 있다. LLM의 언어 이해력과 RL의 리스크 최적화를 결합해 각각의 약점을 상쇄하는 구조다.
Multi-Agent RL(MARL)로 확장하면, 현재 운영 중인 3전략 아키텍처와 자연스럽게 연결된다. 전략 A(뉴스 에이전트), 전략 B(팩터 에이전트), 전략 C(기술적 에이전트)가 각각 독립 RL 에이전트로 동작하고, Meta-Agent가 세 신호의 신뢰도에 따라 가중 투표로 최종 포지션을 결정하는 구조다.
현재 시스템과의 연결: 3전략 아키텍처는 이미 Multi-Agent 구조의 설계를 따르고 있다. 각 전략에 최근 IC(정보계수)를 동적 가중치로 부여하면, 성과가 좋은 전략이 자동으로 더 큰 비중을 갖는 자기 조정 시스템이 된다.
RESEARCH 06 가격 토큰화 GPT

뉴스 없이, 가격 자체를
"언어"로 학습한다 — StockGPT

StockGPT (2024) · arXiv 2404.05101 · 연환산 119%, Sharpe 6.5
가장 충격적인 연구다. 뉴스도, 재무제표도, 거시경제도 없다. 오직 주가 수익률 시퀀스만으로 GPT를 학습시켰더니, 2001~2023년 미국 시장 롱숏 포트폴리오에서 연환산 119%, Sharpe 6.5를 기록했다. 텍스트 기반 LLM 전략의 연 50%, Sharpe 4.8을 압도한다.
🚀
StockGPT 성과 (2001~2023 미국 시장)
일별 롱숏 연환산 119%  ·  Sharpe Ratio 6.5
월별 리밸런싱 기준으로는 연환산 13%, Sharpe 1.0. 전통적 단일 팩터 중 최강인 단기 반전 팩터(8.8%, Sharpe 0.7)를 압도. 텍스트 LLM 전략(연 50%, Sharpe 4.8)도 초과.
작동 원리는 언어 모델과 동일하다. 수익률을 50bp 단위로 토큰화해 "어제 +120bp, 그제 -50bp, 3일 전 +200bp…" 같은 수익률 시퀀스를 문장처럼 취급하고, 다음 '단어'(다음 날 수익률 범위)를 예측한다. GPT가 언어의 패턴을 학습하듯, 주가의 패턴을 학습하는 것이다.
전략연환산 수익률Sharpe Ratio비고
StockGPT (일별)119%6.5가격 수익률 토큰화 GPT
텍스트 LLM 전략50%4.8뉴스 감성 기반 최강 전략
StockGPT (월별)13%1.0현실적 거래 제약 반영
단기 반전 팩터8.8%0.7전통 팩터 중 최강
한국 시장 적용 설계: KOSPI200 + KOSDAQ150 (350종목), 2010~2021 학습, 2022~2024 검증. 한국 시장은 상하한가 ±30%가 있어 50bp 대신 25bp 단위로 세밀하게 토큰화. 이 모델의 상위 20개 종목과 기존 전략 C의 유니버스를 교집합하면 최종 매수 후보가 된다. 단, 일별 리밸런싱은 거래비용으로 불가 → 월별 또는 주별 리밸런싱 기준으로 조정 필요.
RESEARCH 07 알파 자동 발굴

LLM이 알파 수식을 자동으로
설계하고 검증한다

Alpha-GPT (Wang et al. 2023) · AlphaAgent (Tang et al. 2025) · GPT-Signal (2024)
퀀트 연구자가 새 알파(수익 예측 신호)를 발굴하는 데 수주가 걸린다. Alpha-GPT는 이 과정을 LLM이 수백 개의 알파 수식을 자동으로 생성하고, 백테스트로 검증해 살아남은 것만 보존하는 방식으로 혁신했다. AlphaAgent는 여기서 더 나아가 알파 감쇠를 방지하는 탐색 메커니즘을 추가했다.
알파 수식이란 이런 것이다: rank(-corr(returns_5d, volume_5d, 10)). 5일 수익률과 거래량의 상관관계가 높을수록 낮은 순위를 부여한다는 의미다. LLM은 이런 수식을 재무·기술적 지표 조합으로 수백 개 생성하고, IC(정보계수) 0.02 이상이면 보존, 그 미만이면 폐기한다.
알파 감쇠(Alpha Decay)가 가장 큰 도전이다. 좋은 알파를 발견하면 다른 투자자들도 같은 알파를 학습해서 효과가 점점 줄어든다. AlphaAgent는 "이미 많이 쓰인 알파 패턴에 페널티를 부여하고, 새로운 방향으로 탐색을 강제"하는 정규화 탐색으로 이 문제를 완화했다.
주간 알파 탐색 루틴: 매주 토요일, LLM에 "IC 0.02 이상이 예상되는 새 알파 수식 10개를 제안하라. 기존 RSI·MACD와 상관계수 0.3 이하인 것만"을 프롬프트로 보내고, KOSPI200 데이터로 자동 백테스트 후 합격 알파를 팩터 풀에 추가한다. 이 과정을 자동화하면 주간 알파 탐색 비용이 사실상 0에 가까워진다.
SYSTEM INTEGRATION
종합

연구 성과를
3전략 시스템에 이렇게 통합한다

Strategy A 뉴스 기반 이벤트 드리븐 — AI 강화 방향
즉시 (1~2주)
FinBERT(KR-FinBert-SC)로 뉴스 3레벨 분류 + 감성 스코어 교체. 기존 키워드 방식 대비 정확도↑, 인터페이스 동일 유지.
단기 (2~4주)
GPT-4o DART 중요 공시 정밀 분석. FinBERT 1차 필터 → GPT-4o 2차 정밀분석 이원화로 비용 70% 절감.
중기 (1~3개월)
RAG 시스템: ChromaDB에 과거 KOSPI 주요 이벤트 사례 저장 → 현재 뉴스와 유사 케이스 검색 → LLM 컨텍스트로 제공.
리스크 연동
Lopez-Lira & Tang 방식: 감성 점수 -1→+1 전환 + 신뢰도 ≥ 0.7인 경우만 신호 생성. IC 주간 추적으로 신호 품질 모니터링.
Strategy B 통계 리드-래그 팩터 — AI 강화 방향
즉시 (1~2주)
LSTM + 감성 피처: 기존 리드-래그 상관계수에 LSTM 비선형 예측 추가. 60일 시퀀스 → 5일 후 방향 보조 신호.
단기 (2~4주)
동적 가중치: 각 팩터(PSR·모멘텀·FIP)의 최근 30일 IC로 자동 가중치 조정. 성과 좋은 팩터가 자동으로 비중 증가.
중기 (1~3개월)
Alpha-GPT 파이프라인: 주간 자동 알파 탐색. IC>0.02 AND 기존 알파와 상관계수<0.3인 신규 알파만 팩터 풀에 추가.
장기 (3~6개월)
KR-StockGPT: 한국 주식 수익률 토큰화 GPT 실험. 상위 20개 예측 종목과 기존 팩터 풀의 교집합으로 최종 선정.
Strategy C 복합 신호 스윙 — AI 강화 방향
즉시 (1~2주)
IC 측정 모듈: 모든 신호에 정보계수 추적 추가. 신호 발생 시 timestamp·ticker·value 기록, n일 후 실제 수익률과 비교.
중기 (1~3개월)
PPO 에이전트(FinRL): Trend Template 8조건 + VCP 신호를 상태로, 드로우다운 제어 보상함수로 매매 타이밍 최적화.
중기 (1~3개월)
LLM+PPO 2단계: GPT-4o 방향 예측 → PPO가 VaR/CVaR 확인 후 최종 진입 결정. CVaR > 계좌 2% 시 자동 차단.
공통 인프라
엘더 6% Rule: 월 손실 6% 도달 시 전 전략 신규 진입 차단. 슈웨거: 드로우다운 -15% → 전체 사이즈 50% 자동 축소.
IMPLEMENTATION ROADMAP

단계별 구현 로드맵

PHASE
01
1~2주
FinBERT 뉴스 감성 파이프라인 + IC 측정 모듈
  • snunlp/KR-FinBert-SC 로드 → 한국어 뉴스 감성 점수 (-1~+1) 출력
  • 뉴스 3레벨 분류기 (시장 0.2 / 섹터 0.3 / 종목 0.5 가중치)
  • 기존 전략 A 뉴스 처리 모듈 교체 (인터페이스 동일 유지)
  • 신호 발생 시 IC 기록 모듈 추가 (timestamp + ticker + signal_value)
  • 주간 IC, ICIR 자동 계산 + 대시보드 시각화
PHASE
02
2~4주
GPT-4o 정밀 분석 + LSTM 예측 모듈 + 앙상블 결합기
  • DART 중요사항보고서 트리거 → GPT-4o 정밀 감성 분석 (한국어 프롬프트)
  • FinBERT 1차 필터 → GPT-4o 2차 분석 이원화 (비용 70% 절감)
  • 2-Layer LSTM + Attention: OHLCV + 기술지표 20개 + FinBERT 스코어 → 5일 후 방향
  • A/B/C 전략 신호 가중 결합기: 최근 30일 IC 기반 동적 가중치
  • RAG 기초: ChromaDB 구성 + 2020~2024 KOSPI 주요 이벤트 임베딩
PHASE
03
1~3개월
PPO 에이전트 + LLM+PPO 2단계 리스크 제어 + Alpha-GPT
  • FinRL 기반 PPO 에이전트: KOSPI200 단일종목 → 점진적 확장
  • 리스크 조정 보상함수: 드로우다운 패널티 + 월 손실 패널티 + 거래비용 차감
  • LLM+PPO 2단계: GPT-4o 예측 → CVaR > 계좌 2% 시 자동 차단
  • Alpha-GPT: 주간 자동 알파 탐색 (IC>0.02 + 기존 알파 상관<0.3)
  • Shadow Mode: 신규 모델 1개월 시뮬레이션 후 실전 교체
PHASE
04
3~6개월
KR-StockGPT + MARL + XAI 대시보드
  • KR-StockGPT: 한국 주식 수익률 25bp 토큰화 → GPT-2 스케일 학습
  • Multi-Agent RL: A/B/C 에이전트 독립화 + Meta-Agent 가중 투표
  • 온라인 학습: 새 데이터로 지속 업데이트 (EWC 적용해 과거 망각 방지)
  • XAI 대시보드: SHAP 값으로 매수 결정 근거 시각화
REFERENCE PAPERS

핵심 논문 목록

01
Can ChatGPT Forecast Stock Price Movements?
Lopez-Lira & Tang (UCLA) · 2023 · SSRN 4412788
LLM 감성
02
MarketSenseAI 2.0 — LLM + RAG 종목선정
Fatouros et al. · 2025 · Frontiers in AI
RAG
03
StockGPT: A GenAI Model for Stock Prediction
(2024) · arXiv 2404.05101 · Sharpe 6.5
가격 GPT
04
Alpha-GPT: Human-AI Interactive Alpha Mining
Wang et al. · 2023 · arXiv
알파 자동화
05
AlphaAgent: LLM Alpha Mining with Regularized Exploration
Tang et al. · 2025 · 알파 감쇠 방지
알파 감쇠
06
LLM+PPO Two-Stage Risk-Aware Framework
(2025) · VaR/CVaR 리스크 제어 통합
LLM+RL
07
FinBERT-LSTM: 뉴스 3레벨 분류 + 시계열 예측
(2024) · ACM Cloud and Big Data Computing
FinBERT
08
Large Language Models in Equity Markets (84편 종합)
(2025) · PMC / Frontiers in Artificial Intelligence
종합 리뷰
09
GPT-Signal: LLM 기반 반자동 피처 엔지니어링
Wang, Zhao, Lawryshyn · 2024 · arXiv
피처 자동화
10
Adaptive Alpha Weighting with PPO
(2025) · arXiv 2509.01393 · LLM 알파 + RL 결합
알파+RL
CONCLUSION
무엇부터 시작할 것인가

연구 성과들을 보면 분명한 패턴이 보인다. LLM의 언어 이해력 + 강화학습의 리스크 최적화 + 퀀트 팩터의 안정성 이 세 축이 결합될 때 가장 강력한 시스템이 만들어진다. 하지만 모든 것을 한꺼번에 구현하려 하면 아무것도 완성되지 않는다.

가장 먼저 할 것은 FinBERT 뉴스 감성 파이프라인이다. 구현이 단순하고, 기존 전략 A와 연동이 쉬우며, 효과가 논문으로 실증됐다. 여기에 IC 측정 모듈을 붙여 신호 품질을 추적하는 것이 Phase 1의 전부다. 그것만으로도 시스템의 정보 처리 수준이 한 단계 올라간다.

Lopez-Lira & Tang의 한 줄 결론이 기억에 남는다. "GPT-1, GPT-2, BERT는 아무 예측력이 없었다. GPT-3.5부터 효과가 나타났다." 규모가 임계점을 넘어서야 언어 이해가 시장 이해로 전환된다. 2025년 현재, 그 임계점은 이미 API 호출 몇 번으로 넘어설 수 있는 시대다.

iotnbigdata.tistory.com  ·  주식 퀀트 자동매매 시스템 구축 시리즈 Vol.3
Python · Korea Investment Securities API · Kiwoom API · Claude AI · FinBERT · GPT-4o
본 내용은 투자 권유가 아닌 시스템 개발 레퍼런스입니다.

728x90
반응형