In questa lezione effettuiamo un’introduzione all’analisi delle serie temporali. Delimitiamo l’ambito e mostriamo come applicare le tecniche a diverse frequenze di dati finanziari.
Ci sono molti tecniche innovative per identificare i modelli sfruttabili nei prezzi degli asset. In particolare, Ad esempio l’econometria di base, il machine learning statistico e la statistica bayesiana. Pur utilizzando strumenti moderni per l’analisi dei dati, notiamo che la maggior parte dei modelli di asset nel settore adotta ancora l’analisi statistica delle serie temporali.
Cos’è l’analisi delle serie temporali?
Definiamo una serie temporale come una quantità che misuriamo in modo sequenziale nel tempo su un certo intervallo.
Nella sua forma più generale, l’analisi delle serie temporali ci permette di capire cosa è accaduto in passato a una serie di dati e ci aiuta a prevedere cosa succederà in futuro.
Scegliamo un approccio statistico quantitativo, assumendo che le nostre serie temporali rappresentino realizzazioni di sequenze di variabili casuali. Supponiamo quindi che un processo di generazione basato su una o più distribuzioni statistiche produca queste variabili.
L’analisi delle serie temporali ci aiuta a comprendere il passato e prevedere il futuro.
Chiamiamo questa sequenza di variabili casuali processo stocastico a tempo discreto (DTSP). Nel trading quantitativo adattiamo modelli statistici a questi DTSP per scoprire le relazioni sottostanti tra serie e prevedere valori futuri, così da generare segnali di trading.
Caratteristiche delle serie temporali
Le serie temporali, comprese quelle non finanziarie, spesso presentano le seguenti caratteristiche:
- Tendenze: una tendenza rappresenta un movimento direzionale coerente all’interno di una serie temporale. Possiamo osservare tendenze deterministiche o stocastiche. La prima ci fornisce una motivazione per il trend, mentre la seconda riflette una componente casuale della serie. Notiamo tendenze frequenti nelle serie finanziarie, come i prezzi delle materie prime, e molti fondi CTA (Commodity Trading Advisor) costruiscono algoritmi di trading basati su modelli sofisticati per identificare queste tendenze.
- Variazione stagionale: molte serie temporali mostrano variazioni stagionali, specialmente quelle legate a vendite aziendali o condizioni climatiche. Nella finanza quantitativa analizziamo spesso le variazioni stagionali delle materie prime, in particolare durante le stagioni di crescita o i cicli termici annuali, come per il gas naturale.
- Dipendenza seriale: consideriamo la correlazione seriale una delle caratteristiche più rilevanti delle serie temporali, soprattutto nel contesto finanziario. Rileviamo questa correlazione quando osservazioni vicine nel tempo risultano correlate. Il clustering della volatilità rappresenta un caso significativo di correlazione seriale nel trading quantitativo.
Analisi delle serie temporali nella finanza quantitativa
Come ricercatori quantitativi, ci impegniamo a identificare tendenze, stagionalità e correlazioni tramite metodi statistici sulle serie temporali. In modo dagenerare segnali di trading o costruire filtri basati su inferenze e previsioni.
Adottiamo il seguente approccio:
- Previsione e predizione dei valori futuri: per operare con efficacia, puntiamo a prevedere i prezzi futuri degli asset con un buon livello di precisione statistica.
- Simulazione delle serie: dopo aver identificato le proprietà statistiche delle serie temporali, possiamo usarle per simulare scenari futuri. In questo modo stimiamo il numero di operazioni, i costi di transazione previsti, il profilo di rendimento atteso, l’investimento richiesto in infrastrutture e, infine, valutiamo rischio e redditività di una strategia o portafoglio.
- Deduzione delle relazioni: individuando le relazioni tra serie temporali e altri valori quantitativi, possiamo perfezionare i segnali di trading tramite meccanismi di filtraggio. Ad esempio, se comprendiamo come varia lo spread di una coppia di valute in base al volume bid/ask, allora possiamo evitare trade in condizioni di spread elevato, riducendo i costi di transazione.
Infine, applichiamo test statistici standard (sia classici che bayesiani) ai modelli di serie temporali per giustificare certi comportamenti, come i cambiamenti di regime nei mercati azionari.
Applicazioni dell’Analisi delle Serie Temporali
Per applicare alcune delle tecniche basate sull’analisi bayesiana e il machine learning ai dati ad alta frequenza, costruiamo un framework matematico in grado di unificare la nostra ricerca. L’analisi delle serie temporali ci fornisce proprio questa struttura e ci permette di esplorare modelli differenti all’interno di un contesto statistico coerente.
A questo scopo, combiniamo strumenti bayesiani e tecniche di machine learning con i seguenti metodi per prevedere livello e direzione dei prezzi, agire da filtri e individuare i cambi di regime. In generale possiamo individuare e studiare tutti i momenti in cui il comportamento statistico delle nostre serie temporali cambia.
Nella seguente tabella riassumiamo gli argomenti per approfondire l’analisi delle serie temporali. Ogni argomento verrà trattato in una lezione o in una serie di lezioni. Al termine di questo percorso, riusciremo a costruire modelli moderni e sofisticati per l’analisi dei dati ad alta frequenza.
Metodi applicati
- Introduzione all’analisi delle serie temporali: tracciamo l’ambito dell’analisi delle serie temporali e spieghiamo come applicarla ai dati finanziari.
- Correlazione – Un elemento fondamentale nella modellazione delle serie temporali è la correlazione seriale. La definiamo e spieghiamo perché la correlazione non implica causalità, uno degli errori più comuni in quest’ambito.
- Previsione – In questa sezione affrontiamo il concetto di previsione, cioè l’anticipazione della direzione o del livello futuro di una serie temporale, e illustriamo come applichiamo queste tecniche nella pratica.
- Modelli stocastici – Esaminiamo modelli stocastici che estendono il Moto Browniano Geometrico e la Volatilità Stocastica, includendo il rumore bianco e i modelli autoregressivi.
- Regressione – Quando identifichiamo trend deterministici nei dati (anziché stocastici), possiamo giustificarne l’estrapolazione mediante modelli di regressione. Studiamo sia la regressione lineare che quella non lineare, considerando la correlazione seriale.
- Modelli stazionari – I modelli stazionari assumono che media e varianza della serie rimangano costanti nel tempo. Applichiamo modelli Moving Average (MA) e li combiniamo con quelli autoregressivi per ottenere modelli ARMA.
- Modelli non stazionari : Molte serie temporali finanziarie mostrano media e varianza variabili. Ad esempio, i prezzi degli asset attraversano spesso fasi di elevata volatilità. In questi casi impieghiamo modelli come ARIMA, ARCH e GARCH.
- Modellazione multivariata – Nel contesto del mean-reverting tra coppie di azioni, definiamo con rigore la cointegrazione e presentiamo ulteriori test. Introduciamo anche i modelli vettoriali autoregressivi (VAR), da non confondere con il Value-at-Risk.
- Rappresentazione in spazio di Stato – Prendiamo in prestito strumenti dalla teoria del controllo per modellare serie temporali con parametri che cambiano rapidamente, come la variabile di pendenza \(\beta\) tra due asset cointegrati in una regressione. Analizziamo in particolare il filtro di Kalman e il modello Markov nascosto. Questa sarà una delle principali applicazioni dell’analisi bayesiana alle serie temporali.
Conclusioni
Con TradingQuant vogliamo delineare con chiarezza il quadro matematico e statistico utile per l’analisi quantitativa e il trading quantitativo. Partendo dalle basi fino alle tecniche più avanzate. Descriviamo le tecniche più recenti e sofisticate, adottate dai hedge funds quantitativi.
In questo modo offriamo un supporto concreto a chi ambisce a una carriera nel settore. I trader retail possono invece ampliare il proprio set di strumenti e metodi, adottando un approccio integrato al trading.
Con certezza possiamo dire che la maggior parte dei professionisti nei fondi quantitativi adotta tecniche molto evolute per “catturare l’alfa”.
Tuttavia, molte di queste aziende raggiungono dimensioni tali da ignorare le strategie con “capacità limitate”, cioè quelle non scalabili oltre 1-2 milioni di dollari. Come trader retail, se applichiamo un framework sofisticato in questi contesti, possiamo puntare a una redditività sostenibile nel lungo periodo.
Uniamo le lezioni dedicate all’introduzione all’analisi delle serie temporali con l’approccio bayesiano alla verifica delle ipotesi e alla selezione del modello. Insieme al codice Python, genereremo modelli di serie temporali non lineari e non stazionari da utilizzare nel trading ad alta frequenza.
Inoltre, grazie al nostro software TQforex per il backtest ad alta frequenza su più coppie valutarie, disponiamo già di un framework operativo con cui testare efficacemente questi modelli, almeno sui mercati valutari.
La prossima lezione affronterà il concetto di correlazione e spiegherà perché rappresenta uno degli elementi fondamentali nell’introduzione all’analisi delle serie temporali.