Translate

martedì 16 giugno 2015

GLI ALGORITMI LEGGONO LE NEWS DI MERCATO? SI'. PT.3

"Read between the lines, where nobody can lie."
Per la seconda parte, clicca qui. Il passo successivo all'analisi del sentiment è stato -per i sistemi informatici- a livello di processo evolutivo, quello del superamento della mera formulazione di un giudizio di positività, negatività, neutralità della singola notizia, per approdare alla formulazione di una stima dell'impatto della stessa sul prezzo dell'asset. Per far ciò, ancora una volta, si è resa indispensabile l'identificazione delle informazioni chiave contenute nelle news: o tramite Natural Language Processing (di cui al post precedente – clicca qui) o sfruttando la maggiore disponibilità di informazioni direttamente leggibili dalle macchine, sottoposte ad un processo di estrazione dei dati a mezzo dei richiesti tags. Scelto un metodo qualsiasi per estrarre “informazioni” dalle news, si passa alla seconda fase, consistente nello stabilire quali siano i loro effetti sul prezzo dell'asset di riferimento. L'asset pricing è un'attività complessa ma fondamentale, ragion per cui, al fine di stimare l'impatto sul prezzo, le news (o meglio la loro significatività) devono essere incorporate nei modelli di pricing dedicati a ciascun asset. Tale processo, risulta molto semplice in presenza di alcune notizie facilmente interpretabili: ad esempio, qualora venisse annunciata la stipula di un contratto avente un valore complessivamente elevato, verosimilmente, questa verrebbe decodificata come evento impattante il livello di costi e vendite dell'azienda; le dimissioni di un CEO, viceversa, sono difficilmente quantificabili in quanto spesso dipendono dal contesto nel quale siano maturate. Nel corso degli anni, sono state raffinate alcune tecniche di analisi in grado di leggere “tra le righe”: pionieristico in tal senso lo studio condotto nel 2004 da A.Kloptchenko ed altri, sul “tono” impiegato dalle società nei reports, considerato addirittura in grado di sovra performare la significatività informativa -in termini di proiezione sui valori futuri- e dunque di impatto sul prezzo, dei dati numerici in essi contenuti.
L'attività di news mining, combina l'analisi dei dati storici con le informazioni contenute negli archivi delle notizie. Al fine di riconoscere possibili flussi informativi in grado di incidere sulle quotazioni, sui prezzi degli assets, diverse tecniche afferenti il mondo dell' Artificial Intelligence (AI), come reti neurali e/o support vector machines, sono dispiegate nell'ambito di articolate e complesse fasi di apprendimento delle modalità di predizione dei cambiamenti futuri. L'analisi del impatto generato dalle news sul breve termine risulta, normalmente, più semplice rispetto a quello sul medio-lungo. La comparazione tra i dati contenuti nelle news e le aspettative del mercato, ci permette di stabilire in quale misura i primi rappresentino una sorpresa: qualora non dovessero esserlo affatto -in quanto in linea con le seconde- con ogni probabilità potrebbero considerarsi già scontate, ovvero incorporate nel prezzo che, in corrispondenza della release non dovrebbe subire variazioni considerevoli. Al contrario, uno scostamento tra dati attesi e dati ufficiali, può considerarsi fattore idoneo ad innescare una fase di volatilità, la quale caratterizzerà le contrattazioni sino a quando il mercato non prenderà coscienza del nuovo elemento informativo, conducente ad un nuovo prezzo di equilibrio.

Nel comprendere se e quanto una news possa impattare il prezzo di un asset, è necessario valutare quanto e quale contenuto informativo effettivamente “nuovo”, “inedito”, sia in essa contenuto, ponendola a confronto con quelle precedenti. Fatto ciò, si passerà all'osservazione della sua assimilazione -con annessa reazione- da parte del mercato ove, negli anni, è stato possibile osservare casi dall'elevato contenuto significativo: ad esempio, la notizia della scoperta di una molecola la cui efficacia anti tumororale veniva certificata da un'agenzia del farmaco che ne autorizzava la produzione e riportata a pagina 28/30 di un noto quotidiano, in Dicembre, non produceva sul mercato alcuna reazione particolare; la stessa notizia (ovvero l'autorizzazione a produrre il farmaco anti-tumore avente come base quella molecola) riportata in prima pagina qualche mese dopo (Maggio), con qualche approfondimento tecnico, generava una variazione giornaliera nel prezzo delle azioni della società, pari al 330%. Le spiegazioni possono essere, sostanzialmente, due:
  • un'under-reaction degli istituzionali a Dicembre;
  • la maggiore pubblicità ricevuta dalla società tra Dicembre e Maggio, che ha fatto sì che un maggior numero di persone e quindi di investitori, si soffermasse sulla prima pagina del noto giornale.
Da questo piccolo aneddoto possiamo dedurre che, nel valutare l'impatto delle news, dovremmo considerare -anche- quanta attenzione potrebbe ricevere l'informazione. In realtà, potremmo trarre -in aggiunta- un altro insegnamento: la news mining si pone quale strumento utile a valutare come e quanto gli effetti di un evento possano influenzare e condizionare altri assets afferenti lo stesso o diverso settore produttivo. Nel caso del farmaco anti tumore il settore Biotech, nel giorno della seconda pubblicazione della notizia, ricevette molta attenzione ed anche i prezzi delle azioni delle società non direttamente interessate dalla scoperta, salirono di qualche punto percentuale. La complessità del processo di pricing è tuttavia tale, da ricordarci l'importanza di ponderare fattori esogeni rispetto alle news, ma endogeni al mercato, quali ad esempio le condizioni generali delle contrattazioni e/o dati economici/finanziari fondamentali, in grado di spiegare -anche in termini di contenimento o amplificazione del movimento- le ragioni del cambiamento del prezzo dell'asset.
Come nell'approntamento di un qualsiasi modello previsionale, l'esercizio della prudenza si rivela dirimente al fine di evitare che i dati news related siano eccessivamente over-fitted; il tal caso, la prudenza viene tradotta in un metodo operativo che prevede l'esclusione dei dati -tanto storici quanto inerenti le mere notizie- riconducibili ad un prestabilito periodo di tempo, generalmente, molto recente. Ogni relazione basata sul dataset può poi essere ritestata sul periodo appena escluso, al fine di testarne l' adeguatezza. Qualsiasi regola resistente al test, può poi essere sottoposta ad ulteriore verifica basata su dati e prezzi real-time.
Quando si verifica la condizione di over-fitting?
L'over-fitting si materializza quando il rapporto (complessità del modello/dimensione del set di dati di apprendimento) risulti eccessivamente alto. E' possibile pensare all 'over-fitting come ad una situazione in cui il modello di apprendimento predisposto “impari” quanto necessario dal cuore dei dati anziché dalla situazione complessiva, dal “quadro complessivo”, precludendosi la capacità di una maggiore generalizzazione. Questo accade quando il modello è troppo complesso rispetto alla dimensione dei dati di riferimento, vale a dire quando questa è troppo piccola rispetto alla complessità della prima.