La Sfida: Il "Rumore" informativo
Nel mercato delle criptovalute, l'informazione è frammentata, rumorosa e spesso manipolata. La sfida non era solo raccogliere dati, ma **qualificarli in tempo reale** per estrarre il vero sentiment di mercato, distinguendo tra news generiche e movimenti macroeconomici reali.
Era necessario un sistema capace di:
- Monitorare centinaia di fonti RSS e web in modo invisibile (anti-bot).
- Analizzare il testo non solo semanticamente, ma contestualmente alla "narrativa" del momento (ETF, Regulation, Macro).
- Correlare il sentiment con l'azione del prezzo (Price Action) per identificare divergenze.
Architettura della Soluzione
Ho progettato un'architettura modulare basata su microservizi Dockerizzati, ottimizzata per la resilienza e la velocità di esecuzione.
1. Pipeline di Acquisizione Stealth
Il crawler non è un semplice script di download. Implementa tecniche avanzate di evasione anti-bot per garantire la continuità del servizio:
- Rotazione User-Agent: Pool dinamico di browser reali per simulare traffico organico.
- Referer Spoofing: Simulazione di provenienza da motori di ricerca o social media.
- Delays Randomizzati: Algoritmi di attesa non lineari per evitare il pattern detection.
2. AI Narrative-Aware (Il "Motore" di Sentiment)
L'analisi non si ferma alla polarità (positivo/negativo). Il sistema assegna pesi diversi in base alla categoria della notizia. Una news su un **ETF di BlackRock** ha un impatto (Relevance Score) intrinsecamente superiore a una news generica su un'altcoin minore.
Fear Asymmetry: Il sistema applica un moltiplicatore di contrasto sui punteggi negativi durante i trend di calo del prezzo, simulando la reazione psicologica reale degli investitori.
Risultati Tecnici
Il risultato è una dashboard che fornisce un **Sentiment Index** pulito, utilizzato per comprendere le dinamiche di mercato prima che si riflettano completamente sul prezzo.
Demo Live: Sentiment Index
Qui sotto puoi vedere l'indicatore di sentiment in tempo reale generato dal sistema. Il widget recupera i dati direttamente dalla pipeline di analisi descritta sopra.