
Google Cloud Platform È uno strumento per analizzare grandi database y crear modelli statistici in grado di prevedere eventi futuri, qualcosa di simile a ciò che viene utilizzato per le previsioni meteorologiche. Google, nel suo caso, ha utilizzato i suoi computer per prevedere i risultati di recenti partite di calcio della Coppa del Mondo e, curiosamente, le ha azzeccate. Questa affidabilità ha fatto sì che molti ricordassero il famoso "polpo Paul", anche se qui stiamo parlando di scienza dei dati applicato su larga scala.
L'ultimo round dei Mondiali di calcio è stato un successo per Google. Come sottolineano nel blog di Google Cloud Platform, i Risultati ottavi di finale di questa competizione hanno avuto pieno successo dai supercomputer dell'azienda – sì, persino la sconfitta della squadra americana. Se non ci credete, guardate – a partire dal minuto 25 – la conference call del servizio in cui hanno confermato le previsioni il 26 giugno.
Grazie ai dati raccolti in tutti i campionati in cui giocano alcuni giocatori della Coppa del Mondo, Google ha potuto esaminare il loro comportamento nelle partite precedenti, prevedendo così le loro prestazioni nelle partite future. Inoltre, le basi storiche fornite da Opta con diverse stagioni di football professionistico e record del fase a gironi del torneo per arricchire il modello. Queste previsioni si basavano anche sull'entusiasmo e il supporto dei tifosi per ciascuna delle squadre, quantificazione dei ventilatori spostati per sfruttare il noto “vantaggio del fattore campo”.
Come ha fatto Google a fare queste previsioni?
La pipeline dei dati è stata supportata da servizi cloud-native: Flusso di dati di Google Cloud per importare e trasformare dati in modo scalabile e Google BigQuery per elaborarli e consultarli milioni di righe in pochi secondi. Su questi set, gli ingegneri si sono allenati modelli di apprendimento automatico che valutano le prestazioni storiche, la qualità degli avversari, la forma recente, lo stato dei giocatori e segnali esterni come il supporto dei tifosi. La combinazione di più variabili ha permesso la generazione di probabilità di vincita fin dalla fase a gironi con grande stabilità.
Dal motore di ricerca incoraggiano chiunque sia interessato ad utilizzare questi strumenti per crea le tue previsioniHanno persino condiviso il Codice sorgente Python in un repository GitHub pubblico, semplificando la riproduzione dell'intero flusso: acquisizione con Dataflow, analisi in BigQuery e produzione dei modelli.
Pronostici sui quarti di finale
Ora, è stata una questione di fortuna o davvero i modelli costruiti da Google sono corretti al 100% quando si tratta di parlare della Coppa del Mondo FIFA? Bene, se sei interessato a scommettere sulle prossime partite, cioè sul quarti di finalePresta attenzione ai risultati che Google Cloud Platform ha previsto:
Brasile contro Colombia: Brasile (71%)
Francia contro Germania: Francia (69%)
Olanda contro Costa Rica: Paesi Bassi (68%)
Argentina contro Belgio: Argentina (81%)
Oltre a questi attraversamenti, il sistema di Google è arrivato a indovina 13 su 14 partite modellate sulla fase a gironi, superando il 90% corretto nei suoi calcoli. In uno degli scenari più eclatanti, "la nuvola" ha stimato che La Germania vincerebbe con un margine risicato la finale (circa il 55% di probabilità) e ha annunciato che Anche il Brasile vincerebbe la partita corrispondente nella stessa fase a eliminazione diretta.
In queste previsioni la verità è che La Francia si distingue come il risultato più sorprendente poiché la maggior parte dei bookmaker sostiene una vittoria per la Germania. Google avrà di nuovo ragione? Se hai intenzione di "fidarti" delle previsioni dei loro supercomputer, speriamo che commenterai di seguito e che, dopo le partite, sapremo se sei stato fortunato vincitore in qualche bookmaker.
Questo caso è un chiaro esempio di come BigQuery, Flusso di dati, segnali come il numero di ventilatori spostati e dati approfonditi su Opta consentono di trasformare statistiche sparse in probabilità praticabili. La lezione principale è che, sebbene nessun modello offra certezza assoluta, la combinazione di dati di qualità y cloud computing può offrire un reale vantaggio rispetto all'intuizione o alle previsioni tradizionali.
