Statistical Methods in Data Science and Applications - Rilegato

 
9783725807475: Statistical Methods in Data Science and Applications

Sinossi

L'ascesa dei big data ha significativamente elevato l'importanza della scienza dei dati, catalizzando ricerche approfondite in più campi, tra cui matematica, statistica, informatica e intelligenza artificiale. La scienza dei dati comprende processi di modellazione, calcolo e apprendimento per trasformare i dati in informazioni, le informazioni in conoscenza e la conoscenza in decisioni attuabili. Tuttavia, le complessità dei big data pongono numerose sfide, come la gestione dei dati mancanti, dati ad alta e ultra-alta dimensionalità, dipendenze dalle risposte, analisi delle serie temporali e archiviazione distribuita. Le teorie, i metodi e gli algoritmi esistenti per l'analisi dei big data incontrano ostacoli significativi, in particolare per quanto riguarda concetti statistici fondamentali come stima, test di ipotesi, intervalli di confidenza e selezione delle variabili, abbracciando approcci frequentisti e bayesiani. Questa ristampa offre una serie di strumenti nel campo della scienza dei dati volti ad affrontare queste sfide. Comprende vari argomenti, tra cui la gestione degli errori di misurazione o dei dati mancanti, la modellazione della diagnosi cognitiva, la costruzione di scorecard del rischio di credito utilizzando modelli di regressione logistica, modellazione della regressione ponderata geograficamente, pratiche di protezione della privacy nel data mining, metodi di clustering e selezione di modelli per set di dati ad alta dimensione. Inoltre, approfondisce la previsione di caratteristiche sensibili sotto interrogatorio indiretto. Queste discussioni mirano a fornire strumenti preziosi ed esempi per l'applicazione pratica della scienza dei dati.

Le informazioni nella sezione "Riassunto" possono far riferimento a edizioni diverse di questo titolo.