本書系統(tǒng)地闡述機器學習中常見的幾類模型,包括模型的思想、原理及實現(xiàn)細節(jié)等。同時,本書還結合了當前熱門的機器學習框架Sklearn,對書中所涉及的模型進行用法上詳細講解。 全書共10章,第1章介紹機器學習開發(fā)環(huán)境的配置;第2章講解線性回歸模型的基本原理、回歸模型中常見的幾種評價指標,以及用于有監(jiān)督模型訓練的梯度下降算法;第3章介紹邏輯回歸模型的基本原理和分類模型中常見的幾種評價指標;第4章介紹模型的改善與泛化,包括特征標準化、如何避免過擬合及如何進行模型選擇等;第5章講解K最近鄰分類算法的基本原理及kd樹的構造與搜索;第6章介紹樸素貝葉斯算法的基本原理;第7章介紹幾種常見的文本特征提取方法,包括詞袋模型和TF-IDF等;第8章講解決策樹的基本原理,包括幾種經典的決策樹生成算法和集成模型;第9章介紹支持向量機的基本原理與求解過程;第10章介紹幾種經典的聚類算法及相應的評價指標計算方法。 本書包含大量的代碼示例及實際案例介紹,不僅可以作為計算機相關專業(yè)學生入門機器學習的讀物,同時也適用于非計算機專業(yè)及培訓機構的參考學習書籍。