本書在不涉及大量數學模型與復雜編程知識的前提下,從零開始逐步帶領讀者熟悉并掌握當下流行的基于Python 3的數據分析,以及支持單機、深度和分布式機器學習的開源程序庫,如pandas、Scikitlearn、PyTorch、TensorFlow、PaddlePaddle、PySparkML等。全書分4部分。入門篇包括對全書核心概念的指南性介紹,以及在多種主流操作系統(tǒng)(Windows、macOS、Ubuntu)上配置基本編程環(huán)境的詳細說明?;A篇涵蓋Python 3的編程基礎、基于pandas的數據分析,以及使用Scikitlearn解決大量經典的單機(單核/多核)機器學習問題。進階篇介紹如何使用PyTorch、TensorFlow、PaddlePaddle搭建多種深度學習網絡框架,以及如何基于PySpark的ML編程庫完成一些常見的分布式機器學習任務。實踐篇利用全書所講授的Python編程、數據分析、機器學習知識,幫助讀者挑戰(zhàn)和參與Kaggle多種類型的競賽實戰(zhàn),同時介紹如何使用Git在Gitee、GitHub平臺上維護和管理日常代碼與編程項目。 本書適合所有對人工智能領域,特別是機器學習、數據挖掘、自然語言處理等技術及其實踐感興趣的初學者。