本書著眼于人工智能自身的安全問題,旨在將當前人工智能安全的基礎問題、關鍵問題、核心算法進行歸納總結。本書的定位是學習人工智能安全的入門書籍,因此先詳細介紹了人工智能安全相關的基礎知識,包括相關的基礎算法和安全模型,使得讀者明確人工智能面臨的威脅,對人工智能安全有一個大體的概念和初步認識。然后將人工智能系統(tǒng)的主要安全威脅分為模型安全性威脅和模型與數據隱私威脅兩大類。模型安全性威脅主要包括投毒攻擊、后門攻擊、對抗攻擊、深度偽造。模型與數據隱私威脅主要包括竊取模型的權重、結構、決策邊界等模型本身信息和訓練數據集信息。本書在介紹上述經典攻擊技術的同時,也介紹了相應的防御方法,使得讀者通過這些攻擊了解人工智能模型的脆弱性,并對如何防御攻擊的方法、如何增強人工智能模型的魯棒性有一定的思考。本書主要從隱私保護的基本概念、數據隱私、模型竊取與防御三個維度來介紹通用的隱私保護定義與技術、典型的機器學習數據隱私攻擊方式和相應的防御手段,并探討了模型竊取攻擊及其對應的防御方法,使得讀者能夠直觀全面地了解模型與數據隱私并掌握一些經典算法的整體實現流程。這本書還介紹了真實世界場景中不同傳感器下的對抗攻擊和相應的防御措施以及人工智能系統(tǒng)對抗博弈的現狀。相比于數字世界的攻擊,真實世界的攻擊更需要引起人們的關注,一旦犯罪分子惡意利用人工智能系統(tǒng)的漏洞,將會給人們的生產生活帶來安全威脅,影響大家的人身安全、財產安全還有個人隱私。讀者可以通過閱讀此書的知識內容及相關經典案例了解掌握人工智能系統(tǒng)面臨的攻防技術,了解如何在前人的基礎上,研究出針對各種攻擊的防御方法,為可信人工智能助力。本書適合期望入門人工智能安全的計算機相關專業(yè)的學生、技術工作者,人工智能領域的從業(yè)人員,對人工智能安全感興趣的人員,致力于建設可信人工智能的人員,本書所涉及的內容可以幫助讀者快速全面地了解人工智能安全所涉及的問題及技術,了解相關攻防技術算法的基本原理,可幫助人工智能領域的開發(fā)人員做出更安全的應用產品。