隨著教學和數(shù)據分析業(yè)務的開展,我們發(fā)現(xiàn)更多的數(shù)據來自文本,而正則表達式是對文本數(shù)據的分析必不可少的技能。因此近年來,爬蟲俱樂部在開展的Stata編程課程中融入了較多的正則表達式內容。雖然我們在課程中融入很多生動的案例,但是正則表達式看似簡單實則一學就會但是容易忘,客觀上需要一本常備參考手冊。市面上關于正則表達式的參考書很少,而且沒有關于Stata使用正則表達式的資料,用戶只能閱讀Stata公司提供的晦澀難懂的手冊,因此每次上課都會有學員咨詢有沒有可能寫一本專門介紹Stata使用正則表達式方法的書。為此,我們下決心撰寫本書,希望系統(tǒng)地介紹Stata調用正則表達式的方法及其應用。