本書結(jié)合計算機相關(guān)專業(yè)大數(shù)據(jù)采集與分析方向課程體系、企業(yè)大數(shù)據(jù)采集與分析崗位能力模型和相關(guān)課程標(biāo)準(zhǔn),以實踐能力培養(yǎng)為導(dǎo)向,遵循企業(yè)軟件工程標(biāo)準(zhǔn)和技術(shù),針對Anaconda+PyCharm開發(fā)環(huán)境、requests庫、re模塊、lxml庫、BeautifulSoup庫、Selenium、Scrapy框架、文件和MySQL數(shù)據(jù)庫存儲等重要大數(shù)據(jù)的采集與分析知識,結(jié)合實際案例和應(yīng)用環(huán)境進(jìn)行分析和設(shè)計,并對每個重要知識單元進(jìn)行詳細(xì)的實現(xiàn),使讀者能夠真正掌握這些知識在實際場景中的應(yīng)用。本書共有7個項目,項目1至項目6采用項目案例進(jìn)行知識單元訓(xùn)練,項目7用一個求職招聘網(wǎng)站項目貫穿大數(shù)據(jù)采集與分析核心知識,完整訓(xùn)練核心知識單元在企業(yè)真實項目中的應(yīng)用。本書涉及的示例和項目代碼均在Anaconda和PyCharm開發(fā)環(huán)境中運行通過。
本書適合作為“大數(shù)據(jù)采集與分析”課程的教材,也可作為對大數(shù)據(jù)采集與分析感興趣的學(xué)習(xí)者的指導(dǎo)用書。