1000部丰满熟女富婆视频,托着奶头喂男人吃奶,厨房挺进朋友人妻,成 人 免费 黄 色 网站无毒下载

首頁(yè) > 文章中心 > 數(shù)據(jù)分析師

數(shù)據(jù)分析師

前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇數(shù)據(jù)分析師范文,相信會(huì)為您的寫作帶來(lái)幫助,發(fā)現(xiàn)更多的寫作思路和靈感。

數(shù)據(jù)分析師

數(shù)據(jù)分析師范文第1篇

1.數(shù)據(jù)采集

了解數(shù)據(jù)采集的意義在于真正了解數(shù)據(jù)的原始面貌,包括數(shù)據(jù)產(chǎn)生的時(shí)間、條件、格式、內(nèi)容、長(zhǎng)度、限制條件等。這會(huì)幫助數(shù)據(jù)分析師更有針對(duì)性的控制數(shù)據(jù)生產(chǎn)和采集過(guò)程,避免由于違反數(shù)據(jù)采集規(guī)則導(dǎo)致的數(shù)據(jù)問(wèn)題;同時(shí),對(duì)數(shù)據(jù)采集邏輯的認(rèn)識(shí)增加了數(shù)據(jù)分析師對(duì)數(shù)據(jù)的理解程度,尤其是數(shù)據(jù)中的異常變化。比如:

Omniture中的Prop變量長(zhǎng)度只有100個(gè)字符,在數(shù)據(jù)采集部署過(guò)程中就不能把含有大量中文描述的文字賦值給Prop變量(超過(guò)的字符會(huì)被截?cái)?。

在Webtrekk323之前的Pixel版本,單條信息默認(rèn)最多只能發(fā)送不超過(guò)2K的數(shù)據(jù)。當(dāng)頁(yè)面含有過(guò)多變量或變量長(zhǎng)度有超出限定的情況下,在保持?jǐn)?shù)據(jù)收集的需求下,通常的解決方案是采用多個(gè)sendinfo方法分條發(fā)送;而在325之后的Pixel版本,單條信息默認(rèn)最多可以發(fā)送7K數(shù)據(jù)量,非常方便的解決了代碼部署中單條信息過(guò)載的問(wèn)題。(Webtrekk基于請(qǐng)求量付費(fèi),請(qǐng)求量越少,費(fèi)用越低)。

當(dāng)用戶在離線狀態(tài)下使用APP時(shí),數(shù)據(jù)由于無(wú)法聯(lián)網(wǎng)而發(fā)出,導(dǎo)致正常時(shí)間內(nèi)的數(shù)據(jù)統(tǒng)計(jì)分析延遲。直到該設(shè)備下次聯(lián)網(wǎng)時(shí),數(shù)據(jù)才能被發(fā)出并歸入當(dāng)時(shí)的時(shí)間。這就產(chǎn)生了不同時(shí)間看相同歷史時(shí)間的數(shù)據(jù)時(shí)會(huì)發(fā)生數(shù)據(jù)有出入。

在數(shù)據(jù)采集階段,數(shù)據(jù)分析師需要更多的了解數(shù)據(jù)生產(chǎn)和采集過(guò)程中的異常情況,如此才能更好的追本溯源。另外,這也能很大程度上避免“垃圾數(shù)據(jù)進(jìn)導(dǎo)致垃圾數(shù)據(jù)出”的問(wèn)題。

2.數(shù)據(jù)存儲(chǔ)

無(wú)論數(shù)據(jù)存儲(chǔ)于云端還是本地,數(shù)據(jù)的存儲(chǔ)不只是我們看到的數(shù)據(jù)庫(kù)那么簡(jiǎn)單。比如:

數(shù)據(jù)存儲(chǔ)系統(tǒng)是MySql、Oracle、SQL Server還是其他系統(tǒng)。

數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)及各庫(kù)表如何關(guān)聯(lián),星型、雪花型還是其他。

生產(chǎn)數(shù)據(jù)庫(kù)接收數(shù)據(jù)時(shí)是否有一定規(guī)則,比如只接收特定類型字段。

生產(chǎn)數(shù)據(jù)庫(kù)面對(duì)異常值如何處理,強(qiáng)制轉(zhuǎn)換、留空還是返回錯(cuò)誤。

生產(chǎn)數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)如何存儲(chǔ)數(shù)據(jù),名稱、含義、類型、長(zhǎng)度、精度、是否可為空、是否唯一、字符編碼、約束條件規(guī)則是什么。

接觸到的數(shù)據(jù)是原始數(shù)據(jù)還是ETL后的數(shù)據(jù),ETL規(guī)則是什么。

數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)的更新更新機(jī)制是什么,全量更新還是增量更新。

不同數(shù)據(jù)庫(kù)和庫(kù)表之間的同步規(guī)則是什么,哪些因素會(huì)造成數(shù)據(jù)差異,如何處理差異的。

在數(shù)據(jù)存儲(chǔ)階段,數(shù)據(jù)分析師需要了解數(shù)據(jù)存儲(chǔ)內(nèi)部的工作機(jī)制和流程,最核心的因素是在原始數(shù)據(jù)基礎(chǔ)上經(jīng)過(guò)哪些加工處理,最后得到了怎樣的數(shù)據(jù)。由于數(shù)據(jù)在存儲(chǔ)階段是不斷動(dòng)態(tài)變化和迭代更新的,其及時(shí)性、完整性、有效性、一致性、準(zhǔn)確性很多時(shí)候由于軟硬件、內(nèi)外部環(huán)境問(wèn)題無(wú)法保證,這些都會(huì)導(dǎo)致后期數(shù)據(jù)應(yīng)用問(wèn)題。

3.數(shù)據(jù)提取

數(shù)據(jù)提取是將數(shù)據(jù)取出的過(guò)程,數(shù)據(jù)提取的核心環(huán)節(jié)是從哪取、何時(shí)取、如何取。

從哪取,數(shù)據(jù)來(lái)源——不同的數(shù)據(jù)源得到的數(shù)據(jù)結(jié)果未必一致。

何時(shí)取,提取時(shí)間——不同時(shí)間取出來(lái)的數(shù)據(jù)結(jié)果未必一致。

如何取,提取規(guī)則——不同提取規(guī)則下的數(shù)據(jù)結(jié)果很難一致。

在數(shù)據(jù)提取階段,數(shù)據(jù)分析師首先需要具備數(shù)據(jù)提取能力。常用的Select From語(yǔ)句是SQL查詢和提取的必備技能,但即使是簡(jiǎn)單的取數(shù)工作也有不同層次。第一層是從單張數(shù)據(jù)庫(kù)中按條件提取數(shù)據(jù)的能力,where是基本的條件語(yǔ)句;第二層是掌握跨庫(kù)表提取數(shù)據(jù)的能力,不同的join有不同的用法;第三層是優(yōu)化SQL語(yǔ)句,通過(guò)優(yōu)化嵌套、篩選的邏輯層次和遍歷次數(shù)等,減少個(gè)人時(shí)間浪費(fèi)和系統(tǒng)資源消耗。

其次是理解業(yè)務(wù)需求的能力,比如業(yè)務(wù)需要“銷售額”這個(gè)字段,相關(guān)字段至少有產(chǎn)品銷售額和產(chǎn)品訂單金額,其中的差別在于是否含優(yōu)惠券、運(yùn)費(fèi)等折扣和費(fèi)用。包含該因素即是訂單金額,否則就是產(chǎn)品單價(jià)×數(shù)量的產(chǎn)品銷售額。

4.數(shù)據(jù)挖掘

數(shù)據(jù)挖掘是面對(duì)海量數(shù)據(jù)時(shí)進(jìn)行數(shù)據(jù)價(jià)值提煉的關(guān)鍵,以下是算法選擇的基本原則:

沒(méi)有最好的算法,只有最適合的算法,算法選擇的原則是兼具準(zhǔn)確性、可操作性、可理解性、可應(yīng)用性。

沒(méi)有一種算法能解決所有問(wèn)題,但精通一門算法可以解決很多問(wèn)題。

挖掘算法最難的是算法調(diào)優(yōu),同一種算法在不同場(chǎng)景下的參數(shù)設(shè)定相同,實(shí)踐是獲得調(diào)優(yōu)經(jīng)驗(yàn)的重要途徑。

在數(shù)據(jù)挖掘階段,數(shù)據(jù)分析師要掌握數(shù)據(jù)挖掘相關(guān)能力。一是數(shù)據(jù)挖掘、統(tǒng)計(jì)學(xué)、數(shù)學(xué)基本原理和常識(shí);二是熟練使用一門數(shù)據(jù)挖掘工具,Clementine、SAS或R都是可選項(xiàng),如果是程序出身也可以選擇編程實(shí)現(xiàn);三是需要了解常用的數(shù)據(jù)挖掘算法以及每種算法的應(yīng)用場(chǎng)景和優(yōu)劣差異點(diǎn)。

5.數(shù)據(jù)分析

數(shù)據(jù)分析相對(duì)于數(shù)據(jù)挖掘更多的是偏向業(yè)務(wù)應(yīng)用和解讀,當(dāng)數(shù)據(jù)挖掘算法得出結(jié)論后,如何解釋算法在結(jié)果、可信度、顯著程度等方面對(duì)于業(yè)務(wù)的實(shí)際意義,如何將挖掘結(jié)果反饋到業(yè)務(wù)操作過(guò)程中便于業(yè)務(wù)理解和實(shí)施是關(guān)鍵。

6.數(shù)據(jù)展現(xiàn)

數(shù)據(jù)展現(xiàn)即數(shù)據(jù)可視化的部分,數(shù)據(jù)分析師如何把數(shù)據(jù)觀點(diǎn)展示給業(yè)務(wù)的過(guò)程。數(shù)據(jù)展現(xiàn)除遵循各公司統(tǒng)一規(guī)范原則外,具體形式還要根據(jù)實(shí)際需求和場(chǎng)景而定。基本素質(zhì)要求如下:

工具。PPT、Excel、Word甚至郵件都是不錯(cuò)的展現(xiàn)工具,任意一個(gè)工具用好都很強(qiáng)大。

形式。圖文并茂的基本原則更易于理解,生動(dòng)、有趣、互動(dòng)、講故事都是加分項(xiàng)。

原則。領(lǐng)導(dǎo)層喜歡讀圖、看趨勢(shì)、要結(jié)論,執(zhí)行層歡看數(shù)、讀文字、看過(guò)程。

場(chǎng)景。大型會(huì)議PPT最合適,匯報(bào)說(shuō)明Word最實(shí)用,數(shù)據(jù)較多時(shí)Excel更方便。

最重要一點(diǎn),數(shù)據(jù)展現(xiàn)永遠(yuǎn)輔助于數(shù)據(jù)內(nèi)容,有價(jià)值的數(shù)據(jù)報(bào)告才是關(guān)鍵。

7.數(shù)據(jù)應(yīng)用

數(shù)據(jù)應(yīng)用是數(shù)據(jù)具有落地價(jià)值的直接體現(xiàn),這個(gè)過(guò)程需要數(shù)據(jù)分析師具備數(shù)據(jù)溝通能力、業(yè)務(wù)推動(dòng)能力和項(xiàng)目工作能力。

數(shù)據(jù)溝通能力。深入淺出的數(shù)據(jù)報(bào)告、言簡(jiǎn)意賅的數(shù)據(jù)結(jié)論更利于業(yè)務(wù)理解和接受,打比方、舉例子都是非常實(shí)用的技巧。

數(shù)據(jù)分析師范文第2篇

【關(guān)鍵詞】大數(shù)據(jù);大數(shù)據(jù)營(yíng)銷;京東

一、數(shù)據(jù)分析時(shí)代演變歷程

(一)數(shù)據(jù)1.0時(shí)代

數(shù)據(jù)分析出現(xiàn)在新的計(jì)算技術(shù)實(shí)現(xiàn)以后,分析1.0時(shí)代又稱為商業(yè)智能時(shí)代。它通過(guò)客觀分析和深入理解商業(yè)現(xiàn)象,取締在決策中僅憑直覺(jué)和過(guò)時(shí)的市場(chǎng)調(diào)研報(bào)告,幫助管理者理性化和最大化依據(jù)事實(shí)作出決策。首次在計(jì)算機(jī)的幫助下將生產(chǎn)、客戶交互、市場(chǎng)等數(shù)據(jù)錄入數(shù)據(jù)庫(kù)并且整合分析。但是由于發(fā)展的局限性對(duì)數(shù)據(jù)的使用更多的是準(zhǔn)備數(shù)據(jù),很少時(shí)間用在分析數(shù)據(jù)上。

(二)數(shù)據(jù)2.0時(shí)代

2.0時(shí)代開始于2005年,與分析1.0要求的公司能力不同,新時(shí)達(dá)要求數(shù)量分析師具備超強(qiáng)的分析數(shù)據(jù)能力,數(shù)據(jù)也不是只來(lái)源于公司內(nèi)部,更多的來(lái)自公司外部、互聯(lián)網(wǎng)、傳感器和各種公開的數(shù)據(jù)。比如領(lǐng)英公司,充分運(yùn)用數(shù)據(jù)分析搶占先機(jī),開發(fā)出令人印象深刻的數(shù)據(jù)服務(wù)。

(三)數(shù)據(jù)3.0時(shí)代

又稱為富化數(shù)據(jù)的產(chǎn)品時(shí)代。分析3.0時(shí)代來(lái)臨的標(biāo)準(zhǔn)是各行業(yè)大公司紛紛介入。公司可以很好的分析數(shù)據(jù),指導(dǎo)合適的商業(yè)決策。但是必須承認(rèn),隨著數(shù)據(jù)的越來(lái)越大,更新速度越來(lái)越快,在帶來(lái)發(fā)展機(jī)遇的同時(shí),也帶來(lái)諸多挑戰(zhàn)。如何商業(yè)化地利用這次變革是亟待面對(duì)的課題。

二、大數(shù)據(jù)營(yíng)銷的本質(zhì)

隨著顧客主導(dǎo)邏輯時(shí)代的到來(lái)以及互聯(lián)網(wǎng)電商等多渠道購(gòu)物方式的出現(xiàn),顧客角色和需求發(fā)生了轉(zhuǎn)變,世界正在被感知化、互聯(lián)化和智能化。大數(shù)據(jù)時(shí)代的到來(lái),個(gè)人的行為不僅能夠被量化搜集、預(yù)測(cè),而且顧客的個(gè)人觀點(diǎn)很可能改變商業(yè)世界和社會(huì)的運(yùn)行。由此,一個(gè)個(gè)性化顧客主導(dǎo)商業(yè)需求的時(shí)代已然到來(lái),大數(shù)據(jù)沖擊下,市場(chǎng)營(yíng)銷引領(lǐng)的企業(yè)變革初見(jiàn)端倪。

(一)大數(shù)據(jù)時(shí)代消費(fèi)者成為市場(chǎng)營(yíng)銷的主宰者

傳統(tǒng)的市場(chǎng)營(yíng)銷過(guò)程是通過(guò)市場(chǎng)調(diào)研,采集目前市場(chǎng)的信息幫助企業(yè)研發(fā)、生產(chǎn)、營(yíng)銷和推廣。但是在大數(shù)據(jù)以及社會(huì)化媒體盛行的今天,這種營(yíng)銷模式便黯然失色。今天的消費(fèi)者已然成為了市場(chǎng)營(yíng)銷的主宰者,他們會(huì)主動(dòng)搜尋商品信息,貨比三家,嚴(yán)格篩選。他們由之前的注重使用價(jià)值到更加注重消費(fèi)整個(gè)過(guò)程中的體驗(yàn)價(jià)值和情境價(jià)值。甚至企業(yè)品牌形象的塑造也不再是企業(yè)單一宣傳,虛擬社區(qū)以及購(gòu)物網(wǎng)站等的口碑開始影響消費(fèi)者的購(gòu)買行為。更有甚者,消費(fèi)者通過(guò)在社交媒體等渠道表達(dá)個(gè)人的需求已經(jīng)成為影響企業(yè)產(chǎn)品設(shè)計(jì)、研發(fā)、生產(chǎn)和銷售的重要因素。

(二)大數(shù)據(jù)時(shí)代企業(yè)精準(zhǔn)營(yíng)銷成為可能

在大數(shù)據(jù)時(shí)代下,技術(shù)的發(fā)展大大超過(guò)了企業(yè)的想象。搜集非結(jié)構(gòu)化的信息已經(jīng)成為一種可能,大數(shù)據(jù)不單單僅能了解細(xì)分市場(chǎng)的可能,更通過(guò)真正個(gè)性化洞察精確到每個(gè)顧客。通過(guò)數(shù)據(jù)的挖掘和深入分析,企業(yè)可以掌握有價(jià)值的信息幫助企業(yè)發(fā)現(xiàn)顧客思維模式、消費(fèi)行為模式。尤其在今天顧客為了彰顯個(gè)性,有著獨(dú)特的消費(fèi)傾向。相對(duì)于忠誠(chéng)于某個(gè)品牌,顧客更忠誠(chéng)與給自己的定位。如果企業(yè)的品牌不能最大化地實(shí)現(xiàn)客戶價(jià)值,那么即使是再惠顧也難以保證顧客的持續(xù)性。并且,企業(yè)不能奢望對(duì)顧客進(jìn)行歸類,因?yàn)槊總€(gè)顧客的需求都有差別。正是如此,大數(shù)據(jù)分析才能更好地把握顧客的消費(fèi)行為和偏好,為企業(yè)精準(zhǔn)營(yíng)銷出謀劃策。

(三)大數(shù)據(jù)時(shí)代企業(yè)營(yíng)銷理念———“充分以顧客為中心創(chuàng)造價(jià)值”

傳統(tǒng)的營(yíng)銷和戰(zhàn)略的觀點(diǎn)認(rèn)為,大規(guī)模生產(chǎn)意味著標(biāo)準(zhǔn)化生產(chǎn)方式,無(wú)個(gè)性化可言。定制化生產(chǎn)意味著個(gè)性化生產(chǎn),但是只是小規(guī)模定制。說(shuō)到底,大規(guī)模生產(chǎn)與定制化無(wú)法結(jié)合。但是在今天,大數(shù)據(jù)分析的營(yíng)銷和銷售解決的是大規(guī)模生產(chǎn)和顧客個(gè)性化需求之間的矛盾。使大企業(yè)擁有傳統(tǒng)小便利店的一對(duì)一顧客關(guān)系管理,以即時(shí)工具和個(gè)性化推薦使得大企業(yè)實(shí)現(xiàn)與顧客的實(shí)時(shí)溝通等。

三、基于數(shù)據(jù)營(yíng)銷案例研究

———京東京東是最大的自營(yíng)式電商企業(yè)。其中的京東商城,涵蓋服裝、化妝品、日用品、生鮮、電腦數(shù)碼等多個(gè)品類。在整個(gè)手機(jī)零售商行業(yè)里,京東無(wú)論是在銷售額還是銷售量都占到市場(chǎng)份額一半的規(guī)模。之所以占據(jù)這樣的優(yōu)勢(shì)地位,得益于大數(shù)據(jù)的應(yīng)用,即京東的JDPhone的計(jì)劃。JDPhone計(jì)劃是依據(jù)京東的大數(shù)據(jù)和綜合服務(wù)的能力,以用戶為中心整合產(chǎn)業(yè)鏈的優(yōu)質(zhì)資源并聯(lián)合廠商打造用戶期待的產(chǎn)品和服務(wù)體驗(yàn)。京東在銷售的過(guò)程中,通過(guò)對(duì)大數(shù)據(jù)的分析,內(nèi)部研究出一種稱為產(chǎn)品畫像的模型。這個(gè)模型通過(guò)綜合在京東網(wǎng)站購(gòu)物消費(fèi)者的信息,例如:年齡、性別、喜好等類別的信息,然后進(jìn)行深入分析。根據(jù)分析結(jié)果結(jié)合不同的消費(fèi)者便有諸如線上的程序化購(gòu)買、精準(zhǔn)的點(diǎn)擊等營(yíng)銷手段,有效的幫助京東實(shí)現(xiàn)精準(zhǔn)的營(yíng)銷推送。不僅如此,通過(guò)對(duì)于后續(xù)用戶購(gòu)物完成的售后數(shù)據(jù)分析,精確的分析商品的不足之處或者消費(fèi)者的直接需求。數(shù)據(jù)3.0時(shí)代的一個(gè)特征便是企業(yè)不在單純的在企業(yè)內(nèi)部分析數(shù)據(jù),而是共享實(shí)現(xiàn)價(jià)值共創(chuàng)。所以,京東把這些數(shù)據(jù)用于與上游供應(yīng)商進(jìn)行定期的交流,間接促進(jìn)生產(chǎn)廠商與消費(fèi)者溝通,了解市場(chǎng)的需求,指導(dǎo)下一次產(chǎn)品的市場(chǎng)定位??偟膩?lái)說(shuō),這個(gè)計(jì)劃是通過(guò)京東銷售和售后環(huán)節(jié)的大數(shù)據(jù)分析,一方面指導(dǎo)自身精準(zhǔn)營(yíng)銷,另一方面,影響供應(yīng)商產(chǎn)品定位和企業(yè)規(guī)劃,最終為消費(fèi)者提供滿足他們需求的個(gè)性化產(chǎn)品。

四、大數(shù)據(jù)營(yíng)銷的策略分析

(一)數(shù)據(jù)分析要樹立以人為本的思維

“以人為本”體現(xiàn)在兩個(gè)方面,一方面是數(shù)據(jù)分析以客戶為本,切實(shí)分析客戶的需求,用數(shù)據(jù)分析指導(dǎo)下一次的產(chǎn)品設(shè)計(jì)、生產(chǎn)和市場(chǎng)營(yíng)銷。另一方面,以人為本體現(xiàn)在對(duì)用戶數(shù)據(jù)的保密性和合理化應(yīng)用。切實(shí)維護(hù)好大數(shù)據(jù)和互聯(lián)網(wǎng)背景下隱私保護(hù)的問(wèn)題,使得信息技術(shù)良性發(fā)展。

(二)正確處理海量數(shù)據(jù)與核心數(shù)據(jù)的矛盾

大數(shù)據(jù)具有數(shù)據(jù)量大、類型繁多、價(jià)值密度低和速度快時(shí)效高的特點(diǎn)。所以在眾多海量的數(shù)據(jù)中,只有反映消費(fèi)者行為和市場(chǎng)需求的信息才是企業(yè)所需要的。不必要的數(shù)據(jù)分析只會(huì)影響企業(yè)做出時(shí)代Time2017年第04期中旬刊(總第657期)正確的決策。鑒于此,首先企業(yè)需要明確核心數(shù)據(jù)的標(biāo)準(zhǔn);其次企業(yè)要及時(shí)進(jìn)行核心數(shù)據(jù)的歸檔;最后要有專業(yè)的數(shù)據(jù)分析專業(yè)隊(duì)數(shù)據(jù)進(jìn)行分析,得出科學(xué)合理的結(jié)果以指導(dǎo)實(shí)踐。

(三)整合價(jià)值鏈以共享數(shù)據(jù)的方式實(shí)現(xiàn)價(jià)值創(chuàng)造

數(shù)據(jù)分析師范文第3篇

目前,高校專業(yè)課程教學(xué)方式大多以“知識(shí)點(diǎn)”為核心組織教學(xué),學(xué)生主要以學(xué)習(xí)知識(shí)為主,工程應(yīng)用實(shí)踐機(jī)會(huì)較少。項(xiàng)目沉浸式教學(xué)就是讓學(xué)生參與到企業(yè)的實(shí)際項(xiàng)目,將所學(xué)的知識(shí)在完成實(shí)際項(xiàng)目的過(guò)程中,在企業(yè)導(dǎo)師的指導(dǎo)下和同伴交流中進(jìn)行應(yīng)用、整合和重構(gòu),其實(shí)質(zhì)就是一種結(jié)合構(gòu)建主義學(xué)習(xí)理論和情境學(xué)習(xí)理論的探究性學(xué)習(xí)模式。目前國(guó)際上相關(guān)的項(xiàng)目式教學(xué)理論還有CDIO和POPBL[1-2],其中CDIO代表構(gòu)思、設(shè)計(jì)、實(shí)現(xiàn)和運(yùn)作,該理念是以麻省理工學(xué)院為主的大學(xué)在2000年創(chuàng)立的,旨在通過(guò)以完整的工程項(xiàng)目為載體,將傳統(tǒng)的課程教學(xué)與企業(yè)工程項(xiàng)目緊密結(jié)合;POPBL表示面向項(xiàng)目和基于問(wèn)題的學(xué)習(xí)方式,是基于問(wèn)題的學(xué)習(xí)方式PBL的進(jìn)一步提升,不但通過(guò)問(wèn)題引導(dǎo)學(xué)生學(xué)習(xí),還通過(guò)實(shí)際項(xiàng)目鍛煉學(xué)生的思維能力和實(shí)踐能力。這幾種理念在現(xiàn)實(shí)教學(xué)中的應(yīng)用都存在一定的局限性。

在國(guó)內(nèi),清華大學(xué)、大連理工大學(xué)等也都采納CDIO的教學(xué)理念進(jìn)行教學(xué)改革。其中,清華大學(xué)工業(yè)工程系通過(guò)數(shù)據(jù)結(jié)構(gòu)及算法、數(shù)據(jù)庫(kù)系統(tǒng)原理等必修基礎(chǔ)課程進(jìn)行實(shí)踐,提煉出一個(gè)以院系整體為單位的知識(shí)傳播和創(chuàng)新模式[3]。大連理工大學(xué)努力探索構(gòu)建CDIO與創(chuàng)新教育融合的新體系,從課程體系、教育模式等多方面入手,以達(dá)到培養(yǎng)創(chuàng)新型工程科技人才的目的[4]。盡管如此,這些基礎(chǔ)課程的實(shí)踐與工程實(shí)際的要求還有一定的距離。為此,達(dá)內(nèi)等培訓(xùn)公司要求其師資需要有多年的行業(yè)經(jīng)驗(yàn),在基本的知識(shí)授課結(jié)束后指導(dǎo)學(xué)生到合作企業(yè)進(jìn)行實(shí)訓(xùn),這在一定程度上可以解決項(xiàng)目沉浸式教學(xué),但作為一個(gè)培訓(xùn)項(xiàng)目,知識(shí)的系統(tǒng)性還有一定的改進(jìn)空間。IBM公司最近幾年與一些大學(xué)商(管理)學(xué)院合作的A100計(jì)劃,鼓勵(lì)高校專業(yè)教師與企業(yè)合作,帶領(lǐng)學(xué)生深入企業(yè),利用比較成熟的數(shù)據(jù)分析工具幫助企業(yè)解決實(shí)際問(wèn)題,但這種方法對(duì)指導(dǎo)教師的實(shí)踐經(jīng)驗(yàn)、時(shí)間投入等都有較高的要求,一般大學(xué)的專業(yè)師資難以滿足。

數(shù)據(jù)分析類課程包括商務(wù)智能、大數(shù)據(jù)核心技術(shù)、客戶智能等較多的理論知識(shí),且有一定難度,這些知識(shí)在實(shí)際應(yīng)用中有一定的技巧,需要大量的實(shí)踐才能掌握其中的精髓。實(shí)施項(xiàng)目沉浸式教學(xué),為減少前期學(xué)生學(xué)習(xí)的難度,通過(guò)學(xué)習(xí)已經(jīng)完成的項(xiàng)目文檔,通過(guò)實(shí)驗(yàn)方式了解項(xiàng)目需要的知識(shí)和技能,并利用仿真型的項(xiàng)目練習(xí)。在此基礎(chǔ)上,可以進(jìn)入真實(shí)企業(yè)項(xiàng)目,摸索數(shù)據(jù)分析全過(guò)程中遇到的問(wèn)題以及解決技巧,從而增強(qiáng)學(xué)生解決數(shù)據(jù)分析問(wèn)題的能力。

隨著社會(huì)對(duì)數(shù)據(jù)分析類人才的需求增加,很多高校都開設(shè)了數(shù)據(jù)分析類的課程,培養(yǎng)數(shù)據(jù)分析師或數(shù)據(jù)挖掘工程師,因此選擇數(shù)據(jù)分析類課程進(jìn)行教學(xué)改革,有一定的代表性和前沿性。

2 項(xiàng)目沉浸式教學(xué)的內(nèi)涵

如何克服傳統(tǒng)專業(yè)課程教學(xué)脫離企業(yè)所需能力的培養(yǎng)疼點(diǎn),傳統(tǒng)的產(chǎn)學(xué)結(jié)合方式受到了挑戰(zhàn)。項(xiàng)目沉浸式教學(xué)方法結(jié)合高校教學(xué)與達(dá)內(nèi)等企業(yè)培訓(xùn)兩者的優(yōu)點(diǎn),深入到企業(yè)實(shí)際項(xiàng)目,把企業(yè)真實(shí)的項(xiàng)目實(shí)施過(guò)程融入教學(xué)情境,大大增強(qiáng)了教學(xué)的實(shí)戰(zhàn)性,使學(xué)生適應(yīng)企業(yè)的需求,創(chuàng)新能力有實(shí)質(zhì)性的提高。

項(xiàng)目沉浸式教學(xué)的主要目的是通過(guò)企業(yè)項(xiàng)目培養(yǎng)學(xué)生的技能,近年來(lái)一些教學(xué)改革的措施等大多在一定程度上改善了知識(shí)傳授的問(wèn)題,而如何培養(yǎng)使用這些知識(shí)解決實(shí)際問(wèn)題的技能卻是學(xué)校難以解決的。有些高校老師推出第二課堂,組織學(xué)生自發(fā)研究科研問(wèn)題,這在一定程度上增強(qiáng)了學(xué)生對(duì)問(wèn)題的深入思考和創(chuàng)新能力,但這些問(wèn)題多是實(shí)際問(wèn)題的簡(jiǎn)單抽象,比較適合做理論研究。項(xiàng)目沉浸式教學(xué)就是通過(guò)課程指導(dǎo)教師與企業(yè)合作,利用掌握的專業(yè)知識(shí)解決企業(yè)的實(shí)際問(wèn)題,然后與企業(yè)專家一起指導(dǎo)學(xué)生浸入實(shí)際項(xiàng)目,引導(dǎo)學(xué)生掌握解決數(shù)據(jù)分析實(shí)際問(wèn)題的必要技能和思維方法。

項(xiàng)目沉浸式教學(xué)與項(xiàng)目(project)教學(xué)法還是有一定的區(qū)別。項(xiàng)目教學(xué)法中的項(xiàng)目是教師虛擬的實(shí)際問(wèn)題,是實(shí)際問(wèn)題的抽象和簡(jiǎn)化,無(wú)論是數(shù)據(jù)以及分析數(shù)據(jù)的要求都與實(shí)際項(xiàng)目不同。在一般的項(xiàng)目教學(xué)法中,學(xué)生學(xué)習(xí)知識(shí)的方式主要是通過(guò)完成課程內(nèi)布置的課程項(xiàng)目的要求,最終的評(píng)估也是由任課老師進(jìn)行。一般來(lái)說(shuō),課程項(xiàng)目需求明確,考慮的因素較少且理想化,背景相對(duì)比較簡(jiǎn)單,用到的知識(shí)也基本是課內(nèi)所學(xué),很少涉及通過(guò)多次試錯(cuò)得到的技能。項(xiàng)目沉浸式教學(xué)需要圍繞客戶的問(wèn)題,對(duì)龐雜的業(yè)務(wù)數(shù)據(jù)進(jìn)行分析,得到輔助用戶決策的有用知識(shí)。在此復(fù)雜的訓(xùn)練過(guò)程中,無(wú)論數(shù)據(jù)的選擇、數(shù)據(jù)的凈化以及有效分析方法的選擇都沒(méi)有現(xiàn)成的答案,需要學(xué)生在掌握?qǐng)?jiān)實(shí)的理論知識(shí)基礎(chǔ)上,通過(guò)多次比較、探索和討論才能得到有價(jià)值的知識(shí),并最終解決用戶的問(wèn)題,而不是僅僅應(yīng)對(duì)課程考核。

與一般的項(xiàng)目教學(xué)相比,項(xiàng)目沉浸式教學(xué)面對(duì)的項(xiàng)目是要解決企?I實(shí)際業(yè)務(wù)遇到的問(wèn)題。相對(duì)于課程練習(xí),學(xué)院與企業(yè)合作的項(xiàng)目應(yīng)用背景更加復(fù)雜,不確定因素更多,而且需要用到的知識(shí)不僅是課內(nèi)學(xué)習(xí)的知識(shí),還需要解決具體問(wèn)題的經(jīng)驗(yàn)技能。數(shù)據(jù)分析項(xiàng)目需要經(jīng)過(guò)以下幾個(gè)階段:提出問(wèn)題、獲取并清洗數(shù)據(jù)、數(shù)據(jù)建模、評(píng)價(jià)與部署。在這4個(gè)階段中,各個(gè)階段都沒(méi)有固定的解決方法可以簡(jiǎn)單套用,學(xué)生需要以現(xiàn)有知識(shí)為基礎(chǔ),通過(guò)模仿學(xué)習(xí)、試錯(cuò)、反復(fù)實(shí)驗(yàn),才能積累其中必要的技能。

項(xiàng)目沉浸式教學(xué)偏重于實(shí)踐,在訓(xùn)練學(xué)生技能的同時(shí),也要對(duì)學(xué)生的思維方法進(jìn)行訓(xùn)練。在數(shù)據(jù)分析的過(guò)程中,為了保證數(shù)據(jù)分析的質(zhì)量,有些思維方法是必要的,通過(guò)指導(dǎo)教師對(duì)實(shí)際問(wèn)題的示范講解,結(jié)合實(shí)際項(xiàng)目的沉浸式教學(xué),學(xué)生需要深刻地領(lǐng)會(huì)這些思維方法并靈活應(yīng)用,從而使學(xué)生能與企業(yè)的需求接軌[5]。

3 實(shí)施項(xiàng)目沉浸式教學(xué)的條件

在項(xiàng)目沉浸式教學(xué)中,學(xué)生在項(xiàng)目中是主角,指導(dǎo)教師和企業(yè)的專家也會(huì)在項(xiàng)目開展過(guò)程中對(duì)總體方案以及具體步驟進(jìn)行指導(dǎo),引導(dǎo)學(xué)生進(jìn)行合理的分工、思考、討論和具體問(wèn)題求解,他們更多地起到示范、引導(dǎo)和評(píng)判的作用。

項(xiàng)目沉浸式的教學(xué)方式在復(fù)旦大學(xué)軟件學(xué)院已經(jīng)嘗試多年,結(jié)合學(xué)院卓越工程師的人才培養(yǎng),實(shí)踐檢驗(yàn)表明這種教學(xué)改革對(duì)于培養(yǎng)動(dòng)手能力強(qiáng)的創(chuàng)新人才是非常有效的。我們與多個(gè)企業(yè)合作過(guò)數(shù)據(jù)分析項(xiàng)目,與主流的業(yè)界企業(yè)有多年的合作,了解實(shí)際項(xiàng)目的開展過(guò)程以及所需的能力,熟悉項(xiàng)目沉浸式教學(xué)的基本過(guò)程和技巧。

校內(nèi)的指導(dǎo)教師需要有一定的項(xiàng)目經(jīng)驗(yàn),在學(xué)生完成項(xiàng)目的過(guò)程中,給予正確的指導(dǎo),幫助學(xué)生完成項(xiàng)目。我們與多個(gè)企業(yè)合作過(guò)數(shù)據(jù)分析項(xiàng)目,與主流的業(yè)界企業(yè)有多年的合作,了解實(shí)際項(xiàng)目的開展過(guò)程以及所需的能力,熟悉項(xiàng)目沉浸式教學(xué)的基本過(guò)程和技巧。對(duì)于數(shù)據(jù)分析項(xiàng)目來(lái)說(shuō),在識(shí)別項(xiàng)目需求和目的、數(shù)據(jù)收集與處理、對(duì)比多種分析模型、評(píng)估調(diào)整優(yōu)化和部署等階段,每個(gè)階段都需要有相關(guān)的經(jīng)驗(yàn)、技巧和思維方法。指導(dǎo)教師的職責(zé)就是在每個(gè)階段給予學(xué)生適當(dāng)?shù)囊龑?dǎo),能在學(xué)生遇到難題時(shí)給與實(shí)例、啟發(fā)和思路的指導(dǎo),對(duì)分析結(jié)果給與合適的評(píng)價(jià),而不是直接提供答案。

對(duì)學(xué)生來(lái)說(shuō),項(xiàng)目沉浸式教學(xué)對(duì)自?W能力、敢于挑戰(zhàn)困難以及對(duì)數(shù)據(jù)分析具有較強(qiáng)的興趣更加看重。這個(gè)學(xué)習(xí)過(guò)程需要耗費(fèi)很多的時(shí)間和精力,對(duì)有功利心和速成思想的同學(xué)將是一個(gè)挑戰(zhàn)。此外,數(shù)據(jù)分析項(xiàng)目一般都需要學(xué)生以小組為單位完成,因此學(xué)生之間的協(xié)作能力也非常重要。團(tuán)隊(duì)之間的交流意識(shí)也會(huì)使學(xué)生盡快適應(yīng)數(shù)據(jù)分析項(xiàng)目的不同角色。

對(duì)合作企業(yè)的專家來(lái)說(shuō),由于他們有實(shí)施分析型項(xiàng)目豐富的經(jīng)驗(yàn),對(duì)各類數(shù)據(jù)的處理針對(duì)特定的分析需求有實(shí)戰(zhàn)性的思路和技能,但這些經(jīng)驗(yàn)很難直接表達(dá)清楚。他們可以針對(duì)學(xué)生的問(wèn)題,結(jié)合實(shí)際背景給出可行的建議,能夠從指導(dǎo)教師不同的角度引導(dǎo)學(xué)生,在一定程度上彌補(bǔ)指導(dǎo)教師經(jīng)驗(yàn)不足的短板,幫助學(xué)生在完成實(shí)際項(xiàng)目的過(guò)程中,綜合考慮多種因素,選擇最合適的解決方案。

綜合來(lái)說(shuō),項(xiàng)目沉浸式教學(xué)的重點(diǎn)還是培養(yǎng)學(xué)生完成項(xiàng)目,對(duì)所學(xué)的知識(shí)能夠活學(xué)活用。因此,相較于其他教學(xué)方式,項(xiàng)目沉浸式教學(xué)對(duì)學(xué)生的要求更高,需要指導(dǎo)教師、企業(yè)導(dǎo)師和學(xué)生緊密配合。

4 項(xiàng)目沉浸式教學(xué)的過(guò)程

項(xiàng)目沉浸式教學(xué)的重點(diǎn)是通過(guò)項(xiàng)目實(shí)踐培養(yǎng)學(xué)生技能,通過(guò)項(xiàng)目提高學(xué)生應(yīng)用知識(shí)的能力。對(duì)于數(shù)據(jù)分析類等應(yīng)用能力要求很高的課程,項(xiàng)目沉浸式教學(xué)的實(shí)施過(guò)程主要分為項(xiàng)目預(yù)熱、項(xiàng)目實(shí)施和項(xiàng)目總結(jié)等3個(gè)階段。

(1)項(xiàng)目預(yù)熱。項(xiàng)目啟動(dòng)階段對(duì)于項(xiàng)目沉浸式教學(xué)的開展具有重要意義,在專業(yè)知識(shí)學(xué)習(xí)結(jié)束后,可以把以前指導(dǎo)教師做過(guò)的項(xiàng)目整理成案例和實(shí)驗(yàn)指導(dǎo)書,由指導(dǎo)教師示范整個(gè)項(xiàng)目的開展過(guò)程,突出項(xiàng)目過(guò)程中的問(wèn)題以及解決關(guān)鍵所在。然后把數(shù)據(jù)提供給學(xué)生,根據(jù)實(shí)驗(yàn)指導(dǎo)書的要點(diǎn)由學(xué)生模仿數(shù)據(jù)分析的過(guò)程。這個(gè)階段學(xué)生遇到的問(wèn)題會(huì)比較少,主要是熟悉數(shù)據(jù)分析項(xiàng)目思路。

這個(gè)階段也可以用企業(yè)專家提供項(xiàng)目案例和相關(guān)資料,啟發(fā)學(xué)生補(bǔ)充學(xué)習(xí)課堂教學(xué)忽略的知識(shí),并通過(guò)項(xiàng)目資料的學(xué)習(xí)和練習(xí),初步了解數(shù)據(jù)分析項(xiàng)目常用的思維方法以及處理過(guò)程常見(jiàn)的問(wèn)題。

(2)項(xiàng)目實(shí)施。項(xiàng)目實(shí)施過(guò)程是整個(gè)教學(xué)中最重要的環(huán)節(jié)。在該過(guò)程中,學(xué)生對(duì)于已經(jīng)掌握的知識(shí)在實(shí)際問(wèn)題中加深理解。還需要學(xué)習(xí)項(xiàng)目分析過(guò)程遇到的新知識(shí)和新工具,這就要求學(xué)生有足夠強(qiáng)的學(xué)習(xí)能力。例如,學(xué)生在進(jìn)行數(shù)據(jù)分析時(shí),需要根據(jù)已學(xué)算法基礎(chǔ)或者學(xué)習(xí)新算法,選擇合適的數(shù)據(jù)分析算法,建立合適的數(shù)據(jù)分析模型,通過(guò)對(duì)比分析,不斷完善改進(jìn)問(wèn)題的結(jié)果。此時(shí)導(dǎo)師就需要根據(jù)項(xiàng)目經(jīng)驗(yàn)引導(dǎo)學(xué)生對(duì)問(wèn)題的理解、數(shù)據(jù)的預(yù)處理、建模優(yōu)化以及評(píng)估等階段的處理。學(xué)生在完成項(xiàng)目的過(guò)程中,需要將項(xiàng)目中新用到的知識(shí)、技能進(jìn)行整合,構(gòu)建自己的知識(shí)網(wǎng)絡(luò),并結(jié)合實(shí)際項(xiàng)目深入理解、鞏固和提高。

對(duì)于學(xué)生來(lái)說(shuō),項(xiàng)目實(shí)施是一個(gè)探索的過(guò)程。學(xué)生在完成項(xiàng)目的過(guò)程中,會(huì)遇到具體業(yè)務(wù)、數(shù)據(jù)預(yù)處理、比較選擇合適的分析算法等很多實(shí)際問(wèn)題,而這些問(wèn)題的解決方法在課堂上、書本上沒(méi)有講授,或者根本沒(méi)有明確的答案,需要學(xué)生不斷地進(jìn)行探索、思考,這個(gè)過(guò)程是積累寶貴的實(shí)踐經(jīng)驗(yàn),培養(yǎng)實(shí)踐能力的過(guò)程。

(3)項(xiàng)目總結(jié)。項(xiàng)目總結(jié)階段是一個(gè)不可缺少的環(huán)節(jié),起到提煉、強(qiáng)化技能,擴(kuò)展知識(shí)體系的作用。這個(gè)階段可以幫助學(xué)生對(duì)整個(gè)項(xiàng)目進(jìn)行總結(jié)回顧、理清的過(guò)程,突出項(xiàng)目中遇到的問(wèn)題和求解方法,從而作為新的案例和實(shí)驗(yàn)素材。

上述項(xiàng)目沉浸式的教學(xué)過(guò)程是一個(gè)反復(fù)的過(guò)程,每次順利地完成一個(gè)項(xiàng)目,指導(dǎo)教師也會(huì)增強(qiáng)對(duì)實(shí)際項(xiàng)目的理解,并積累更多實(shí)踐經(jīng)驗(yàn);而學(xué)生順利地完成項(xiàng)目,會(huì)增強(qiáng)對(duì)業(yè)務(wù)的認(rèn)識(shí)并強(qiáng)化數(shù)據(jù)分析的技能。

這里以我們與IBM合作的SUR項(xiàng)目“基于Spark的文件傳輸網(wǎng)絡(luò)設(shè)計(jì)以及負(fù)載優(yōu)化研究”為例,簡(jiǎn)要說(shuō)明項(xiàng)目沉浸式的教學(xué)過(guò)程。這個(gè)項(xiàng)目首先由IBM研究院的專家根據(jù)多年的實(shí)踐經(jīng)驗(yàn)提出,目的是優(yōu)化文件傳輸網(wǎng)絡(luò)的設(shè)計(jì),在工程實(shí)際有一定的應(yīng)用需求。針對(duì)這個(gè)需求,我們與IBM專家一起,組建了由3名復(fù)旦大學(xué)軟件學(xué)院高年級(jí)本科生組成的項(xiàng)目小組,通過(guò)多次磋商,進(jìn)一步細(xì)化了文件傳輸網(wǎng)絡(luò)的功能需求。然后通過(guò)對(duì)實(shí)際文件傳輸網(wǎng)絡(luò)的分析,摸索其中節(jié)點(diǎn)的數(shù)據(jù)流向和流量,抽象出便于分析的文件傳輸網(wǎng)絡(luò)模型。通過(guò)仿真分析,研究這個(gè)模型的特點(diǎn)和參數(shù)設(shè)計(jì)。在此基礎(chǔ)上,從多種分析方法中,通過(guò)比較發(fā)現(xiàn)深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)比較適合預(yù)測(cè)網(wǎng)絡(luò)節(jié)點(diǎn)之間文件傳輸網(wǎng)絡(luò)流量的預(yù)測(cè),并利用Spark實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)的高速訓(xùn)練和計(jì)算。有關(guān)深度學(xué)習(xí)、Spark等知識(shí)都需要學(xué)生自學(xué),并用Python語(yǔ)言實(shí)現(xiàn)實(shí)驗(yàn)?zāi)P停ㄟ^(guò)多次比較調(diào)優(yōu)。這個(gè)過(guò)程歷經(jīng)數(shù)月,師生共同努力,多次修改設(shè)計(jì),其中IBM專家提供了相關(guān)的資料,并根據(jù)經(jīng)驗(yàn)對(duì)每個(gè)階段的工作提出了建議,最后得到比較可行的方案。

5 項(xiàng)目沉浸式教學(xué)建設(shè)存在的問(wèn)題

項(xiàng)目沉浸式教學(xué)的理念對(duì)教師和學(xué)生都有較高的要求,目前在高校的專業(yè)課程教學(xué)中還存在一些需要解決的問(wèn)題。

(1)專業(yè)知識(shí)的教學(xué)問(wèn)題。項(xiàng)目沉浸式教學(xué)對(duì)于學(xué)生的專業(yè)基礎(chǔ)知識(shí)和動(dòng)手能力有一定的要求。當(dāng)前很多高校的專業(yè)課程注重基礎(chǔ)知識(shí)的培養(yǎng),脫離了實(shí)際應(yīng)用背景,而這些知識(shí)的掌握只有實(shí)際應(yīng)用才可以深入理解。這就要求指導(dǎo)教師能根據(jù)實(shí)際項(xiàng)目應(yīng)用的需要,梳理相應(yīng)的數(shù)據(jù)分析知識(shí)體系,幫助學(xué)生對(duì)于實(shí)際問(wèn)題的分析奠定比較扎實(shí)的專業(yè)基礎(chǔ)知識(shí)。

(2)學(xué)生時(shí)間的協(xié)調(diào)問(wèn)題。學(xué)生在完成實(shí)際項(xiàng)目的過(guò)程中,需要結(jié)合所學(xué)多門專業(yè)課程的知識(shí),因此項(xiàng)目沉浸式教學(xué)需要學(xué)生能拿出一定的時(shí)間,自學(xué)項(xiàng)目要求的額外知識(shí),并通過(guò)反復(fù)試錯(cuò)完成項(xiàng)目。我們建議項(xiàng)目沉浸式教學(xué)與學(xué)校的各種科創(chuàng)項(xiàng)目結(jié)合起來(lái),根據(jù)學(xué)生做項(xiàng)目的成果,滿足一定的條件就給予一定的學(xué)分,以便進(jìn)一步調(diào)動(dòng)學(xué)生的積極性。

(3)項(xiàng)目風(fēng)險(xiǎn)管理問(wèn)題。由于學(xué)生缺乏實(shí)際項(xiàng)目的研究經(jīng)驗(yàn),因此學(xué)生參與企業(yè)的實(shí)際分析項(xiàng)目具有一定的風(fēng)險(xiǎn)。指導(dǎo)教師與企業(yè)專家合作,吸引有一定實(shí)踐經(jīng)驗(yàn)的員工?⒂胂钅浚?承擔(dān)項(xiàng)目關(guān)鍵問(wèn)題,學(xué)生剛開始介入項(xiàng)目時(shí)可以根據(jù)分工承擔(dān)相對(duì)容易的工作,并逐步承擔(dān)有難度的數(shù)據(jù)分析環(huán)節(jié),培養(yǎng)數(shù)據(jù)分析在各個(gè)崗位和階段需要的基本技能。

6 結(jié) 語(yǔ)

數(shù)據(jù)分析師范文第4篇

關(guān)鍵詞:大數(shù)據(jù);計(jì)算機(jī);數(shù)據(jù)備份;安全保障

中圖分類號(hào):TP311

文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1009-3044(2017)10-0025-01

數(shù)據(jù)信息作為時(shí)代的信息管理標(biāo)志其安全性必須收到更大的重視,數(shù)據(jù)信息的安全存儲(chǔ)系統(tǒng)尤為重要,防止信息數(shù)據(jù)的丟失的管理備份系統(tǒng)更為重要。因此能夠?qū)?shù)據(jù)信息妥善管理,保證其正常工作的技術(shù)相當(dāng)重要,但當(dāng)數(shù)據(jù)真正丟失或不可避免地出現(xiàn)問(wèn)題以后能夠盡快地將其找回或者是在有效的時(shí)間內(nèi)將其完整地恢復(fù),以確保整個(gè)計(jì)算機(jī)系統(tǒng)能夠正常工作的技術(shù)更是必不可少的。

1.數(shù)據(jù)備份概念及其特點(diǎn)

數(shù)據(jù)備份指的是將計(jì)算機(jī)系統(tǒng)的所有數(shù)據(jù)或者是部分重要數(shù)據(jù)借助某一種或多種手段從計(jì)算機(jī)一個(gè)系統(tǒng)復(fù)制到另一個(gè)系統(tǒng),或者是從本地計(jì)算機(jī)存儲(chǔ)系統(tǒng)中復(fù)制到其他的存儲(chǔ)系統(tǒng)中。其目的就是保障系統(tǒng)可用或者是數(shù)據(jù)安全。防止由于人為的失誤或者是系統(tǒng)故障問(wèn)題亦或是自然災(zāi)害等方面的原因造成系統(tǒng)數(shù)據(jù)的安全性無(wú)法保障的問(wèn)題。數(shù)據(jù)備份更重要的原因是數(shù)據(jù)信息的多重保存以備不時(shí)之需。

數(shù)據(jù)備份按照備份的實(shí)現(xiàn)方式可以分為單機(jī)和網(wǎng)絡(luò)兩種備份方式,傳統(tǒng)的備份就是單機(jī)備份針對(duì)計(jì)算機(jī)本身將數(shù)據(jù)進(jìn)行異地存儲(chǔ),現(xiàn)代比較流行的就是網(wǎng)絡(luò)備份。這是針對(duì)整個(gè)網(wǎng)絡(luò)而言的,這種方式的備份較為復(fù)雜,是通過(guò)網(wǎng)絡(luò)備份軟件對(duì)存儲(chǔ)介質(zhì)和基礎(chǔ)硬件存儲(chǔ)設(shè)備的數(shù)據(jù)進(jìn)行保存和管理。由于網(wǎng)絡(luò)備份是在網(wǎng)絡(luò)中進(jìn)行數(shù)據(jù)備份的,因此也就不同于普通的傳統(tǒng)單機(jī)備份,是包含需要備份的文件數(shù)據(jù)和網(wǎng)絡(luò)系統(tǒng)中使用到的應(yīng)用程序以及系統(tǒng)參數(shù)和數(shù)據(jù)庫(kù)等內(nèi)容的。

數(shù)據(jù)備份的作用在于:一方面,在數(shù)據(jù)受到損害時(shí)對(duì)數(shù)據(jù)進(jìn)行還原和恢復(fù);另一方面,數(shù)據(jù)信息的歷史性、長(zhǎng)久保存,方便數(shù)據(jù)的歸檔。

2.數(shù)據(jù)備份存儲(chǔ)技術(shù)

備份換言之就是數(shù)據(jù)的再存儲(chǔ),因此備份技術(shù)是存儲(chǔ)技術(shù)的重要內(nèi)容之一,但是數(shù)據(jù)備份存儲(chǔ)作為計(jì)算機(jī)系統(tǒng)技術(shù)與簡(jiǎn)單的備份區(qū)別很大。計(jì)算機(jī)數(shù)據(jù)備份存儲(chǔ)技術(shù)時(shí)更為全面、完整、穩(wěn)定安全的數(shù)據(jù)信息的備份,是網(wǎng)絡(luò)系統(tǒng)高效數(shù)據(jù)存儲(chǔ)的,也是安全性較高的網(wǎng)絡(luò)備份。

文件存儲(chǔ)作為最基礎(chǔ)的數(shù)據(jù)類型是隨機(jī)存儲(chǔ)在硬盤上的數(shù)據(jù)片段和文檔資料,這些存儲(chǔ)的數(shù)據(jù)文檔、報(bào)表甚至是作為數(shù)據(jù)庫(kù)文件的應(yīng)用程序等等在存儲(chǔ)一定的量就會(huì)出現(xiàn)超出容量的情況因此對(duì)其的整合是必要的。這樣的整合是將存儲(chǔ)的各類數(shù)據(jù)或者是數(shù)據(jù)庫(kù)以一個(gè)順序和程序的形式出現(xiàn),幫助人們解決備份存儲(chǔ)的空間問(wèn)題,技術(shù)問(wèn)題以及成本問(wèn)題。更能將工作人員的連續(xù)數(shù)據(jù)維護(hù)和監(jiān)控從繁重的工作中解放出來(lái)。

3.保障計(jì)算機(jī)數(shù)據(jù)網(wǎng)絡(luò)備份的安全性策略

通過(guò)網(wǎng)絡(luò)傳輸?shù)膫浞輸?shù)據(jù)在傳輸過(guò)程和傳輸路徑方面必須確保數(shù)據(jù)的安全性。若不能保證數(shù)據(jù)的安全那么一些企業(yè)的關(guān)鍵數(shù)據(jù)和重要應(yīng)用程序就會(huì)受損,甚至是失去了備份的意義。因此相比單機(jī)備份而言網(wǎng)絡(luò)備份更要確保安全傳輸和安全存儲(chǔ)。

首先確保備份數(shù)據(jù)的機(jī)密性。數(shù)據(jù)信息的網(wǎng)絡(luò)備份不能被非法用戶隨意獲得,因此在數(shù)據(jù)備份過(guò)程和傳輸過(guò)程中必須防止數(shù)據(jù)的機(jī)密性被破壞。一般數(shù)據(jù)備份常用的方法是加密。必須保證是數(shù)據(jù)擁有者才能使用這些數(shù)據(jù)信息,關(guān)鍵的數(shù)據(jù)信息的加密工作相比更加嚴(yán)格。數(shù)據(jù)內(nèi)容不容有失,甚至是數(shù)據(jù)的相關(guān)名稱和代碼等也不能隨便被非法進(jìn)入系統(tǒng)的人獲得才是最能保障數(shù)據(jù)安全的方式。

此外,在數(shù)據(jù)網(wǎng)絡(luò)傳輸存儲(chǔ)之前一定要確認(rèn)接受信息一方的真實(shí)性,核實(shí)雙方信息是否匹配,一定要在雙方身份確認(rèn)之后才能對(duì)網(wǎng)絡(luò)的數(shù)據(jù)信息進(jìn)行發(fā)送和接受,這樣既避免了欺詐行為又確保了網(wǎng)絡(luò)中間不可信的因素存在使數(shù)據(jù)信息遭到破壞。

其次。確保備份數(shù)據(jù)的完整性。數(shù)據(jù)備份存儲(chǔ)不是一個(gè)簡(jiǎn)單的過(guò)程,數(shù)據(jù)信息是通過(guò)設(shè)備和網(wǎng)絡(luò)之間傳輸來(lái)完成備份數(shù)據(jù)存儲(chǔ)的。這一個(gè)成必須要保障所傳輸?shù)男畔⑼暾乇簧蟼鞫疫@些數(shù)據(jù)信息不能被其他方攔截和篡改,以破壞備份數(shù)據(jù)信息的內(nèi)容和屬性等。此外在存儲(chǔ)時(shí)也要保障數(shù)據(jù)信息的正確無(wú)誤完整保存。

再次,備份存儲(chǔ)的數(shù)據(jù)可用性。數(shù)據(jù)存儲(chǔ)必須是可用的,而且是計(jì)算機(jī)資源用戶合理合法的使用。對(duì)于網(wǎng)絡(luò)備份系統(tǒng)的信息和信息用戶系統(tǒng)的信息是完全一致的,是可用的。備份數(shù)據(jù)資料必須在合法用戶需要時(shí)可以隨時(shí)安全使用。這是網(wǎng)絡(luò)數(shù)據(jù)備份存儲(chǔ)必須保證的。

數(shù)據(jù)分析師范文第5篇

關(guān)鍵詞:分布式數(shù)據(jù)流,分布式數(shù)據(jù)流系統(tǒng)

近年來(lái),數(shù)據(jù)流查詢處理是數(shù)據(jù)庫(kù)研究領(lǐng)域的一個(gè)熱點(diǎn)方向。數(shù)據(jù)流的特征可概括為無(wú)限性、瞬時(shí)性、流速不定性、語(yǔ)義不定性(數(shù)據(jù)模式隨時(shí)可能改變)等。針對(duì)數(shù)據(jù)流的以上特征,不考慮將數(shù)據(jù)流存儲(chǔ)在傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)中,數(shù)據(jù)流上的查詢是近似查詢、連續(xù)查詢(continuousquery)。目前,數(shù)據(jù)流管理系統(tǒng)中所采用的近似查詢的方法主要有以下幾種:隨機(jī)抽樣(randomsampling)、數(shù)據(jù)寫生(sketching)、直方圖(histograms)、小波變換(wavelets)、窗口(windows)等。如何保證查詢的服務(wù)質(zhì)量成為上述各種近似查詢方法必須考慮的問(wèn)題。數(shù)據(jù)流上的查詢處理給人們提出了一個(gè)很大的難題——對(duì)處理器、內(nèi)存等系統(tǒng)資源非??量痰男枨?。到目前已經(jīng)出現(xiàn)了許多數(shù)據(jù)流的原型系統(tǒng):?jiǎn)喂?jié)點(diǎn)(單CPU)上的數(shù)據(jù)流管理系統(tǒng),如Stanford大學(xué)的Stream[1]系統(tǒng)、布朗大學(xué)的Aurora[2,3]系統(tǒng)等;有分布式數(shù)據(jù)流處理系統(tǒng),如MIT的Medusa[4,5]項(xiàng)目,Brandeis、Brown、MIT的合作項(xiàng)目Borealis[6,7]等。這些項(xiàng)目在數(shù)據(jù)流處理的查詢語(yǔ)言、近似查詢算法、保證服務(wù)質(zhì)量的策略,以及系統(tǒng)的負(fù)載均衡等方面做了大量的工作,但同時(shí)也揭示出在分布式數(shù)據(jù)流處理系統(tǒng)中更多值得研究的問(wèn)題。本文將對(duì)基于structuredoverlaynetwork的分布式數(shù)據(jù)流系統(tǒng)的近似、自適應(yīng)查詢處理進(jìn)行研究,給出查詢處理模型。

1集中式數(shù)據(jù)流查詢處理及分布式散列表、Chord路由協(xié)議的相關(guān)說(shuō)明

1.1數(shù)據(jù)流查詢處理相關(guān)的概念定義以及假設(shè)說(shuō)明

集中式數(shù)據(jù)流查詢處理的體系結(jié)構(gòu)由兩部分構(gòu)成,即查詢計(jì)劃生成子系統(tǒng)(FRONT-end)以及查詢執(zhí)行子系統(tǒng)(BACK)。其中兩部分與關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)相比均有較大的區(qū)別。查詢執(zhí)行子系統(tǒng)如圖1所示。

通過(guò)這種散列,將系統(tǒng)當(dāng)前的所有查詢映射到節(jié)點(diǎn)空間,然后由該節(jié)點(diǎn)上的查詢處理器完成到達(dá)的查詢。

b)查詢內(nèi)并行處理方式。在系統(tǒng)的范圍內(nèi),由操作符、輸入均輸出記錄隊(duì)列、維持操作符狀態(tài)的大綱信息構(gòu)成網(wǎng)狀結(jié)構(gòu)。

c)命名發(fā)現(xiàn)機(jī)制。參與查詢處理的節(jié)點(diǎn)有全局惟一命名participant(如IP地址等)。當(dāng)在一個(gè)節(jié)點(diǎn)上面定義一個(gè)新的流模式、數(shù)據(jù)流、操作符,這些實(shí)體均隸屬于其命名空間。該實(shí)體可以采用下面的命名方式:(participant,entity-name)。為了了解系統(tǒng)中數(shù)據(jù)流模式的定義、系統(tǒng)中的數(shù)據(jù)流、數(shù)據(jù)流的到達(dá)(存放)位置、系統(tǒng)中哪一部分查詢執(zhí)行,就要考慮在catalog中存放必要的數(shù)據(jù)。其中catalog信息是通過(guò)在DHT下分布式存儲(chǔ)的,前面已經(jīng)分析了catalog信息的存儲(chǔ)問(wèn)題。

系統(tǒng)中對(duì)每一個(gè)數(shù)據(jù)流、每一個(gè)查詢、查詢中的算子、算子大綱、節(jié)點(diǎn)間輸出隊(duì)列均有惟一的命名。查詢處理器位于DHT之上。同查詢相關(guān)的數(shù)據(jù)粒度限定為數(shù)據(jù)流、輸入數(shù)據(jù)源(記錄集)、節(jié)點(diǎn)間傳輸數(shù)據(jù)隊(duì)列、算子大綱,而不是針對(duì)單個(gè)記錄而言。對(duì)于這些粒度的數(shù)據(jù)可以通過(guò)在DHT中通過(guò)put(namespace,object)、get(namespace)、multicast(namespace)消息得到。

對(duì)于操作符(算子)在節(jié)點(diǎn)間遷移的情況,可以提供遠(yuǎn)程算子定義接口。當(dāng)節(jié)點(diǎn)A上查詢執(zhí)行的下一步j(luò)oin操作要求節(jié)點(diǎn)B的查詢執(zhí)行器完成時(shí),節(jié)點(diǎn)B接收到遠(yuǎn)程調(diào)用請(qǐng)求,初始化join算子,將節(jié)點(diǎn)A上發(fā)出調(diào)用請(qǐng)求算子的狀態(tài)信息(大綱,synopsis)作為參數(shù)傳遞給B,然后就可以在節(jié)點(diǎn)B上進(jìn)行join算子運(yùn)算。查詢內(nèi)并行就是有若干這樣的節(jié)點(diǎn)間的算子遷移,使一個(gè)查詢計(jì)劃得以在多節(jié)點(diǎn)的算子之間并行執(zhí)行。

對(duì)于基于滑動(dòng)窗口的數(shù)據(jù)流處理的join操作,如果有兩個(gè)數(shù)據(jù)流,查詢處理基于時(shí)間的窗口,進(jìn)行join操作的兩個(gè)數(shù)據(jù)流時(shí)間范圍較長(zhǎng),那么要求在一個(gè)節(jié)點(diǎn)上維護(hù)操作符的狀態(tài)信息將會(huì)變得非常困難,join算子狀態(tài)信息存儲(chǔ)要求的內(nèi)存空間可能非常大,則會(huì)進(jìn)行操作符分割操作。在該節(jié)點(diǎn)的近鄰節(jié)點(diǎn)上同時(shí)進(jìn)行join操作,最終將各個(gè)節(jié)點(diǎn)上的狀態(tài)信息進(jìn)行合并操作即可。算子遷移、算子合并、算子分割等操作在基于DHT的系統(tǒng)上實(shí)現(xiàn)具有良好的擴(kuò)展性。DHT層為數(shù)據(jù)流處理系統(tǒng)在荷載大的情況下進(jìn)行負(fù)載脫落、查詢計(jì)劃間并行、查詢計(jì)劃內(nèi)并行提供了可以隨意擴(kuò)展的基礎(chǔ)平臺(tái)。

3結(jié)束語(yǔ)

本文給出了基于structuredoverlaynetwork的分布式數(shù)據(jù)流查詢處理模型,考慮了對(duì)于到達(dá)系統(tǒng)的大量數(shù)據(jù)流的分片存放策略;同時(shí)在查詢處理中對(duì)查詢內(nèi)的并行、查詢間的并行、算子在分布式節(jié)點(diǎn)的遷移等提供了很好的支持。對(duì)系統(tǒng)catalog目錄信息的分布式存放維護(hù),從而消除了單節(jié)點(diǎn)查詢處理引擎在資源(CPU、內(nèi)存)上的約束。本文沒(méi)有考慮分布式查詢模型在網(wǎng)絡(luò)帶寬資源方面的問(wèn)題,這將是以后要完善的地方?;诮Y(jié)構(gòu)化覆蓋網(wǎng)的分布式數(shù)據(jù)流查詢模型提高了系統(tǒng)性能、查詢服務(wù)質(zhì)量,并且基于Chord實(shí)現(xiàn),具有很好的擴(kuò)展性。

參考文獻(xiàn):

[1]BRIANB,SHIVNATHB,JENNIFERW.Modelsandissuesindatastreamsystems[C]//Procofthe21stACMSymposiumonPrinciplesofDatabaseSystems,2002.

[2]BALAKRISHNANH,BALAZINSKAM,CARNEYD,etal.RetrospectiveonAurora[J].VLDBJournal,2004,13(4):370-383.

[3]ABADID,CARNEYD,STONEBRAKERM,etal.Aurora:anewmodelandarchitecturefordatastreammanagement[J].VLDBJournal,2003,12(2):120-139.

[4]ZDONIKS,STONEBRAKERM,CHERNIACKM,etal.TheAuroraandMedusaProjects[J].IEEEDataEngineeringBulletin,2003,26(1):3-10.

[5]CHERNIACKM,BALAKRISHNANH,BALAZINSKAM,etal.Scalabledistributedstreamprocessing[C]//Procofthe1stBiennialConferenceonInnovativeDataSystemsResearch.Asilomar,California:[s.n.],2003.

[6]ABADIDJ,AHMADY,BALAZINSKAM,etal.ThedesignoftheBorealisstreamprocessingengine[C]//Procofthe2ndBiennialConferenceonInnovativeDataSystemsResearch(CIDR’05).Asilomar:[s.n.],2005.

[7]TATBULN,ZDONIKS.Dealingwithoverloadindistributedstreamprocessingsystems[C]//ProcofIEEEInternationalWorkshoponNetworkingMeetsDatabases(NetDB’06).Atlanta:[s.n.],2006.

[8]Distributedhashtableslinks[EB/OL].

相關(guān)期刊更多

數(shù)據(jù)

省級(jí)期刊 審核時(shí)間1個(gè)月內(nèi)

北京市統(tǒng)計(jì)局

大數(shù)據(jù)

統(tǒng)計(jì)源期刊 審核時(shí)間1個(gè)月內(nèi)

工業(yè)和信息化部

數(shù)據(jù)法學(xué)

部級(jí)期刊 審核時(shí)間1個(gè)月內(nèi)

中國(guó)人民公安大學(xué)法學(xué)院

主站蜘蛛池模板: 莱芜市| 察雅县| 双峰县| 浦城县| 淮滨县| 张家川| 石门县| 普陀区| 平舆县| 新乡市| 宜州市| 永胜县| 南涧| 双城市| 芜湖县| 修武县| 广丰县| 罗平县| 华坪县| 石棉县| 洞口县| 五指山市| 平远县| 阳山县| 东山县| 长沙市| 乐昌市| 周口市| 东海县| 卓资县| 岱山县| 通辽市| 高阳县| 行唐县| 隆化县| 迭部县| 天全县| 克山县| 定州市| 刚察县| 文昌市|