什么是大數(shù)據,大數(shù)據有什么特點
精選回答
大數(shù)據指無法在一定時間范圍內用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產。
大數(shù)據具有“4V”特性:
1.數(shù)據量大(Volume):大數(shù)據的起始計量單位是PB(1024TB)、EB(1024PB,約100萬TB)或ZB(1024EB,約10億TB ),未來甚至會達到YB(1024ZB)或BB(1024YB)。
2. 數(shù)據多樣性(Variety):大數(shù)據類型繁多,包括網絡日志、音頻、視頻、圖片、地理位置等;各種結構化、半結構化和非結構化的數(shù)據。結構化數(shù)據是指存儲在數(shù)據庫里,可以用二維表結構實現(xiàn)表達的數(shù)據;非結構化數(shù)據是指數(shù)據結構不規(guī)則或不完整,沒有預定義的數(shù)據,包括所有格式的辦公文檔、文本、圖片、報表、圖像、音頻、視頻等;半結構化數(shù)據是介于完全結構化數(shù)據和完全非結構化數(shù)據之間的數(shù)據,具有一定的結構性,例如員工簡歷,有的簡歷只有教育情況,有的簡歷包括教育、婚姻、戶籍、出人境情況等很多信息。
3. 價值密度低(Value):大數(shù)據價值密度的高低與數(shù)據總量的大小成反比。以視頻為例,在連續(xù)不間斷的監(jiān)控中,有用數(shù)據可能僅有一兩秒。原始零散、復雜多樣,甚至可能有數(shù)據噪聲和污染的數(shù)據需要經歷價值“提純”,才能得出信息、獲取知識。
4. 數(shù)據的產生和處理速度快(Velocity): 大數(shù)據的智能化和實時性要求越來越高,對處理速度也有極嚴格的要求,一般要在秒級時間范圍內給出分析結果,超出這個時間數(shù)據就可能失去價值,即大數(shù)據的處理要符合“1秒定律”。
點擊查看相關知識點:
想要獲取更多中級經濟師考試報名相關資訊內容,請多多關注東奧會計在線,中級經濟師頻道。
免費試聽 全部>>
-
經濟師
論
2024《經濟基礎》基礎班
免費
已有2500人學習 -
經濟師
市場供給
2024《經濟基礎》基礎班
免費
已有2500人學習 -
經濟師
個人所得稅的征稅對象
2024《財政稅收》基礎班
免費
已有2500人學習