一、算法概述
算法是指解題方案的準確而完整的描述,是一系列解決問題、高度符合邏輯性、可執(zhí)行性的指令集合,代表運用系統(tǒng)方法描述解決問題的策略機制。算法能夠?qū)σ欢ㄒ?guī)范的輸入在有限時間內(nèi)運行得到輸出。
算法中的指令描述的是計算過程,當其運行時能從初始狀態(tài)和初始輸入(初始輸入可能為空的)開始,經(jīng)過一系列有限而清晰定義的狀態(tài),最終產(chǎn)生輸出并終止于某一狀態(tài)。
不同的算法在解決相同問題所需時間、空間可能不同,即算法的效率不同。算法的優(yōu)劣可通過解決相同問題所需的時間復雜度與空間復雜度衡量。
二、傳統(tǒng)算法與大數(shù)據(jù)算法
傳統(tǒng)的數(shù)據(jù)算法可被稱為數(shù)據(jù)分析,數(shù)據(jù)分析的目的在于對已有的數(shù)據(jù)進行描述性分析,其重點在于發(fā)現(xiàn)數(shù)據(jù)隱含的規(guī)律,進行商業(yè)分析和處理。
大數(shù)據(jù)時代的數(shù)據(jù)算法可被稱為數(shù)據(jù)科學,與數(shù)據(jù)挖掘和機器學習相關。
機器學習是交叉學科,機器學習涉及的學科包括概率論、統(tǒng)計學、逼近論、圖分析、算法復雜度理論等。機器學習主要研究計算機怎樣模擬或?qū)崿F(xiàn)人類的學習行為,以獲取新的知識或技能,并重新組織已有的知識結構使之不斷改善自身性能。
大數(shù)據(jù)機器學習更強調(diào)學習是手段。機器學習成為一種支持和服務技術,基于機器學習對復雜多樣的數(shù)據(jù)進行深層次的分析和更高效地利用信息成為大數(shù)據(jù)機器學習研究的主要方向。所以,大數(shù)據(jù)機器學習逐漸向智能數(shù)據(jù)分析的方向發(fā)展,并已成為智能數(shù)據(jù)分析技術的重要組成部分。
大數(shù)據(jù)時代,數(shù)據(jù)體量以空前的速度增長,需要分析新類型數(shù)據(jù)也在不斷出現(xiàn),新類型數(shù)據(jù)包括:文本理解、文本情感分析、圖像的檢索和理解、圖形和網(wǎng)絡等。數(shù)據(jù)體量快速增長和新類型數(shù)據(jù)不斷出現(xiàn)使得大數(shù)據(jù)機器學習和數(shù)據(jù)挖掘等智能計算技術在大數(shù)據(jù)智能化分析處理應用中具有重要作用。
圖片來源:學堂在線《大數(shù)據(jù)導論》
三、機器學習算法
目前,主流的機器學習算法包括:監(jiān)督學習和非監(jiān)督學習。
(1)監(jiān)督學習
監(jiān)督學習是指從標記的訓練數(shù)據(jù)推斷某一功能的機器學習任務,訓練數(shù)據(jù)包括一套訓練示例。每套訓練示例均由一個輸入對象(通常為矢量)和一個期望的輸出值 (也稱為監(jiān)督信號)組成。監(jiān)督學習算法通過分析訓練示例(個人理解:需分析多套訓練示例),產(chǎn)生某種推斷功能,該推斷功能可以用于映射新示例。
監(jiān)督學習包括:分類算法和回歸分析。
1)分類算法包括:自然貝葉斯、決策樹、隨機森林、神經(jīng)網(wǎng)絡等。分類算法主要針對離散數(shù)據(jù)。
2)回歸類算法包括:線性回歸、邏輯回歸、支持向量機等?;貧w類算法主要針對連續(xù)數(shù)據(jù)。
(2)非監(jiān)督學習
非監(jiān)督學習是指在沒有類別信息情況下,通過分析所研究對象大量樣本的據(jù)數(shù),實現(xiàn)樣本分類的數(shù)據(jù)處理方法。
通過非監(jiān)督式學習,可將樣本集劃分為若干個子集(類別),或?qū)颖炯鳛橛柧殬颖炯?,再通過監(jiān)督學習方法進行分類器設計。
非監(jiān)督學習包括:聚類算法、抽維算法。
1)聚類算法包括:距離聚類、快速聚類等。
2)抽維算法包括:主因子、典型相關等。
審核編輯:劉清
-
神經(jīng)網(wǎng)絡
+關注
關注
42文章
4820瀏覽量
106263 -
機器學習
+關注
關注
66文章
8532瀏覽量
135985 -
大數(shù)據(jù)
+關注
關注
64文章
8998瀏覽量
142602
原文標題:大數(shù)據(jù)相關介紹(8)——算法
文章出處:【微信號:行業(yè)學習與研究,微信公眾號:行業(yè)學習與研究】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
DFT算法與FFT算法的優(yōu)劣分析
AI算法托管平臺是什么
PID控制算法的C語言實現(xiàn):PID算法原理
什么是BP神經(jīng)網(wǎng)絡的反向傳播算法
算法加速的概念、意義、流程和應用
深入解析ECC256橢圓曲線加密算法

【「從算法到電路—數(shù)字芯片算法的電路實現(xiàn)」閱讀體驗】+內(nèi)容簡介
【「從算法到電路—數(shù)字芯片算法的電路實現(xiàn)」閱讀體驗】+介紹基礎硬件算法模塊
【「從算法到電路—數(shù)字芯片算法的電路實現(xiàn)」閱讀體驗】+一本介紹基礎硬件算法模塊實現(xiàn)的好書
激光雷達在SLAM算法中的應用綜述

評論