18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Python機(jī)器學(xué)習(xí)庫談Scikit-learn技術(shù)

深度學(xué)習(xí)自然語言處理 ? 來源:NewBeeNLP公眾號 ? 作者:Rebecca Vickery ? 2020-08-27 17:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Scikit-learn是使用最廣泛的Python機(jī)器學(xué)習(xí)庫之一。它有標(biāo)準(zhǔn)化和簡單的接口,用于數(shù)據(jù)預(yù)處理和模型訓(xùn)練、優(yōu)化以及評估。

這個(gè)項(xiàng)目最初是由David Cournapeau 開發(fā)的Google Summer of Code 項(xiàng)目,并于2010年首次公開發(fā)布。自創(chuàng)建以來,該庫已經(jīng)發(fā)展成為一個(gè)豐富的生態(tài)系統(tǒng),用于開發(fā)機(jī)器學(xué)習(xí)模型。隨著時(shí)間的推移,該項(xiàng)目開發(fā)了許多方便的功能,以增強(qiáng)其易用性。在本文中,我將介紹你可能不知道的10個(gè)關(guān)于Scikit-learn最有用的特性。

1. 內(nèi)置數(shù)據(jù)集

Scikit-learn API內(nèi)置了各種toy和real-world數(shù)據(jù)集[1]。這些可以便捷地通過一行代碼訪問,如果你正在學(xué)習(xí)或只是想快速嘗試新功能,這會(huì)非常有用。

你還可以使用make_regression()、make_blobs()和make_classification()生成合成數(shù)據(jù)集。所有加載實(shí)用程序都提供了返回已拆分為X(特征)和y(目標(biāo))的數(shù)據(jù)選項(xiàng),以便它們可以直接用于訓(xùn)練模型。

2. 獲取公開數(shù)據(jù)集

如果你想直接通過Scikit-learn訪問更多的公共可用數(shù)據(jù)集,請了解,有一個(gè)方便的函數(shù)datasets.fetch_openml,可以讓您直接從openml.org網(wǎng)站[2]獲取數(shù)據(jù)。這個(gè)網(wǎng)站包含超過21000個(gè)不同的數(shù)據(jù)集,可以用于機(jī)器學(xué)習(xí)項(xiàng)目。

3. 內(nèi)置分類器來訓(xùn)練baseline

在為項(xiàng)目開發(fā)機(jī)器學(xué)習(xí)模型時(shí),首先創(chuàng)建一個(gè)baseline模型是非常有必要的。這個(gè)模型在本質(zhì)上應(yīng)該是一個(gè)“dummy”模型,比如一個(gè)總是預(yù)測最頻繁出現(xiàn)的類的模型。這就提供了一個(gè)基準(zhǔn),用來對你的“智能”模型進(jìn)行基準(zhǔn)測試,這樣你就可以確保它的性能比隨機(jī)結(jié)果更好。

Scikit learn包括用于分類任務(wù)的DummyClassifier() 和用于基于回歸問題的 DummyRegressor()。

4. 內(nèi)置繪圖api

Scikit learn有一個(gè)內(nèi)置的繪圖API,允許你在不導(dǎo)入任何其他庫的情況下可視化模型性能。包括以下繪圖:部分相關(guān)圖、混淆矩陣、精確召回曲線和ROC曲線。

5. 內(nèi)置特征選擇方法

提高模型性能的一種技術(shù)是只使用最好的特征集或通過刪除冗余特征來訓(xùn)練模型。這個(gè)過程稱為特征選擇。

Scikit learn有許多函數(shù)來執(zhí)行特征選擇。一個(gè)示例為 SelectPercentile(),該方法根據(jù)所選的統(tǒng)計(jì)方法選擇性能最好的X百分位特征進(jìn)行評分。

6. 機(jī)器學(xué)習(xí)pipeline

除了為機(jī)器學(xué)習(xí)提供廣泛的算法外,Scikit learn還具有一系列用于「預(yù)處理」「轉(zhuǎn)換數(shù)據(jù)」的功能。為了促進(jìn)機(jī)器學(xué)習(xí)工作流程的再現(xiàn)性和簡單性,Scikit learn創(chuàng)建了管道(pipeline),允許將大量預(yù)處理步驟與模型訓(xùn)練階段鏈接在一起。

管道將工作流中的所有步驟存儲(chǔ)為單個(gè)實(shí)體,可以通過「fit」「predict」方法調(diào)用該實(shí)體。在管道對象上調(diào)用fit方法時(shí),預(yù)處理步驟和模型訓(xùn)練將自動(dòng)執(zhí)行。

7. ColumnTransformer

在許多數(shù)據(jù)集中,你將擁有不同類型的特征,需要應(yīng)用不同的預(yù)處理步驟。例如,可能有分類數(shù)據(jù)和連續(xù)數(shù)據(jù)的混合,你可能希望通過one-hot編碼將分類數(shù)據(jù)轉(zhuǎn)換為數(shù)字,并縮放數(shù)字變量。

Scikit-learn管道有一個(gè)名為ColumnTransformer的函數(shù),它允許你通過索引或指定列名來輕松指定要對哪些列應(yīng)用最適當(dāng)?shù)念A(yù)處理。

8. 管道的HTML形式

管道通常會(huì)變得非常復(fù)雜,尤其是在處理真實(shí)世界的數(shù)據(jù)時(shí)。因此,scikit-learn提供了一種方法來輸出管道中步驟的HTML圖表[3],非常方便。

9. 可視化 樹模型

plot_tree() 函數(shù)允許你創(chuàng)建決策樹模型中的步驟圖。

10. 豐富的第三方擴(kuò)展

許多第三方庫可以更好地?cái)U(kuò)展scikit-learn的特性。舉個(gè)栗子,category-encoders庫,它為分類特性提供了更大范圍的預(yù)處理方法,以及ELI5包以實(shí)現(xiàn)更大的模型可解釋性。這兩個(gè)包也可以直接在Scikit-learn管道中使用。

本文參考資料

[1]toy和real-world數(shù)據(jù)集: https://scikit-learn.org/stable/datasets/index.html

[2]openml.org網(wǎng)站: https://www.openml.org/home

[3]HTML圖表: https://scikit-learn.org/stable/modules/compose.html#visualizing-composite-estimators

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8532

    瀏覽量

    136013
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4849

    瀏覽量

    89183

原文標(biāo)題:關(guān)于Scikit-Learn你(也許)不知道的10件事

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于米爾瑞芯微RK3576開發(fā)板的創(chuàng)建機(jī)器學(xué)習(xí)環(huán)境方案

    】 【米爾-瑞芯微RK3576核心板及開發(fā)板】具有6TpsNPU以及GPU,因此是學(xué)習(xí)機(jī)器學(xué)習(xí)的好環(huán)境,為此結(jié)合《深度學(xué)習(xí)的數(shù)學(xué)——使用Python語言》 1、使用vscode 連接遠(yuǎn)
    發(fā)表于 06-27 11:33

    **【技術(shù)干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合**

    技術(shù)干貨】nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合 近期收到不少伙伴咨詢nRF54系列芯片的應(yīng)用與技術(shù)細(xì)節(jié),今天我們整理幾個(gè)核心問題與解答,帶你快速掌握如何在nRF
    發(fā)表于 04-01 00:00

    是否可以使用OpenVINO?部署管理器在部署機(jī)器上運(yùn)行Python應(yīng)用程序?

    使用 OpenVINO?部署管理器創(chuàng)建運(yùn)行時(shí)軟件包。 將運(yùn)行時(shí)包轉(zhuǎn)移到部署機(jī)器中。 無法確定是否可以在部署機(jī)器上運(yùn)行 Python 應(yīng)用程序,而無需安裝OpenVINO? Toolkit 和
    發(fā)表于 03-05 08:16

    基于瑞芯微米爾RK3576開發(fā)板創(chuàng)建機(jī)器學(xué)習(xí)環(huán)境

    及開發(fā)板】具有6TpsNPU以及GPU,因此是學(xué)習(xí)機(jī)器學(xué)習(xí)的好環(huán)境,為此結(jié)合《深度學(xué)習(xí)的數(shù)學(xué)——使用Python語言》 1、使用vscode 連接遠(yuǎn)程開發(fā)板 2、使用conda新建虛
    發(fā)表于 02-08 14:44

    使用Python實(shí)現(xiàn)xgboost教程

    裝: bash復(fù)制代碼conda install -c conda-forge xgboost 2. 導(dǎo)入必要的 在你的Python腳本或Jupyter Notebook中,導(dǎo)入必要的
    的頭像 發(fā)表于 01-19 11:21 ?2006次閱讀

    適用于MySQL和MariaDB的Python連接器:可靠的MySQL數(shù)據(jù)連接器和數(shù)據(jù)

    和 MariaDB 數(shù)據(jù)服務(wù)器以及托管數(shù)據(jù)服務(wù),以對存儲(chǔ)的數(shù)據(jù)執(zhí)行創(chuàng)建、讀取、更新和刪除操作。該解決方案完全實(shí)現(xiàn)了 Python DB API 2.0 規(guī)范,并作為 Windows、macOS
    的頭像 發(fā)表于 01-17 12:18 ?759次閱讀
    適用于MySQL和MariaDB的<b class='flag-5'>Python</b>連接器:可靠的MySQL數(shù)據(jù)連接器和數(shù)據(jù)<b class='flag-5'>庫</b>

    適用于Oracle的Python連接器:可訪問托管以及非托管的數(shù)據(jù)

    適用于 Oracle 的 Python 連接器 適用于 Oracle 的 Python 連接器是一種可靠的連接解決方案,用于從 Python 應(yīng)用程序訪問 Oracle 數(shù)據(jù)服務(wù)器和
    的頭像 發(fā)表于 01-14 10:30 ?670次閱讀

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    在上一篇文章中,我們介紹了機(jī)器學(xué)習(xí)的關(guān)鍵概念術(shù)語。在本文中,我們會(huì)介紹傳統(tǒng)機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)和多種算法特征,供各位老師選擇。 01 傳統(tǒng)機(jī)器
    的頭像 發(fā)表于 12-30 09:16 ?1659次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    如何選擇云原生機(jī)器學(xué)習(xí)平臺(tái)

    當(dāng)今,云原生機(jī)器學(xué)習(xí)平臺(tái)因其彈性擴(kuò)展、高效部署、低成本運(yùn)營等優(yōu)勢,逐漸成為企業(yè)構(gòu)建和部署機(jī)器學(xué)習(xí)應(yīng)用的首選。然而,市場上的云原生機(jī)器
    的頭像 發(fā)表于 12-25 11:54 ?636次閱讀

    Arm成功將Arm KleidiAI軟件集成到騰訊自研的Angel 機(jī)器學(xué)習(xí)框架

    Arm 與騰訊攜手合作,成功將 Arm KleidiAI 軟件集成到騰訊自研的 Angel 機(jī)器學(xué)習(xí)框架。 ? 借助 KleidiAI 解鎖卓越性能、能效和可移植性,騰訊混元大模型能夠?qū)崿F(xiàn)更快
    的頭像 發(fā)表于 11-24 15:33 ?1552次閱讀

    使用Python進(jìn)行串口通信的案例

    當(dāng)然!以下是一個(gè)使用Python進(jìn)行串口通信的簡單示例。這個(gè)示例展示了如何配置串口、發(fā)送數(shù)據(jù)以及接收數(shù)據(jù)。我們將使用 pyserial ,這是一個(gè)非常流行的用于串口通信的Python
    的頭像 發(fā)表于 11-22 09:11 ?2214次閱讀

    什么是機(jī)器學(xué)習(xí)?通過機(jī)器學(xué)習(xí)方法能解決哪些問題?

    計(jì)算機(jī)系統(tǒng)自身的性能”。事實(shí)上,由于“經(jīng)驗(yàn)”在計(jì)算機(jī)系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機(jī)器學(xué)習(xí)需要設(shè)法對數(shù)據(jù)進(jìn)行分析學(xué)習(xí),這就使得它逐漸成為智能數(shù)據(jù)分析技術(shù)的創(chuàng)新源之一,
    的頭像 發(fā)表于 11-16 01:07 ?1384次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題?

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域,機(jī)器學(xué)習(xí)算法是實(shí)現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對計(jì)算資源的需求也在不斷增長。NPU作為一種專門為深度學(xué)習(xí)機(jī)器
    的頭像 發(fā)表于 11-15 09:19 ?1708次閱讀

    如何使用Python構(gòu)建LSTM神經(jīng)網(wǎng)絡(luò)模型

    : NumPy:用于數(shù)學(xué)運(yùn)算。 TensorFlow:一個(gè)開源機(jī)器學(xué)習(xí),Keras是其高級API。 Keras:用于構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型。 你可以使用pip來安裝這些
    的頭像 發(fā)表于 11-13 10:10 ?2012次閱讀

    Python編程:處理網(wǎng)絡(luò)請求的代理技術(shù)

    在網(wǎng)絡(luò)編程中,代理技術(shù)扮演著至關(guān)重要的角色,尤其在處理網(wǎng)絡(luò)請求時(shí)。通過代理服務(wù)器,我們可以實(shí)現(xiàn)請求的轉(zhuǎn)發(fā)、緩存、負(fù)載均衡以及安全控制等功能。Python作為一種功能強(qiáng)大的編程語言,為提供了豐富的工具和,以便敏捷地實(shí)現(xiàn)和處理網(wǎng)絡(luò)
    的頭像 發(fā)表于 11-12 07:23 ?778次閱讀