久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術文章
文章詳情頁

Python 機器學習工具包SKlearn的安裝與使用

瀏覽:57日期:2022-06-19 16:35:07
目錄1、SKlearn 是什么2、SKlearn 的安裝3、SKlearn 內置數據集測試問題數據集實際問題數據集4、Sklearn 數模筆記的計劃1、SKlearn 是什么

Sklearn(全稱 SciKit-Learn),是基于 Python 語言的機器學習工具包。

Sklearn 主要用Python編寫,建立在 Numpy、Scipy、Pandas 和 Matplotlib 的基礎上,也用 Cython編寫了一些核心算法來提高性能。

Sklearn 包括六大功能模塊:

分類(Classification):識別樣本屬于哪個類別,常用算法有 SVM(支持向量機)、nearest neighbors(最近鄰)、random forest(隨機森林) 回歸(Regression):預測與對象相關聯的連續值屬性,常用算法有 SVR(支持向量機)、 ridge regression(嶺回歸)、Lasso 聚類(Clustering):對樣本進行無監督的自動分類,常用算法有 k-Means(k均值)、spectral clustering(特征聚類)、mean-shift(均值漂移) 數據降維(Dimensionality reduction):減少相關變量維數,常用算法有 PCA(主成分分析)、feature selection(特征選擇)、non-negative matrix factorization(非負矩陣分解) 模型選擇(Model Selection):比較,驗證,選擇參數和模型,常用模塊有 grid search(網格搜索)、cross validation(交叉驗證)、 metrics(度量) 數據處理 (Preprocessing):特征提取和歸一化,常用模塊有 preprocessing(預處理),feature extraction(特征提取) 這六個功能模塊涉及 4類算法,分類、回歸 屬于監督學習,聚類屬于非監督學習。

Python 機器學習工具包SKlearn的安裝與使用

官網地址:https://scikit-learn.org/

官方文檔中文版: https://www.scikitlearn.com.cn/

內置數據集:https://scikit-learn.org/stable/datasets.html

2、SKlearn 的安裝

Sklearn 的安裝要求:Python 3.5 以上版本,需要安裝 NumPy、SciPy、Pandas 工具包的支持,部分內容需要使用 Matplotlib、joblib 工具包。

pip 安裝命令:

pip3 install -U scikit-learnpip3 install -U scikit-learn -i https://pypi.douban.com/simple

注意 Sklearn 建議安裝 Numpy+mkl,可以在網址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 找到你需要的numpy+mkl版本,下載后 pip3安裝:

pip install numpy-1.11.1+mkl-cp27-cp27m-win_amd64.whl

3、SKlearn 內置數據集

Sklearn 內置了一些標準數據集可以用于練習和測試,都是經常被引用的經典問題,數據網址:https://scikit-learn.org/stable/datasets.htmlSklearn 標準數據集主要包括:

測試問題數據集 波士頓房價:Boston house prices dataset 鳶尾花問題:Iris plants dataset 糖尿病數據:Diabetes dataset 手寫數字的識別:Optical recognition of handwritten digits dataset 體能訓練:Linnerrud dataset 葡萄酒鑒別:Wine recognition dataset 威斯康星州癌癥診斷:reast cancer wisconsin (diagnostic) dataset 實際問題數據集 人臉數據:The Olivetti faces dataset 20個新聞文本數據:The 20 newsgroups text dataset 標記的人臉數據:The Labeled Faces in the Wild face recognition dataset 森林覆蓋類型:Forest covertypes 路透社新聞數據:RCV1 dataset 網絡入侵檢測數據:Kddcup 99 dataset 加州住房數據:California Housing dataset 4、Sklearn 數模筆記的計劃

粗略看看 Sklearn 的文檔,是一個功能強大和豐富的機器學習庫,遠遠超出了數學建模學習的范圍。基于數模教學的目的,本系列主要對應數模學習中的分類、聚類、降維問題,并不打算全面講解 Sklearn 的各種算法,而是以典型問題為例來介紹原理簡單、使用廣泛的基本方法,以便新手入門。

Python 機器學習工具包SKlearn的安裝與使用

以上就是Python 機器學習工具包SKlearn的安裝與使用的詳細內容,更多關于Python SKlearn的安裝與使用的資料請關注好吧啦網其它相關文章!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 横山县| 珠海市| 龙山县| 鹰潭市| 江源县| 道孚县| 肃北| 九龙县| 湄潭县| 永寿县| 边坝县| 寿光市| 屏南县| 富川| 中江县| 乌兰察布市| 江西省| 枞阳县| 遵化市| 肥城市| 宝鸡市| 曲沃县| 长宁县| 乐东| 公主岭市| 华坪县| 华亭县| 曲沃县| 右玉县| 长春市| 漳平市| 增城市| 沈丘县| 江永县| 万州区| 通许县| 屏南县| 潞城市| 墨脱县| 诏安县| 崇文区|