十の並列した脳

何でも勉強する,毎週月木曜に投稿予定

「初探機器學習使用Python」まとめ#8 第七章 支持向量機

「初探機器學習使用Python」(↓の中国語版 )

Thoughtful Machine Learning with Python: A Test-Driven Approach

Thoughtful Machine Learning with Python: A Test-Driven Approach

 

 

#8では第七章について扱う。

 

 

顧客快樂度ー留言函數

本章では,オンラインストアにおける顧客の満足度と利益の関係を例に話が進められる。ただし本記事では,第三章K-最近鄰法と同じ例を用いることとする。

f:id:ryosuke_okubo:20190417184651p:plain

這個問題的解決方案不可勝數,而本章聚焦於一個運作穩當的解決方案:支持向量機SVM)。該演算法使用決策邊界(decision boundaries)將資料劃分成多個部分,而藉由特徵轉換與忽略資料點之間的距離,針對高維度也可妥善運作。(p111)

単語

  • :わずかに,〜のみ
  • 穩當:安定した,確実な
  • 支持向量機Support Vector Machine,サポートベクトルマシン
  • 決策邊界:decision boundaries,決定境界
  • 忽略:見落とす,無視する
  • :もっと,より

意訳

「この問題に対する解決策は無数にあるが,この章ではうまく機能する,Support Vector Machineにのみ焦点を当てる。 アルゴリズムは決定境界を使用してデータを複数の部分に分割する。また,特徴変換とデータポイント間の距離の無視により,より高い次元においても適切に機能する。」

 

SVM背後的理論

支持向量機では,決策邊界を用いてクラス分類する。

 

f:id:ryosuke_okubo:20190417190614p:plain

決策邊界は,マージンが最大になるように決められる。実際の計算においては,二次規劃(quadratic program)の一種である凸優化(convex opitimization)を用いる。

線形分離できないデータに対しては,核技巧(kernel trick)を用いることでうまく行くことがある。(※よくカーネル法SVMと絡めて説明されるが,実際カーネル法は他の手法においても非線形データに対して適用される。)

 

本章總結

SVM演算法非常適合對兩個可劃分的類別進行分類。可以將其修改為劃分兩個以上的類別,而不會受到KNN的維度詛咒的影響。(p132)

意訳

SVMアルゴリズムは、2つの細分可能なカテゴリを分類するのに非常に良い。 KNNのように次元の呪いの影響を受けずに、3つ以上のカテゴリーを分割するように修正することができる。」

 

次回↓

作成中