machine-learning - Stanford university

machine-learning – Stanford university

第7週はサポートベクターマシンです。名前は聞いたことがありました。
今までと同様に散らばったデータ群に境界線を引いてうまく分類するための手法です。特徴は境界線と近傍データとの距離を最大化するように線をひく、というものです。数学的な説明もありましたが、実際にSVMをプログラミングする必要はなくむしろ既存のソフトウェアを使うべし、とのことです。本講座はとにかく実地で機械学習を使えるようになることを主眼にしているので、無駄に時間を浪費するようなことは推奨されません。そんなわけで今回のプログラミング課題は比較的楽な内容でした。スパムメールの分類問題でしたが、英語の場合と日本語の場合とでは同じ手法でいけないのでは?との疑問が残りました。

それと前から気になっていたのですが、アメリカではグラフを描くときに○と×の使い方が日本とは逆ですね。ポジティブが×でネガティブが○なのでどうしても違和感があります。