AIジョブカレ3回目に参加してきました - ありまっくすのへっぽこ日記

先々週の話ですが。。。

水曜日はAIジョブカレの第3回目に参加してきました。

今回のテーマは「分類」でした。例えば、「スパムメール」か「スパムメールでない」のようなものが挙げられます。

分類方法にはいくつか種類があります。

学習をしない方法（怠惰学習という）で、予測したいデータと距離の近いk個の訓練データの正解ラベルから予測を決定します。

「自分と周りは同じだろう」という前提の方法

以下の最小化問題を解き、重みパラメータ(w)を学習していきます。

※機械学習は、損失関数を最小化していく

式の前半部分（+の前まで）はL2正則化といわれており、過学習を防ぐためにモデルに対してペナルティを与えています。（極端なデータが与えられた時にあまり学習しないようにする）

C の値が大きければ、正則化の効力が相対的に下がります。

yi=1（正しい例）のデータの戻り値が大きく、yi=-1（間違っている例）のデータの戻り値が小さくなるようなwを探していきます。

最終的に、スコアはロジスティック関数によって確率に変換されます。

入力されたデータによって発火する、脳のニューロンの仕組みを応用したもの。

下の図のように、入力層、隠れ層、出力層からなり、重みパラメータを学習していきます。

力尽きたので、今日はここまで。