・大量データの扱い
データの分量が100万、億の単位(いわゆるビッグデータ)になった時の勾配降下法のやり方についてです。確率的勾配降下法と呼ばれ、パラメータの更新をするときにすべてのデータを使わずにひとつのデータのみを使うというものです。1回ごとの精度は低いけれども最後には最小値の付近に到達し、それを数回繰り返すことで通常のやり方と同等の結果を得られます。

・オンライン機械学習
WEBショップなど継続的に顧客のデータが得られる場合などに使われる手法で、上記の考え方に似ていて常に新しい単独のデータをもとにパラメータを更新していきそのデータは次回からは使われません。長期にわたって状況の変動などにも対応できます。

・並列処理(Map Reduce)
ビッグデータを複数のコンピュータに分散して処理する手法。

今回プログラミング課題はありませんでしたが、初回の進級テストが5問中3問正解で不合格になりました。もちろん再挑戦できます。翌日Corseraから「Don’t give up!」のメールが届いていました。
******************************
We noticed that you didn’t pass Large Scale Machine Learning in Machine Learning yet! We wanted to remind you that there’s no penalty, so feel free to try again.

Research shows testing will help you remember and apply the information more easily, so this exam is not only a way to gauge how well you’ve mastered the material – it will actually help you learn!
*******************************
次週は最後です。