Web+DataMining勉強会 第9回第2週

| | コメント(0) | トラックバック(0)

第9回 データマイニング+WEB 勉強会@東京  ( Google Group ) 主催者まとめ

Ustreamで観戦してたけど、いろいろ覚えておくことがあったのでまとめ。


1. 初めてでもわかる Complementary Naive Bayes 分類器 (講師:@yanaoki)

 開発Webアプリ さまったー

アルゴリズムの詳しく内容を知るには、朱鷺の杜  参照。

Complement Naive Bayseについての実例


2. お金をかけず広告配信のログ分析システムを作った話 (講師:@karubi)

 

 

Kauri社長さん。プレスなどでしばしば目にしていたので登録してみた。

安くシステムつくって営業には資金を投資するという姿勢。

そう言っている割に、システムカッコイイし使いやすい。たぶん、ハードウェアへの無駄な投資をしないという姿勢。


3. 分析屋のためのマーケティング講座 (講師:@mmlab_jp)

ロックオン・MMLabの中川さん。主にマーケティングの話。


4. Mecab以外の形態素解析 – 新たなわかち書き機能を実装してみた- (講師:@super_rti  はてな )

MeCab最高!ってことが証明されたwww

 

資料

 

PREZLカッコイイ!


5. 画像認識の初歩、SIFT, SURF特徴量 (講師:@lawmn)

素粒子物理でPhD.だけど仕事に無関係・・・。物理多いなあ。価格.COMにお勤め?

 

 

SIFT (1999) Googleの論文 C#ライブラリ libsift  回転普遍、拡大縮小普遍

SURF(2006) SIFTの速度向上。OpenCVに実装されている

HOG(2005) Histogram of Oriented Gradient  大まかな特徴抽出

参考URL:

3日で作る高速特定物体認識システム (2) SIFT特徴量の抽出

大規模画像認識のための局所特徴量の比較

SURFすごい

画像処理の基礎 OpenCVによる基本的な例

---------------------------------------------------------

【SIFT/SURFの話をもう少し詳しく解説】

SIFTは、LOGだと計算量が多すぎて使えないので、DOGを用いている。

特徴点の抽出→ 特徴量の計算をしている。

SIFTよりSURFの方が特徴点検出を高速化しているが、誤認識がでるので認識率はSIFTの方が上。

Bag Of Featuresを使って、複数の画像から同一のオブジェクト抽出をおこなう。これは、Bag of Wordsの画像版。そのため、特徴量をVisual Wordと呼ぶ。


6. ペアトレードを実装してみた (講師:@yokkuns)

初めてでも分かるヘッジファンド入門

 

実装してもうまく儲けられるとおもえない・・・。確信あれば投資するんだけどなあ。


 7. 「GraphDB徹底入門」〜構造や仕組み理解から使いどころ・種々のGraphDBの比較まで幅広く〜 (講師:@doryokujin)

 

P23: Graphの種類の関係図が分かりやすくて良い。

P32,33 Graph DBはIndex-Freeであることが条件。ここ重要。DBの設計思想の違い。ある種のアプリケーションの動作速度の最適実装になる。グラフをB木でもつのはコストが大きすぎる。

Graph DBの比較および、Tool群の紹介。Graph DBを使ったからこそできるアプリケーションが思いつけば使いたいなあ。 

Graphデータ by Stanford


 8. Newman アルゴリズムによるソーシャルグラフのクラスタリング (講師:@komiya_atsushi)

 

 

グラフのクラスタリングなんて、30年前には必要なかったからなあ。ほんと近代の計算科学の分野だ。


おまけ:

前日にあった、第4回 自然言語処理勉強会のまとめ

トラックバック(0)

このブログ記事を参照しているブログ一覧: Web+DataMining勉強会 第9回第2週

このブログ記事に対するトラックバックURL: http://mt.nogutetu.com/mt-tb.cgi/452

コメントする

コネタ

全部みる

食事歴

全部みる

このブログ記事について

このページは、noguが2011年1月23日 17:26に書いたブログ記事です。

ひとつ前のブログ記事は「AdExchange、RTB関連 2010年12月」です。

次のブログ記事は「Mongo DB 第3回勉強会」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。