広告技術AdTechの最近のブログ記事
第9回 データマイニング+WEB 勉強会@東京 ( Google Group ) 主催者まとめ
Ustreamで観戦してたけど、いろいろ覚えておくことがあったのでまとめ。
1. 初めてでもわかる Complementary Naive Bayes 分類器 (講師:@yanaoki)
開発Webアプリ さまったー
アルゴリズムの詳しく内容を知るには、朱鷺の杜 参照。
2. お金をかけず広告配信のログ分析システムを作った話 (講師:@karubi)
Kauri社長さん。プレスなどでしばしば目にしていたので登録してみた。
安くシステムつくって営業には資金を投資するという姿勢。
そう言っている割に、システムカッコイイし使いやすい。たぶん、ハードウェアへの無駄な投資をしないという姿勢。
3. 分析屋のためのマーケティング講座 (講師:@mmlab_jp)
ロックオン・MMLabの中川さん。主にマーケティングの話。
4. Mecab以外の形態素解析 – 新たなわかち書き機能を実装してみた- (講師:@super_rti はてな )
MeCab最高!ってことが証明されたwww
PREZLカッコイイ!
5. 画像認識の初歩、SIFT, SURF特徴量 (講師:@lawmn)
素粒子物理でPhD.だけど仕事に無関係・・・。物理多いなあ。価格.COMにお勤め?
SIFT (1999) Googleの論文 C#ライブラリ libsift 回転普遍、拡大縮小普遍
SURF(2006) SIFTの速度向上。OpenCVに実装されている
HOG(2005) Histogram of Oriented Gradient 大まかな特徴抽出
参考URL:
3日で作る高速特定物体認識システム (2) SIFT特徴量の抽出
---------------------------------------------------------
【SIFT/SURFの話をもう少し詳しく解説】
SIFTは、LOGだと計算量が多すぎて使えないので、DOGを用いている。
特徴点の抽出→ 特徴量の計算をしている。
SIFTよりSURFの方が特徴点検出を高速化しているが、誤認識がでるので認識率はSIFTの方が上。
Bag Of Featuresを使って、複数の画像から同一のオブジェクト抽出をおこなう。これは、Bag of Wordsの画像版。そのため、特徴量をVisual Wordと呼ぶ。
6. ペアトレードを実装してみた (講師:@yokkuns)
実装してもうまく儲けられるとおもえない・・・。確信あれば投資するんだけどなあ。
7. 「GraphDB徹底入門」〜構造や仕組み理解から使いどころ・種々のGraphDBの比較まで幅広く〜 (講師:@doryokujin)
P23: Graphの種類の関係図が分かりやすくて良い。
P32,33 Graph DBはIndex-Freeであることが条件。ここ重要。DBの設計思想の違い。ある種のアプリケーションの動作速度の最適実装になる。グラフをB木でもつのはコストが大きすぎる。
Graph DBの比較および、Tool群の紹介。Graph DBを使ったからこそできるアプリケーションが思いつけば使いたいなあ。
8. Newman アルゴリズムによるソーシャルグラフのクラスタリング (講師:@komiya_atsushi)
グラフのクラスタリングなんて、30年前には必要なかったからなあ。ほんと近代の計算科学の分野だ。
おまけ:
前日にあった、第4回 自然言語処理勉強会のまとめ
モバイルアドエクスチェンジの「Mobclix」がモバイル向けRTB
Mobclixの発表によると、RTBを通して広告在庫を販売することにより、40%から85%もパフォーマンスが改善したそうだ。
「プレミアム オーディエンス ターゲティング」とは、訴求したいオーディエンスカテゴリを指定して広告を掲載できるオーディエンスターゲティングの広告商品です。カテゴライズされたプレミアムサイト(マーキングパートナー)でCookieを付与することによりオーディエンスの行動を認識し、そのオーディエンスが媒体(配信パートナー)に来訪した際に最適な広告をターゲティング配信します。明確なターゲットのみに広告を配信するため、高い訴求力が期待できます。
CCI, MicroAd提携。大規模人材募集中・・・
仲間内での分析ではRTB/AdExchangeの必須要件として、「オーディエンスデータを利用」、「媒体impの20%以上が参加」が求められ、推進要件として、「高度なDSPと、簡易なDSPの整備」、「AdServerの安価もしくは無料供給」があります。
OptのOpenDPF構想「Xrost」の概念図をみると、AdExchangeの中にAudienceデータを保有し、SSPやDSPの配信効率を最適化しようという意図がハッキリと見えます。

単一のAdNetworkが、高度なDSP機能、オーディエンスデータの保有をするのはコスト面で難しいので、みんなの力で弱いところを助け合いましょう・・・と一見みえます。
Googleのリスティング広告のようにメディアを持っていない、Xrost、OpenX、AdLantis、などの企業にとって、広告業界でAdExchangeのポジションは「美味しい場所」で魅せられます。
一方、Googleのように強大な資本力・開発力・顧客数をもつAdNetworkは自前で全て備えることが可能です。
勝利戦略が見えない・・・。
