TriAx Labs

トライアックスの技術関連ブログです。
Search

‘Mahout’ タグのついている投稿

2010 Oct 25 10:50
retweet

Hadoop本


Hadoop関連のテキストを3冊紹介します。

1冊目は「象本」こと Hadoop: The Definitive Guide です。Hadoopについて勉強したい方は、まずはこのテキストを読むとよいでしょう。原初では第2版が出版されているので、英語が苦手ではない人は原初を読んだ方がよいかもしれません。

2冊目は Data Intensive Text Processing with MapReduce です。 “in-mapper combining”,  “pairs/stripes”,  “reduce/map-side join” などのMapReduceのデザインパターンや、 「転置インデックス」「グラフアルゴリズム」「EMアルゴリズム」などについて説明しています。MapReduceを用いてデータ解析を行う場合には、これらの知識が基礎になるのではないでしょうか。著者のWebページ でドラフト版の全文PDFが公開されているので、興味を持った方はまずこちらに目を通して見るとよいかと思います。

3冊目は Mahout in Action です。Hadoop上の機械学習・データマイニングライブラリであるMahoutについて説明しています。このテキスト、実はまだ完成していないのですが 「書きあがった所まで読む権利」 を購入することが出来ます。現在読むことが出来るのは “Recommendations” と “Clustering” のパートです。どのようなアルゴリズムがMapReduceに載せられるのか、実例を通して理解するという観点からも参考になるテキストです。

ところで HBase, Cassandara などの NoSQLや GAE のデータモデリングについて、何かよい参考文献はないものでしょうか?

カテゴリー:
  • その他開発
Author:sato

    タグ:
  • Hadoop , 
  • Mahout , 
  • MapReduce
このエントリをはてなブックマークに追加このエントリをdel.icio.usに追加このエントリをLivedoor Clipに追加このエントリをYahoo!ブックマークに追加このエントリをGoogle bookmarkに追加
<< 前の月のアーカイブを見る
これより後の月にはエントリーがありません。
Category
Archive
Tags
すくすくスクラム アクセスログ アジャイル アラン・クーパー クラウド コメントの書き方 コンパイル コーディング規約 スクラム スマートフォン ソーシャルメディア タブレット タブレット端末 テキストマイニング テーマ デザイン デバッグ ドン・ノーマン ネットワーク プログラマ ペルソナ マーケティング メソッド ユーザ行動モデリング 便利ツール 勉強会 壁紙 実行時間 教育 暑中見舞い 行動パターン分析 開発 Android article aside buildbot CSS3 daemon mode facebook facebook page GAE Getting Things Done gnuplot Google Analytics Google App Engine GTD Hadoop Hardy HTML5 iframe iOS iOS4.2 iPad iPhone Jinja Jinja2 Mahout Mako MapReduce NFS PEP pybundle Pylons PyPl Python Pyxis Review Board RHEL4 section Smartphone Sphinx Tablet Toscawidgets Trac TrStyle UX Validator virtualenv web-kit Widget WSGI
    • トライアックス株式会社
    • LaCoon
Copyright(C) TriAx Corp. All rights reserved.