mapreduce

java

MapReduceはNaNを返します

MapReduceはNaNを返します M / R関数があり、一部の結果の値としてNaNを取得します。 JSの経験はありません。 Javaドライバーを使用してJSをエスケープしています。 String map = "functio...
couchdb

ビュー照合をCouchDBの有用な出力に「マージ」する

ビュー照合をCouchDBの有用な出力に「マージ」する CouchDBで_ "join" _を実行する場合、ビュー照合を使用してレコードをグループ化できます。 たとえば、2つのドキュメントタイプ_customers_と_orders_...
hadoop

DistributedCacheがファイル名をマングルするのはなぜですか

DistributedCacheがファイル名をマングルするのはなぜですか 奇妙な問題があります。DistributedCacheはファイルの名前を変更しているように見えます。元の名前を親フォルダーとして使用し、ファイルを子として追加し...
cloud

Hadoopカウンターの値としてテキスト/文字列タイプを指定する

Hadoopカウンターの値としてテキスト/文字列タイプを指定する hadoopカウンタを設定/インクリメントする現在のメソッドは、「long」値のみを取ります。 例: `increment(long incr)`と `setVal...
amazon-web-services

Ruby CLIクライアントを使用して、Amazon Elastic MapReduceのJSON JobFlow記述に基づいてJobFlowを起動する方法

Ruby CLIクライアントを使用して、Amazon Elastic MapReduceのJSON JobFlow記述に基づいてJobFlowを起動する方法 hadoop用のmapreduceアプリケーションを作成し、1台のマシンのコ...
hadoop

Hadoop分散キャッシュに複数のファイルを追加しますか?

Hadoop分散キャッシュに複数のファイルを追加しますか? hadoop分散キャッシュに複数のファイルを追加しようとしています。 実際、私はファイル名を知りません。 それらは「part-0000 *」のように命名されます。 誰かがそれ...
disco

Disco / MapReduce:前の反復の結果を新しい反復への入力として使用

Disco / MapReduce:前の反復の結果を新しい反復への入力として使用 現在、ディスコにPageRankを実装しています。 反復アルゴリズムとして、ある反復の結果が次の反復への入力として使用されます。 すべてのリンクを表...
combiners

Hadoopコンバイナーのソートフェーズ

Hadoopコンバイナーのソートフェーズ 指定されたコンバイナでMapReduceジョブを実行する場合、コンバイナはソートフェーズ中に実行されますか? コンバイナは各流出のマッパー出力で実行されることを理解していますが、ソートをマージ...
hadoop

Hadoopでファイルテキスト全体をマップキーとして追加する

Hadoopでファイルテキスト全体をマップキーとして追加する ファイルテキスト全体をマップに読み込む方法を探しています。 TextInputFormatのように一度に1行ではありません。 そのため、マップでvalue.toString...
couchdb

couchdb map-reduceおよびグループ化

couchdb map-reduceおよびグループ化 私はオブジェクトのユニークなイベントの数を取得しようとしています(ビデオを言うことができます): 私のドキュメントは次のとおりです。 { "type":"View",...
タイトルとURLをコピーしました