りおパパの日記

徒然なるままに。ドトールのコーヒーが好きです。

日経コンピュータ

日経コンピュータの7月24日号はビッグデータの特集。Part 4の最新技術動向はとても参考になりました。というか、つい先日までほとんど判っていなかったのだけど、この文章の中でHadoop2と称されている新しいHadoop周りの動きの整理で、先日の話がやっと何を話しているのかが見えてきました。いわく、バッチ処理を得意としていたHadoopSQLクエリーを使ったインタラクティブな分析、インメモリー処理、機械学習処理の世界を実現しつつあるということでしょうか。キーワードはYARNとDAG(有向非循環グラフDirected Acyclic Graph)。そして、DAGの代表的なものであるSparkとTez。この辺が抑えどころかなと思いました。
また、「データ分析基盤はHPCへ」という記事も興味深くて、この記事によるとHPCの技術のポイントは「メモリの階層化」だと指摘している。これは、プロセッサの演算性能が上がったため、ボトルネックがメモリやインターコネクトの性能になったためというもの。代表的なものとして3次元積層DRAMの話が出ていました。非常に興味深い内容でした。