Treasure Dataの2015年サマーインターンの中間発表 #td_intern

9月4日に行われた,サマーインターンに参加している3人の中間発表のまとめ - HivemallへのFactorization Machineの実装 - HivemallのRandom Forest実装の効率化 - Fluentdのナノ秒対応 続きを読む
3

機械学習をメインでやってる一人目の発表

SKS/ファントムの申し子 @repeatedly

強化学習の研究している人のサマーインターンの発表中.インターンではHivemallや機械学習周りの実装・改善をしている.まずはfactorization machine #td_intern

2015-09-04 13:38:36
SKS/ファントムの申し子 @repeatedly

Matrix factorizationとfactorization machineの違い #td_intern

2015-09-04 13:41:22
SKS/ファントムの申し子 @repeatedly

今回実装したのは,SGDを使って学習させている #td_intern

2015-09-04 13:44:00
tagomoris @tagomoris

最近メリットデメリットをわかりやすく説明するところから入るぞ! みたいなプレゼンばっかり聞いてたんだなーという…… #td_intern

2015-09-04 13:44:07
SKS/ファントムの申し子 @repeatedly

Matrix factorizationはd = 2だけど,Factorization matchineだとd ≧ 2となり,より多くのコンテキストを付加出来る #td_intern

2015-09-04 13:46:06
Sadayuki Furuhashi @frsyuki

『FluentdとHivemallで作る本格レコメンデーションエンジン』みたいな本(かチュートリアル)が欲しくなる気がしてきた。 #td_intern

2015-09-04 13:47:44
SKS/ファントムの申し子 @repeatedly

今回は二つのモデルを実装した.オンライン学習に向いたMapModelと,有限なデータに適したArrayModel #td_intern

2015-09-04 13:48:22
SKS/ファントムの申し子 @repeatedly

Latent Dirichlet Allocation. Unsupervised LearningでGenerative Modelな手法(ルー語っぽい #td_intern

2015-09-04 13:50:35
SKS/ファントムの申し子 @repeatedly

Learning methodはVariational BayesやMCMCを使った #td_intern

2015-09-04 13:54:26
SKS/ファントムの申し子 @repeatedly

今回はbatchとonlineの中間であるMini-batch online LDA #td_intern

2015-09-04 13:55:02
SKS/ファントムの申し子 @repeatedly

Webとかで見つかるような実装とは違って,オンラインでunknown dataにより適したのを今実装している #td_intern

2015-09-04 13:56:38

機械学習とFluentdの両方をやっている二人目の発表

SKS/ファントムの申し子 @repeatedly

次は大学でPhysic simulationをやっている人のインターン発表.やっていることはHivemall上のRandom Forestへの専用VMの実装とFluentdのSocketManager #td_intern

2015-09-04 14:05:04
Sadayuki Furuhashi @frsyuki

ほう。JSのコードを生成してJavaで実行とな? #td_intern

2015-09-04 14:06:40
SKS/ファントムの申し子 @repeatedly

現在のJavaScriptを使ったHivemallのRandom Forestの実装の問題点を説明中 #td_intern

2015-09-04 14:08:23
Sadayuki Furuhashi @frsyuki

JavaScriptを生成すると、無限ループみたいなコードを作ってしまったときに、Java側から止められない。そこで、独自のVMを作ったと。ほほう… #td_intern

2015-09-04 14:08:46
SKS/ファントムの申し子 @repeatedly

現在の実装の問題を解決するために,専用のVMを使った.illegalなコードの検証のしやすさ,様々な制限をつけられる,より高速に動作させられる,などメリットがたくさん #td_intern

2015-09-04 14:09:58
Sadayuki Furuhashi @frsyuki

Random Forest向けに特化しているのでif文で済む。セキュアな if 文の実行環境。なるほどな。 #td_intern

2015-09-04 14:10:28
SKS/ファントムの申し子 @repeatedly

JavaScriptで1000sで掛かっていたのが,専用VMなら100sで住むようになった #td_intern

2015-09-04 14:11:02
SKS/ファントムの申し子 @repeatedly

binary codeでより高速化も考えている.すでにHivemallのbranchで試すことができ,masterにマージ予定.勝手にRandom Forestが高速化される! #td_intern

2015-09-04 14:12:39