Treasure Dataの2015年サマーインターンの中間発表 #td_intern
- repeatedly
- 8395
- 0
- 27
- 24
機械学習をメインでやってる一人目の発表
強化学習の研究している人のサマーインターンの発表中.インターンではHivemallや機械学習周りの実装・改善をしている.まずはfactorization machine #td_intern
2015-09-04 13:38:36Matrix factorizationとfactorization machineの違い #td_intern
2015-09-04 13:41:22最近メリットデメリットをわかりやすく説明するところから入るぞ! みたいなプレゼンばっかり聞いてたんだなーという…… #td_intern
2015-09-04 13:44:07Matrix factorizationはd = 2だけど,Factorization matchineだとd ≧ 2となり,より多くのコンテキストを付加出来る #td_intern
2015-09-04 13:46:06『FluentdとHivemallで作る本格レコメンデーションエンジン』みたいな本(かチュートリアル)が欲しくなる気がしてきた。 #td_intern
2015-09-04 13:47:44今回は二つのモデルを実装した.オンライン学習に向いたMapModelと,有限なデータに適したArrayModel #td_intern
2015-09-04 13:48:22Latent Dirichlet Allocation. Unsupervised LearningでGenerative Modelな手法(ルー語っぽい #td_intern
2015-09-04 13:50:35Webとかで見つかるような実装とは違って,オンラインでunknown dataにより適したのを今実装している #td_intern
2015-09-04 13:56:38機械学習とFluentdの両方をやっている二人目の発表
次は大学でPhysic simulationをやっている人のインターン発表.やっていることはHivemall上のRandom Forestへの専用VMの実装とFluentdのSocketManager #td_intern
2015-09-04 14:05:04現在のJavaScriptを使ったHivemallのRandom Forestの実装の問題点を説明中 #td_intern
2015-09-04 14:08:23JavaScriptを生成すると、無限ループみたいなコードを作ってしまったときに、Java側から止められない。そこで、独自のVMを作ったと。ほほう… #td_intern
2015-09-04 14:08:46現在の実装の問題を解決するために,専用のVMを使った.illegalなコードの検証のしやすさ,様々な制限をつけられる,より高速に動作させられる,などメリットがたくさん #td_intern
2015-09-04 14:09:58Random Forest向けに特化しているのでif文で済む。セキュアな if 文の実行環境。なるほどな。 #td_intern
2015-09-04 14:10:28JavaScriptで1000sで掛かっていたのが,専用VMなら100sで住むようになった #td_intern
2015-09-04 14:11:02binary codeでより高速化も考えている.すでにHivemallのbranchで試すことができ,masterにマージ予定.勝手にRandom Forestが高速化される! #td_intern
2015-09-04 14:12:39