2017年1月26日木曜日

サタデースクールはじめます

子どもたちがテクノロジーに触れ、テクノロジーと遊べる場所「テックパーク・キッズ」。はじめのうちは、「子どもたちが理解するには、子ども向けのコンテンツじゃないとダメじゃないか。」とか考えていました。

でも、集まってくる子どもたちに触れていると、そうじゃないってわかってきた。

「子どもだから」ではなく、「はじめてテクノロジーに触れる人たち」の入り口を準備し、その先の道を用意してあげること。ぼくたち自身エンジニアなので、テクノロジーの楽しさは熟知している。だから、適切な入り口さえ用意してあげれば、あとはその先がどんなに楽しいかは、いくらでも見せてあげられる。


例えば低学年生には、マインクラフトの仮想空間で作り上げた建造物を3Dプリンターで出力したり、高学年生は専門家が使うようなプログラム言語で、ゲーム作りをしたり。つまり、子供向けの子供のツールではなく、子供の入り口を準備したプロのやり方を、ぼくたち自身の知識と経験で作り上げてきた。

まぁ、とにかく驚くほど緻密な建造物を3Dプリンタで出力する子とか。素晴らしくプログラムセンスの良い子とか。ゆっくりだけど、最後にはすごい個性を見せつける子とか。

ひとりひとりキラキラするような個性の持ち主ばかり。

たぶん、テックパークに集まってきた子どもたちがキラキラしているだけじゃなくて、子どもたちには、ちゃんとした入り口さえ用意してあげて、自分のペースで、自分の個性で、その先の歩き方を教えてあげれば、だれだってまぶしいくらいの個性を発揮できるということなんだ。

そんな誇らしくも素晴らしい場所。子どもを通わせたいけれど、平日の学童保育としては通えない。だから、休日にカリキュラムだけ受けられないか。そんな声が多く寄せられていました。

ぼくたちは、塾を作ったつもりじゃないし、子どもたちをたくさん集めすぎて、一人一人の個性が輝きはじめるのを手伝えなくなってしまうのも嫌なので、ちょっと躊躇していたのも確か。

でも、子どもたちと一緒に作り上げてきたコンテンツを、みんなメキメキと吸収していくのをみて、決めました。

土曜日に、ぼくたちのカリキュラムを受けられる時間。サタデースクールをはじめます。

コンテンツは3つ。

「ゲームをつくろう!プログラミングコース」
「ロボットで学ぶ電子工作コース」
「パソコンでマインクラフトコース」

入り口は誰でもできるものばかり。そして、やり続けるならその先は、どこまでも刺激的なワクワクする世界ばかり。

詳しくは、佐々木のブログをみてください。

コンピューターで思いっきり遊びたい子どもたち、あつまれ。

2017年1月13日金曜日

音声認識を使ったプロジェクトから考える変化の時代

 先日あるプロジェクトで、「現場で作業をする人の会話を文字化する」ということを実験的に取り組むことになった。実験的というのは、「作業しながら話をしている声をちゃんと認識できるのか」とか、「業界の専門用語があるんだけど、そういうの認識できるのか」とか。できたらいいなだけど、色々課題はありそうなので、とりあえず実験するということ。POCってやつね。Proof of Concept。コンセプトが実現できるのかを実証する。


 ぼくらはMAGELLAN BLOCKSを使って実験。今回は、音声を認識するだけなので、独自の学習モデルとかは作らず、BLOCKSに登録されているGoogleの学習済み音声認識機能ブロックを使った。

 もうひとつは、国内でも圧倒的実績のある音声認識パッケージ。なんでもこの業界の専門用語を数万語登録してあるという。

 Googleの音声認識機能というのは、Speech APIという名前のクラウドサービス。Googleがこれまで様々なサービスで培ってきた機能を、クラウドで使える。

 これって何かというと、Androidで「OK, Google!」って言うと質問に答えてくれるヤツ、あるよね?あのサービスって、世界中の人が使えば使うほど、Googleの機械学習が、音声について学んでいる。学べば学ぶほど、OK Googleは便利になるわけだから、世界中の人が使って、世界中の人が便利になるという仕組みのサービスなんだよ。

 Googleが得意なのは、こういう機械学習で、教師なし学習というやつ。どういうことかというと、荒っぽく例えるなら学校の試験で出るような難しい問題があるとして、数学とか物理とか、答えよりも解き方が重要なやつ。そういうやつを、問題と答えだけたくさん見せていくと、コンピュータは解き方を見つけ出してしまう。そんな感じ。解き方を教えなくても、自分で見つけ出すので「教師なし」。

 で、さっきのプロジェクト。Googleは、単純に世界中の人との会話で学んだだけ。一方は、専門用語辞書を万全に備えた仕組み。


 結果は、BLOCKSの圧勝だった。つまりGoogleの圧勝ね。

 このプロジェクトの結果は、いろいろ考えることが多かった。だって、対抗馬になった仕組みは、実績もあるのでプログラム的にはよくできているんだと思う。そして専門用語をたくさん用意してあるのでデータも充分。
 
 Googleの仕組みがどうなっているのかは知らないけれど、TensorFlowで開発されたソースを色々見てきた感覚で言うと、音声認識をするニューラルネットワーク自体は驚くほどシンプルなんだと思う。100行程度だったりとかね。
 じゃぁデータはどうなんだろう?「OK. Google」に話かけた音声。あれって機械学習に学習させたら、もういらないわけだ。つまり、世界中の人たちが話しかけた言葉、音声自体は、学習させたら不要。だって、学習させた結果、学習した学習済みモデルがあればいいわけであって、一つ一つのデータはいらない。

 こう考えていくと、すごく時間をかけて巨大なプログラムを準備することとか、大量のデータを持っていることとかは、もはやそれほど重要ではないのかとさえ思えてくる。(とはいえ大量のデータがあるから学べるので、この表現は難しいんだけど。)シンプルな構造と、上手にデータを学習させる。つまり加工して持っていること。そちらの方がよっぽど大切だし、そういう時代なんだろうと思う。

 大量のエンジニアを投入した、数千万ステップのシステムとか。もしかしたらそういうこと自体、もはやダメなシステムの証なんじゃないかと。

 AIがどうのこうのという以前に、もしかしたらとてつもないイノベーションの真っ只中。その本質を理解することが、とても大切な、そういう時代なんだろうな。

2017年1月11日水曜日

ぼくらがBLOCKSで機械学習サービス「MLボード」をリリースする理由

 社会は、ますます複雑化してきているし、世の中は不連続な出来事であふれているかのようだ。理解しがたく、未来が見通しにくい時、人は過剰な行動で何かを守ろうとするのかもしれない。

 世界では、飢えや貧困に苦しむ人がいる一方で、生産される食料の3分の1は廃棄されている。「もったいない」という精神が息づいていると賞賛された日本は、食料廃棄率では世界一で、5,000万人の人が一年間に食べる量を毎年捨てているのだ。

 その一方、流通業の課題は廃棄ロスとチャンスロスだと言われている。仕入れすぎて廃棄せざるをえないロスと、せっかく欲しい人がいるのに、商品を渡せないというロス。

 欲しいものがいつでも手に入り、電気もガスも水道も、途切れることなく提供される。電車もバスも時間通りに来て、注文したものは時間通りに届く。友達とはSNSでいつでも会話ができるし、行きたかったコンサートの情報は、間違いなく届いてくれる。

 便利な社会は、みんなが望んだから成立しているわけなので、望んだ未来がだんだん形作られているとも言える。でもその一方で壮絶なる無駄があり、世界のどこかで苦しむ人がいることを無視したかのような繁栄は、本当にいいのかとも思ってしまう。

 だからこそ。便利さを維持するためにも。無駄な部分をどうやって切り詰めていくことができるのかを、企業も社会も真剣に考えている人たちがいるのだ。そしてぼくたちは、真剣に社会の不合理なところと向き合っている人たちが、自分の手で確かめ、自分で考え、解決していくための手段を提供していきたい。そう思ってサービスを磨いてきた。


今日、MAGELLAN BLOCKSに新しく機械学習機能「Machine Learningボード」(MLボード)をαリリースします。αリリースというのは、まずは試験的にも使ってみたいと望んでいる人だけに使ってもらうリリース。

 これまでは、グルーヴノーツがコンサルティングしながらMLボードを使っていた。そしてこれからは、コンサルタントがいなくても自分でできる。でもコンサルタントがいないということで、使いにくいところがあるかもしれない。そういうところに耳を傾け、改善していく。それがα、その後に一般公開するのがβ。この段階では、もっと多くの人に使ってもらう、さらに改善を行って最終リリースに持ち込む。評判になったりとか、話題になったりとかよりも、本当に必要とされるものに磨き上げていく。そういうことの方が、ずっと重要だと思う。だから、面倒臭いかもしれないけれど、こうやって段階を踏んだリリースをする。

 そして、最初にリリースするのは、「数値回帰モデル」と「数値分類モデル」。

 数値回帰モデルとは、需要予測に使えるニューラルネットワーク。数値分類は、カードの不正利用や、地勢的な需要分類など、与えた因子の傾向から指定された分類を行うニューラルネットワーク。(今後も新しい課題解決のモデルを、どんどんリリースするからね。)

 数値というのは、数字の羅列からコンピュータがパターンを読み取ってくれるということ。需要予測に使うなら、需要の因子となっている情報を並べると、BLOCKSは特徴を自動的に調べていき、どういう場合には何個売れるのか、どういう場合には何人の人がやってくるのか。そういうことを予測してくれる。天候が因子なのかもしれないし、価格が因子になるのかもしれない。もしかしたら、季節的な出来事が因子になっているのかもしれない。そういう因子を並べれば、あとはBLOCKSが自分で考えてくれる。どこをどう見てほしいとか、伝える必要もない。

 そして、使いこなすためにプログラムを作る必要はないし、機械学習に関する知識もいらない。

 必要なのは、ビジネスに関する知識、現場を想像できる力。予測精度が思うようにでないなら、与えた因子が違うのでは、というところから見直してほしい。だからこそ、人はなぜ買いたいと思うのか、人はなぜ行動するのか。そういう根源的なことをちゃんと考えなければならない。

 IT技術者のための機械学習では、社会に浸透しないし、社会が本当に変わっていく力にはならない。だからこそ

 機械学習の民主化

 それがぼくらがめざしていること。

 MAGELLAN BLOCKSの機械学習サービス「MLボード」は、今日の午後リリース。
是非試してみたいという人は、こちらから申し込んでください。


 まずは一歩を。踏み出すことができれば、踏み出した数だけ未来を変えることができる。