スキップしてメイン コンテンツに移動

音声認識を使ったプロジェクトから考える変化の時代

 先日あるプロジェクトで、「現場で作業をする人の会話を文字化する」ということを実験的に取り組むことになった。実験的というのは、「作業しながら話をしている声をちゃんと認識できるのか」とか、「業界の専門用語があるんだけど、そういうの認識できるのか」とか。できたらいいなだけど、色々課題はありそうなので、とりあえず実験するということ。POCってやつね。Proof of Concept。コンセプトが実現できるのかを実証する。


 ぼくらはMAGELLAN BLOCKSを使って実験。今回は、音声を認識するだけなので、独自の学習モデルとかは作らず、BLOCKSに登録されているGoogleの学習済み音声認識機能ブロックを使った。

 もうひとつは、国内でも圧倒的実績のある音声認識パッケージ。なんでもこの業界の専門用語を数万語登録してあるという。

 Googleの音声認識機能というのは、Speech APIという名前のクラウドサービス。Googleがこれまで様々なサービスで培ってきた機能を、クラウドで使える。

 これって何かというと、Androidで「OK, Google!」って言うと質問に答えてくれるヤツ、あるよね?あのサービスって、世界中の人が使えば使うほど、Googleの機械学習が、音声について学んでいる。学べば学ぶほど、OK Googleは便利になるわけだから、世界中の人が使って、世界中の人が便利になるという仕組みのサービスなんだよ。

 Googleが得意なのは、こういう機械学習で、教師なし学習というやつ。どういうことかというと、荒っぽく例えるなら学校の試験で出るような難しい問題があるとして、数学とか物理とか、答えよりも解き方が重要なやつ。そういうやつを、問題と答えだけたくさん見せていくと、コンピュータは解き方を見つけ出してしまう。そんな感じ。解き方を教えなくても、自分で見つけ出すので「教師なし」。

 で、さっきのプロジェクト。Googleは、単純に世界中の人との会話で学んだだけ。一方は、専門用語辞書を万全に備えた仕組み。


 結果は、BLOCKSの圧勝だった。つまりGoogleの圧勝ね。

 このプロジェクトの結果は、いろいろ考えることが多かった。だって、対抗馬になった仕組みは、実績もあるのでプログラム的にはよくできているんだと思う。そして専門用語をたくさん用意してあるのでデータも充分。
 
 Googleの仕組みがどうなっているのかは知らないけれど、TensorFlowで開発されたソースを色々見てきた感覚で言うと、音声認識をするニューラルネットワーク自体は驚くほどシンプルなんだと思う。100行程度だったりとかね。
 じゃぁデータはどうなんだろう?「OK. Google」に話かけた音声。あれって機械学習に学習させたら、もういらないわけだ。つまり、世界中の人たちが話しかけた言葉、音声自体は、学習させたら不要。だって、学習させた結果、学習した学習済みモデルがあればいいわけであって、一つ一つのデータはいらない。

 こう考えていくと、すごく時間をかけて巨大なプログラムを準備することとか、大量のデータを持っていることとかは、もはやそれほど重要ではないのかとさえ思えてくる。(とはいえ大量のデータがあるから学べるので、この表現は難しいんだけど。)シンプルな構造と、上手にデータを学習させる。つまり加工して持っていること。そちらの方がよっぽど大切だし、そういう時代なんだろうと思う。

 大量のエンジニアを投入した、数千万ステップのシステムとか。もしかしたらそういうこと自体、もはやダメなシステムの証なんじゃないかと。

 AIがどうのこうのという以前に、もしかしたらとてつもないイノベーションの真っ只中。その本質を理解することが、とても大切な、そういう時代なんだろうな。

コメント

このブログの人気の投稿

増資に関わる ぼくたちの覚悟

世の中は、時々おどろくほど大きな転換点が訪れる。過去と無関係な未来なんてないはずだけど、これまでの様々なこととは不連続に思える未来だ。


さきほど日本経済新聞のサイトでニュースが流れたので、お知らせします。
ぼくたちグルーヴノーツは、少し大きめの資金調達に踏み切りました。

グルーヴノーツと名乗り始めてから一貫して取り組んできたのは、最先端のIT技術を、専門知識がない人でも取り組めること。

そしてぼくらの「MAGELLAN BLOCKS

めざしているのは「機械学習の民主化」だ。

そのために、たくさん議論をし、機能を磨き、たくさんのプロジェクトで実践してきた。そして、さまざまな成果から、過去とは不連続だけど、とてつもなく大きな可能性を秘めた未来が見えてきた。同時に、ぼくらがやらなければならないことがハッキリしてきた。

だからこそ、ここはしっかりと前に進み、大きく前進していこう。
曖昧な一歩ではなく、ぼくらがやらなければならないことを、確実に、ためらわずに実行する。

今回の増資は、そういうこと。そして、増資を外部に公表するのは、そうしたぼくたちの覚悟を世間に公開する。そういう意思表示。

日経の記事には次のように紹介されている。

「同社の「マゼランブロックス」は米グーグルの機械学習サービスを使い、数値や文字、画像データを入力するだけで、AIが規則性などを発見して将来を予測できる。プログラミングなど専門知識を不要にした。」

でも、正確に言うなら、

「同社の「マゼランブロックス」はGoogleの機械学習インフラを活用し、グルーヴノーツが独自開発した機械学習サービスを使い、数値や文字、画像データを入力するだけで、AIが規則性などを発見して将来を予測できる。プログラミングなど専門知識を不要にした。」

Googleの圧倒的なパワーを借りながら、ぼくら自身が作り上げた機械学習モデルを使い、ぼくら自身が考え、作り上げたサービス。だから、これまでのやり方では解決できないことがあったら、ぜひ相談してほしい。

専門ベンダーを起用するのではなく、事業会社が自力で考え、自力で作り上げる機械学習サービス。そうしたことが、実現できるのだから。

そして、ベンダーに依存するのではなく、自力で考え、構築することこそ、機械学習が開く未来への扉の鍵なのだから。

福岡本社の、まだまだ小さな会社だけど、社会が望むことに真っ直…

福岡ではじまる新たな動き「OPEN AI LAB」

ぼくたちは、福岡が本社だ。このエネルギーにあふれ、人の可能性を否定しない街は、ぼくたちのあらゆることの原点でもある。


だからこそ、福岡が刺激的に成長していくことは、ぼくたちにとって欠くべからざることなのだ。

テックパークという学童保育をやっていることも、九州経済産業局と一緒に地元製造業のために機械学習を学ぶ場を作ったことも、すべてそういう思いがあったから。

でも、もっと継続的に。地元企業同士が学び、知見を共有しあいながら、機械学習について研鑽を深め、事業を生み出していくことができたら。

実際、地元企業からとても多くの相談を受けるようになって、わずかなアドバイスでめちゃくちゃ画期的なサービスを完成させた人たちもいるし。そして、この土地は、周りと協力しあうことがとても好きな土地だし。

やっぱり機械学習は、理屈よりも実践だ。機械学習の権威が「無理じゃないかな」と言ったことが、やってみたら意外にも成果が出たこともある。

だから、まずは実践すること。迷わず実践してみて、成果が見込まれたら本格的に取り組めばいい。そしてこういうことは、一人で悶々と進めちゃダメだ。仲間と一緒に、あーだこーだ実験したり、成果を共有しあいながら進める。できるなら、会社も違い、業種も違う人たちと一緒に。そうなんだよ。こういうことが得意なのは、やっぱり福岡の人間だよな。そう思ったわけだ。

色々な思いがあって、ふくおかフィナンシャルグループの人たちと意気投合し、ざっくりとしたアイディアながら、高島市長も賛同してくれたし。

そして、いつもいろんな意見を交わしあっているソフトバンクが、「やるよ!」って男らしく笑顔とともに引き受けてくれたし、機械学習で世界を圧倒的にリードしているGoogleも、もちろんやりますよ。といってくれたし。

ということでスタートします。

オープンな場で、機械学習について学び、事業化に向けて実践していく場。
OPEN AI LAB

これはエンジニアの集まりではなく、事業家の集まり、ビジネスマンのためのもの。

そういう人たちが実践できるような、数々の手段や、事例や、ワークショップや。そういうものを通じて、理屈だけじゃなく、成功までの道筋を体感できるような。そんな活動をはじめます。

とびっきりの道具を使って、自分のビジネスに劇的な革新を起こしたい人は、ぜひここに集ってほしい。最高の体験を…

工場の不良品検査を機械学習で実現 BLOCKSに画像分類モデル登場

製造業にとっては、生産している商品が全てだ。


会社の体制も、工場の仕組みも、顧客の信頼を裏切らない商品を生産するために存在する。

工夫に工夫を重ね、素晴らしい精度で商品を生み出しているからこそ、商品のわずかな傷や、不良も見逃せない。

そんな製造業では、最終検品をベテラン社員が目視で行なっているところが非常に多い。


社員は製品を熟知しているし、新しい製品が出てきたとしても、少しレクチャーを受ければすぐにコツをつかむことができる。

でも、人間は疲れるし、体調だって崩すこともある。そして社会全体が人口減少なんだから、人手に頼っているのはコスト的にも、拡張性という点でもリスクだとも言える。

そんなことを考えてしまうと、例えばデジタルカメラの精度は人間の目をはるかに超えているわけだし、そんな作業はコンピュータに任せることはできないのか。そう思っている会社は極めて多い。

コンピュータを使って不良品を見つけ出す。

簡単なようでいて、これはなかなか難しい課題だ。

だって製品の仕様はコロコロ変わるわけだし、バリエーションもたくさんあったりする。

機械学習を使って判定させようとすると、新しい製品が出るたびに、新しい仕様が決まるたびに、新しく何千枚、何万枚と画像を撮影して学習させなければいけないとしたら、多分そんなことやってられない。

でも、もしも、わずか100枚くらいの画像を見せて、極めて高い精度の判定ができるとしたら。もしも学習が10分ちょっとで終わるとしたら。

そんなに簡単なら、新しい商品が登場するたびに、写真をとって学習させ、すぐに使ってみることができるだろう。

だから。



製造業のみなさん、おまたせしました。

そんなことを実現するMAGELLAN BLOCKSの新しい機械学習モデル「画像分類」がリリースされました。

新しい画像分類モデルは、転移学習という手法を使っており、あらかじめ世の中の様々な画像で物の見た目から特徴をつかむことを学習させてあります。だから不良の画像が100枚、正常の画像が100枚といった少ない枚数でも、不良という画像にはどんな特徴があるのかを、極めて高い精度で見つけ出し、判断することができるようになります。

使い方は簡単。

例えば良・不良の判定をしたいなら、goodというフォルダにgoodな画像を入れ、NGというフォルダにNGな画像を入れ。そしてBLOCK…