スキップしてメイン コンテンツに移動

音声認識を使ったプロジェクトから考える変化の時代

 先日あるプロジェクトで、「現場で作業をする人の会話を文字化する」ということを実験的に取り組むことになった。実験的というのは、「作業しながら話をしている声をちゃんと認識できるのか」とか、「業界の専門用語があるんだけど、そういうの認識できるのか」とか。できたらいいなだけど、色々課題はありそうなので、とりあえず実験するということ。POCってやつね。Proof of Concept。コンセプトが実現できるのかを実証する。


 ぼくらはMAGELLAN BLOCKSを使って実験。今回は、音声を認識するだけなので、独自の学習モデルとかは作らず、BLOCKSに登録されているGoogleの学習済み音声認識機能ブロックを使った。

 もうひとつは、国内でも圧倒的実績のある音声認識パッケージ。なんでもこの業界の専門用語を数万語登録してあるという。

 Googleの音声認識機能というのは、Speech APIという名前のクラウドサービス。Googleがこれまで様々なサービスで培ってきた機能を、クラウドで使える。

 これって何かというと、Androidで「OK, Google!」って言うと質問に答えてくれるヤツ、あるよね?あのサービスって、世界中の人が使えば使うほど、Googleの機械学習が、音声について学んでいる。学べば学ぶほど、OK Googleは便利になるわけだから、世界中の人が使って、世界中の人が便利になるという仕組みのサービスなんだよ。

 Googleが得意なのは、こういう機械学習で、教師なし学習というやつ。どういうことかというと、荒っぽく例えるなら学校の試験で出るような難しい問題があるとして、数学とか物理とか、答えよりも解き方が重要なやつ。そういうやつを、問題と答えだけたくさん見せていくと、コンピュータは解き方を見つけ出してしまう。そんな感じ。解き方を教えなくても、自分で見つけ出すので「教師なし」。

 で、さっきのプロジェクト。Googleは、単純に世界中の人との会話で学んだだけ。一方は、専門用語辞書を万全に備えた仕組み。


 結果は、BLOCKSの圧勝だった。つまりGoogleの圧勝ね。

 このプロジェクトの結果は、いろいろ考えることが多かった。だって、対抗馬になった仕組みは、実績もあるのでプログラム的にはよくできているんだと思う。そして専門用語をたくさん用意してあるのでデータも充分。
 
 Googleの仕組みがどうなっているのかは知らないけれど、TensorFlowで開発されたソースを色々見てきた感覚で言うと、音声認識をするニューラルネットワーク自体は驚くほどシンプルなんだと思う。100行程度だったりとかね。
 じゃぁデータはどうなんだろう?「OK. Google」に話かけた音声。あれって機械学習に学習させたら、もういらないわけだ。つまり、世界中の人たちが話しかけた言葉、音声自体は、学習させたら不要。だって、学習させた結果、学習した学習済みモデルがあればいいわけであって、一つ一つのデータはいらない。

 こう考えていくと、すごく時間をかけて巨大なプログラムを準備することとか、大量のデータを持っていることとかは、もはやそれほど重要ではないのかとさえ思えてくる。(とはいえ大量のデータがあるから学べるので、この表現は難しいんだけど。)シンプルな構造と、上手にデータを学習させる。つまり加工して持っていること。そちらの方がよっぽど大切だし、そういう時代なんだろうと思う。

 大量のエンジニアを投入した、数千万ステップのシステムとか。もしかしたらそういうこと自体、もはやダメなシステムの証なんじゃないかと。

 AIがどうのこうのという以前に、もしかしたらとてつもないイノベーションの真っ只中。その本質を理解することが、とても大切な、そういう時代なんだろうな。

コメント

このブログの人気の投稿

福岡ではじまる新たな動き「OPEN AI LAB」

ぼくたちは、福岡が本社だ。このエネルギーにあふれ、人の可能性を否定しない街は、ぼくたちのあらゆることの原点でもある。


だからこそ、福岡が刺激的に成長していくことは、ぼくたちにとって欠くべからざることなのだ。

テックパークという学童保育をやっていることも、九州経済産業局と一緒に地元製造業のために機械学習を学ぶ場を作ったことも、すべてそういう思いがあったから。

でも、もっと継続的に。地元企業同士が学び、知見を共有しあいながら、機械学習について研鑽を深め、事業を生み出していくことができたら。

実際、地元企業からとても多くの相談を受けるようになって、わずかなアドバイスでめちゃくちゃ画期的なサービスを完成させた人たちもいるし。そして、この土地は、周りと協力しあうことがとても好きな土地だし。

やっぱり機械学習は、理屈よりも実践だ。機械学習の権威が「無理じゃないかな」と言ったことが、やってみたら意外にも成果が出たこともある。

だから、まずは実践すること。迷わず実践してみて、成果が見込まれたら本格的に取り組めばいい。そしてこういうことは、一人で悶々と進めちゃダメだ。仲間と一緒に、あーだこーだ実験したり、成果を共有しあいながら進める。できるなら、会社も違い、業種も違う人たちと一緒に。そうなんだよ。こういうことが得意なのは、やっぱり福岡の人間だよな。そう思ったわけだ。

色々な思いがあって、ふくおかフィナンシャルグループの人たちと意気投合し、ざっくりとしたアイディアながら、高島市長も賛同してくれたし。

そして、いつもいろんな意見を交わしあっているソフトバンクが、「やるよ!」って男らしく笑顔とともに引き受けてくれたし、機械学習で世界を圧倒的にリードしているGoogleも、もちろんやりますよ。といってくれたし。

ということでスタートします。

オープンな場で、機械学習について学び、事業化に向けて実践していく場。
OPEN AI LAB

これはエンジニアの集まりではなく、事業家の集まり、ビジネスマンのためのもの。

そういう人たちが実践できるような、数々の手段や、事例や、ワークショップや。そういうものを通じて、理屈だけじゃなく、成功までの道筋を体感できるような。そんな活動をはじめます。

とびっきりの道具を使って、自分のビジネスに劇的な革新を起こしたい人は、ぜひここに集ってほしい。最高の体験を…

工場の不良品検査を機械学習で実現 BLOCKSに画像分類モデル登場

製造業にとっては、生産している商品が全てだ。


会社の体制も、工場の仕組みも、顧客の信頼を裏切らない商品を生産するために存在する。

工夫に工夫を重ね、素晴らしい精度で商品を生み出しているからこそ、商品のわずかな傷や、不良も見逃せない。

そんな製造業では、最終検品をベテラン社員が目視で行なっているところが非常に多い。


社員は製品を熟知しているし、新しい製品が出てきたとしても、少しレクチャーを受ければすぐにコツをつかむことができる。

でも、人間は疲れるし、体調だって崩すこともある。そして社会全体が人口減少なんだから、人手に頼っているのはコスト的にも、拡張性という点でもリスクだとも言える。

そんなことを考えてしまうと、例えばデジタルカメラの精度は人間の目をはるかに超えているわけだし、そんな作業はコンピュータに任せることはできないのか。そう思っている会社は極めて多い。

コンピュータを使って不良品を見つけ出す。

簡単なようでいて、これはなかなか難しい課題だ。

だって製品の仕様はコロコロ変わるわけだし、バリエーションもたくさんあったりする。

機械学習を使って判定させようとすると、新しい製品が出るたびに、新しい仕様が決まるたびに、新しく何千枚、何万枚と画像を撮影して学習させなければいけないとしたら、多分そんなことやってられない。

でも、もしも、わずか100枚くらいの画像を見せて、極めて高い精度の判定ができるとしたら。もしも学習が10分ちょっとで終わるとしたら。

そんなに簡単なら、新しい商品が登場するたびに、写真をとって学習させ、すぐに使ってみることができるだろう。

だから。



製造業のみなさん、おまたせしました。

そんなことを実現するMAGELLAN BLOCKSの新しい機械学習モデル「画像分類」がリリースされました。

新しい画像分類モデルは、転移学習という手法を使っており、あらかじめ世の中の様々な画像で物の見た目から特徴をつかむことを学習させてあります。だから不良の画像が100枚、正常の画像が100枚といった少ない枚数でも、不良という画像にはどんな特徴があるのかを、極めて高い精度で見つけ出し、判断することができるようになります。

使い方は簡単。

例えば良・不良の判定をしたいなら、goodというフォルダにgoodな画像を入れ、NGというフォルダにNGな画像を入れ。そしてBLOCK…

東京に縛られるな。福岡移住のすすめ。

九州の人には信じがたいことかもしれないけれど、東京の人たちは「どこの出身」とか「どこに本社がある」とかは、大して興味がない。そんなことより、その人、その人の感性、その人たちがやっていること、ポリシー。そういうことのほう興味があるし、重要だ。

でも、九州の人たちは、地元から来たとか、地元企業だというだけで、放っておけなくなる。

しかも、地元では「九州」というカテゴリはほとんど意味がないのに、東京に来た瞬間に「九州」は、大切な地元。九州全県出身者が、がぜん愛すべき地元出身者になるわけだ。



だから、ぼくは東京でのプレゼンで、「本社は福岡です。」「今日は福岡から来ました。」と呼びかけてみたりする。

呼びかけてみなくても、福岡に住んでいる間にしみついてしまった博多弁の片鱗が出てしまって

「あのですね」
「それでですね」
「ですからですね」

とか全く無自覚に言ってしまったりする。そうすると、なんかプレゼン終わった後にニヤニヤ近づいてくる人が必ずいる。

まー、つまりこういうことっていうのは、ある意味ボーナスポイントみたいなもんで、本当ならコンセプトで勝負し、中身で訴えなければならないのに、「地元」というプレゼントをもらってしまえる。図らずも心の友が登場する。という感じなんだな。

でも、それは今九州に住んでいる人のおかげというよりも、これまでの長い歴史の中で、先人たちが築きあげてきた文化だったりするわけだ。

そして素晴らしいことに、ぼくのように東京から移住した人間であっても、やっぱり地元なのであって、放っておけない仲間として扱ってくれる。

だから東京で最高のビジネス経験をした人は、例えば福岡に拠点を移し、そして福岡を飛び出して仕事を広げるのがおすすめ。どこへ行っても、愛すべき「地元」の仲間、先輩がいて、放っておけない気持ちでさりげなくアドバイスしてくれる。

そういう人は、東京から離れているとか離れてないとか、全く関係ないもんな。

デキるやつほど、東京に縛られるなよ。ということなんだけどな。