Cloud API を活用して複雑なプロダクトを爆速で作る

Cloud API を活用して複雑なプロダクトを爆速で作る

約8万枚の画像をカテゴライズして3D空間にマッピング

2016年3月の Google のイベント、 GCP NEXT 2016 にて Google の Jeff Dean が同社の Vision API についてデモンストレーションを行いました。

Google の公式ブログで利用テクノロジーについて紹介されているほか、実際にデモンストレーションに使われたアプリケーションを試してみることが可能です。
<http://googlecloudplatform-japan.blogspot.jp/2016/05/cloud-vision-api.html (翻訳 ver.)>
http://vision-explorer.reactive.ai/

ソースコードも公開されています。
https://github.com/reactiveai/cloud-vision-explorer

2週間という超短納期(!)で開発

Screenshot 2016-08-15 01.19.09
実は僕もこのプロダクトの開発に携わっており、主に 3D 部分以外の UI や Vision API をコールする部分を開発しました。(画像の解析結果を閲覧するための情報パネルや顔認識のオーバーレイなど。 React.js 使用)

先進的なテクノロジーをふんだんに使っているのにもかかわらず、なんとこのプロダクトの開発期間はたったの3週間!細かい修正や Google 社からのフィードバックを受けて細かい修正などもありましたから、メインの機能の開発に充てられるのは2週間程度しかありませんでした。

それでもこのような良いものを完成させられたのは幾つかの理由があったように思います。

1. チームメンバーがそれぞれの専門スキルを高いクオリティで発揮できた

デザイナー、バックエンドエンジニア、フロントエンドエンジニア、機械学習エンジニア、それぞれのスキルが高く、お互いの担当範囲やゴールが明確だったため、コミュニケーションコストも少なく、皆が最大限の成果を出すことができたというチームの力がまずあります。

2. Google の Vision API を始めとした人類の英知の結晶を利用できた

画像解析をまともにやろうとすると、まず大量のデータを用意し、解析用のモデルを探し(なければ論文などをもとに自分で構築し)、何度もトレーニングを行って精度をあげ、実際の画像を分類するためのもとにトレーニングを行い、解析のためのモデルを構築し、そのモデルを使って画像の分類をするためのシステムを作り。。。等の多大な作業が必要になってきます。

しかしながらこのような特定の企業によって一般公開されている API を使えば、数時間もあればより制度の高い結果を得ることができるのです。これはものすごい生産性の向上です。

車輪の再発明をせずに巨人の肩の上に立つ

あなたがもしこのような画像の解析を行うプロダクトを提供している会社であれば、このような Cloud API の公開は多少の打撃を被るかもしれませんが、ほとんどの人は “画像認識テクノロジーそのもの” ではなく “画像認識テクノロジーによって得られるベネフィット” の方を必要としています。

そのベネフィットをより少ないコストで得られるということは、様々なビジネスの可能性やスピードを向上させるものです。

自分たちのコアバリューが何かを考えた時にそれが車輪の再発明でないのであれば、このようなオープンテクノロジーを積極的に活用して問題を片付け、本質的な課題にフォーカスできるのが一流のエンジニアなのだと思います。

(編集後記

Geek 系エンジニアとしては難しい処理をアウトソーシング(単に API 呼ぶだけなど)するのはやや歯ごたえが無いとも感じてしまったりするのですが (^^;

Yu Yamanaka
Co-founder at INGoT LLC / Core Engineer at Reactive Inc.

Related

Sorry, no posts were found.

Comments

No Comments Yet!

You can be first to comment this post!

Post Reply