AI向け学習データ作成(画像データの拡張)

ITアウトソーシング「AI向け学習データ作成(画像データの拡張)」サービス詳細ページはこちら

ディープラーニング(深層学習)の精度を高めるためには、大量の学習データ(教師データ)が必要ですが、学習データ自体が少ない・追加が難しいといった場合は何らかの対策が必要となります。また、過学習や過剰適合も防ぐ必要もあります。
サイバーテックが提供する「AI向け学習データ作成(画像データの拡張)」サービスでは、学習データをご依頼に応じて水増し(拡張)した形で納品するBPOサービスです。アウトソースの活用で、本来のチューニングに集中することが可能です。

「AI向け学習データ作成(画像データの拡張)」が求められる背景

AIの導入により様々な業務カイゼンが進みつつあり、ルールベースではなくディープラーニング(深層学習)によるAIは注目されている分野となります。ディープラーニングはまだまだ本当に使える分野は限られていますが、その中でも、画像の入力情報を判別する用途は効果的な領域のうちの一つです。

ただ、精度の高い分類器や判別器を生成するには、高品質かつ大量の学習データ(教師データ)を準備する事が求められます。ディープラーニング(深層学習)の精度を高めるためには、大量の学習データ(教師データ)が必要となりますが、そもそもベースとなる学習データ自体が少ない、あるいは追加が難しい、といったケースや、あまりに揃いすぎている学習データのみで学習させた場合に発生する、過剰適合や過学習(学習データに対して分類器が最適化されてしまい、汎用性が無くなる事)を防ぐ必要がある、といったニーズが存在します。

「AI向け学習データ作成(画像データの拡張)」サービス概要

サイバーテック セブITアウトソーシングセンターでは、ディープラーニングに必要不可欠な学習データを作成するサービスを提供しています。ただし、単純な画像アノテーションや分類のみでは学習データ数が不足する場合、あるいは学習データとなる画像データが揃いすぎてしまっている場合、学習データの拡張(水増し処理、とも呼ばれます)を行い、学習データの精度を落としながら、絶対量を増やす必要が出てきます。

サイバーテックが提供する「AI向け学習データ作成(画像データの拡張:Data Augmentation)」では、以下のような画像データの拡張(水増し)処理を行う事が可能です。もちろん、以下の拡張パターン以外のご要望も承っております。ご指定頂いた仕様とパラメータにより、画像データの拡張(水増し)サービスをリーズナブルにご提供することが可能です。

ランダム回転・角度指定回転

指定角度の範囲でランダムに回転、もしくは設定値に応じた角度で画像を回転します(以下は36度ずつ回転)。

ランダム回転・角度指定回転イメージ図

ランダムズーム・倍率指定ズーム

指定ズームの範囲でランダムにズーム、もしくは設定値に応じたピッチのズーム倍率により、画像をズーム処理します(以下はズーム倍率を10~90%に設定)。

ランダムズーム・倍率指定ズームイメージ図

水平シフト

指定したシフト幅の範囲で、ランダムに水平シフトを行います(以下は水平シフト幅を10~90%に設定)。

水平シフトイメージ図

ランダムシフト

指定したシフト幅の範囲で、ランダムに垂直シフトを行います(以下は垂直シフト幅を10~90%に設定)。

ランダムシフトイメージ図

水平反転

画像をランダムに水平反転します。

水平反転イメージ図

垂直反転

画像をランダムに垂直反転します。

垂直反転イメージ図

シアー変換

指定したシアー変換値の範囲で、ランダムにシアー変換をかけます(以下はシアー変換値を10~90%の範囲に設定)。

シアー変換イメージ図

チャンネル(RGB)変換

指定したチャンネル(RGB値)の範囲で、ランダムに変換をかけます(以下はRGB値を[0,0,0] - [2,2,2]の範囲で設定)。

チャンネル(RGB)変換イメージ図

機械学習のライブラリにはデータ拡張をサポートとしているものがありますが、以下のサンプル画像は、TensorFlow のフレームワークである、Kerasで使う事の出来るライブラリを主に利用しました。回転はpillowライブラリ、ズームはscipyライブラリ、それ以外はImageDataGeneratorクラスを用いて生成されています。チャンネル(RGB)変換のみ、Kerasなしの単純なTensorFlowを使用しています。

「AI向け学習データ作成(画像データの拡張)」サービスの特徴

「安心」直接雇用スタッフが行うため、高い守秘性。データ漏洩も無し!

画像データの拡張は、セブITアウトソーシングセンター内のエンジニアがTensorFlowやKeras、Pythonといった、汎用性の高いテクノロジを用いて行います。クラウドソーシングによる在宅や再委託ではないので、データ流出の心配もありません。もちろん、プロジェクトの内容自体の守秘性も守られます!

「リーズナブル」物価が安いフィリピンへのオフショア委託!

セブITアウトソーシングセンターは、海外オフショア委託先の中でも、ベトナム(ホーチミン・ハノイ)よりも物価が安い「フィリピン中部(セブエリア)」に位置します。エンジニア不足の状況にもかかわらず、リーズナブルに画像データの拡張サービスを提供いたします!

「高品質」日本人マネージャ管理の元、フィリピン人エンジニアが実施!

セブITアウトソーシングセンターは2006年に設立し、様々なITアウトソーシング・デジタルBPOサービスをはじめ、オフショア開発などのエンジニアリング業務を日本のお客様向けに提供してまいりました。組織成熟度の高い同拠点で、高品質なデータ拡張作業を行い、学習データを納品いたします!

「AI向け学習データ作成(画像データの拡張)」サービスの事例・価格

概要 ディープラーニング(深層学習)用の学習データとして、支給された画像に対して、複数のエフェクトパターンを5段階で実施をすることにより、学習データを約20倍に水増し。データチェックは弊社側100%にて実施。
ボリューム 200ファイル
使用ツール・技術 Python、TensorFlow、Keras
価格・費用 お問合せください

上記は一般的な「AI向け学習データ作成(画像データの拡張)」サービスの事例となります。そのほか多数の事例がございます、詳細はお問合せください。

「AI向け学習データ作成(画像データの拡張)」サービス Q&A

「AI向け学習データ作成(画像データの拡張)」サービスに関する次のような課題をお持ちではありませんか?

海外オフショアは、やはり品質・コミュニケーション面で不安です。

AI向け画像データの拡張作業を行う場所はフィリピン・セブITアウトソーシングセンターとなりますが、自社直轄オフショア拠点であり、ご契約および受発注は、全て東京本社と行って頂きます。いわゆる「安かろう・悪かろう」や、突然依頼を断られる、といった海外ベースのオフショア企業とは異なり、日系企業の海外オフショア拠点として責任を持って取り組ませて頂きます!

英語が話せません。日本語でのやりとりでも大丈夫?

セブITアウトソーシングセンターのフィリピン人スタッフは日本語が読めませんが、全ての案件に英語が堪能な現地日本人スタッフが付きますので、日本人とフィリピン人が協調しながら業務を進めております。10年以上の海外オフショア拠点の運営ノウハウがございますので、AI向け画像データの拡張仕様やパラメータの設定、といった指示内容も日本語で大丈夫です。海外委託における一番のリスクであるコミュニケーションの齟齬を防ぐことができます。

日本人が全てディレクションに入ると、結局割高になるのでは?

オフショア委託で一番コスト超過に陥る理由は「クオリティや納品内容の齟齬による追加費用」となります。経験豊かな日本人ディレクターがしっかり管理することにより、納期はもちろんのこと、手戻りを防ぐことにより、トータルで見ると低コストにつながります。もちろん国内企業への委託と比べてもリーズナブルです。

外国とのやり取りはタイムラグが心配なのですが

AI向け画像データの拡張作業を行う、セブITアウトソーシングセンターがあるフィリピン・セブ島は、日本との時差がたった1時間しかありません。さらに、始業時間なども日本時間に合わせておりますので、メールやスカイプのやり取りでも国境や時差を感じさせることはございません!

急ぎの納期でも対応してもらえる?

自社オフショア拠点「セブITアウトソーシングセンター」は、フィリピン セブ島エリアの独立系日系ITサービス企業において最大規模となっています。AI向け画像データの拡張作業は短期間で一気に行う事が求められる場合が多くありますが、常に最適な人員配置を行っておりますので、急な納品対応や業務ピークにも柔軟な要員調整が可能です!

御相談、ご質問はこちら

お気軽にご相談ください

製品カタログ・セミナーでの講演資料など、豊富な資料がダウンロードできます

最新事例の公開情報や、イベント・セミナー情報をお届け

pagetop ボタン
©2018 CyberTech corporation ltd. All Rights Reserved.