アノテーションによる学習データ作成(セグメンテーション)

セグメンテーション~AI向け学習データ作成(アノテーション)が求められる背景

ディープラーニングに代表される「新しいAI」の導入が進んでいく中、これまで人が行っていた業務の中でAIが代行できる業務や作業も多くなってきました。自動、高速、そして正確な処理を可能とすることで、私たちに様々なメリットをもたらしてくれるAIですが、その処理をAIが行うためには、機械に知能をつけさせるために学習させることが必要となり、そのためには大量の学習データが必要となります。さらに正確な判断をAIができるように導くためには、量だけではなく、目的に沿った、精度の高い学習データが必要です。

特に、自動運転などの自律型AIでは、ビデオカメラで対象物や状況を確認しながら動作させる必要があるため、風景や対象物の区分を明確にさせるための領域抽出が必要になるとともに、その領域が何であるかといった内容をAIに学習させる必要があります。そのようなAIモデル開発ではディープラーニングによる手法が選択されることが多く、アノテーションの中でもセグメンテーションが実施された学習データが必要となりますが、専用のデータセットに対して大量のアノテーションが必要となるため、どうしても大量の人的資源の確保等が必要となります。

また、大量のデータセットに対してセグメンテーションを正確に実施するためには、アノテーションの中でも平易とされるバウンディングボックスの付与とは比べものにならないほど、難易度も高く、手間もかかります。そのため、片手間による社内での実施は余り現実的ではなく、学習データの作成を請け負う専門特化型のベンダーに依頼することが多いのが現状です。アノテーション作業の代行を請け負うベンダーには、クラウドワーカーを集めてアノテーションを行う企業と、正社員によりアノテーションを行うアウトソーシング型のベンダーの2種類がありますが、セグメンテーションに関しては、経験豊富なアウトソーシング型のベンダーが適しています。

セグメンテーション~AI向け学習データ作成(アノテーション)サービス概要

サイバーテックがフィリピン・セブ島に有する自社直営オフショア拠点である「セブITアウトソーシングセンター」では、現地日本人ディレクターが窓口となり、日本品質ながらリーズナブルなBPO・ITアウトソーシングサービスを提供しております。AI向けのアノテーション作業においては、クラウドソーシングによるスタッフではなく、正社員により、画像データに対する様々なアノテーション作業に携わっております。

複雑な画像が対象となる事が多いセグメンテーションや、画像の全領域をセグメンテーションするセマンティック セグメンテーションなど、難易度が高いために画像1枚あたりにかかる費用が高めとなる学習データに関しても、これまでのノウハウを活かし、海外オフショア委託による低価格オペレーションと高品質のAI向けアノテーションを両立いたします。画像データに対するアノテーションの場合、例として以下のように、画像からの領域抽出(ポリゴン)や、画素レベルでの塗り分け(セグメンテーション)といったヒューマン ラベリングを実施しております。

画像からの領域抽出(セグメンテーション - ポリゴン)

画像から領域抽出したデータのイメージ写真

学習データとなる画像内の物体に対して、お客様からの指示書によりご指定いただいたツールや仕様に応じて、ポリゴン形式で画像の輪郭線情報の付与(セグメンテーション)を行った後、クラス付与によるラベリングを行うことで、アノテーションによる学習データ作成を行います。セグメンテーションを行ったポリゴン情報はJSONファイル形式で提供いたします(labelmeの場合)。XMLファイルなどへのパースが必要な際は別途ご対応いたします。
※サンプル画像で用いた使用ツール:labelme

画像からの領域抽出(セマンティック セグメンテーション)

セグメンテーション前の画像 セグメンテーション後画像

学習データとなる画像内の全ての物体に対して、お客様の指示書によりご指定いただいたツールや仕様に応じて、指定の画素値にてラベル付けを行います。より高度な識別ができることから、最近ではこのセグメンテーションのご注文を多くいただいております。納品形式は使用ツール独自のxcfファイルとpngファイルにて提出いたします。
※サンプル画像で用いた使用ツール:GIMP

画像からの領域抽出(セグメンテーション)

セグメンテーション前のパイプ画像 セグメンテーション後のパイプ画像

学習データとなる画像内の錆や劣化等を、お客様の指示書によりご指定いただいたツールや仕様に応じて、定められたレベル定義に沿いながら指定の画素値にてセグメンテーションを実施します。納品形式は使用ツール独自のxcfファイルとpngファイルにて提出いたします。
※サンプル画像で用いた使用ツール:GIMP

ディープラーニングに関する技術は日々進化しているため、求められる学習モデルに即したアノテーション仕様も常に変化しています。サイバーテックでは、様々な画像データのセグメンテーション作業によるAI学習データ作成を実施しております。

セグメンテーション~AI向け学習データ作成(アノテーション)サービスの特徴

セグメンテーションによる学習データ作成(アノテーション)を実施する他の受託企業よりも低価格!

セグメンテーションによるAI向け学習データ作成(アノテーション)業務の委託先候補としては、様々な海外オフショア拠点があります。比較的リーズナブルなエリアとして代表的な場所は、中国(大連)、ベトナム(ホーチミン・ハノイ)、フィリピン(マニラ)などが知られていますが、セブITアウトソーシングセンターはそれらの都市圏よりも物価が安い「フィリピン中部(セブエリア)」に存在します。地道な作業となりがちなセグメンテーションや、大量の学習データ作成が求められがちとなるアノテーション業務であれば、なおさら効果が発揮されます!

直営オフショア拠点による、直接雇用スタッフによる安心のAIセグメンテーション作業!

当社はフィリピン、セブ島に自社オフィスを所有しているため、直雇用の日本人マネージャーと、同じく直雇用のフィリピン人アノテーターによるヒューマン ラベリングを実施します。価格を重視した受託先の場合、クラウドワーカーによる在宅作業や再委託も多くなっていますが、その場合に不安なのがセキュリティの確保。オフィス作業とは違い、企業名やプロジェクト内容の情報流出、データ流出や紛失などのリスクが懸念されます。当社の場合、指紋認証付きエントランスや監視カメラの設置、日本人管理者常駐などのセキュリティ管理の下で作業を実施するため、セキュリティ面での不安もありません。

難易度の高いセグメンテーションも、経験豊富なメンバーにより高品質を実現。Bynameによるラボ型のメンバー固定も可能!

セグメンテーションはアノテーションの難易度が高くなりがちです。セグメンテーションを実施するセブITアウトソーシングセンターでは、正社員によるアノテーション作業を繰り返し実施しているため、経験豊富なスタッフが難易度の高いセグメンテーション作業を行います。さらに経験豊富なアノテーションマネージャが進捗管理やチェック体制の構成、指示書の作成や見直しなどを行うため、アノテーション経験が豊富なチーム体制での作業となるため、属人的な「バラツキ・誤差」を極力なくし、高品質なセグメンテーション作業を実現します。
また、正社員による実施体制のため、クライアント企業のアノテーション部門として、Bynameによる要員固定を行っていただくことが可能です。これにより、長期的な視点において、さらなる品質向上とコストダウンを実現することが可能となります。

セグメンテーション~AI向け学習データ作成(アノテーション)サービス内容

セグメンテーション~AI向け学習データ作成(アノテーション)サービスの流れは以下の通りとなります。

1. 学習データの作成対象となる画像データ・作業手順書やセグメンテーション仕様の確認

学習データの作成対象となる画像データのサンプルと作業手順書を拝見します。作業手順書が存在しない場合は、ご要望のセグメンテーション仕様(クラス数・セグメンテーション対象となる平均オブジェクト数など)や納品形態をお聞きした上で、要件定義を実施することにより、作業手順書やセグメンテーション・ガイドラインを別途作成する事も可能です。構築予定の学習モデルや想定用途・業務などについてもお聞かせいただくと、より最適なご提案が可能です。秘密保持契約の締結が必要となる場合は、いつでもお申しつけください。

下矢印

2. セグメンテーションによる学習データの作成体制と想定期間・概算費用のご提案

全画像データに対して、ご要望の仕様やツールでセグメンテーションによる学習データ作成(アノテーション)を行った場合の想定体制、および想定期間と概算費用をご提案いたします。特にクオリティに関して、アノテーションマネージャやチェッカーの有無、また担当するスタッフが日本人もしくはフィリピン人のいずれかによって費用は変わるため、ご予算に応じた形でプランをご提案いたします。

下矢印

3. セグメンテーション トライアルプロジェクトの実施

ご提案プランの内容で着手指示頂く前提、もしくは少額のご発注により、少ロットの画像データを用いた学習データ作成(画像データのセグメンテーション)を実施いたします。想定体制でご要望のクオリティと量産スピードを両立させることが出来るかどうかに着目した形で進めさせていただき、作成したセグメンテーション済学習データをご指定の形式(通常はJSON)で納品するとともに、作業手順書の見直しを実施します。トライアルプロジェクトにおける納品物は、少量とはなりますが、実際のAI学習データとして活用いただけます。

下矢印

4. セグメンテーションのトライアルプロジェクトを評価・検証

小ロットの画像データを用いたセグメンテーション作業のトライアルプロジェクトを行った結果について、評価・検証を行います。その上で、主にクオリティや作成スピードの面において、当初ご提案した体制やメンバー通りで良いか、あるいは別の体制やメンバーを再検討すべきか、このフェーズで検証させていただきます。状況により、クラスや対象オブジェクトなどの見直しもご提案いたします。別プランが良いという判断になった場合は、3.に戻り再度トライアルプロジェクトによる学習データの作成を実施することも可能です。トライアルプロジェクトでの成果物をご確認後、正式にご発注頂けますので、オフショア委託が初めてのお客さまでも安心してご依頼いただけます。

下矢印

5. セグメンテーションによる学習データ作成プロジェクトとして全画像に対してアノテーションを実施

学習データ作成(画像データのセグメンテーション)作業のトライアルプロジェクトの評価・検証を行った結果、問題無いとご判断頂けましたら、全ての画像データを対象とした、アノテーション(セグメンテーション)による学習データ作成プロジェクトを開始いたします。プロジェクトの途中であっても、画像データの追加や変更・クラス数やセグメンテーション仕様の変更などにより実施フローの変更が必要となった場合は、軽微なものであればプロジェクト内で吸収した形で進めることが可能です。大きな方向性の見直しが必要となった場合は、3.もしくは4.のフェーズに戻り、セグメンテーション・プロジェクトの体制やクオリティ基準の再検討から進めさせていただきます。

セグメンテーション~AI向け学習データ作成(アノテーション)サービスの事例・価格

不動産物件の間取り図に対するセグメンテーション

概要 不動産物件の間取り図に対して、セグメンテーションを実施。
ボリューム 5,000ファイル
作業内容 不動産物件の間取り図の画像データセットに対して、ヒューマン ラベリングによるセグメンテーションを実施(クラス数:10、1画像あたりの平均オブジェクト:5)。イレギュラーな対象物が出てきた場合は都度アノテーション実施内容の調整とともに手順書の改訂も行いながらアノテーションを実施。
使用ツール・技術 Labelme、JSON
作業場所 セブITアウトソーシングセンター(フィリピンの自社オフショア拠点)
その他
  • 作業者同士のクロスチェック実施
  • お客様のご要望により本番実施前にサンプルの提出を実施
価格・費用 お問合せください

撮影画像内の指定物体に対するセグメンテーション~クラス付与による学習データ作成(アノテーション)

概要 撮影画像から指示書に記載の指定物体に関して、セマンティック・セグメンテーションを実施。
ボリューム・期間 約1000枚の画像に対して、セマンティック セグメンテーションによるアノテーションを1か月で完了
作業内容 AI向けディープラーニング(深層学習)用の学習データとして、約1000枚の撮影画像から、専門的な金具部品や線条物質のセグメンテーションを指示書に基づいて実施し、クラスを付与。
使用ツール・技術 GIMP、JSON
作業場所 セブITアウトソーシングセンター(フィリピンの自社オフショア拠点)
その他
  • 作業者同士のクロスチェック実施
  • お客様のご要望により本番実施前にサンプルの提出を実施
価格・費用 お問合せください

劣化レベルに応じて画像データのセグメンテーション実施による学習データ作成(アノテーション)

概要 撮影画像から指示書に沿ったレベルに応じて、指定物体(部分)に対してセグメンテーション~クラス付与を実施。
ボリューム・期間 50枚の画像を3週間で実施(一枚あたりの画像データのアノテーション所要時間:約一日)
作業内容 AI向けディープラーニング(深層学習)用の学習データとして、撮影画像内に存在する金属の物体に対して、部位ごとに異なる錆による劣化レベルに応じた形でアノテーション(セグメンテーションによる塗り分け・クラス付与)を実施。
使用ツール・技術 GIMP、JSON
作業場所 セブITアウトソーシングセンター(フィリピンの自社オフショア拠点)
その他
  • 作業者同士のクロスチェック実施
  • お客様のご要望により本番実施前にサンプルの提出を実施
価格・費用 お問合せください

上記は一般的なセグメンテーション~AI向け学習データ作成(アノテーション)サービスの事例となります。そのほか多数の事例がございます、詳細はお問合せください。

セグメンテーション~AI向け学習データ作成(アノテーション)サービス Q&A

セグメンテーション~AI向け学習データ作成(アノテーション)サービスに関する次のような課題をお持ちではありませんか?

クラス数が多い・分類基準が複雑など、日本人でも難しいセグメンテーション作業でも大丈夫ですか。

アノテーション(セグメンテーション)を実施するための手順書や、識別ルールをいただければ、その内容をフィリピン・セブITアウトソーシングセンターの日本人マネージャーがフィリピン人作業員に現地で正確に伝えるため、問題ありません。クオリティチェックは基本的にフィリピン人作業員によるダブルチェックを実施いたしますが、ご希望があれば最終チェックを日本人チェッカーが行うことも可能です。

海外オフショアによる学習データ作成(画像データのセグメンテーション)は、やはり品質・コミュニケーション面で不安です。

セグメンテーション~AI向け学習データ作成(アノテーション)の実施場所はフィリピン・セブITアウトソーシングセンターとなりますが、自社直轄オフショア拠点であり、ご契約および受発注は、全て東京本社と行って頂きます。いわゆる「安かろう・悪かろう」や、突然依頼を断られる、といった海外ベースのオフショア企業とは異なり、日系企業の海外オフショア拠点として責任を持って取り組ませて頂きます!

セグメンテーション プロジェクトの進捗管理について教えてください。

通常は週次で成果物を納品いたしますので、お客様の方で最終チェック頂くという流れが基本となりますが、日時での納品や、プロジェクト単位によるアノテーション・プロジェクトの運営も可能です。ご依頼頂く画像データのアノテーション業務の難易度次第で最適なプランをご相談させて頂きます。

最低アノテーション(セグメンテーション)件数、もしくは最大発注件数はありますか。

画像データのアノテーション(セグメンテーション)の難易度や、指示書の網羅性がどれだけ高いかなどの状況により、費用な納期が大きく異なります。また現地の空き稼働状況により、アノテーションが実施可能となるキャパシティも異なってきますので、ご依頼いただける発注数には特に制限は設けておりません。まずはお気軽にお問い合わせください。

セグメンテーションをフィリピン・セブ島へのオフショア委託ならではのメリットはなんですか。

人件費等の理由から費用を安くできることはもちろん、フィリピンの英語力の高さを活用した英語関連のアノテーションも実施できます。例えば指定ツールのシステム言語が英語のみ対応(日本語不可)、英語知識を要するクラス分け、英語音声の書き起こしなど、英語力が求められるセグメンテーションに関してもお問い合わせください。

御相談、ご質問はこちら

サービスご案内資料や、特別資料「神は細部に宿る~アノテーションを駆使したAIシステムの精度向上」がダウンロードできます。

最新事例の公開情報や、イベント・セミナー情報をお届けします。

pagetop ボタン
サイバーテックお知らせ画像
©2018 CyberTech corporation ltd. All Rights Reserved.