アノテーション委託に関する一般的な流れとQ&A

アノテーション委託に関する一般的な流れとQ&A イメージ画像

アノテーション作業を高品質かつリーズナブルにご提供するために、サイバーテックでは自社が英語圏のフィリピンに保有するオフショア拠点「セブITアウトソーシングセンター」にて実施いたしますが、アノテーション品質やコミュニケーションの面で、国内ではなく海外でのアノテーション作業に不安をお持ちの方もおられるかと思います。
ここでは、サイバーテックで「高品質・低価格」のアノテーション作業を実施させて頂く際の一般的な流れと、よくあるご質問をQ&A形式でまとめました。

アノテーション~AI向け学習データ作成サービスの内容

サイバーテックが提供する、アノテーション~AI向け学習データ作成サービス「セブ ハイスペック アノテーション」サービスの流れは以下の通りとなります。

1. アノテーション仕様や概要の確認

アノテーションに関するお問合せ内容を元に、弊社がどのフェーズから携わらせていただくべきか、お客様側にお伺いします。まだ検討段階ということであれば、AI化を検討されている業務内容や想定用途、構築予定の学習モデルなどをお聞きした上で、場合によりPOC(Proof of Concept)による概念実証のご提案も実施いたします。複数アノテーションの組み合わせが必要かどうか検討中であっても、弊社にて取り組ませて頂いた事例をベースにお話させて頂きます。秘密保持契約の締結が必要となる場合は、いつでもお申しつけください。

下矢印

2. 学習データの作成対象となる画像データ・作業手順書の受領

AI導入プロジェクトとして正式に立ち上がっているようであれば、アノテーションの詳細仕様やご予算をお伺いした上で、アノテーションの対象データとなる、学習データの元となる画像データのサンプルと作業手順書を拝見します。作業手順書が存在しない場合は、ご要望のアノテーション仕様(クラス数・平均オブジェクト数など)を要件定義としてとりまとめることにより、作業手順書やアノテーション・ガイドラインを別途作成する事も可能です。画像の解像度が低い、あるいは全件が対象画像とはならない場合、クラシフィケーションにより学習データ対象とする画像データを絞り込み、実際にアノテーションを実施する、といったご提案も致します。

下矢印

3. アノテーションによる学習データの作成体制と想定期間・概算費用のご提案

ご要望の仕様や利用ツール、対象データや携わらせて頂く工程をベースに、アノテーションによる学習データ作成を行った場合の想定体制、および想定期間と概算費用をご提案いたします。プロジェクトの方向性をまず固める必要がある場合は、POCもしくはアドバイザリーサービスのご提案を行います。アノテーションマネージャやチェッカーの有無・アノテーションマネージャの担当者が日本人かフィリピン人のいずれか・アノテーション実施後のチェック回数や頻度によってアノテーションのクオリティや費用は変わるため、ご予算に応じた形でプランをご提案いたします。

下矢印

4. アノテーション・トライアルプロジェクトの実施

AIプロジェクトの一部として、ご提案プランの内容で着手指示頂く前提、もしくは少額のご発注により、少ロットのアノテーション作業により、学習データの作成を実施いたします。想定体制でご要望のクオリティと量産スピードを両立させることが出来るかどうかに着目した形で進めさせていただき、作成したアノテーション済学習データをご指定の形式(通常はJSON)で納品するとともに、作業手順書の見直しを実施します。クラス設計に甘さがあった場合は、見直しのご提案を実施いたします。トライアルプロジェクトにおける納品物は、少量とはなりますが、実際のAI学習データとして活用いただけます。

下矢印

5. 学習結果やアノテーション・トライアルプロジェクトの評価・検証

アノテーションのトライアルプロジェクトにより作成された学習データは、少量ですが実際に学習させた上で結果を評価頂くことも可能です。モデルの妥当性を検証頂くと同時に、トライアルプロジェクトの評価・検証を実施いただきます。その上で、主にクオリティや作成スピードの面において、当初ご提案した体制やメンバー通りで良いか、あるいは別の体制やメンバーを再検討すべきか、このフェーズで検証させていただきます。モデルの妥当性と同時に、AIの効果検証を行った結果、クラスや対象オブジェクトなどの見直しもご提案いたします。別プランが良いという判断になった場合は、4.に戻り再度トライアルプロジェクトによる学習データの作成を実施することも可能です。

下矢印

6. 全データに対してアノテーションを行い、学習データを作成

アノテーションによる学習データ作成作業のトライアルプロジェクトにおいて、品質をはじめ、お客様側でモデルにおいても評価・検証を行った結果、問題無いとご判断頂いたのち、残りの画像データに対して、アノテーションによる学習データ作成作業を行います。プロジェクトの途中であっても、画像データの追加や変更・クラス数や対象オブジェクトの変更などにより実施フローの変更が必要となった場合は、軽微なものであればプロジェクト内で吸収した形で進めることが可能です。大きな方向性の見直しが必要となった場合は、4.もしくは5.のフェーズに戻り、アノテーション・プロジェクトの体制やクオリティ基準の再検討から進めさせていただきます。

下矢印

7. 実際に機械学習を実施した結果をベースに検討

アノテーション実施済の全データを用いて機械学習を行い、学習済のモデルに対して要求水準を満たしているかどうかの性能評価を実施いただき、追加データに対してアノテーションの実施が必要かどうか、検討いただきます。さらに学習データが必要である場合は、アノテーションを追加で実施いたします。もし対象データが枯渇してしまうようであれば、画像データの拡張(データアーギュメンテーション:Data augmentation)を実施することにより、学習データの水増しを行うことが可能です。

アノテーション~AI向け学習データ作成サービス Q&A

アノテーション~AI向け学習データ作成サービス「セブ ハイスペック アノテーション」サービスに関する次のような課題をお持ちではありませんか?

海外オフショアによる学習データ作成(画像データのアノテーション)は、やはり品質・コミュニケーション面で不安です。

サイバーテックが提供するアノテーション~AI向け学習データ作成サービス「セブ ハイスペック アノテーション」サービスの実施場所はフィリピン・セブITアウトソーシングセンターとなりますが、自社直轄オフショア拠点となります。したがって、ご契約および受発注はもとより、何らかのイレギュラーな事が発生した場合においても、東京本社が全面的にバックアップさせていただきます。いわゆる「安かろう・悪かろう」や、突然依頼を断られる、といった海外ベースのオフショア企業とは異なり、日系企業の海外オフショア拠点として責任を持って取り組ませて頂きます!

英語が話せません。日本語でのやりとりでも画像データのアノテーションの指示は大丈夫?

セブITアウトソーシングセンターのフィリピン人スタッフは日本語が読めませんが、全ての案件に英語が堪能な現地日本人スタッフが付きますので、日本人とフィリピン人が協調しながら業務を進めております。10年以上の海外オフショア拠点の運営ノウハウがございますので、アノテーション~AI向け学習データ作成時における指示内容も日本語で大丈夫です。海外委託における一番のリスクであるコミュニケーションの齟齬を防ぐことができます。

日本人がアノテーションマネージャとして入った場合、結局割高になるのでは?

オフショア委託で一番コスト超過に陥る理由は「クオリティや納品内容の齟齬による追加費用」となります。経験豊かな日本人アノテーションマネージャがしっかり管理することにより、納期はもちろんのこと、学習モデルの再作成やクオリティの低下、といった手戻りを防ぐことにより、トータルで見ると低コストにつながります。もちろん国内企業へ学習データ作成を委託した場合と比べてもリーズナブルです。

海外で画像データのアノテーションを実施する際、時差などのタイムラグが心配なのですが

アノテーション~AI向け学習データ作成を実際に行う「セブITアウトソーシングセンター」があるフィリピン・セブ島は、日本との時差がたった1時間しかありません。さらに、始業時間なども日本時間に合わせておりますので、お客様の指示はダイレクトにアノテーションマネージャがキャッチアップいたします。メールやスカイプのやり取りでも国境や時差を感じさせることはございません!

急ぎもしくは大量の画像データのアノテーション委託でも対応してもらえる?

自社オフショア拠点「セブITアウトソーシングセンター」は、フィリピン セブ島エリアの独立系日系ITサービス企業において最大規模となっています。アノテーション~AI向け学習データ作成のニーズとしては、短期間で一気に行う事が求められる場合が多くありますが、常に最適な人員配置を行っておりますので、急な納品対応や業務ピークにも柔軟な要員調整によりアノテーションチームを編成し、短期間で高品質の学習データを大量に作成することが可能です!

御相談、ご質問はこちら

サービスご案内資料や、特別資料「神は細部に宿る~アノテーションを駆使したAIシステムの精度向上」がダウンロードできます。

最新事例の公開情報や、イベント・セミナー情報をお届けします。

pagetop ボタン
サイバーテックお知らせ画像
©2018 CyberTech corporation ltd. All Rights Reserved.