AI向け学習データ作成(アノテーション)

ITアウトソーシング「AI向け学習データ作成(アノテーション)」サービス詳細ページはこちら

ハードウェアのスペック向上とともに、AI(人工知能)へのニーズは日増しに高まっており、従来のルールベースによるAIや、応用技術であるRPA(ロボティック・プロセス・オートメーション)から、ディープラーニング(深層学習)へとニーズは移りつつあります。
実現には大量の学習データ(教師データ)の準備が必要不可欠ですが、「AI向け学習データ作成(アノテーション)」サービスでは、高品質・低価格のアノテーションサービスをご提供いたします。

「AI向け学習データ作成(アノテーション)」が求められる背景

ハードウェアのスペック向上とともに、AI(人工知能)技術を応用したソリューションへのニーズは日増しに高まっています。その中でも、従来のルールベースによるAIや、応用技術であるRPA(ロボティック・プロセス・オートメーション)を用いた業務最適化といった動きは既に一般化しつつあり、次世代のAIとしてディープラーニング(深層学習)に注目が集まっています。それに伴い、先進的な企業はPOC(Proof of Concept:概念実証)やトライアルプロジェクトにより、取り組むAIの対象としてはディープラーニングに移りつつあります。このディープラーニングに必要不可欠なものは、ハイパーパラメーターの設定といったチューニングなどの構築ノウハウと同時に、大量の学習データ(教師データ)であるため、低コストで学習データを作成することが求められます。

サイバーテックでは、数年前からディープラーニングに取り組み、現在は多言語マニュアルの標準化・改訂コスト削減・Web化を実現する多言語マニュアル用のCMS(コンテンツ管理システム)「Publish MakerX」のオプションとして、AI校正機能を提供しています。必要とされる学習データの作成は全て自社で実施しています。

AI向け学習データ作成(アノテーション)は、サイバーテックがフィリピン セブ島に有する自社オフショア拠点「セブITアウトソーシングセンター」にて実施いたします。日本品質で様々なBPO・ITアウトソーシングサービスを提供する同拠点では、数年前よりAI校正オプションに用いる学習データ作成を行っております。画像データに対するアノテーション業務においても、それらのノウハウを流用し、海外オフショア委託による低価格オペレーションながら、高品質のAI向けアノテーションサービスにより学習データの作成サービスを提供いたします。

「AI向け学習データ作成(アノテーション)」サービス概要

サイバーテックがフィリピン・セブ島に有する自社オフショア拠点「セブITアウトソーシングセンター」にて、日本人およびフィリピン人の管理者(アノテーションマネージャ)の下、オペレーションスタッフ(アノテータ)が様々なディープラーニング向け学習データを作成しています。

画像データに対するアノテーションの場合、例として以下のように、画像からの物体認識(オブジェクト ディテクション)や、領域抽出(セマンテック セグメンテーション)を実施しております。ディープラーニングに関する技術は日々進化しているため、求められる学習モデルに即したアノテーション仕様に基づき、様々なAI学習データ作成(アノテーション)に関する取り組みを実施しております。最新情報はお問合せください。

画像からの物体認識(オブジェクト ディテクション / object detection)

矩形物体認識(object recognition)画面キャプチャ画像お客様からの指示書によりご指定いただいたツールや仕様に応じて、入力した画像から検出する物体や特徴に対して、点や線といったオブジェクトを設置、あるいは矩形(バウンディングボックス)で囲みます。同時にそのオブジェクトが何であるかを示すタグ(クラス)付けと、座標情報のラベル付け(ローカライゼーション)により、アノテーションによる学習データ作成を行います。
※サンプル画像で用いた使用ツール:LabelImg


画像からの領域抽出(セマンティック セグメンテーション / Semantic Segmentation)

セグメンテーション 画面キャプチャ画像お客様からの指示書によりご指定いただいたツールや仕様に応じて、入力した画像の輪郭線情報の付与(セマンテック セグメンテーション)、およびラベリングといった形でアノテーションによる学習データ作成を行います。セグメンテーションを行ったポリゴン情報はJSONファイル形式で提供いたします(labelmeの場合)。XMLファイルなどへのパースが必要な際は別途ご対応いたします。
※サンプル画像で用いた使用ツール:labelme


「AI向け学習データ作成(アノテーション)」サービスの特徴

安心の直接雇用スタッフによるAIアノテーション作業!

AI向け学習データ作成(アノテーション)はフィリピン・セブ島に有する自社拠点「セブITアウトソーシングセンター」の直接雇用スタッフのみで実施します。クラウドソーシングによる在宅ワークや再委託による業務推進体制ではありませんので、管理下に置かれた作業端末でAI向け学習データ作成(アノテーション)作業を実施します。端末の紛失などによるデータ流出はもちろんのこと、プロジェクト内容自体の情報流出といった心配はありません!

学習データ作成(アノテーション)はリーズナブルに!

AI向け学習データ作成(アノテーション)業務の委託先候補としては、様々な海外オフショア拠点があります。比較的リーズナブルなエリアとして代表的な場所は、中国(大連)、ベトナム(ホーチミン・ハノイ)、フィリピン(マニラ)などが知られていますが、セブITアウトソーシングセンターはそれらの都市圏よりも物価が安い「フィリピン中部(セブエリア)」に存在します。大量になりがちのAI向け学習データ作成(アノテーション)業務であれば、なおさら効果が発揮されます!

チーム体制による高品質AIアノテーション!

セブITアウトソーシングセンター内では、日本人もしくはフィリピン人によるアノテーションマネージャ(リーダー)とアノテーター(オペレーション担当者)によるチーム体制で、属人的な「バラツキ・誤差」を極力なくしたAI向け学習データ作成(アノテーション)作業により、教師データを作成します。
ディープラーニングでは、特に学習データのクオリティが判定器の精度に大きく関係します。アノテーションマネージャがフィリピン人の場合であっても、日本人チェッカーによる全件チェックを行う事も可能です。

「AI向け学習データ作成(アノテーション)」サービス内容

「AI向け学習データ作成(アノテーション)」サービスの流れは以下の通りとなります。

1. 学習データの作成対象となる画像データ・作業手順書やアノテーション仕様の確認

学習データの作成対象となる画像データのサンプルと作業手順書を拝見します。作業手順書が存在しない場合は、ご要望のアノテーション仕様(クラス数・平均オブジェクト数など)や納品形態をお聞きした上で、要件定義を実施することにより、作業手順書やアノテーション・ガイドラインを別途作成する事も可能です。構築予定の学習モデルや想定用途・業務などについてもお聞かせいただくと、より最適なご提案が可能です。秘密保持契約の締結が必要となる場合は、いつでもお申しつけください。

下矢印

2. アノテーションによる学習データの作成体制と想定期間・概算費用のご提案

全画像データに対して、ご要望の仕様やツールで学習データ作成(アノテーション)を行った場合の想定体制、および想定期間と概算費用をご提案いたします。特にクオリティに関して、アノテーションマネージャやチェッカーの有無、また担当するスタッフが日本人もしくはフィリピン人のいずれかによって費用は変わるため、ご予算に応じた形でプランをご提案いたします。

下矢印

3. アノテーション・トライアルプロジェクトの実施

ご提案プランの内容で着手指示頂く前提、もしくは少額のご発注により、少ロットの画像データを用いた学習データ作成(アノテーション)を実施いたします。想定体制でご要望のクオリティと量産スピードを両立させることが出来るかどうかに着目した形で進めさせていただき、作成したアノテーション済学習データをご指定の形式(通常はJSON)で納品するとともに、作業手順書の見直しを実施します。トライアルプロジェクトにおける納品物は、少量とはなりますが、実際のAI学習データとして活用いただけます。

下矢印

4. アノテーション・トライアルプロジェクトの評価・検証

小ロットの画像データを用いたアノテーション作業のトライアルプロジェクトを行った結果について、評価・検証を行います。その上で、主にクオリティや作成スピードの面において、当初ご提案した体制やメンバー通りで良いか、あるいは別の体制やメンバーを再検討すべきか、このフェーズで検証させていただきます。状況により、クラスや対象オブジェクトなどの見直しもご提案いたします。別プランが良いという判断になった場合は、3.に戻り再度トライアルプロジェクトによる学習データの作成を実施することも可能です。

下矢印

5. アノテーションによる学習データ作成プロジェクトとして量産

学習データ作成(アノテーション)作業のトライアルプロジェクトの評価・検証を行った結果、問題無いとご判断頂いた後、全ての画像データを対象とした、アノテーションによる学習データ作成プロジェクトとして量産を開始いたします。量産プロジェクトの途中であっても、画像データの追加や変更・クラス数や対象オブジェクトの変更などにより実施フローの変更が必要となった場合は、軽微なものであればプロジェクト内で吸収した形で進めることが可能です。大きな方向性の見直しが必要となった場合は、3.もしくは4.のフェーズに戻り、アノテーション・プロジェクトの体制やクオリティ基準の再検討から進めさせていただきます。

「AI向け学習データ作成(アノテーション)」サービスの事例・価格

ディープラーニング(深層学習)に用いる学習データ作成

概要 ディープラーニング(深層学習)によるAIで用いる学習データを作成。元データは特定のWebサイトにプラグインを埋め込むことにより抽出対象の一覧を自動的に生成し、抽出作業を実施。規定のルールに基づき抽出情報からノイズ情報を判別し、除去を行った。
ボリューム・期間 約1,000ページ(ファイル)・2週間
作業内容
  • Movable Type、WordPressへのプラグイン設定
  • テキストファイルの抽出~指示書通りの命名即に基づいたファイル生成
  • ディープラーニング時にノイズとなるデータの除去
  • ツールによる最終確認
  • テキストデータとリストの納品
使用ツール・技術
  • Notepad++(編集エディタ)
  • Microsoft Excel(データ一覧作成)
  • Network Kanji Filter(UTF-8のBOM一括削除)
作業場所 セブITアウトソーシングセンター(フィリピンの自社オフショア拠点)
その他
  • 納品後のプロセス(形態素解析)を意識した、文字コードや改行コードによるテキストデータの作成。
  • 日本語コンテンツにもかかわらず、除去が必要なノイズデータをパターン化し、フィリピン人オペレータによりリーズナブルに実施。
  • 最終チェックは日本人により実施。
価格・費用 お問合せください

ディープラーニング(深層学習)に用いる学習データ作成(矩形アノテーション実施)

概要 ディープラーニング(深層学習)用の学習データとして、支給された画像に対して矩形アノテーションを実施(クラス数:10、1画像あたりの平均オブジェクト:5)。データチェックは弊社側100%にて実施。
ボリューム 10,000ファイル
使用ツール・技術 LabelImg、JSON
作業場所 セブITアウトソーシングセンター(フィリピンの自社オフショア拠点)
価格・費用 お問合せください

上記は一般的な「AI向け学習データ作成(アノテーション)」サービスの事例となります。そのほか多数の事例がございます、詳細はお問合せください。

「AI向け学習データ作成(アノテーション)」サービス Q&A

「AI向け学習データ作成(アノテーション)」サービスに関する次のような課題をお持ちではありませんか?

海外オフショアによる学習データ作成(アノテーション)は、やはり品質・コミュニケーション面で不安です。

AI向け学習データ作成(アノテーション)の実施場所はフィリピン・セブITアウトソーシングセンターとなりますが、自社直轄オフショア拠点であり、ご契約および受発注は、全て東京本社と行って頂きます。いわゆる「安かろう・悪かろう」や、突然依頼を断られる、といった海外ベースのオフショア企業とは異なり、日系企業の海外オフショア拠点として責任を持って取り組ませて頂きます!

英語が話せません。日本語でのやりとりでもアノテーションの指示は大丈夫?

セブITアウトソーシングセンターのフィリピン人スタッフは日本語が読めませんが、全ての案件に英語が堪能な現地日本人スタッフが付きますので、日本人とフィリピン人が協調しながら業務を進めております。10年以上の海外オフショア拠点の運営ノウハウがございますので、AI向け学習データ作成(アノテーション)の指示内容も日本語で大丈夫です。海外委託における一番のリスクであるコミュニケーションの齟齬を防ぐことができます。

日本人がアノテーションマネージャとして入った場合、結局割高になるのでは?

オフショア委託で一番コスト超過に陥る理由は「クオリティや納品内容の齟齬による追加費用」となります。経験豊かな日本人アノテーションマネージャがしっかり管理することにより、納期はもちろんのこと、学習モデルの再作成やクオリティの低下、といった手戻りを防ぐことにより、トータルで見ると低コストにつながります。もちろん国内企業へ学習データ作成を委託した場合と比べてもリーズナブルです。

海外でアノテーションを実施する際、時差などのタイムラグが心配なのですが

AI向け学習データ作成(アノテーション)を行う、セブITアウトソーシングセンターがあるフィリピン・セブ島は、日本との時差がたった1時間しかありません。さらに、始業時間なども日本時間に合わせておりますので、お客様の指示はダイレクトにアノテーションマネージャがキャッチアップいたします。メールやスカイプのやり取りでも国境や時差を感じさせることはございません!

急ぎもしくは大量のアノテーション委託でも対応してもらえる?

自社オフショア拠点「セブITアウトソーシングセンター」は、フィリピン セブ島エリアの独立系日系ITサービス企業において最大規模となっています。AI向け学習データ作成(アノテーション)では短期間で一気に行う事が求められる場合が多くありますが、常に最適な人員配置を行っておりますので、急な納品対応や業務ピークにも柔軟な要員調整により、アノテーションによる学習データの大量作成が可能です!

御相談、ご質問はこちら

お気軽にご相談ください

製品カタログ・セミナーでの講演資料など、豊富な資料がダウンロードできます

最新事例の公開情報や、イベント・セミナー情報をお届け

pagetop ボタン
©2018 CyberTech corporation ltd. All Rights Reserved.