AI向け学習データ作成(画像データのアノテーション)

「AI向け学習データ作成(画像データのアノテーション)」サービス詳細ページはこちら

ハードウェアのスペック向上とともに、AI(人工知能)へのニーズは日増しに高まっており、従来のルールベースによるAIや、応用技術であるRPA(ロボティック・プロセス・オートメーション)から、ディープラーニング(深層学習)へとニーズは移りつつあります。
実現には大量の学習データ(教師データ)の準備が必要不可欠ですが、「AI向け学習データ作成(画像データのアノテーション)」サービスでは、高品質・低価格のアノテーションサービスをご提供いたします。

「AI向け学習データ作成(画像データのアノテーション)」が求められる背景

ハードウェアのスペック向上とともに、AI(人工知能)技術を応用したソリューションへのニーズは日増しに高まっています。その中でも、従来のルールベースによるAIや、応用技術であるRPA(ロボティック・プロセス・オートメーション)を用いた業務最適化といった動きは既に一般化しつつあり、次世代のAIとしてディープラーニング(深層学習)に注目が集まっています。それに伴い、先進的な企業はPOC(Proof of Concept:概念実証)やトライアルプロジェクトにより、取り組むAIの対象としてはディープラーニングに移りつつあります。このディープラーニングに必要不可欠なものは、ハイパーパラメーターの設定といったチューニングなどの構築ノウハウと同時に、大量の学習データ(教師データ)であるため、低コストで学習データを作成することが求められます。

サイバーテックでは、数年前からディープラーニングに取り組み、現在は多言語マニュアルの標準化・改訂コスト削減・Web化を実現する多言語マニュアル用のCMS(コンテンツ管理システム)「Publish MakerX」のオプションとして、AI校正機能を提供しています。必要とされる学習データの作成は全て自社で実施しています。

AI向け学習データ作成(画像データのアノテーション)は、サイバーテックがフィリピン セブ島に有する自社オフショア拠点「セブITアウトソーシングセンター」にて実施いたします。日本品質で様々なBPO・ITアウトソーシングサービスを提供する同拠点では、数年前よりAI校正オプションに用いる学習データ作成を行っております。画像データに対するアノテーション業務においても、それらのノウハウを流用し、海外オフショア委託による低価格オペレーションながら、高品質のAI向けアノテーションサービスにより学習データの作成サービスを提供いたします。

「AI向け学習データ作成(画像データのアノテーション)」サービス概要

サイバーテックがフィリピン・セブ島に有する自社オフショア拠点「セブITアウトソーシングセンター」にて、日本人およびフィリピン人の管理者(アノテーションマネージャ)の下、オペレーションスタッフ(アノテータ)が様々なディープラーニング向け学習データを作成しています。

画像データに対するアノテーションの場合、例として以下のように、画像からの物体認識(オブジェクト ディテクション)や、領域抽出(セグメンテーション)を実施しております。ディープラーニングに関する技術は日々進化しているため、求められる学習モデルに即したアノテーション仕様に基づき、様々なAI学習データ作成(画像データのアノテーション)に関する取り組みを実施しております。最新情報はお問合せください。

AI向け学習データ作成(画像データのアノテーション - クラシフィケーション)

AI向け学習データ作成(画像データのアノテーション - クラシフィケーション)イメージ画像AIの導入により様々な業務カイゼンが進みつつあり、ルールベースではなくディープラーニング(深層学習)によるAIは注目されている分野となります。ディープラーニングはまだまだ本当に使える分野は限られていますが、その中でも、画像分類は効果的な領域です。実現には大量の学習データ(教師データ)の準備が必要不可欠ですが、「AI向け学習データ作成(画像データのアノテーション - クラシフィケーション)」サービスでは、大量の教師データの準備が必要不可欠となるディープラーニングにおいて、アノテーション用データ整理などに使われる、カテゴリ分けによるラベリングを実施いたします。


画像からの物体認識(オブジェクト ディテクション / object detection)

矩形物体認識(object recognition)画面キャプチャ画像学習データとなる画像内のすべての物体に対して、お客様からの指示書によりご指定いただいたツールや仕様に応じて、画像から検出する物体や特徴に対して、点や線といったオブジェクトを設置、あるいは矩形(バウンディングボックス)で囲みます。同時にそのオブジェクトが何であるかを示すタグ(クラス)付けと、座標情報のラベル付け(ローカライゼーション)により、アノテーションによる学習データ作成を行います。
※サンプル画像で用いた使用ツール:LabelImg


画像からの領域抽出(セグメンテーション / Segmentation)

セグメンテーション 画面キャプチャ画像学習データとなる画像内の物体に対して、お客様からの指示書によりご指定いただいたツールや仕様に応じて、画像の輪郭線情報をポリゴンにより付与(セグメンテーション)した後、クラス付与によるラベリングを行うことで、アノテーションによる学習データ作成を行います。セグメンテーションを行ったポリゴン情報はJSONファイル形式で提供いたします(labelmeの場合)。XMLファイルなどへのパースが必要な際は別途ご対応いたします。
※サンプル画像で用いた使用ツール:labelme


「AI向け学習データ作成(画像データのアノテーション)」サービスの特徴

クラウドソーシングとは異なり、ディープラーニング自体も手掛ける当社によるAIアノテーション!

AI向け学習データ作成(画像データのアノテーション)作業は、アノテーション仕様が設計済みである場合、単純なバウンディングボックス付与やセグメンテーションであれば、クラウドソーシングによる在宅ワーカーを組織することでリーズナブルに実施することが可能かもしれません。しかしながら上流から検討する場合は、元となる画像データが大量にあり、どの画像にどうアノテーションを実施すると精度の高い学習モデルが構築できるか、といった観点で検討を行う必要があります。そのような場合は、クラシフィケーションなどにより、対象画像の中からアノテーションを実施する画像を選択し、付与するクラスを設計するといった、AIアノテーションのプロジェクト全体を俯瞰して考慮する必要があります。サイバーテックでは自社でディープラーニング技術を活用したAI校正サービスを提供しており、ディープラーニングの学習モデル自体の構築から実施しておりますので、アノテーション・プロジェクトの上流から携わる事が可能です!

安心の直接雇用スタッフによるAIアノテーション作業!

AI向け学習データ作成(画像データのアノテーション)はフィリピン・セブ島に有する自社拠点「セブITアウトソーシングセンター」の直接雇用スタッフのみで実施します。クラウドソーシングによる在宅ワークや再委託による業務推進体制ではありませんので、管理下に置かれた作業端末でAI向け学習データ作成(画像データのアノテーション)作業を実施します。端末の紛失などによるデータ流出はもちろんのこと、プロジェクト内容自体の情報流出といった心配はありません!

チーム体制による高品質AIアノテーション!

セブITアウトソーシングセンター内では、日本人もしくはフィリピン人によるアノテーションマネージャ(リーダー)とアノテーター(オペレーション担当者)によるチーム体制で、属人的な「バラツキ・誤差」を極力なくしたAI向け学習データ作成(画像データのアノテーション)作業により、教師データを作成します。
ディープラーニングでは、特に学習データのクオリティが判定器の精度に大きく関係します。アノテーションマネージャがフィリピン人の場合であっても、日本人チェッカーによる全件チェックを行う事も可能です。

「AI向け学習データ作成(画像データのアノテーション)」サービス内容

「AI向け学習データ作成(画像データのアノテーション)」サービスの流れは以下の通りとなります。

1. アノテーション仕様や概要の確認

アノテーションに関するお問合せ内容を元に、弊社がどのフェーズから携わらせていただくべきか、お客様側にお伺いします。まだ検討段階ということであれば、AI化を検討されている業務内容や想定用途、構築予定の学習モデルなどをお聞きした上で、場合によりPOC(Proof of Concept)による概念実証のご提案も実施いたします。複数アノテーションの組み合わせが必要かどうか検討中であっても、弊社にて取り組ませて頂いた事例をベースにお話させて頂きます。秘密保持契約の締結が必要となる場合は、いつでもお申しつけください。

下矢印

2. 学習データの作成対象となる画像データ・作業手順書の受領

AI導入プロジェクトとして正式に立ち上がっているようであれば、アノテーションの詳細仕様やご予算をお伺いした上で、アノテーションの対象データとなる、学習データの元となる画像データのサンプルと作業手順書を拝見します。作業手順書が存在しない場合は、ご要望のアノテーション仕様(クラス数・平均オブジェクト数など)を要件定義としてとりまとめることにより、作業手順書やアノテーション・ガイドラインを別途作成する事も可能です。画像の解像度が低い、あるいは全件が対象画像とはならない場合、クラシフィケーションにより学習データ対象とする画像データを絞り込み、実際にアノテーションを実施する、といったご提案も致します。

下矢印

3. アノテーションによる学習データの作成体制と想定期間・概算費用のご提案

ご要望の仕様や利用ツール、対象データや携わらせて頂く工程をベースに、アノテーションによる学習データ作成を行った場合の想定体制、および想定期間と概算費用をご提案いたします。プロジェクトの方向性をまず固める必要がある場合は、POCもしくはアドバイザリーサービスのご提案を行います。アノテーションマネージャやチェッカーの有無・アノテーションマネージャの担当者が日本人かフィリピン人のいずれか・アノテーション実施後のチェック回数や頻度によってアノテーションのクオリティや費用は変わるため、ご予算に応じた形でプランをご提案いたします。

下矢印

4. アノテーション・トライアルプロジェクトの実施

AIプロジェクトの一部として、ご提案プランの内容で着手指示頂く前提、もしくは少額のご発注により、少ロットのアノテーション作業により、学習データの作成を実施いたします。想定体制でご要望のクオリティと量産スピードを両立させることが出来るかどうかに着目した形で進めさせていただき、作成したアノテーション済学習データをご指定の形式(通常はJSON)で納品するとともに、作業手順書の見直しを実施します。クラス設計に甘さがあった場合は、見直しのご提案を実施いたします。トライアルプロジェクトにおける納品物は、少量とはなりますが、実際のAI学習データとして活用いただけます。

下矢印

5. 学習結果やアノテーション・トライアルプロジェクトの評価・検証

アノテーションのトライアルプロジェクトにより作成された学習データは、少量ですが実際に学習させた上で結果を評価頂くことも可能です。モデルの妥当性を検証頂くと同時に、トライアルプロジェクトの評価・検証を実施いただきます。その上で、主にクオリティや作成スピードの面において、当初ご提案した体制やメンバー通りで良いか、あるいは別の体制やメンバーを再検討すべきか、このフェーズで検証させていただきます。モデルの妥当性と同時に、AIの効果検証を行った結果、クラスや対象オブジェクトなどの見直しもご提案いたします。別プランが良いという判断になった場合は、4.に戻り再度トライアルプロジェクトによる学習データの作成を実施することも可能です。

下矢印

6. 全データに対してアノテーションを行い、学習データを作成

アノテーションによる学習データ作成作業のトライアルプロジェクトにおいて、品質をはじめ、お客様側でモデルにおいても評価・検証を行った結果、問題無いとご判断頂いたのち、残りの画像データに対して、アノテーションによる学習データ作成作業を行います。プロジェクトの途中であっても、画像データの追加や変更・クラス数や対象オブジェクトの変更などにより実施フローの変更が必要となった場合は、軽微なものであればプロジェクト内で吸収した形で進めることが可能です。大きな方向性の見直しが必要となった場合は、4.もしくは5.のフェーズに戻り、アノテーション・プロジェクトの体制やクオリティ基準の再検討から進めさせていただきます。

下矢印

7. 実際に機械学習を実施した結果をベースに検討

アノテーション実施済の全データを用いて機械学習を行い、学習済のモデルに対して要求水準を満たしているかどうかの性能評価を実施いただき、追加データに対してアノテーションの実施が必要かどうか、検討いただきます。さらに学習データが必要である場合は、アノテーションを追加で実施いたします。もし対象データが枯渇してしまうようであれば、画像データの拡張(データアーギュメンテーション:Data augmentation)を実施することにより、学習データの水増しを行うことが可能です。

「AI向け学習データ作成(画像データのアノテーション)」サービスの事例・価格

AI向け学習データ作成(テキストデータの前処理)

概要 ディープラーニング(深層学習)によるAIで用いる学習データを作成。元データは特定のWebサイトにプラグインを埋め込むことにより抽出対象の一覧を自動的に生成し、抽出作業を実施。規定のルールに基づき抽出情報からノイズ情報を判別し、除去を行った。
ボリューム・期間 約1,000ページ(ファイル)・2週間
作業内容
  • Movable Type、WordPressへのプラグイン設定
  • テキストファイルの抽出~指示書通りの命名即に基づいたファイル生成
  • ディープラーニング時にノイズとなるデータの除去
  • ツールによる最終確認
  • テキストデータとリストの納品
使用ツール・技術
  • Notepad++(編集エディタ)
  • Microsoft Excel(データ一覧作成)
  • Network Kanji Filter(UTF-8のBOM一括削除)
作業場所 セブITアウトソーシングセンター(フィリピンの自社オフショア拠点)
その他
  • 納品後のプロセス(形態素解析)を意識した、文字コードや改行コードによるテキストデータの作成。
  • 日本語コンテンツにもかかわらず、除去が必要なノイズデータをパターン化し、フィリピン人オペレータによりリーズナブルに実施。
  • 最終チェックは日本人により実施。
価格・費用 お問合せください

AI向け学習データ作成(セグメンテーションによるアノテーションの実施)

概要 ディープラーニング(深層学習)用の学習データとして、支給された画像に対してセグメンテーションを行い、アノテーションを実施(クラス数:10、1画像あたりの平均オブジェクト:5)。データチェックも含め実施。
ボリューム 5,000ファイル
使用ツール・技術 Labelme、JSON
作業場所 セブITアウトソーシングセンター(フィリピンの自社オフショア拠点)
その他
  • 作業者同士のクロスチェック実施
  • お客様のご要望により本番実施前にサンプルの提出を実施
価格・費用 お問合せください

上記は一般的な「AI向け学習データ作成(画像データのアノテーション)」サービスの事例となります。そのほか多数の事例がございます、詳細はお問合せください。

「AI向け学習データ作成(画像データのアノテーション)」サービス Q&A

「AI向け学習データ作成(画像データのアノテーション)」サービスに関する次のような課題をお持ちではありませんか?

海外オフショアによる学習データ作成(画像データのアノテーション)は、やはり品質・コミュニケーション面で不安です。

AI向け学習データ作成(画像データのアノテーション)の実施場所はフィリピン・セブITアウトソーシングセンターとなりますが、自社直轄オフショア拠点であり、ご契約および受発注は、全て東京本社と行って頂きます。いわゆる「安かろう・悪かろう」や、突然依頼を断られる、といった海外ベースのオフショア企業とは異なり、日系企業の海外オフショア拠点として責任を持って取り組ませて頂きます!

英語が話せません。日本語でのやりとりでも画像データのアノテーションの指示は大丈夫?

セブITアウトソーシングセンターのフィリピン人スタッフは日本語が読めませんが、全ての案件に英語が堪能な現地日本人スタッフが付きますので、日本人とフィリピン人が協調しながら業務を進めております。10年以上の海外オフショア拠点の運営ノウハウがございますので、AI向け学習データ作成(画像データのアノテーション)の指示内容も日本語で大丈夫です。海外委託における一番のリスクであるコミュニケーションの齟齬を防ぐことができます。

日本人がアノテーションマネージャとして入った場合、結局割高になるのでは?

オフショア委託で一番コスト超過に陥る理由は「クオリティや納品内容の齟齬による追加費用」となります。経験豊かな日本人アノテーションマネージャがしっかり管理することにより、納期はもちろんのこと、学習モデルの再作成やクオリティの低下、といった手戻りを防ぐことにより、トータルで見ると低コストにつながります。もちろん国内企業へ学習データ作成を委託した場合と比べてもリーズナブルです。

海外で画像データのアノテーションを実施する際、時差などのタイムラグが心配なのですが

AI向け学習データ作成(画像データのアノテーション)を行う、セブITアウトソーシングセンターがあるフィリピン・セブ島は、日本との時差がたった1時間しかありません。さらに、始業時間なども日本時間に合わせておりますので、お客様の指示はダイレクトにアノテーションマネージャがキャッチアップいたします。メールやスカイプのやり取りでも国境や時差を感じさせることはございません!

急ぎもしくは大量の画像データのアノテーション委託でも対応してもらえる?

自社オフショア拠点「セブITアウトソーシングセンター」は、フィリピン セブ島エリアの独立系日系ITサービス企業において最大規模となっています。AI向け学習データ作成(画像データのアノテーション)では短期間で一気に行う事が求められる場合が多くありますが、常に最適な人員配置を行っておりますので、急な納品対応や業務ピークにも柔軟な要員調整により、画像データのアノテーションによる学習データの大量作成が可能です!

御相談、ご質問はこちら

お気軽にご相談ください

製品カタログ・セミナーでの講演資料など、豊富な資料がダウンロードできます

最新事例の公開情報や、イベント・セミナー情報をお届け

pagetop ボタン
©2018 CyberTech corporation ltd. All Rights Reserved.