AI向け学習データ作成(画像データのアノテーション - クラシフィケーション)

クラシフィケーション~AI向け学習データ作成(アノテーション)が求められる背景

AI(人工知能)の導入により様々な業務カイゼンが進みつつあります。その中でも、ルールベースではなくディープラーニング(深層学習)によるAIは注目されている分野となります。ディープラーニングが本当に使える分野はまだまだ限られていますが、その中でも、画像分類は効果的な領域のうちの一つです。例えば、犬と猫を区別するように物体(Object)を見分ける画像分類(Image classification)、正常と不良を見分ける故障診断(Daiagnostics)や、離れていきそうな顧客を検知する顧客維持(Customer Retention)など、さまざまな分野で画像分類の概念は使われています。

この画像分類をディープラーニングで行う場合、教師あり学習を行う必要がありますが、そのベースとなる考え方はクラス分類となります。セグメンテーションやバウンディングボックス、キーポイントなどのアノテーションを実際に行う前に、データセットの元データを準備するために、データの要・不要を選別することも広い意味でのクラス分類に該当します。あらかじめ分類されたデータセットが存在する場合はそちらをそのまま活用、あるいはアノテーションを実施することにより学習データを作成することも可能ですが、存在しない場合はヒューマンラベリングによるラベル付与・分類を行うことが必要となります。

分類は古くから行われてきた人工知能の代表的な作業であり、代表的なものは「ネガ ポジ分類」です。それらはルールベースで行われることが多く、ディープラーニングよりも1世代前の技術であるため、機械学習アルゴリズムも数多くあります。例えばルールベースで分類する決定木(Decision Tree)や確率で表現するK近傍法、といったものですが、特徴点を見つけて分類してゆく作業はディープラーニングも得意なジャンルです。ハードスペックの向上も相まって、ルールベースで決まらない曖昧なものの分類にはディープラーニングが使われるようになりつつあります。

クラシフィケーション~AI向け学習データ作成(アノテーション)サービス概要

サイバーテックがフィリピンに有する自社直営オフショア拠点である「セブITアウトソーシングセンター」では、ディープラーニングで「教師あり」学習を行うにあたり必要不可欠な、学習データ(教師データ)を高品質かつリーズナブルに作成するアノテーション「セブアノ(セブ ハイスペック アノテーション)」サービスを提供しています。アノテーション作業は正社員が行うために、データ漏洩の心配もありません。

アノテーション仕様が設計済みである場合、単純なバウンディングボックス付与やセグメンテーションであれば、クラウドソーシングによる在宅ワーカーを組織することでリーズナブルに実施することが可能かもしれません。しかし、対象のデータセットが定まっていない場合などは、どの画像にどのような仕様でアノテーションを実施すると精度の高いモデル開発が行えるかといった観点で、プロジェクトの上流から検討を行う必要があります。そのような場合は、データセットに対して、クラシフィケーションによるデータ分類により、対象画像の中からアノテーションを実施する画像を選択し、付与するクラスを設計するといった、AIアノテーションのプロジェクト全体を俯瞰して考慮する必要があります。

工場における故障検出・物流現場における配送物の自動仕分け・医療現場における疾患の検出、といった、大量の画像データを学習器により分類し、正誤を判定するAIを考えた場合、学習データも大量に必要となりますが、データセットの中から必要とされるデータのみを抽出し、実際にアノテーションを行う対象となるデータの分類作業なども、セブITアウトソーシングセンターの現地ディレクターが責任をもって取りまとめた上で作成いたします。管理者が存在することにより、要件をとりまとめることが可能であるため、お客様側の負荷を減らすことや、品質管理を徹底させることが可能です。お客様側で直接複数のフリーランスに委託し、個別にコミュニケーションを取りつつ品質管理も行う、という手間をかけて頂く必要はもうありません。サイバーテック セブITアウトソーシングセンターによる高品質かつ低コストオペレーションによるヒューマン ラベリングで、精度の高いデータ分類(Classification)を実施いたします。

AI向け学習データ作成(画像データの分類)

クラシフィケーション~AI向け学習データ作成(アノテーション)サービスの特徴

安心の直接雇用スタッフによるAI向けデータの分類作業!

AI向けデータ分類(Classification)作業はフィリピン・セブ島に有する自社拠点「セブITアウトソーシングセンター」の直接雇用スタッフのみで実施します。クラウドソーシングによる在宅ワークや再委託による業務推進体制ではありませんので、管理下に置かれた作業端末でAI向けのデータ分類作業を実施します。端末の紛失などによるデータ流出はもちろんのこと、プロジェクト内容自体の情報流出といった心配はありません!

国内フリーランスや他の海外オフショアと比べても圧倒的な低コスト!

AI向けデータ分類の委託先候補としては、様々な海外オフショア拠点があります。比較的リーズナブルなエリアとして代表的な場所は、中国(大連)、ベトナム(ホーチミン・ハノイ)、フィリピン(マニラ)などが知られていますが、セブITアウトソーシングセンターはそれらの都市圏よりも物価が安い「フィリピン中部(セブエリア)」に存在します。大量になりがちのAI向けデータの分類業務であれば、なおさら効果が発揮されます!

ダブルチェックによる高品質AIデータの分類!

ディープラーニングにおいて、学習データの品質がばらついてしまうことは、測定器の品質に直結します。データの分類作業を平準化させるため、セブITアウトソーシングセンター内では、フィリピン人による作業の2重化を行っており、属人的な「バラツキ・誤差」を極力なくしたヒューマン ラベリングによるAI向けデータの分類作業により、教師データを作成します。

クラシフィケーション~AI向け学習データ作成(アノテーション)サービス内容

クラシフィケーション~AI向け学習データ作成(アノテーション)サービスの流れは以下の通りとなります。

1. データのサンプル確認と作業手順書の確認・作成

サンプルとなるデータを頂くとともに、データの分類やクラス付与の仕様が記載された作業手順書を拝見した上でお見積りを致します。作業手順書が存在しない場合は、想定されているクラシフィケーション仕様に関してヒアリングを実施することにより、作業手順書の作成に関しても別途お見積りいたします。秘密保持契約の締結が必要となる場合は、いつでもお申しつけください。

下矢印

2. データ量や仕様に応じて、トライアルプロジェクトの実施

データが大量に存在する、あるいはクラシフィケーション仕様がまだ固まっていない、といった場合は、ご提案プランの内容で着手指示頂く前提、もしくは少額のご発注により、少ロットの実データを用いたトライアルプロジェクトを実施いたします。なお、クラシフィケーション仕様が既に確定しており、かつ単純である場合は、本フェーズは省略させていただく場合もございます。

下矢印

3. クラシフィケーション・トライアルプロジェクトの評価・検証

トライアルプロジェクトを実施した場合は、実施結果について、評価・検証を行います。その上で、当初ご提案したプラン通りで良いか、あるいは別のプランを再検討すべきか、このフェーズで検証させていただきます。別プランが良いという判断になった場合は、2.に戻り再度トライアルプロジェクトを実施することも可能です。

下矢印

4. 全データを対象とした、クラシフィケーション本番プロジェクトの開始

全てのデータを対象とした本番プロジェクトを開始いたします。プロジェクトの途中であっても、対象データの追加や変更、またはクラシフィケーション仕様の変更が必要となった場合は、軽微なものであればプロジェクト内で吸収した形で進めることが可能です。プロジェクトの方向性について大幅な修正が必要となった場合は、2.もしくは3.のフェーズに戻り、方式の再検討から進めさせていただきます。

クラシフィケーション~AI向け学習データ作成(アノテーション)サービスの事例・価格

食品分類(検出)システムのAIモデル開発に必要となる、学習データのクラシフィケーション(手動による分類)

概要 ディープラーニング(深層学習)用の学習データとして、支給された食品画像(30カテゴリ)に対して、完全体、2分の1、4分の1、といった3種類に分類。データチェックは弊社側100%にて実施。
ボリューム 30,000ファイル
使用ツール・技術 Windowsフォトビューアー
作業場所 セブITアウトソーシングセンター(フィリピンの自社オフショア拠点)
価格・費用 分類1工程あたり数円~

上記は一般的なクラシフィケーション~AI向け学習データ作成(アノテーション)サービスの事例となります。そのほか多数の事例がございます、詳細はお問合せください。

クラシフィケーション~AI向け学習データ作成(アノテーション)サービス Q&A

クラシフィケーション~AI向け学習データ作成(アノテーション)サービスに関する次のような課題をお持ちではありませんか?

海外オフショアは、やはり品質・コミュニケーション面で不安です。

AI向けデータ分類を行う場所はフィリピン セブITアウトソーシングセンターとなりますが、自社直轄オフショア拠点であり、ご契約および受発注は、全て東京本社と行って頂きます。いわゆる「安かろう・悪かろう」や、突然依頼を断られる、といった海外ベースのオフショア企業とは異なり、日系企業の海外オフショア拠点として責任を持って取り組ませて頂きます!

英語が話せません。日本語でのやりとりでも大丈夫?

セブITアウトソーシングセンターのフィリピン人スタッフは日本語が読めませんが、全ての案件に英語が堪能な現地日本人スタッフが付きますので、日本人とフィリピン人が協調しながら業務を進めております。10年以上の海外オフショア拠点の運営ノウハウがございますので、AI向けデータ分類における仕様も日本語で大丈夫です。海外委託における一番のリスクであるコミュニケーションの齟齬を防ぐことができます。

日本人が全てディレクションに入ると、結局割高になるのでは?

オフショア委託で一番コスト超過に陥る理由は「クオリティや納品内容の齟齬による追加費用」となります。経験豊かな日本人ディレクターがしっかり管理することにより、納期はもちろんのこと、手戻りを防ぐことにより、トータルで見ると低コストにつながります。もちろん国内企業への委託と比べてもリーズナブルです。

外国とのやり取りはタイムラグが心配なのですが

AI向けデータ分類を行う、セブITアウトソーシングセンターがあるフィリピン・セブ島は、日本との時差がたった1時間しかありません。さらに、始業時間なども日本時間に合わせておりますので、メールやスカイプのやり取りでも国境や時差を感じさせることはございません!

急ぎの納期でも対応してもらえる?

自社オフショア拠点「セブITアウトソーシングセンター」は、フィリピン セブ島エリアの独立系日系ITサービス企業において最大規模となっています。AI向けデータ分類業務では、短期間で一気に行う事が求められる場合が多くありますが、常に最適な人員配置を行っておりますので、急な納品対応や業務ピークにも柔軟な要員調整を行った上でヒューマン ラベリングが可能です!

御相談、ご質問はこちら

サービスご案内資料や、特別資料「神は細部に宿る~アノテーションを駆使したAIシステムの精度向上」がダウンロードできます。

最新事例の公開情報や、イベント・セミナー情報をお届けします。

pagetop ボタン
サイバーテックお知らせ画像
©2018 CyberTech corporation ltd. All Rights Reserved.