ライブセルイメージングデータ~線虫画像のアノテーション

国立大学法人K大学では、神経系の研究者との共同研究において、ライブセルイメージングデータに存在する多数の細胞領域を自動的に検出・追跡するため、線虫の神経系に入れたカリウムにより、電位差で反応している部分をAIで識別するソフトウェアを開発したが、学習データとして線虫画像のデータセットにアノテーションを実施する必要があった。
大量のデータセットに対して作業を実施することになるため、経験豊富な要員が多数在籍し、高品質かつリーズナブルなアノテーションサービスを提供する、サイバーテックの自社海外拠点「セブITアウトソーシングセンター」にアノテーション作業を委託した。

ITアウトソーシング事例

ライブセルイメージングデータ~線虫画像のアノテーション

国立大学法人K大学

国立大学法人K大学では、神経系の研究者との共同研究において、ライブセルイメージングデータに存在する多数の細胞領域を自動的に検出・追跡するため、線虫の神経系に入れたカリウムにより、電位差で反応している部分をAIで識別するソフトウェアを開発したが、学習データとして線虫画像のデータセットにアノテーションを実施する必要があった。
大量のデータセットに対して作業を実施することになるため、経験豊富な要員が多数在籍し、高品質かつリーズナブルなアノテーションサービスを提供する、サイバーテックの自社海外拠点「セブITアウトソーシングセンター」にアノテーション作業を委託した。

背景

アノテーション作業がライブセルイメージングデータに求められた背景

線虫画像のデータセットにおいて、自動追跡を行うソフトウェアにはAIが最適

国立大学法人K大学では、ライブセルイメージングについて神経研究者と共同研究を実施している。この分野の研究では、ライブセルイメージングデータに存在する多数の細胞領域から定量的に検出・追跡を行うには、人手で行う方法しか存在しない。また、追跡対象となる細胞が密に存在する場合があり、視覚的に類似しているため、標準的な追跡手法を適用した場合、本来の追跡対象を別の対象物と誤認し、追跡に失敗する事が多い。したがって、定量的に検出・追跡を行う基準を設け、かつ自動的に行うための研究を実施していた。

これらの仕組みをソフトウェアで実施するためには、大量の線虫画像のデータセットを活用し、AIによる方法が最適と思えるが、それには大量の線虫画像に対してアノテーションを実施する必要があり、要員確保の観点から学内での作業は困難であった。したがって、高品質かつ低価格でAIアノテーションが実施出来るベンダーにアウトソーシングを実施することを決定し、インターネットでの検索により外注先の探索および問合せを行った。

課題

アノテーション作業をアウトソーシング委託する際の課題

アノテーション業務の経験豊富なベンダーと要員(アノテーター)の確保が必要

今回のアノテーション作業は、線虫の画像に対して実施するものである。具体的には、線虫の神経系に入れたカリウムにより、電位差で反応している部分を区分けするアノテーションとなり、対象となるデータセット画像は最低でも10,000枚以上にのぼる。これらのアノテーションは研究発表のスケジュールで決められた期限までに終わらせる必要があり、アノテーターとしてアノテーションを行う作業員の確保が急務となっていた。その上、全ての画像に対してアノテーションを実施するわけではなく、画像によってはアノテーションの対象画像となりうるか否かを判断することも求められた。さらに、どの部分がアノテーションの対象となるか、判断が難しいものも存在した。研究発表の期日が定まっているため、費用や納期もさることながら、作業者との間でコミュニケーションがきちんと取れることも重要な要素の1つとなっていた。

アノテーション作業の委託先にサイバーテックを選定した理由

アノテーション業務の経験が豊富で、日本品質かつリーズナブルなオフショアベンダー

必要とされるアノテーションの内容を踏まえて複数のベンダーに問い合わせを行い、見積依頼から費用および内容提案が実施されたが、その結果、サイバーテックがフィリピンに有する、セブITアウトソーシングセンターがアウトソーシング委託先として選定された。決め手となった要素は以下の通りである。

  • アノテーション作業において、想定していたアノテーションツール(Labelme)の経験が豊富な作業員(アノテーター)が多数在籍していた。
  • アノテーション作業期間中はセブITアウトソーシングセンターと直接やり取りを実施するが、見積段階から現地の日本人担当者が入ることにより、コミュニケーションがスムーズに進められた。更にセブITアウトソーシングセンターのあるフィリピン セブ島エリアは日本との時差が1時間しかないため、リアルタイムのコミュニケーションを取る事が可能であり、打ち合わせのためのWeb会議の日程調整なども容易であった。
  • セブITアウトソーシングセンターによるアノテーション業務は、日本人窓口、日本品質でありながらアウトソーシングの利点であるリーズナブルな価格で、予算と納期の両方において、希望内におさまるものであった

上記の理由により選定は非常にスムーズに進み、想定よりも早くサイバーテックに委託することが決定された。

線虫画像に対するアノテーション作業

アノテーション対象画像は10,000枚以上、これらのアノテーション作業を2か月で実施

アノテーション対象のデータセットを受領して作業を開始すると、アノテーションを実施する対象画像の特定方法について、どのように判断を行うかという課題を解決する必要が生じた。アノテーションを実施する対象画像の特定はその分野の専門家でなければ困難であり、かつ定性的な面も持ち合わせているため、開始当初はお客様担当者とセブITアウトソーシングセンターのアノテーションマネージャとなる日本人との間で頻繁にやり取りを行いながら作業を進めた。また、10,000枚以上のデータを納品後に全て確認頂くことは現実的ではないため、開始当初は数十枚単位でデータを送付し、確認頂くことで作業内容のすり合わせと品質確認を行った。

アノテーション業務の開始当初に密にすり合わせを行ったことで、プロジェクトの中盤以降は順調に作業を進めることができ、結果として、一次納品後の一部修正対応を含めて想定納期内に全てのアノテーション作業を完了させることができた。

アノテーション作業実施後の展開

コミュニケーションを取りながら進める必要のある作業はサイバーテックで

同大学では、アノテーションを実施したデータを元に共同研究者との論文をまとめ、発表することができた。今後も研究を進めるにあたって、高品質なアノテーションデータが必要となるケースが考えられる。その場合にも、コミュニケーションが取れ、かつ低コストで実施可能なサイバーテック セブITアウトソーシングセンターのアノテーションサービスが重要な役割を担うこととなる。

御相談、ご質問はこちら

サービスご案内資料や、特別資料「神は細部に宿る~アノテーションを駆使したAIシステムの精度向上」がダウンロードできます。

最新事例の公開情報や、イベント・セミナー情報をお届けします。

pagetop ボタン
サイバーテックお知らせ画像
©2018 CyberTech corporation ltd. All Rights Reserved.