属性情報の抽出~作成・タグ付け

ITアウトソーシング「属性情報の抽出~作成・タグ付け」サービス詳細ページはこちら

IT技術の発達やデータ量の増大に伴い、情報の検索性やアクセスを容易にするため、データ自体に属性情報やタグを付与する必要性が増加しています。
「属性情報の抽出~作成・タグ付け」サービスでは、分量が多い場合や、クオリティが求められる場合などでも、リーズナブルに実施いたします。また、ディープラーニング(深層学習)で用いるAI用学習データの作成・タグ付け(アノテーション)などにも活用いただけます。

はじめに

日々様々なデータが生成されている情報化社会において、欲しい情報を素早く入手できるかどうかは重要視されています。また、昔は紙で保有していた情報についても、単にデータ化するだけではなく、どのようにして目当ての情報を探し出すことができるか、という点はとても重要です。

IT技術の発達や、ハンドリング可能なデータ量の飛躍的な増大、コンテンツ自体の多様化や肥大化に伴い、お客様へのサービス提供という点においては、いかにして検索性を向上させるか、という課題が重要視されています。また、社内コストの面においては、業務上必要となる情報へのアクセス効率を向上させることが、『従業員一人当たりの情報検索にかかる時間×従業員数』、といった形で発生する無駄なコストを削減することが可能となるため、経営面においても重要課題といえるのではないでしょうか。

いずれの場合においても、画像・音声・動画などをはじめとするリッチコンテンツの検索性を向上させる方法として、それらの情報に属性情報やタグ情報といった、メタ情報(メタデータ)と呼ばれる、「データのデータ」を付与することが効果的ですが、それらのデータ作成は想像以上に大変です。

例えば、過去の文書を単にスキャンしデータ化する作業よりも、それらのデータの意味を理解し、属性情報やタグ情報を付与するほうが、実は手間も時間もかかります。そのような作業を社内の手が空いている従業員で片手間に行おうとしても、分量が膨大である場合はそれだけ時間を要するので現実的ではないばかりではなく、単純作業となるITオペレーション作業は、従業員にとって大きなモチベーションダウンの要因となります。

「属性情報の抽出~作成・タグ付け」サービス概要

画像・音声・動画などが含まれる大量のリッチコンテンツから属性情報を抽出することや、内容を理解しタグ付けをする作業は、ITの高度な専門知識は不要ですが、単純作業となるため、外部へのアウトソーシングは効果的な解決方法となります。

サイバーテックが提供する「属性情報の抽出~作成・タグ付け」サービスでは、皆さまが保有する様々なコンテンツやドキュメント情報に対して、属性情報やタグ情報の付与を「日本品質・リーズナブル」なITアウトソーシング・サービスとして提供します。

その秘密は、自社オフショア拠点である「セブITアウトソーシングセンター」にあります。

単純な属性データの作成はもとより、データベースに初期データを投入する際に必要となる構造化された属性情報や、今はやりのディープラーニング用学習データに使われるタグ付け(アノテーション)も含め、しっかりと現地在住の日本人がディレクションを行います。これらの業務は自動化できる部分もありますが、どこかの工程で人手による修正やチェックが入ることが多くなるため、日本人がフィリピン人に指導しながら現地で作業を行います。そのような体制を持つ日系の海外オフショア拠点だからこそ、低コストと日本品質を両立させたサービスを提供することが可能です。

さらに、日本語が多く登場する、教育サービス向けの教材に教材管理情報などの属性情報やタグ付けを行うことも実施しています。教材には縦書きも存在しますが、経験豊富な日本人ディレクションの下、フィリピン人オペレータに適切に作業指示を行うノウハウを有しているため、日本語コンテンツへの対応も問題ありません。日本語自体のライティングによるデータ作成など、日本人による直接的なオペレーションが必要なプロジェクトの場合は、自社ニアショア拠点である「サイバーテック沖縄」がサポートいたします。

案件のご相談を頂いた後は、必要とされる属性情報やタグ情報に関してご要望をヒアリングさせていただくとともに、お客様からサンプルコンテンツをお預かりする場合もあります。秘密保持契約の締結が必要となる場合は、いつでもお申しつけください。その後、分量および必要に応じてトライアルプロジェクトを実施させていただき、工数やそれに応じたコストとクオリティをお客さまにご確認いただきます。内容により全てオフショアで実施することをご提案することもありますが、実物をご確認後、正式にご発注頂けますので、オフショア委託が初めてのお客さまでも安心してご依頼いただけます。

サイバーテックの「ITアウトソーシング」サービスでは、ニアショア拠点の「サイバーテック沖縄」だけではなく、セブITアウトソーシングセンターとも常に連携しておりますので、「属性情報の抽出~作成・タグ付け」業務でボトルネックとなりやすい繁忙期へのご対応や突発的な業務などにも柔軟に対応させていただくことが可能です。

「属性情報の抽出~作成・タグ付け」サービスの特徴

安心の日系企業なのに低価格、上流からのご提案も可能!

東京を本社とする日本企業である当社が、セブITアウトソーシングセンターを設立し運営しており、10年以上の実績がございます。日系の海外オフショア拠点だからこそ、日本品質ながらリーズナブルなITアウトソーシング(属性情報の抽出~作成・タグ付け)サービスを実現していますので、初めての海外オフショア委託である場合でもご安心ください。

コンテンツの構造化からご提案をさせていただく場合は、サイバーテック本社のコンサルタントが別途お話をお伺いし、紙面分析や構造化提案などを実施させていただきます。したがいまして、ボリュームが多い・ITスキルが求められる、といった属性情報・タグ情報の付与だけではなく、「どのようなデータを付与したらよいか分からない」といった場合につきましても、お気軽にお問合せください!

人海戦術による、コピペによるデータ収集やデータ起こしなども対応!

属性情報やタグ情報の生成を行う際に、元データの加工・修正などが必要となる場合もありますが、人海戦術が求められる「コピペによるデータ収集」や「データ起こし」などにも対応しております。データソースは、通常の画像・動画・音声形式のファイルだけではなく、OCRによるスキャンデータをはじめ、Webサイトや、PDF・DTPデータ、MS Word・Excel・PowerPointなど、どのようなものでも大丈夫です。

要件により、スクリプトによる自動抽出~チェックだけで可能なものや、スクリプトによる半自動抽出~オペレータによる微修正、あるいはそれらが困難な場合は全て手作業による人海戦術により、大量のデータに関しても、様々な方法でリーズナブルに属性情報やタグ情報の生成をいたします。

AI学習に必要なアノテーション(タグ付け)作業も実施!

AIにおいて、ディープラーニングは非常に注目されている技術ですが、ニューラルネットワークを構築する上で大量の学習データが必要となります。それにはデータ量だけではなく、整備された情報であればあるだけ、学習に逆効果となるノイズは避けられます。

「属性情報の抽出~作成・タグ付け」サービスでは、学習データを確認し、正解ラベルを付与するタグ付け(アノテーション)の実施や、学習データ自体の加工・整備・チェックなど、人海戦術で行わざるをえない作業にも対応いたします。

むろん、アノテーションはディープラーニングだけで求められるわけではありません。XMLを得意とするサイバーテックだからこそ、メタデータを様々なコンテンツに付与し、データベース化するといった案件も多数実績がございます。

「属性情報の抽出~作成・タグ付け」サービスの実施例

PDFの教材から属性情報を抽出、Excelに入力

概要 80冊分の問題集から問題メタデータを抽出し、csvファイル化、属性情報の整理や日本語入力が必要なものは日本人チーム、問題番号やページ数といった簡単な内容はフィリピン人チームで実施。入力ツールを自社で開発することでcsv化を圧倒的に短縮した。日本人チームによるcsv最終チェックも行った。
PDFの教材データの内容を理解した上で、データを整理し、お客様に代わってExcelに教材の属性データを実施。
ボリューム 100冊分・数千問
ツール Microsoft Excel

Webサイトからディープラーニング用の学習データを取得~クレンジング

概要 ディープラーニングによる学習モデルのプロトタイプ構築に用いるテキストファイルを作成。対象となるWebサイトからテキストデータのみ収集し、装飾文字や顔文字などを取り去り、データクレンジングを実施。
ボリューム 約1000ページ
ツール テキストエディタ

「属性情報の抽出~作成・タグ付け」サービス Q&A

「属性情報の抽出~作成・タグ付け」サービスに関する次のような課題をお持ちではありませんか?

海外オフショアは、やはり品質・コミュニケーション面で不安です。

ご契約および受発注は、全て東京本社と実施いただけますので、いわゆる「安かろう・悪かろう」や、突然依頼を断られる、といった海外ベースのオフショア企業とは異なり、責任を持って取り組ませて頂きます!

フィリピン人は、英語は得意だが日本語が苦手と聞いていますが、大丈夫?

セブITアウトソーシングセンターのフィリピン人スタッフは日本語が読めませんが、全ての案件に英語が堪能な現地日本人スタッフが付きますので、日本人とフィリピン人が協調しながら業務を進めております。縦書きコンテンツの対応実績も豊富ですので、ご安心ください。10年以上の海外オフショア拠点の運営ノウハウがございますので、プロジェクト内にて必要となる手順書(指示書)の作成にも蓄積された独自のノウハウを有しており、海外委託における一番のリスクであるコミュニケーションの齟齬を防ぐことができます。

日本人が全てディレクションに入ると、結局割高になるのでは?

オフショア委託で一番コスト超過に陥る理由は「クオリティや納品内容の齟齬による追加費用」となります。経験豊かな日本人ディレクターがしっかり管理することにより、納期はもちろんのこと、手戻りを防ぐことにより、トータルで見ると必ず低コストにつながります。もちろん国内企業への委託と比べてもリーズナブルです。

外国とのやり取りはタイムラグが心配なのですが

セブITアウトソーシングセンターがあるフィリピン・セブ島は、日本との時差がたった1時間しかありません。さらに、始業時間なども日本時間に合わせておりますので、メールやスカイプのやり取りでも国境や時差を感じさせることはございません!

急ぎの納期でも対応してもらえる?

自社オフショア拠点「セブITアウトソーシングセンター」は、フィリピン セブ島エリアの独立系日系ITサービス企業において最大規模であり、急な納品対応や業務ピークにも柔軟な要員調整が可能です!

御相談、ご質問はこちら

サイバーテック お問い合わせ
お気軽にご相談ください

製品カタログ・セミナーでの講演資料など、豊富な資料がダウンロードできます

サイバーテック 製品カタログ 資料ダウンロード

最新事例の公開情報や、イベント・セミナー情報をお届け

サイバーテック メルマガ登録
pagetop ボタン