コンテンツデータやテキストデータの整理・整形

ITアウトソーシング「コンテンツデータやテキストデータの整理・整形」サービス詳細ページはこちら

フィリピンのセブITアウトソーシングセンターでは、データのチェック、修復などを行う「コンテンツデータやテキストデータの整理・整形」サービスを実施しています。名寄せや数値情報のクレンジング・チェックだけではなく、工場で使用する指示書・設計書、営業やマーケティング部門で必要となる提案書、改訂が頻発するマニュアル(取扱説明書)など、MS WordやDTPデータのドキュメントはもちろん、Excel・PowerPoint・Visioなどの描画機能で作成された図形オブジェクトのクレンジング(データ・マイグレーション)も行います。

「コンテンツデータやテキストデータの整理・整形」が求められる背景

ビジネスの変革スピードが速まる中、企業が進める組織変更や統廃合・M&Aなどのダイナミックなアクションも増加しており、それに伴うシステムの統廃合やデータ最適化、業務フローの見直しや業務マニュアル・規程集などの社内文書の改訂などの必要性が高まっています。また、法制度の変更などにも速やかに対応することが求められており、コンプライアンスや管理体制の強化に伴い、ドキュメントの分量や種類も増加する傾向にあります。さらに繰り返し改訂が行われたドキュメントは、「フォーマット通りに記載されない」「表記や用語の揺れが多くなる」「改訂履歴もふくめた管理効率が低下する」などといった事が発生するため、ドキュメントの正規化・標準化が求められています。

特に、DTP・図面情報などの場合、特定のソフトウェアで閲覧・修正を行う事が多く、ビューワーを含めた環境に依存しがちですが、ソフトウェア製品自体の方針変更やサポート終了などにより、強制的に新フォーマットもしくは別フォーマットに移行(マイグレーション)しなければならないケースも見受けられます。

一般的にデータクレンジングは、数値データやテキストデータをシステム(データベース)に格納する前に、データの正規化、表記揺れの修正、誤字脱字の修正などを行うことを指し、システムの移行や複数システムのデータベースを統合、連携する時には必要になります。ただし、システムやデータベースの統合だけでなく、業務マニュアル・工場で使用する指示書・設計書など、ドキュメントを管理・運用する上でもデータクレンジングが必要となる場合があります。

例えば、Microsoft Wordで作成した大量の業務マニュアルや規程集を文書管理やファイルサーバで一元管理する時、クレンジング前のデータの品質が悪いと「検索しても探したい情報にヒットしない」「図面やイラストが崩れてしまい正しく表示されない」という事が発生してしまいます。また、商品カタログの仕様(スペック)表についても、不正な形式で数値データが入力されているためにマクロが動作しない、システムに取り込めない、と言ったトラブルが発生することがあります。

このようなデータやドキュメントのクレンジング・チェックは人海戦術に頼らなければならない事が多いため、対応件数が多くなればなるほど、しっかりと改善プロセスを回すことができる実施体制が求められます。さらに、新たな製品やサービスを作り出す作業ではないため、コスト面においても予算確保が難しい場合がほとんどです。そのような状況であるため、クオリティを維持することができる体制構築とコストダウンの両方が求められます。

「コンテンツデータやテキストデータの整理・整形」サービス概要

「コンテンツデータやテキストデータの整理・整形」サービスでは、対象とするデータの種類や内容などによりますが、理想としては全てツールもしくはバッチ処理で完結することがベストです。しかしながら、ツールでカバーすることが難しいドキュメント分野であればあるほど、どこかのプロセスで人手による作業やチェックが必要となり、ツールのみで完結することが困難になります。そのような人海戦術が必要となる分野や、対象となるデータ量が多ければ多いほど、コスト面で有利な海外アウトソーシングが有効なソリューションとなります。

サイバーテックでは、自社オフショア拠点である「セブITアウトソーシングセンター」を中心に、対象データ・スケジュール・費用・お客様ニーズに合わせた最適なクレンジング・チェック作業のアウトソーシングをご提案し、対象となる様々なデータをクレンジング(修復、変換)~チェックを実施するサービスを提供しています。海外で実施するためにリーズナブルな事はもちろん、日本人プロジェクトマネージャ・ディレクターにより、確実にPDCAを回しますので、クオリティ管理もしっかりと行われます。数多くの教材情報を取り扱ってきた実績もあり、日本語対応も得意としています。

特に、MS WordやExcel、PDFのような文書ファイルは、修復、変換のすべてをプログラムで実施するのは困難であるため、人海戦術が中心となりますが、クレンジング後の目視チェックなどは可能な限りツールを使用して効率化を図ります。一方で、クレンジング・チェック対象がHTMLやXMLのような構造化文書や、csvファイル、データベースのクレンジング・チェックを実施する場合は、構造変換や一括置換プログラムを使用して、出来るだけ自動化を図ります。

データクレンジング・チェックを実施する前に、データのルール化・正規化・標準化が必要となる場合もあります。そのような場合は、コンサルティング・サービスにより前工程からご支援させていただくことも可能です。

「コンテンツデータやテキストデータの整理・整形」サービスの特徴

人海戦術とツール開発を組み合わせたITアウトソーシングを提供!

サイバーテックでは、システム開発技術とオフショア・ニアショアのアウトソーシングサービスを組み合わせることで、人海戦術による大量データのクレンジング・チェック作業とツール開発による効率化を組み合わせたクレンジング・チェックサービスを提供します。例えば、お客様から頂いたインプットデータをツールで整形した後で人海戦術によるデータの補正や修復を実施、最後に差分比較ツールで効率良くチェックして納品する、という流れが可能です。

文書データも数値データも効率良く確実にクレンジング!

サイバーテックでは、数値データだけではなく、ノウハウが必要な文書データのクレンジング・チェックを効率良く実施します。取扱説明書や規程集の標準化や管理効率化を支援する「ドキュメントソリューション」で培った技術とノウハウを駆使して、MS WordやExcel、DTP、PDFといった文書データから、本文とそこに含まれる画像、図形オブジェクト、リンク情報などを抽出し、お客様のご要望に応じた形に整えて納品します。

ルールベースのAI・統計用に使われるExcelデータの整理・整形もリーズナブルに!

統計解析やルールベースのAIなどに用いられるようなExcelデータの整理や整形は、RPAツールを使って実施する事も多いかと思いますが、RPAツールは非常に高価です。特にワンタイムで終了するようなデータクリーニングや、POCフェーズなどで実際にデータが有効活用できるかどうかといった段階では、RPAツールは不要です。RPAを導入するまでもない内容や、そもそもの下処理が必要、といった場合もセブITアウトソーシングセンターでExcelデータのクレンジングを行わせて頂きます。

「コンテンツデータやテキストデータの整理・整形」サービスの事例・価格

作業指示書のデータクレンジング(MS Office文書ファイル)

概要 旧バージョンのMS Office文書ファイルを、最新のMS Officeバージョンへと移行する文書ファイルのマイグレーション及び図形のクレンジング作業を実施。お客様の社内事業所で使用する作業指示書のシステム更新に伴い、システムに取り込むことができない旧バージョンのMS Officeデータを最新バージョンのMS Officeで正しく表示できるように修復、移行する必要があった。
作業場所 フィリピン セブITアウトソーシングセンター
ボリューム・期間 約20,000ファイル・約4か月
作業内容
  • チェックツールで正誤判定
  • 目視による図形オブジェクトの破損や変形チェック
  • MS Officeソフトで破損や変形の修復作業
  • 差分比較ツールで修復作業の品質チェック
  • 作業リストへエビデンス記入
  • データとリストの納品
使用ツール・技術
  • Microsoft Word、Excel、PowerPoint、Visio(編集エディタ)
  • WinMerge(差分比較ツール・フリーソフト)
その他
  • お客様と共同で作業工程のリカバリー計画も含めた1日単位の綿密な計画を事前に作成した
  • プロジェクト開始時にお客様立ち合いの元、約1週間の現地トレーニングを実施した
  • ツール操作や手順に従ったオペレーションの習熟度が時間と共に向上し、予定より前倒しで全ファイルのクレンジングが終了した
価格・費用 お問合せください

ディープラーニング(深層学習)に用いる学習データ作成

概要 ディープラーニング(深層学習)によるAIで用いる学習データを作成。元データは特定のWebサイトにプラグインを埋め込むことにより抽出対象の一覧を自動的に生成し、抽出作業を実施。規定のルールに基づき抽出情報からノイズ情報を判別し、除去を行った。
作業場所 フィリピン セブITアウトソーシングセンター
ボリューム・期間 約1,000ページ(ファイル)・2週間
作業内容
  • Movable Type、WordPressへのプラグイン設定
  • テキストファイルの抽出~指示書通りの命名即に基づいたファイル生成
  • ディープラーニング時にノイズとなるデータの除去
  • ツールによる最終確認
  • テキストデータとリストの納品
使用ツール・技術
  • Notepad++(編集エディタ)
  • Microsoft Excel(データ一覧作成)
  • Network Kanji Filter(UTF-8のBOM一括削除)
その他
  • 納品後のプロセス(形態素解析)を意識した、文字コードや改行コードによるテキストデータの作成。
  • 日本語コンテンツにもかかわらず、除去が必要なノイズデータをパターン化し、フィリピン人オペレータによりリーズナブルに実施。
  • 最終チェックは日本人により実施。
価格・費用 お問合せください

需要予測(統計用・ルールベースAI)に使われるExcelデータの前処理(整理・整形)

概要 需要予測を行うための統計システムに使うデータの前処理を実施。対象データが現場ごとにセル結合などを独自に行ったものと、一部紙ベースの手書きデータが混在しているため、RPAによる自動化ではなく、データエントリー含め人海戦術でExcelデータの前処理(整理・整形)を実施。
作業場所 フィリピン セブITアウトソーシングセンター
ボリューム・期間 Excel 約1,000シート(一部手書きの紙資料からのデータエントリー含む)・2ヵ月
作業内容
  • 統計解析用Excelの仕様をお伺いし、整理・整形ルールを作業指示書に落とし込み
  • Excel修正チーム:データの整理・整形を実施
  • データエントリーチーム:Excel仕様に即した形でデータエントリーを実施
  • 別途チェッカーにより最終確認後、納品
使用ツール・技術
  • Microsoft Excel
その他
  • 紙データは、手書きされた数値情報をデータエントリー
価格・費用 お問合せください

上記は一般的な「コンテンツデータやテキストデータの整理・整形」サービスの事例となります。そのほか多数の事例がございます、詳細はお問合せください。

「コンテンツデータやテキストデータの整理・整形」サービス Q&A

日本語の文書やデータでも大丈夫でしょうか?

「コンテンツデータやテキストデータの整理・整形」サービスは、リーズナブルに実施させていただくため、メインでクレンジング・チェックを行うのはフィリピン人オペレータとなります。その際、フィリピン人QA(Quality Assurance:品質保証)チームによるダブルチェックや、ご要望に応じて最後に日本人のチェッカーが確認しますのでご安心ください。また日本語の読み書きが伴うクレンジング・チェック作業は、日本人オペレータが担当します。

作業指示や進捗管理はどのように行うのですか?

お客様のご要望に合わせた様々な体制構築が可能です。メールやスカイプ、プロジェクト管理ツールを駆使する事で、お客様がフィリピンの日本人マネージャとリモートでコミュニケーション頂く事ができます。また、場合により本社側でBSE(ブリッジSE)や、ディレクター・PM(プロジェクト・マネージャ)をアサインしてお客様の近くでご支援する事も可能です。

英語の作業指示書を用意しないといけないのですか?

アウトソーシングする際に、作業指示書はお客様でご用意いただいても結構ですし、サイバーテック側で作成することもできます。お客様でご用意いただく際は、手順書を英語で記載いただく必要はなく、日本語のままでお客様フォーマットの手順書をご提示いただくだけで大丈夫です。

見積や相談をする際に何を準備すれは良いですか?

ご相談頂く段階でサンプルデータと簡単なご説明資料を準備いただくとスムーズです。実際のお見積り時には、サンプルデータを使ってクレンジング作業の生産性を現地で測定した結果、お見積りいたします。もちろん事前にNDAが必要な場合はおっしゃって下さい。

システムやツール開発も含めて相談できますか?

「コンテンツデータやテキストデータの整理・整形」サービスでは、お客様と協議して最適な方法をご提案しますが、クレンジング・チェック作業自体をお客様側で実施されたい場合もあるかと思います。そのような際は、クレンジング・チェック作業に必要となるツールを開発してご提供する、というサービス提供形態もございますので、ご予算が少ない場合でも、まずはご相談くださいませ。

御相談、ご質問はこちら

お気軽にご相談ください

製品カタログ・セミナーでの講演資料など、豊富な資料がダウンロードできます

最新事例の公開情報や、イベント・セミナー情報をお届け

pagetop ボタン
©2018 CyberTech corporation ltd. All Rights Reserved.