VillageAIデータクレンジングサービス

高性能ツール + 人的作業 精度の高い 価値あるデータへ。

What is data cleansing?

データクレンジングとは?

データ分析や
マーケティング戦略において
現在最も重要とされている対策です。 データクレンジングを行う事で
データに一貫性と精度が保たれ
データの価値向上につながります。

生産性向上、サービスやマーケティングの品質向上までの流れ図 生産性向上、サービスやマーケティングの品質向上までの流れ図

データ分析の現状と課題
  • データ分析を行いたいが、データが分散していて利用できない、利用方法が分からない。

  • データの表現が揺れていて、それを統一したり名寄せしたりの作業を行う事が難しい。

  • 大量のデータ処理はエクセルでは不可能なうえ、ビッグデータ解析ツールが使いこなせない。

  • 社内のリソースが足りず、データ解析の前処理をアウトソースしたい。

  • データクレンジングを行っても、そのデータの活用方法が分からない。

データ分析のプロである
VillageAIなら
高性能ツール+人的チェック+データサイエンティスト を駆使して
この様な課題を解決できます!

Our strengths

VillageAIの強み

高品質なデータクレンジングを
実現するためには
「手作業」による修正が重要です。 Village AIでは
種子島の人材を活用することで
低コスト・短納期での
処理を実現しています。

他社のクレンジングサービスとの比較図
他社のクレンジングサービスとの比較図 他社のクレンジングサービスとの比較図
  • 精度

    高性能ツール+手作業

    ビッグデータ処理ツール「Dataiku」を用いた初期的なデータ統合と修正作業を効率的に処理します。さらに種子島の人材を活用した「手作業」で高い精度を誇っています。

  • コスト

    地方人材を生かす

    処理ツールと種子島の地方人材を活用することで、高い精度を保ちながら大幅なコストダウンを実現しています。

  • 社会貢献度

    種子島の人材活用

    種子島の地方人材を活用する事で社会貢献につながり、企業の存在価値を向上させブランドイメージを良くすることにつながります。

  • データ活用

    データサイエンティスト

    他社とは違いデータサイエンティストが、データ分析やAI開発に使えるようにデータセットを設計する事で、データ活用できる価値のあるデータを作ることが可能です。

これまでに数百の
データ分析案件を手掛けてきた
経験豊富な
データサイエンティストが在籍

  • AI、ディープラーニングでの利用を前提としたデータの統合・形成をアドバイス。

  • 最終的な納品データをチェックしクオリティを担保。

  • クレンジング後のデータ分析の方法などのご提案も可能。

Case

事例

多種多様な業界に
ご利用頂いております。

  • 大手飲料メーカー様
    マーケティング施策のために表記ゆれを修正し顧客データの売上データを統合
    問題点

    企業名や店舗名のマスタ登録が各店舗の営業担当の手入力で行われているため、表気揺れが発生しており、自社で顧客管理ができていない。

    また一部データはそもそも紙であったためOCRで電子化したがクオリティが低かった。マーケティング施策を打つためにもデータの整理が急務であった。

    対応内容

    表気ゆれの統一、データの統合

    データ量

    8万件

    納期

    3週間

  • 大手ITサービス様
    M&Aによる同業者買収後のデータ統合作業
    問題点

    サブスクリプション型でサービス展開しているITベンダーガ、シナジーノアルSaaSサービスを買収。全く形式の違う顧客データ、見込み客データを統一し,インバウンドsalesから営業を行うにあたり、クレンジングサービスのニーズが発生。

    対応内容

    案件定義により統一後のデータ形式をアドバイス、データ統合と表記のゆれの修正

    データ量

    8,000件

    納期

    1.5ヶ月

  • 大手不動産仲介業者様
    物件情報を市場データなどを使用して
    アップデートしたい
    問題点

    物件名、所在地などの誤記、または欠損が存在し地域毎の経年や価格などの分析に困難が発生。市場データなどを参照しつつ、抜本的な修正を行いたい。全件は困難なため、まずは首都圏から始めて効果があれば中部・関西も継続的に実施していきたい。

    対応内容

    自社データと外部データを名寄せし、最新の市場データにアップデートを行う

    データ量

    1万件

    納期

    1.5ヶ月

  • 大手IoTベンチャー企業様
    細かすぎる数百万件のIoTデータの重複を削除し、分析に適した粒度に修正したい
    問題点

    毎秒発信されるIoTセンサーの情報が数百万件存在するが、データの採取頻度が頻繁すぎて分析に適した粒度になっていない。またセンサーによっては同じデータが重複して格納されており、重複データは削除したい。データ量が多すぎてExcelでは作業不能であり、知見のある専門家にアウトソースしたい。

    対応内容

    重複データの削除、電波強度比較し最も強い物を残すスクリプトを開発、BIツールで取りまとめ

    データ量

    300万件

    納期

    1.5ヶ月

Flow

流れ

高品質なデータクレンジングを
短納期ご提供いたします。
また、処理前のアウトソース
請け負うことも可能です。

  1. STEP.1

    要件定義

    Village AIのデータサイエンティストが概要をヒアリングいたします。

  2. STEP.2

    お見積もり

    所定の料金テーブルを用い、作業工数をお見積もりいたします。

  3. STEP.3

    クレンジング作業

    ビッグデータ解析ツールを用いデータをクレンジングし、修正不可能なな作業は「手作業」によって変換を行います。

  4. STEP.4

    ダブルチェック

    Village AIのデータサイエンティストが人を変えてクレンジング済みのデータをツールと目視によりダブルチェックを行います。

  5. STEP.5

    ご納品

    お客様にて受け入れチェックをして頂き、仕様通りに作業が行われているかを確認して頂きます。データに問題があれば修正を行います。

  1. 1〜2週間
  2. 3〜5日
  3. 数日〜3ヶ月
  4. 数日〜1ヶ月

Fee

料金

データクレンジング

10,000レコード

[1データセット]

10万円~

内容によって変動いたしますので、
詳しくはお問い合わせください。

  • ※データ処理案件には不確定要素を含みます。
  • ※不確定な部分は別途お打ち合わせで相談させていただきます。
  • ※納期や打ち合わせな等、個別の対応が必要なケースは別途相談会等で実施させていただきます。

FAQ

よくあるご質問

Q.どのような種類のデータに対応していますか?
A.

当サービスは、様々なデータに対応しています。いくつかの例を記載しますが、まずはどうぞご相談ください。

顧客データベース、財務レコード、製品情報、オンラインフォームの入カデータなど、その他、さまざまな種類の構造化および非構造化データ等。

Q.どのような形式のデータに対応できますか?
A.

任意に対応可能です。まずはご相談下さい。以下参考までによくある対応したデータの種類を記載しておきます。

対応できるデータ:CSV・TSV、XML、JSON、各種データベース(Oracle、PostgresQL、MySQL、Access)、PDF、その他紙データ等。

Q.導入実績について教えてください。
A.

業界を問わず、幅広いお客様から引き合いをいただいており、数多くの導入実績がございます。

事例としましては、以下の業界などがあります。

金融業界、人材業界、不動産業界、製造業界、物流業界、旅行・宿泊業界、その他業界。

Q.データクレンジングのコストはどのように計算されますか?
A.

コストはプロジェクトの規模、データの量、作業の複雑さに基づいて計算されます。詳しくはぜひご相談にてお話しできればと思います。

Q.導入メリットを教えてください。
A.

データクレンジングによって以下が可能になります。

データの統合管理、工数削減・業務効率向上、データ活用の促進、不足データの解消。

お問い合わせ・お申し込みは
下記フォームからお気軽にご連絡ください。

データクレンジングサービス お問い合わせ