データクレンジングとは、管理しているデータベースの中から、重複や 誤記、表記の揺れなどを探し出し、修正や削除などを行い、データの正規化を行うことです。名寄せなどの作業を行うことで、複数登録されている同一人物、同一企業、同一世帯などを一元化してマーケティング活動の最適化を図ることができます。
- データクレンジング処理プロセス
-
- 書式統一
-
- 半角/全角の統一
- カタカナ、ひらがなの統一
- 空白文字の処理
(前後の空白除去、文字数統一) - 通貨、数値、生年月日などの形式統一
- 住所クレンジング
-
- 住所分割
- 住所表記統一
- 市区町村合併など最新住所への変換
- 住所コード、カスタマーバーコード付加
- 姓名クレンジング
-
- 姓名の分割
- ふりがな付加
- 異体字、外字の処理
- 電話番号クレンジング
-
- 電話番号標準化
- 電話番号分割
- 電話番号ハイフン付加
- 電話番号妥当性チェック
- 法人名クレンジング
-
- 法人格の統一
- 法人名、部署名の分離
- 異体字、外字の処理
- 重複・名寄せチェック
-
- 判定ロジックを確定し、そのロジックに基き処理を行っていきます。
- 姓と住所、氏名と電話番号・・・etc
- 郵便番号クレンジング
-
- 郵便番号の正規化チェック
- 最新郵便番号の付加
- 妥当性チェック
-
- コールチェック
(回線の使用状況の判定を行います) - 弊社マスターDBとの正誤判定
- コールチェック
- データクレンジングの各種マスターDB
-
データクレンジングの精度を高めるために、各種マスターデータベースを構築管理しております。
・市外市内局番マスター ・電話帳マスター ・住所マスター
・郵便番号マスター ・姓名辞書マスター ・コールチェックマスター
・建物マスター ・法人データマスター ・その他各種