コラム

データ重複を防ぐ名寄せの前に。データクレンジングはとても重要

顧客情報を管理していく上で名寄せ作業はとても大事なデータ管理となります。

名寄せとは複数のデータで同じ顧客情報があった場合に、その顧客情報をひとつのデータに統合もしくは更新することです。

名寄せをしないでいると顧客情報が重複、参照した際に違う情報を確認してしまい、正しくない情報を元に話を進めてトラブルになるなんてこともあります。

その名寄せの肝となってくる作業が『データクレンジング』という工程になります。

名寄せとデータクレンジングはほとんどの場合に同時に行われる作業なので混同して表現される場合もありますが、厳密には違う作業です。

データクレンジングとは名寄せの準備のようなもので、名寄せの際に自動で名寄せをしやすいように表記ゆれなどをあらかじめ整えておく作業のことです。

この整えたデータをプログラム上で参照して名寄せが行われるわけですね。

そのため、データクレンジングがしっかりと行われていないと名寄せをしたとしてもミスが発生してしまうなど、大きな弊害があります。

今回は名寄せ及びデータクレンジングの関係性や注意点などを紹介していきます。

名寄せとデータクレンジングの関係性

冒頭でも少し触れましたが、名寄せとは複数に分かれてしまっているデータをひとつに統合する作業のことで、データクレンジングはデータを整理された状態にすることです。

表記ゆれなどがある状態で整理されていないデータのままだと、機械はそのデータを同一の情報と認識することができません。

そのため、データクレンジングをすることで機械にとって同一の情報と認識しやすい状態にし、その上で名寄せツールによって同一だと判断されたものを統合または新しいデータに更新していきます。

名寄せの際に同一かどうかを参照するデータのクレンジングが不完全だと、ここで認識されずに複数のデータとして残り続けてしまいます。

重複データが残っていると、同じ顧客に複数の同じDMを送ってしまったり、複数の営業担当者が古い情報を元に何度も同じ内容の営業を短期間に繰り返してしまったりなどのミスが発生してしまうのです。

以上のことから、名寄せを正確に行うために正確なデータクレンジングが欠かせないということがわかります。

データクレンジングはどこに注意するべきか

データクレンジングをするといってもどういったところを訂正すれば良いのでしょうか?

人間が確認したら同じだと理解できても機械は融通が利かないものです。

特に競合他社と合併した際や今まで個人で作成し運用していた顧客リストを社内管理に切り替える場合などには、同じ取引相手が登録されていることも多いでしょう。

この異なるデータをまずは同じデータベースにまとめて、データクレンジングをしていくことになりますが、別の会社や個人作成のものであれば同じ取引相手でも表記の仕方に『ゆれ』が生じてしまうものです。

まずはどういった情報を精査して表記ゆれを直していくことになるのかを確認しましょう。

例えば、『株式会社ABC』というような会社があった時、株式会社の表記が『㈱』になっていたりアルファベットが小文字になってしまっていたりエービーシーとカタカナ表記になっていたり株式会社とABCの間にスペースが入っていたりするということが挙げられます。

また、連絡先などであれば電話番号や住所(郵便番号)のハイフンの有無や数字の半角全角なども注意すべき点でしょう。

たったひとつの会社名や電話番号でもこのように色々なパターンで表記されてしまっている可能性があるのです。

その他にも個人名に関しては、「齋藤」と「齊藤」など、似たような漢字で間違えて登録してしまっているなどのミスにも注意が必要です。

個人名が間違っているとせっかく他の名寄せキーがデータクレンジングによって統一されていても同じ人物として扱われず名寄せの対象から外れてしまいます。

また、低確率ではありますが同姓同名の同会社所属の方が取引相手にいた場合はそのデータが名寄せされてしまわないように、名前の後に部署名を入れるなどの対策が必要です。

こういった表記ゆれや更新し忘れていた取引相手の役職情報などを、機械から見て同じものであると認識しやすいように同じ表記方法に更新していきます。

名寄せの際はいくつかの『名寄せキー』という、参照する項目を設定し、キーワードが一致していたら名寄せによってひとつのデータに統合されます。

例えば、『株式会社ABC』と『(株)ABC』が存在するデータでも、企業名である『ABC』を名寄せキーに設定すれば、システムは同一情報と認識できるというわけです。

そのため、名寄せさえできれば多少の表記ゆれは問題ないという場合は名前や会社名、連絡先などの全ての情報を完璧にクレンジングする必要はないかもしれません。

ここに関しては、自社のシステムや顧客情報の活用方法を考慮して都合の良い方を選択すると良いでしょう。

きれいに整理されたデータを保つために

そしてここが大切なのですが、データクレンジングは一度行ってしまえば終わりというものではなく、定期的にデータクレンジングを行って新規登録時も重複チェックは随時意識して行っていく必要があります。

例えば電話番号などのハイフンを表記しないように設定したとしても、営業担当者がハイフン付きで新規登録してしまうというミスもあるでしょう。

そういったことが起きないように自社の表記ルールを設けて、それに則った表記をするように周知することがデータの乱れを抑えることに繋がりますし、乱れが少なければ再度データクレンジングをする際にも作業が楽になるでしょう。

もしくはシステム上ハイフンを入力することができないようにしてしまう(有りの場合はあらかじめ入力された状態にする)というのも有効な対策です。

こうした対策をした上で定期的にデータクレンジングと名寄せを行っていくことで、きれいに整理されたデータを使って営業やマーケティングに集中して打ち込むことができます。

表記ゆれを正すことを社内で周知している(もしくはシステムで表記ゆれが起きないようにする)とデータ検索の際の表記ゆれもなくなり、目的の情報を楽に検索、抽出できるというメリットがあります。

こうして様々な業務が効率化されていくことで、業績にも好影響があるでしょう。

まとめ

名寄せにおいて、データクレンジングは大変重要な役割を持つ工程です。

データクレンジングや名寄せにはツールを使用するか、データクレンジング業者に依頼することが多いかと思います。

100件程度の顧客情報であれば人間の目で確認することも可能かもしれませんが、1,000件や10,000件となってくると人の手で確認して直していくのはあまり現実的ではないでしょう。

業者を利用する際は業者の担当者と相談してデータクレンジングや名寄せをしてもらうことになるかと思います。

ただ、後からデータクレンジング業者に依頼するのであれば、顧客データ作成の段階から名刺情報入力代行サービスを利用すると、データの重複や表記ゆれを防げるので効率的でしょう。

いくら顧客情報の登録に社内ルールを設けたとしても、人為的ミスは防ぎきれないものです。

顧客データの追加を社員に任せるのではなく、入力代行のある名刺管理サービスを利用して、データクレンジングの手間を省くことも検討してみてはいかがでしょう。