sima2*blog

ネットのよもやまをお茶の間に

メールアドレスやデータの重複チェックを5秒で終わらせる方法。

   

同報送信などで複数のメールアドレスのリストから重複をチェックしたり、企業名などで重複したものを探したりとかって、結構「目検」、見て探す、って事になったりしがちですけど、Excelで以外に簡単に片付いたりします。私自身は昔からやってますが、試みに調べてみたらWebで紹介されてる方法はかなり複雑なので紹介しときます。

ちなみにWebで出ていた方法は以下。

A列にメールアドレスの後にカンマで区切りその後にハンドルネームが
入った物が100ほどあります。
<中略>
重複しているメールアドレスを削除したいんですが
どうしたらいいでしょうか?

『重複チェック』(まな) エクセル Excel [エクセルの学校]

顧客マスタなど、重複データしたデータが入力されていてはいけないリストがあります。そして、この重複データが入力されているかどうかを、目で追って確認するのは大変な作業になります。そこで、今回の記事では、ワークシート関数を組み合わせて、重複データのチェックを効率的に行う便利なテクニックを紹介します。

エクセルで重複データをチェック[エクセル(Excel)の使い方]All About

どちらも関数を駆使して、各セルが他のセルに値がないかどうか、みたいな事をやっています。けどデータを重複だけはじいてクリーニングして使ったら終わり、とかだといちいちやってられない・・・というのが正直なところだと思います。

で、5秒でどうやるか。

まずこういうデータがあると考えましょう。サンプルなので行数が少ないですが、Excelでやる場合は最大行数までいけますので、最低でも6万件はいけます。
あとはExcelのバージョン次第です。

で、何気に重複しているデータがありますが、見出しとして「Email」とか適当な名前をつけて行を丸々選択。このデータをピポットテーブルにするだけ。

やり方を一応書いておくと、

  1. 一番上の行に見出しをつける(Emailでもメールでもなんでもいい)
  2. A列であればA列まるまる選択。
  3. メニュー>データ>ピポットテーブルとピポットグラフレポートを選択。
  4. ウィザードが立ち上がるので次へを連打w
  5. ピポットの枠の左の「ここに行のフィールドをドラッグします」と、真ん中の「ここにデータアイテムをドラッグします」と書いているところにそれぞれ上でつけた見出し(Emailとか)をドラッグ。つまりどのメールアドレスが何個あるかの集計ピポットを作る、ということです。

こんな感じになると思いますが、これで完了。
個数をカウントしているので左列は当然重複はありません。
これをコピーするなりなんなりして終了です。
ピポットテーブルを作るところはやる人の経験に依存しますが、ぶっちゃけ列全選択してからalt+D、P、Enter x 3回というショートカット(Windowsの場合)で終わるので慣れるとここは1秒かかりません。あとは慣れだけ。

ちなみにメールアドレスだと全角混じり(特に@)がありますが、その場合はWindowsであればエディタの秀丸に1回コピーペーストして全選択、右クリックで「ハンカクに変換」というオプションがあるのでこれで大抵片付きます。

お試しあれ。

 - トピック