オフィスソフト使いこなし(第35回)

エクセルで「重複削除」を使いこなす

posted by 川本 鉄馬

このエントリーをはてなブックマークに追加
Evernoteに保存
印刷

 エクセルは、住所録から会計管理まで使える非常に高機能なソフトです。しかし、元となるデータが表の中に複数存在していると、正しい情報が導き出せないケースがあります。

 たとえば住所録であれば、同一のファイルに同じ人の情報が重複して入っているのは好ましい状態ではありません。片方のデータだけを最新情報に更新してしまうと、どちらの情報が正しいのか、わからなくなってしまいます。

 また、同じ内容のデータが大量に重複していると、それだけでデータファイルのサイズが増えてしまうため、エクセルの操作スピードが遅くなったり、データの保存スペースを無駄に消費してしまいます。

 こうした無駄なデータの処理に便利なのが、「重複の削除」です。この機能を使うと、データシートの中から重複箇所を自動で削除できます。

重複データの削除は一発でできる

 重複の削除は、ツールバーの[重複の削除]アイコンで行います。ツールバーの[データ]を選ぶと、アイコンが表示されます。

 もし、[重複の削除]が見当たらない場合は、エクセルの表を横方向に拡大してみてください。エクセルでは、画面の表示幅によってツールバーの表示内容が自動的に調整されるため、表の横幅が狭い場合、[重複の削除]アイコンが表示されない場合があります。

 対象となる表を選択し、[重複の削除]をクリックすると、ウインドウが表示されます。

 すべての項目で重複しているデータを消去したい場合は、「名前」や「住所」など、ウインドウの項目すべてにチェックマークが入っている状態で[OK]をクリックします。

 今回説明用に作成した住所録では、3行目と7行目にある「山本英夫」という人物のデータが、名前、住所、電話番号のすべての項目で重複しています。ここで重複データを消去すると、7行目のデータがまるごと削除されます。削除後は、以下のようなメッセージが表示されます。

 住所だけ、電話番号だけなど、一部の項目だけを検索のキーとすることも可能です。その場合は、当該項目だけにチェックマークを付けます。

 上の図は、名前と電話番号に対して重複のチェックを行う場合の例です。この表では、「山本英夫」という人物の名前と電話番号は重複していますが、住所は異なります。引っ越しなどの理由により、同一人物ながら複数の住所録ができてしまった典型的なケースです。

 この場合、「住所」をチェック項目から外し、OKを押すことで、「山本英夫」の重複データが削除できます。

「本当に削除しますか」のような確認メッセージはナシ

 気をつけておきたいのが、重複項目を指定するウインドウの「OK」をクリックすると、すぐにデータが削除されてしまう点です。「本当に削除しますか?」のような確認のメッセージは表示されません。

 また、削除されるのは表の後ろに位置するデータとなります。たとえば3行目に引越し前の古いデータがあり、7行目に最新のデータがあるような場合、7行目のデータが自動的に削除されます。重要なファイルの場合は、事前にデータのコピーを作るなどの慎重さが求められます。

 もっとも、最新のデータが削除された場合でも、ファイルを閉じる前であれば、削除されたデータは簡単に復活できます。エクセル画面の左上にある[元に戻す]アイコン(もしくはキーボードで[Ctrl+Z])を使えば、削除前の状態に戻せます。落ち着いて操作することが大切です。

スペースや全角/半角文字にご注意

 もうひとつ、データを削除する際の注意点があります。それは、重複しているように見えているデータが削除されないケースです。

 原因は、セル内のデータにあります。重複削除機能では、セルに入力されたデータが完全に一致した場合のみ、重複と認識します。このため、名字と名前の間にスペースがある場合とない場合では、重複データと見なされません。

 数字や記号の全角と半角も、異なる文字として認識されます。一方で、半角のアルファベットの場合、小文字と大文字は同じ文字として認識されます。

 「名字と名前の間にはスペースを入れない」「ハイフンは半角」など、予め入力ルールを決めておくことが大切です。

重複データを削除するのではなく、重複していないデータを抜き出す技

 重複データ削除後にファイルを上書き保存してしまうと、前述した[元に戻す]アイコンをクリックしても、元のデータは戻ってきません。そのため、誤って他のシートから参照されているデータを削除し、上書きしてしまった場合は、元の状態に設定し直すのは一苦労です。

 そういった事態を招かないために、重複データを削除するのではなく、重複していないデータだけを抜き出す方法もあります。元となるシートからデータを削除しないため、複雑なデータ処理を行うファイルを扱う場合に向いています。

 重複していないデータを抜き出すためには、メニューから「データ」→ [詳細設定]を選択します。

 すると、「フォルダーオプションの設定」というダイアログボックスが表示され、データ抽出の範囲や条件が指定できるようになります。抽出先は「指定した範囲」を選択し、「リスト範囲」で元となるデータの範囲を選択します。

 その次の「抽出範囲」で、抜き出したデータを表示するセルを選びます。最後に「重複するレコードは無視する」にチェックマークを入れ、OKをクリックします。

 これで、重複“しない”データを抜き出すことができました。

 「重複削除」と「詳細設定」をうまく使い分ければ、効率的なデータ整理や更新が可能になります。長く更新を重ねてきた住所録や見積書などで、実践してみてください。

このエントリーをはてなブックマークに追加
Evernoteに保存
印刷

連載記事一覧

川本 鉄馬

川本 鉄馬

IT系をメインに原稿を書いてきましたが、最近は自動車、オートバイ、自転車、防犯、ウクレレなどイロイロ書きます。PC系は、Windowsがバージョン2の頃からのお友だち。ここ何年かのお気に入りはUbuntuで、今年になってPythonをいじり始めました。いつの間にか始めていたIngressが、もうすぐレベル11になります。

メルマガ登録


「人材不足」を働き方改革で乗り越える


教育機関向け特集


自治体向け特集

ページトップへ